Documentación
Modelos de razonamiento en la documentación de NexoRouter.
Modelos de razonamiento
Estado: Usa pruebas por modelo.
Los modelos tipo reasoning pueden ser más lentos y más caros que modelos chat estándar. También varía cómo los clientes exponen controles de razonamiento.
Primera prueba
Usa un prompt pequeño y timeout más largo:
Explain the tradeoffs of retrying a failed API request in three bullets.
Timeout del cliente
Empieza con al menos 60 segundos para modelos chat normales. Para modelos lentos tipo reasoning, permite hasta 180 segundos antes de agregar reintentos.
Control de costo
- Usa presupuesto de key para experimentos.
- Mantén prompts cortos.
- Evita loops agénticos hasta verificar la respuesta de texto.
- Revisa tokens y costo en Usage Logs.