Documentación

Modelos de razonamiento en la documentación de NexoRouter.

Modelos de razonamiento

Estado: Usa pruebas por modelo.

Los modelos tipo reasoning pueden ser más lentos y más caros que modelos chat estándar. También varía cómo los clientes exponen controles de razonamiento.

Primera prueba

Usa un prompt pequeño y timeout más largo:

Explain the tradeoffs of retrying a failed API request in three bullets.

Timeout del cliente

Empieza con al menos 60 segundos para modelos chat normales. Para modelos lentos tipo reasoning, permite hasta 180 segundos antes de agregar reintentos.

Control de costo

  • Usa presupuesto de key para experimentos.
  • Mantén prompts cortos.
  • Evita loops agénticos hasta verificar la respuesta de texto.
  • Revisa tokens y costo en Usage Logs.

Relacionado

Modelos de razonamiento — NexoRouter