Modelos de razonamiento

Estado: Usa pruebas por modelo.

Los modelos tipo reasoning pueden ser más lentos y más caros que modelos chat estándar. También varía cómo los clientes exponen controles de razonamiento.

Primera prueba

Usa un prompt pequeño y timeout más largo:

Explain the tradeoffs of retrying a failed API request in three bullets.

Timeout del cliente

Empieza con al menos 60 segundos para modelos chat normales. Para modelos lentos tipo reasoning, permite hasta 180 segundos antes de agregar reintentos.

Control de costo

Usa presupuesto de key para experimentos.
Mantén prompts cortos.
Evita loops agénticos hasta verificar la respuesta de texto.
Revisa tokens y costo en Usage Logs.

Relacionado

Modelos y model IDs
FAQ de timeouts