Documentación

FAQ: ¿Por qué este modelo costó más de lo esperado? en la documentación de NexoRouter.

FAQ: ¿Por qué este modelo costó más de lo esperado?

El costo depende del modelo elegido, tokens de entrada, tokens de salida y patrón de requests. Usage Logs es la fuente de verdad para costo por request.

Revisa en este orden

Confirma el model ID exacto en Usage Logs.
Revisa prompt tokens y completion tokens.
Revisa si la app hizo retries automáticos.
Revisa si un loop agéntico hizo múltiples requests.
Revisa si max_tokens permitió una respuesta larga.
Compara el modelo contra Pricing.

Causas comunes

Causa	Solución
Más output tokens de lo esperado	Usa `max_tokens` menor durante pruebas.
Loop agéntico o retries de herramientas	Usa una key de bajo presupuesto para agentes y revisa Usage Logs.
Una herramienta eligió un modelo caro	Restringe el alcance de modelos de la key o configura un solo modelo explícito.
Cadena automática de fallback	Empieza con un solo modelo hasta entender el costo.
Prompt de contexto largo	Recorta input, resume historial o elige modelo de forma intencional.

Setup para controlar costo

Entorno	Configuración recomendada de key
Experimento local	Bajo presupuesto, uno o pocos modelos de bajo costo.
Staging	Key separada, alcance realista, presupuesto moderado.
Producción	Key separada, solo modelos aprobados, gasto monitoreado.

FAQ: ¿Por qué este modelo costó más de lo esperado?

Revisa en este orden

Causas comunes

Setup para controlar costo

Relacionado