Documentación
FAQ: ¿Por qué este modelo costó más de lo esperado? en la documentación de NexoRouter.
FAQ: ¿Por qué este modelo costó más de lo esperado?
El costo depende del modelo elegido, tokens de entrada, tokens de salida y patrón de requests. Usage Logs es la fuente de verdad para costo por request.
Revisa en este orden
- Confirma el model ID exacto en Usage Logs.
- Revisa prompt tokens y completion tokens.
- Revisa si la app hizo retries automáticos.
- Revisa si un loop agéntico hizo múltiples requests.
- Revisa si
max_tokenspermitió una respuesta larga. - Compara el modelo contra Pricing.
Causas comunes
| Causa | Solución |
|---|---|
| Más output tokens de lo esperado | Usa max_tokens menor durante pruebas. |
| Loop agéntico o retries de herramientas | Usa una key de bajo presupuesto para agentes y revisa Usage Logs. |
| Una herramienta eligió un modelo caro | Restringe el alcance de modelos de la key o configura un solo modelo explícito. |
| Cadena automática de fallback | Empieza con un solo modelo hasta entender el costo. |
| Prompt de contexto largo | Recorta input, resume historial o elige modelo de forma intencional. |
Setup para controlar costo
| Entorno | Configuración recomendada de key |
|---|---|
| Experimento local | Bajo presupuesto, uno o pocos modelos de bajo costo. |
| Staging | Key separada, alcance realista, presupuesto moderado. |
| Producción | Key separada, solo modelos aprobados, gasto monitoreado. |