Documentación

FAQ: ¿Por qué este modelo costó más de lo esperado? en la documentación de NexoRouter.

FAQ: ¿Por qué este modelo costó más de lo esperado?

El costo depende del modelo elegido, tokens de entrada, tokens de salida y patrón de requests. Usage Logs es la fuente de verdad para costo por request.

Revisa en este orden

  1. Confirma el model ID exacto en Usage Logs.
  2. Revisa prompt tokens y completion tokens.
  3. Revisa si la app hizo retries automáticos.
  4. Revisa si un loop agéntico hizo múltiples requests.
  5. Revisa si max_tokens permitió una respuesta larga.
  6. Compara el modelo contra Pricing.

Causas comunes

CausaSolución
Más output tokens de lo esperadoUsa max_tokens menor durante pruebas.
Loop agéntico o retries de herramientasUsa una key de bajo presupuesto para agentes y revisa Usage Logs.
Una herramienta eligió un modelo caroRestringe el alcance de modelos de la key o configura un solo modelo explícito.
Cadena automática de fallbackEmpieza con un solo modelo hasta entender el costo.
Prompt de contexto largoRecorta input, resume historial o elige modelo de forma intencional.

Setup para controlar costo

EntornoConfiguración recomendada de key
Experimento localBajo presupuesto, uno o pocos modelos de bajo costo.
StagingKey separada, alcance realista, presupuesto moderado.
ProducciónKey separada, solo modelos aprobados, gasto monitoreado.

Relacionado

FAQ: ¿Por qué este modelo costó más de lo esperado? — NexoRouter