Documentación

Rate Limits en la documentación de NexoRouter.

Rate Limits

Estado: Guardrail estable del gateway.

NexoRouter puede rechazar requests antes de llegar al proveedor cuando el tráfico supera límites de requests por minuto o tokens por minuto.

Códigos

CódigoSignificadoCorrección
rate_limit_exceededDemasiados requests en la ventana actual.Espera, baja concurrencia o encola trabajo.
token_rate_limit_exceededDemasiados tokens estimados en la ventana actual.Reduce prompt o reparte el trabajo en el tiempo.
request_too_largeUn request supera el presupuesto de tokens por minuto.Divide o acorta el request; reintentar igual fallará.

Comportamiento del cliente

Usa retry-after cuando esté presente. No reintentes inmediatamente en bucle cerrado.

Checklist de producción

  • Agrega reintentos limitados con backoff.
  • Limita concurrencia por usuario.
  • Mantén prompts compactos.
  • Usa un modelo más barato o rápido para trabajos de fondo.
  • Vigila Usage Logs por 429 repetidos.

Relacionado

Rate Limits — NexoRouter