Documentación
Rate Limits en la documentación de NexoRouter.
Rate Limits
Estado: Guardrail estable del gateway.
NexoRouter puede rechazar requests antes de llegar al proveedor cuando el tráfico supera límites de requests por minuto o tokens por minuto.
Códigos
| Código | Significado | Corrección |
|---|---|---|
rate_limit_exceeded | Demasiados requests en la ventana actual. | Espera, baja concurrencia o encola trabajo. |
token_rate_limit_exceeded | Demasiados tokens estimados en la ventana actual. | Reduce prompt o reparte el trabajo en el tiempo. |
request_too_large | Un request supera el presupuesto de tokens por minuto. | Divide o acorta el request; reintentar igual fallará. |
Comportamiento del cliente
Usa retry-after cuando esté presente. No reintentes inmediatamente en bucle cerrado.
Checklist de producción
- Agrega reintentos limitados con backoff.
- Limita concurrencia por usuario.
- Mantén prompts compactos.
- Usa un modelo más barato o rápido para trabajos de fondo.
- Vigila Usage Logs por 429 repetidos.