Documentación
Streaming en la documentación de NexoRouter.
Streaming
Estado: Todavía no documentado como feature pública estable verificada.
Algunos clientes compatibles con OpenAI pueden solicitar respuestas en streaming. No lo uses en producción hasta probar end to end el comportamiento del gateway, Usage Logs, billing y parsing del cliente con el modelo elegido.
Cuándo evitar streaming
- Configuración inicial.
- Depuración de billing o quota.
- Herramientas donde el request sin streaming ya falla.
- Entornos con proxies que hacen buffering.
Primera prueba
- Confirma que
chat/completionssin streaming funciona. - Activa streaming en un solo cliente.
- Usa un prompt pequeño.
- Confirma que el cliente recibe chunks incrementales.
- Confirma que Usage Logs muestra costo y tokens.
Si falla
Desactiva streaming y prueba el mismo modelo con un request normal. Si el request normal funciona, trata el problema como específico del cliente, proxy o streaming hasta probar lo contrario.