Documentación
FAQ: ¿Qué modelo debería elegir primero? en la documentación de NexoRouter.
FAQ: ¿Qué modelo debería elegir primero?
Empieza con un modelo chat rápido y de bajo costo mientras validas base URL, API key, model ID y Usage Logs. Pasa a un modelo más grande o caro solo después de confirmar que la integración funciona.
Opciones iniciales
| Necesidad | Empieza con | Por qué |
|---|---|---|
| Check de setup API | deepseek-v4-flash | Primera solicitud rápida y de bajo costo; útil para loops de agentes. |
| Funciones generales de app | gpt-4o-mini | Generación de texto, extracción y flujos de soporte equilibrados. |
| Salida multilingüe | Qwen/Qwen-Plus | Buena opción inicial para prompts en inglés, español y chino. |
Copia siempre el model ID actual desde Models. No dependas de capturas antiguas, docs de proveedores o memoria.
Checklist de selección
- Elige el modelo más barato que pueda completar la tarea.
- Confirma que aparece en
GET /v1/models. - Confirma que el alcance de modelos de la API key incluye ese modelo.
- Ejecuta un request pequeño sin streaming.
- Revisa Usage Logs para costo, latencia, estado y request ID.
- Solo entonces prueba prompts más grandes, herramientas agénticas o tráfico de producción.
Cuándo cambiar de modelo
| Síntoma | Prueba |
|---|---|
| Calidad de texto insuficiente | Un modelo chat más fuerte desde Models. |
| Latencia demasiado alta | Un modelo más rápido o prompt más corto. |
| Costo demasiado alto | Un modelo más barato y max_tokens menor. |
| Ediciones agénticas fallan | Un modelo con mejor comportamiento de tool use y nueva prueba en una rama desechable. |
model_not_found | Copia el model ID exacto y revisa alcance de modelos de la key. |