Documentación

FAQ: ¿Qué modelo debería elegir primero? en la documentación de NexoRouter.

FAQ: ¿Qué modelo debería elegir primero?

Empieza con un modelo chat rápido y de bajo costo mientras validas base URL, API key, model ID y Usage Logs. Pasa a un modelo más grande o caro solo después de confirmar que la integración funciona.

Opciones iniciales

NecesidadEmpieza conPor qué
Check de setup APIdeepseek-v4-flashPrimera solicitud rápida y de bajo costo; útil para loops de agentes.
Funciones generales de appgpt-4o-miniGeneración de texto, extracción y flujos de soporte equilibrados.
Salida multilingüeQwen/Qwen-PlusBuena opción inicial para prompts en inglés, español y chino.

Copia siempre el model ID actual desde Models. No dependas de capturas antiguas, docs de proveedores o memoria.

Checklist de selección

  1. Elige el modelo más barato que pueda completar la tarea.
  2. Confirma que aparece en GET /v1/models.
  3. Confirma que el alcance de modelos de la API key incluye ese modelo.
  4. Ejecuta un request pequeño sin streaming.
  5. Revisa Usage Logs para costo, latencia, estado y request ID.
  6. Solo entonces prueba prompts más grandes, herramientas agénticas o tráfico de producción.

Cuándo cambiar de modelo

SíntomaPrueba
Calidad de texto insuficienteUn modelo chat más fuerte desde Models.
Latencia demasiado altaUn modelo más rápido o prompt más corto.
Costo demasiado altoUn modelo más barato y max_tokens menor.
Ediciones agénticas fallanUn modelo con mejor comportamiento de tool use y nueva prueba en una rama desechable.
model_not_foundCopia el model ID exacto y revisa alcance de modelos de la key.

Relacionado

FAQ: ¿Qué modelo debería elegir primero? — NexoRouter