FAQ: ¿Qué modelo debería elegir primero?

Empieza con un modelo chat rápido y de bajo costo mientras validas base URL, API key, model ID y Usage Logs. Pasa a un modelo más grande o caro solo después de confirmar que la integración funciona.

Opciones iniciales

Necesidad	Empieza con	Por qué
Check de setup API	`deepseek-v4-flash`	Primera solicitud rápida y de bajo costo; útil para loops de agentes.
Funciones generales de app	`gpt-4o-mini`	Generación de texto, extracción y flujos de soporte equilibrados.
Salida multilingüe	`Qwen/Qwen-Plus`	Buena opción inicial para prompts en inglés, español y chino.

Copia siempre el model ID actual desde Models. No dependas de capturas antiguas, docs de proveedores o memoria.

Checklist de selección

Elige el modelo más barato que pueda completar la tarea.
Confirma que aparece en GET /v1/models.
Confirma que el alcance de modelos de la API key incluye ese modelo.
Ejecuta un request pequeño sin streaming.
Revisa Usage Logs para costo, latencia, estado y request ID.
Solo entonces prueba prompts más grandes, herramientas agénticas o tráfico de producción.

Cuándo cambiar de modelo

Síntoma	Prueba
Calidad de texto insuficiente	Un modelo chat más fuerte desde Models.
Latencia demasiado alta	Un modelo más rápido o prompt más corto.
Costo demasiado alto	Un modelo más barato y `max_tokens` menor.
Ediciones agénticas fallan	Un modelo con mejor comportamiento de tool use y nueva prueba en una rama desechable.
`model_not_found`	Copia el model ID exacto y revisa alcance de modelos de la key.

FAQ: ¿Qué modelo debería elegir primero?

Opciones iniciales

Checklist de selección

Cuándo cambiar de modelo

Relacionado