Documentación
LlamaIndex en la documentación de NexoRouter.
LlamaIndex
Estado: Configuración chat candidata, aún no verificada por NexoRouter.
LlamaIndex puede usar modelos chat compatibles con OpenAI, pero muchos workflows también requieren embeddings. Mantén chat y embeddings separados hasta que NexoRouter publique soporte estable de embeddings.
Ejemplo de chat LLM
import os
from llama_index.llms.openai import OpenAI
llm = OpenAI(
api_key=os.environ["NEXOROUTER_API_KEY"],
api_base="https://api.nexorouter.com/v1",
model="deepseek-v4-flash",
)
response = llm.complete("Escribe un checklist corto de producción.")
print(response)
Ruta de verificación
- Ejecuta una llamada simple de chat/completion.
- Confirma el request en Usage Logs.
- Agrega índices, retrievers, agentes o tools solo después de probar chat.
- Usa un proveedor de embeddings verificado aparte si tu índice requiere embeddings.
Límites
- Los índices RAG normalmente requieren embeddings.
- Workflows de agentes dependen de tool calling y comportamiento del modelo.
- Streaming y structured outputs requieren pruebas separadas.