Documentación

LlamaIndex en la documentación de NexoRouter.

LlamaIndex

Estado: Configuración chat candidata, aún no verificada por NexoRouter.

LlamaIndex puede usar modelos chat compatibles con OpenAI, pero muchos workflows también requieren embeddings. Mantén chat y embeddings separados hasta que NexoRouter publique soporte estable de embeddings.

Ejemplo de chat LLM

import os
from llama_index.llms.openai import OpenAI

llm = OpenAI(
    api_key=os.environ["NEXOROUTER_API_KEY"],
    api_base="https://api.nexorouter.com/v1",
    model="deepseek-v4-flash",
)

response = llm.complete("Escribe un checklist corto de producción.")
print(response)

Ruta de verificación

  1. Ejecuta una llamada simple de chat/completion.
  2. Confirma el request en Usage Logs.
  3. Agrega índices, retrievers, agentes o tools solo después de probar chat.
  4. Usa un proveedor de embeddings verificado aparte si tu índice requiere embeddings.

Límites

  • Los índices RAG normalmente requieren embeddings.
  • Workflows de agentes dependen de tool calling y comportamiento del modelo.
  • Streaming y structured outputs requieren pruebas separadas.

Páginas relacionadas

LlamaIndex — NexoRouter