LlamaIndex

Estado: Configuración chat candidata, aún no verificada por NexoRouter.

LlamaIndex puede usar modelos chat compatibles con OpenAI, pero muchos workflows también requieren embeddings. Mantén chat y embeddings separados hasta que NexoRouter publique soporte estable de embeddings.

Ejemplo de chat LLM

import os
from llama_index.llms.openai import OpenAI

llm = OpenAI(
    api_key=os.environ["NEXOROUTER_API_KEY"],
    api_base="https://api.nexorouter.com/v1",
    model="deepseek-v4-flash",
)

response = llm.complete("Escribe un checklist corto de producción.")
print(response)

Ruta de verificación

Ejecuta una llamada simple de chat/completion.
Confirma el request en Usage Logs.
Agrega índices, retrievers, agentes o tools solo después de probar chat.
Usa un proveedor de embeddings verificado aparte si tu índice requiere embeddings.

Límites

Los índices RAG normalmente requieren embeddings.
Workflows de agentes dependen de tool calling y comportamiento del modelo.
Streaming y structured outputs requieren pruebas separadas.

LlamaIndex

Ejemplo de chat LLM

Ruta de verificación

Límites

Páginas relacionadas