Pali v0.1: Infraestructura de Memoria de Código Abierto para LLMs con Puntos de Referencia Reproducibles

✍️ OpenClawRadar📅 Publicado: 14 de marzo de 2026🔗 Source
Pali v0.1: Infraestructura de Memoria de Código Abierto para LLMs con Puntos de Referencia Reproducibles
Ad

Qué es Pali

Pali es una infraestructura de memoria de código abierto para LLMs que prioriza la infraestructura. Está construido en Go como un binario único listo para usar con configuraciones para adjuntos plug and play como qdrant, neo4j, ollama y openrouter. El proyecto tiene licencia MIT y es completamente autoalojable.

Características Clave

  • APIs de memoria multiinquilino con aislamiento por inquilino
  • Recuperación híbrida a través de métodos léxicos, densos, de fusión, reranking y expansión multi-salto opcional
  • Servidor MCP con herramientas centradas en memoria y resolución consciente del inquilino
  • API REST con respectivos paquetes de Python y JavaScript en vivo
  • Panel de control para operadores que inspeccionan inquilinos, memorias y estado del sistema
  • Puntos de extensión plug-and-play para almacenes vectoriales, incrustadores, backends de entidades-hechos y puntuación/enrutamiento

Enfoque de Pruebas Comparativas

El creador aborda problemas comunes con las pruebas comparativas de pilas de memoria implementando un enfoque reproducible:

  • Cada ejecución almacena los archivos de configuración exactos utilizados (perfil + renderizado)
  • El hardware se divulga completamente (CPU, GPU, RAM, versiones del modelo)
  • Solo comparaciones emparejadas — mismo fixture/evaluación/top_k en todos los perfiles
  • Los carriles de velocidad y los carriles de calidad de recuperación se mantienen separados
Ad

Números de Rendimiento

Pruebas comparativas de pruebas en un Ryzen 9 7950X + RTX 5070:

  • sqlite + léxico: 208 operaciones de almacenamiento/s, Top1=0.32, Recall@5=0.54
  • qdrant + ollama (all-minilm): 98 operaciones de almacenamiento/s, Top1=0.34, Recall@5=0.52
  • parser+graph (carril de estrés de memoria estructurada): 2.4 operaciones de almacenamiento/s — lento debido al costo de extracción estructurada, pero alcanza ~30 promedio en LoCoMo con picos temporales alrededor de ~40

Aclaración Importante

Pali no es memoria LLM en el sentido SaaS. Devuelve resultados de recuperación crudos que optimizas para tu propio flujo de trabajo — sin puntuación de caja negra, sin decisiones de proveedor bloqueadas. Puedes intercambiar backends vectoriales, incrustadores y puntuadores a través de la configuración sin cambiar tu contrato de aplicación.

Estado del Proyecto

La versión 0.1 se publicó recientemente con un conjunto de pruebas comparativas adecuado añadido. El creador está buscando colaboradores.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también