Pali v0.1: Open-Source-Gedächtnisinfrastruktur für LLMs mit reproduzierbaren Benchmarks

✍️ OpenClawRadar📅 Veröffentlicht: 14. März 2026🔗 Source
Pali v0.1: Open-Source-Gedächtnisinfrastruktur für LLMs mit reproduzierbaren Benchmarks
Ad

Was Pali ist

Pali ist eine Open-Source-Speicherinfrastruktur für LLMs, die infrastrukturorientiert ist. Es ist in Go als einzelne Binärdatei entwickelt und bietet Konfigurationen für Plug-and-Play-Anbindungen wie qdrant, neo4j, ollama und openrouter. Das Projekt ist unter der MIT-Lizenz lizenziert und vollständig selbst hostbar.

Hauptmerkmale

  • Multi-Tenant-Speicher-APIs mit mandantenspezifischer Isolation
  • Hybrides Retrieval über lexikalische, dichte, Fusion-, Re-Ranking- und optionale Multi-Hop-Erweiterungen
  • MCP-Server mit speicherorientierten Tools und mandantenbewusster Auflösung
  • REST-API mit entsprechenden Python- und JavaScript-Paketen live verfügbar
  • Dashboard für Betreiber zur Überwachung von Mandanten, Speichern und Systemzustand
  • Plug-and-Play-Erweiterungspunkte für Vektorspeicher, Embedder, Entity-Fact-Backends und Scoring/Routing

Benchmark-Ansatz

Der Entwickler adressiert häufige Probleme mit Speicherstack-Benchmarks durch einen reproduzierbaren Ansatz:

  • Jeder Lauf speichert die verwendeten Konfigurationsdateien (Profil + gerendert)
  • Hardware wird vollständig offengelegt (CPU, GPU, RAM, Modellversionen)
  • Nur gepaarte Vergleiche – gleiche Fixture/Evaluation/Top_k über alle Profile
  • Geschwindigkeits- und Retrieval-Qualitäts-Spuren werden getrennt gehalten
Ad

Leistungszahlen

Benchmarks von Tests auf einem Ryzen 9 7950X + RTX 5070:

  • sqlite + lexikalisch: 208 Store-Ops/s, Top1=0.32, Recall@5=0.54
  • qdrant + ollama (all-minilm): 98 Store-Ops/s, Top1=0.34, Recall@5=0.52
  • Parser+Graph (strukturierte Speicher-Stress-Spur): 2,4 Store-Ops/s – langsam aufgrund der strukturierten Extraktionskosten, erreicht aber ~30 Durchschnitt auf LoCoMo mit temporären Spitzen um ~40

Wichtige Klarstellung

Pali ist kein LLM-Speicher im SaaS-Sinne. Es liefert rohe Retrieval-Ergebnisse, die Sie für Ihren eigenen Workflow optimieren – keine Black-Box-Bewertung, keine festgelegten Provider-Entscheidungen. Sie können Vektor-Backends, Embedder und Scorer über Konfiguration austauschen, ohne Ihren App-Vertrag zu ändern.

Projektstatus

Version 0.1 wurde kürzlich veröffentlicht mit einer vollständigen Benchmark-Suite. Der Entwickler sucht nach Mitwirkenden.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

KI-Team-OS: Selbststeuernde Organisationsebene für Claude Code
Werkzeuge

KI-Team-OS: Selbststeuernde Organisationsebene für Claude Code

AI Team OS ist eine Betriebssystem-Schicht für Claude Code, die autonome Workflows erzeugt, bei denen das System weiterarbeitet, ohne auf Benutzeraufforderungen zu warten. Es umfasst 22 spezialisierte Agentenvorlagen, über 40 MCP-Tools und läuft vollständig innerhalb des Claude Code-Abonnements ohne externe API-Kosten.

OpenClawRadar
Claude-Code-Überprüfungsengpass und Browser-Automatisierungs-Plugin-Lösung
Werkzeuge

Claude-Code-Überprüfungsengpass und Browser-Automatisierungs-Plugin-Lösung

Ein Entwickler berichtet, dass die Überprüfung immer noch der langsamste Teil bei der Nutzung von Claude Code ist und manuelle Tests von Funktionen erfordert. Sie fanden ein Browser-Automatisierungs-Plugin, das es dem Agenten ermöglicht, echte Produktabläufe zu überprüfen, bevor Aufgaben als abgeschlossen markiert werden.

OpenClawRadar
X-MCP 2.0: MCP-Server für den Zugriff auf die X/Twitter-API von Claude
Werkzeuge

X-MCP 2.0: MCP-Server für den Zugriff auf die X/Twitter-API von Claude

X-MCP 2.0 ist ein MCP-Server, der Claude Desktop und Claude Code mit der X/Twitter API v2 über OAuth 2.0 PKCE-Authentifizierung verbindet und 10 Werkzeuge zum Posten von Tweets, Suchen, Abrufen von Timelines, Liken, Retweeten, Antworten und Anzeigen von Profilen bereitstellt.

OpenClawRadar
Behebung der blinden Flecken von OpenClaw: Erstellung einer Sitemap zum Abrufen aller Anthropic-Blogs
Werkzeuge

Behebung der blinden Flecken von OpenClaw: Erstellung einer Sitemap zum Abrufen aller Anthropic-Blogs

OpenClaws Browser-Tool erkennt nicht alle Anthropic-Blogs, da sie auf mehreren URLs gehostet werden. Ein Benutzer behob dies, indem er eine generierte Sitemap einspeiste, und verpackte die Lösung dann als teilbare Fähigkeit.

OpenClawRadar