Pali v0.1: Open-Source-Gedächtnisinfrastruktur für LLMs mit reproduzierbaren Benchmarks

Was Pali ist
Pali ist eine Open-Source-Speicherinfrastruktur für LLMs, die infrastrukturorientiert ist. Es ist in Go als einzelne Binärdatei entwickelt und bietet Konfigurationen für Plug-and-Play-Anbindungen wie qdrant, neo4j, ollama und openrouter. Das Projekt ist unter der MIT-Lizenz lizenziert und vollständig selbst hostbar.
Hauptmerkmale
- Multi-Tenant-Speicher-APIs mit mandantenspezifischer Isolation
- Hybrides Retrieval über lexikalische, dichte, Fusion-, Re-Ranking- und optionale Multi-Hop-Erweiterungen
- MCP-Server mit speicherorientierten Tools und mandantenbewusster Auflösung
- REST-API mit entsprechenden Python- und JavaScript-Paketen live verfügbar
- Dashboard für Betreiber zur Überwachung von Mandanten, Speichern und Systemzustand
- Plug-and-Play-Erweiterungspunkte für Vektorspeicher, Embedder, Entity-Fact-Backends und Scoring/Routing
Benchmark-Ansatz
Der Entwickler adressiert häufige Probleme mit Speicherstack-Benchmarks durch einen reproduzierbaren Ansatz:
- Jeder Lauf speichert die verwendeten Konfigurationsdateien (Profil + gerendert)
- Hardware wird vollständig offengelegt (CPU, GPU, RAM, Modellversionen)
- Nur gepaarte Vergleiche – gleiche Fixture/Evaluation/Top_k über alle Profile
- Geschwindigkeits- und Retrieval-Qualitäts-Spuren werden getrennt gehalten
Leistungszahlen
Benchmarks von Tests auf einem Ryzen 9 7950X + RTX 5070:
- sqlite + lexikalisch: 208 Store-Ops/s, Top1=0.32, Recall@5=0.54
- qdrant + ollama (all-minilm): 98 Store-Ops/s, Top1=0.34, Recall@5=0.52
- Parser+Graph (strukturierte Speicher-Stress-Spur): 2,4 Store-Ops/s – langsam aufgrund der strukturierten Extraktionskosten, erreicht aber ~30 Durchschnitt auf LoCoMo mit temporären Spitzen um ~40
Wichtige Klarstellung
Pali ist kein LLM-Speicher im SaaS-Sinne. Es liefert rohe Retrieval-Ergebnisse, die Sie für Ihren eigenen Workflow optimieren – keine Black-Box-Bewertung, keine festgelegten Provider-Entscheidungen. Sie können Vektor-Backends, Embedder und Scorer über Konfiguration austauschen, ohne Ihren App-Vertrag zu ändern.
Projektstatus
Version 0.1 wurde kürzlich veröffentlicht mit einer vollständigen Benchmark-Suite. Der Entwickler sucht nach Mitwirkenden.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

KI-Team-OS: Selbststeuernde Organisationsebene für Claude Code
AI Team OS ist eine Betriebssystem-Schicht für Claude Code, die autonome Workflows erzeugt, bei denen das System weiterarbeitet, ohne auf Benutzeraufforderungen zu warten. Es umfasst 22 spezialisierte Agentenvorlagen, über 40 MCP-Tools und läuft vollständig innerhalb des Claude Code-Abonnements ohne externe API-Kosten.

Claude-Code-Überprüfungsengpass und Browser-Automatisierungs-Plugin-Lösung
Ein Entwickler berichtet, dass die Überprüfung immer noch der langsamste Teil bei der Nutzung von Claude Code ist und manuelle Tests von Funktionen erfordert. Sie fanden ein Browser-Automatisierungs-Plugin, das es dem Agenten ermöglicht, echte Produktabläufe zu überprüfen, bevor Aufgaben als abgeschlossen markiert werden.

X-MCP 2.0: MCP-Server für den Zugriff auf die X/Twitter-API von Claude
X-MCP 2.0 ist ein MCP-Server, der Claude Desktop und Claude Code mit der X/Twitter API v2 über OAuth 2.0 PKCE-Authentifizierung verbindet und 10 Werkzeuge zum Posten von Tweets, Suchen, Abrufen von Timelines, Liken, Retweeten, Antworten und Anzeigen von Profilen bereitstellt.

Behebung der blinden Flecken von OpenClaw: Erstellung einer Sitemap zum Abrufen aller Anthropic-Blogs
OpenClaws Browser-Tool erkennt nicht alle Anthropic-Blogs, da sie auf mehreren URLs gehostet werden. Ein Benutzer behob dies, indem er eine generierte Sitemap einspeiste, und verpackte die Lösung dann als teilbare Fähigkeit.