Pali v0.1: 再現可能なベンチマークを備えたLLM向けオープンソースメモリ基盤

Paliとは
Paliは、インフラストラクチャファーストのオープンソースLLMメモリ基盤です。Goで構築されたシングルバイナリとして提供され、qdrant、neo4j、ollama、openrouterなどのプラグアンドプレイアタッチメントの設定が可能です。プロジェクトはMITライセンスで、完全にセルフホスティングできます。
主な機能
- テナントスコープの分離を備えたマルチテナントメモリAPI
- 語彙検索、密ベクトル検索、融合検索、再ランキング、オプションのマルチホップ拡張を横断するハイブリッド検索
- メモリファーストツールとテナント対応解決を備えたMCPサーバー
- 対応するPythonおよびJavaScriptパッケージがライブで利用可能なREST API
- テナント、メモリ、システム状態を監視するためのオペレータ向けダッシュボード
- ベクトルストア、埋め込みモデル、エンティティファクトバックエンド、スコアリング/ルーティングのためのプラグアンドプレイ拡張ポイント
ベンチマーク手法
作成者は、メモリスタックのベンチマークに関する一般的な問題に対処するため、再現可能な手法を実装しています:
- 各実行で使用された正確な設定ファイル(プロファイル+レンダリング済み)を保存
- ハードウェアを完全に開示(CPU、GPU、RAM、モデルバージョン)
- ペア比較のみ — すべてのプロファイルで同じフィクスチャ/評価/top_kを使用
- 速度レーンと検索品質レーンは分離して保持
パフォーマンス数値
Ryzen 9 7950X + RTX 5070でのテスト結果:
- sqlite + 語彙検索:208 store ops/s、Top1=0.32、Recall@5=0.54
- qdrant + ollama(all-minilm):98 store ops/s、Top1=0.34、Recall@5=0.52
- パーサー+グラフ(構造化メモリストレスレーン):2.4 store ops/s — 構造化抽出コストにより低速だが、LoCoMoでは平均約30、一時的なピークは約40程度
重要な明確化
PaliはSaaS的な意味でのLLMメモリではありません。独自のワークフローに最適化するための生の検索結果を返します — ブラックボックススコアリングやロックされたプロバイダ決定はありません。アプリケーションの契約を変更することなく、設定を通じてベクトルバックエンド、埋め込みモデル、スコアラーを交換できます。
プロジェクト状況
バージョン0.1が最近公開され、適切なベンチマークスイートが追加されました。作成者は貢献者を募集しています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Pleng:AI駆動のインフラ管理を備えたセルフホスト型クラウドプラットフォーム
Plengは、AGPL-3.0ライセンスのセルフホスト型クラウドプラットフォームで、AIエージェント(現在はClaude)を使用してTelegramボットコマンドでインフラストラクチャを管理します。GitHubリポジトリまたはローカルディレクトリから自動化されたTraefikルーティング、Let's Encrypt SSL、基本分析機能を備えたデプロイを実現します。

OpenClaw Budget Guard Pluginは、同時予算超過支出を防止します。
新しいOpenClawプラグイン「@runcycles/openclaw-budget-guard」は、アトミックな残高チェック、実行前の予約、冪等性のあるリトライを実装することで、同時実行時の予算超過問題を解決します。Redisを備えたCyclesサーバーが必要で、bashコマンドからインストールできます。
コラボレート:マルチエージェントハンドオフを用いた構造化・非同期ドキュメント作成のためのClaude Codeスキル
「Collaborate」というClaude Codeスキルは、複数の寄稿者が別々のClaude会話でドキュメントを共同執筆する際の調整問題を解決します。各参加者はClaudeからプレーンな英語で、前回の変更内容やその意図、次に必要な作業について説明を受け、並行セクション、構造化された批評、Slack/Signal通知をサポートします。

tmuxを使用してヘッドレスClaude Codeチャンネルを管理するTelegram Bot
依存関係ゼロのPython製Telegramボットで、ヘッドレスサーバー上のtmuxセッションでClaude Code Channelsを起動、停止、監視し、ウォッチドッグによる自動再起動も可能。