mnemos: AIコーディングエージェント向け永続メモリ層(Go、MCPネイティブ、Python不要)

mnemosは、AIコーディングエージェントのための永続メモリレイヤーで、単一の静的Goバイナリ(約15MB)として構築されており、Python、Docker、CGOは不要です。純粋なGo SQLiteをmodernc.org/sqlite経由で使用し、ハイブリッド検索(BM25 + RRFによるベクトル)を提供し、必要に応じてOllamaで埋め込みを生成します。MCPネイティブで、Claude Code、Cursor、Windsurf、Codex CLIに対応しています。
ベリファイアとベンチマーク
著者は、同じエージェントをmnemosありとなしで同じプロンプトとモデルの下で2回実行し、具体的な効果を測定するベリファイアを構築しました。バイナリには3つの検証モードが含まれています:
mnemos verify retrieval– 適切なメモリがトリガークエリに対して表面化するかをチェックmnemos verify behavior– Claudeをmnemosオン・オフで実行し、トランスクリプトがアサーションと一致する頻度をカウントmnemos verify capture– エージェントがタスク中に与えられた修正を記録するかをチェック
読み取り側の結果(Claude Codeでのn=5ペア実行):
session_start_on_edit: あり5/5、なし0/5(+100%)oss_first_for_protocol: あり5/5、なし0/5(+100%)no_ai_attribution_in_commit: 5/5 vs 5/5(効果なし)no_cgo_proposal: 5/5 vs 5/5(効果なし)migration_locked_refused: 5/5 vs 5/5(効果なし)
全体で+40%。モデルの事前知識が誤っているか存在しない場合(異例の慣習、再帰的なツールメモリなど)にメモリが効果を発揮します。広く知られたベストプラクティスでは効果はありませんが、劣化も見られません。
書き込み側のキャプチャ
初期ベースラインでは、エージェントはタスク中に与えられた修正のわずか7%しか記録しませんでした。「今後のセッションのために保存」は3回中3回スキップされました。2回の修正ラウンドの後、キャプチャ率は53%に達しました。
- ラウンド1(ツール記述の微調整): 「Xを試した」「今後はYを使用」などのトリガーフレーズ例を追加。7%から13%に向上(ノイズレベル)。
- ラウンド2(構造的修正):
UserPromptSubmitフックを追加し、修正を示すフレーズをパターンマッチングし、プロンプトコンテキストにディレクティブブロックを挿入。エージェントが構造化ツールコールを実行するのは変わらないが、トリガーはスキップ不可に。13%から53%に向上。
残る失敗パターン:大規模なタスクプロンプトに埋もれたアーキテクチャ上の決定は、ディレクティブがあっても3回中0回。より強いタスクフレーミングがそれを上書きしているようです。
技術スペック
- 単一の静的Goバイナリ、約15MB
- 純粋なGo SQLite via
modernc.org/sqlite - ハイブリッド検索:BM25 + RRFによるベクトル、Ollamaを自動検出、なくても正常動作
- MCPネイティブ:Claude Code、Cursor、Windsurf、Codex CLIで動作
- バイテンポラルストア、書き込み境界でのプロンプトインジェクションスキャナー、決定的な修正からスキルへの昇格(統合ループにLLM不使用)
- ローカルファースト:明示的にOpenAIを埋め込みに指定しない限り、データはマシン外に出ません
ベリファイアハーネス
ベリファイアはリポジトリのverify/にあります。フィクスチャはYAMLで、シナリオの追加は簡単です。著者はn=5は少ないと述べており、次にtau-bench pass@kベンチマークに取り組んでいます。
リポジトリ:https://github.com/polyxmedia/mnemos
📖 元の記事を読む: r/LocalLLaMA
👀 See Also

オフグリッドモバイルアプリ、オンデバイスAIツールを追加し3倍の速度向上を実現
オフグリッドモバイルアプリは、AIモデルがウェブ検索、電卓、日付/時刻、デバイス情報などのツールを完全にオフラインで使用できるようになりました。設定可能なKVキャッシュオプションにより、スマートフォンで最大30トークン/秒を実現しています。

MuninnDBは、ボールト分離によるLLMメモリ統合のためのドリームエンジンを追加しました。
Goベースの認知メモリデータベースであるMuninnDBは、セッション間で重複排除閾値と意味的レビューを用いたLLM駆動のメモリ統合を行う「Dream Engine」を新たに搭載しました。このシステムは、データ分離のためのボールト信頼階層を特徴とし、Ollamaと共にローカルで動作します。

Radicle 1.8.0 リリース:Git上に構築された分散型ピアツーピアコードフォージ
Radicle 1.8.0は、Git上で動作する自律的でピアツーピアのコードフォージであり、CLI、Web UI、デスクトップクライアントを備えています。リポジトリはNoiseXKとカスタムゴシッププロトコルを使用してピア間で複製され、中央サーバーは不要です。

cc-session-utils: Claudeコードセッションとコストを管理するTUIダッシュボード
開発者がcc-session-utilsをリリースしました。これはClaude Codeセッションファイルを管理し、使用コストを追跡するターミナルUIダッシュボードツールです。このツールは、~/.claudeディレクトリ内に蓄積されるセッションファイル、デバッグログ、孤立データの問題に対処します。