プロジェクトレジャー:AIコーディングエージェントのためのヒューマン・イン・ザ・ループ記憶システム

GitHubプロジェクト「project-ledger」は、AIコーディングエージェントがコードベースについて記憶する内容を人間が管理するためのヒューマン・イン・ザ・ループシステムを提供します。その核心的な課題は、エージェントが何が重要かを判断できないことです。実装上のバグとアーキテクチャ上の欠陥を同じように扱い、何を変更したかではなく、何が重要かを記録します。
仕組み
このシステムには3つの主要な構成要素があります:
- YAML台帳 - 要約、信頼度レベル、タグ、相互参照を含む構造化されたエントリ
/ledgerスキル - エントリを公開し、Haiku監査人を自動的に起動して客観的にレビューする- UserPromptSubmitフック - すべてのプロンプトに対してTF-IDF検索を実行し、エージェントが思考を開始する前に一致するエントリを自動的に注入する
このフックは重要です。これがないと、ただYAMLを無意味に書いているだけになります。ソースで指摘されているように:「エージェントは指示されなければ参照ドキュメントを読みません。このフックはすべてのプロンプトで実行され、台帳を検索し、エージェントが思考を開始する前に関連するエントリを注入します。」
実用例
作成者は実際の使用例を説明しています:組み込みプロジェクトの色レンダリング問題を修正して数週間後、「以前にこれを修正したときのことを覚えている?」とエージェントに尋ねました。フックは、低い値での8ビット量子化が色忠実度を損なうという正確なエントリを表示しました。根本原因、閾値、影響を受けるコンポーネントを含みます。
比較とアプローチ
OpenVikingと比較すると、このシステムは手作業を必要としますが、よりシンプルなアーキテクチャを持っています:バックエンドなしで、YAMLファイルとシェルフックだけです。その哲学は、洞察が得にくいプロジェクトでは、何を引き継ぐかを人間が決定すべきだというものです。
このシステムは、AIエージェントがコードベースで操作する際の技術的負債の蓄積を防ぐように設計されています。適切な文脈なしでは、各変更が正しく行うのが難しくなります。
📖 完全なソースを読む: r/ClaudeAI
👀 See Also

Claudeランク:AI検索可視性監査のためのClaudeコードプラグイン
Claude-rankは、AI検索可視性の技術的基盤を監査する無料のClaude CodeプラグインおよびCLIツールです。技術的SEO、AI引用可能性スコアリング、AIボット向けクローラビリティチェック、および可視性問題の自動修正を扱います。

OpenClawギルド:チーム向けマルチユーザーAIエージェントサーバー
OpenClaw Guildは、単一ユーザー向けのOpenClawを、ロールベースのアクセス制御、エージェントごとのデータ分離、4階層のメモリシステムを備えたマルチユーザーAIサーバーに拡張します。Web管理ダッシュボードとDocker-composeによるデプロイメントを含み、15分でセットアップ可能です。

マルチエージェント俳句システム、複素数理論問題でClaude Opusと同等の性能を15分の1のコストで達成
Redditでの実験では、2つの俳句エージェントシステム(生成器+監査役)が、難しいフェルマーの小定理の証明においてClaude Opus 4.5と同一の4/4スコアを達成し、1クエリあたり約0.004ドル(Opusは0.06ドル)のコストで済むことが示されました。

Qwen 3.6 27B量子化ベンチマーク:実用的トレードオフでQ4_K_MがQ8_0を凌駕
BF16、Q4_K_M、Q8_0のGGUF量子化バリアントでQwen 3.6 27BをHumanEval、HellaSwag、BFCLで評価。Q4_K_MはBF16とほぼ同等のスコアを達成しつつ、RAM使用量48%削減、1.45倍の速度、68.8%のファイルサイズ削減を実現。