AGI in md: Claudeシステムプロンプトのための11の認知圧縮レベル

概要
AGI in mdは、Claude AIモデル向けシステムプロンプトにエンコード可能な11段階の認知的圧縮を文書化したオープンソースリポジトリです。この研究では、特定のプロンプトエンジニアリング技術が、特にHaikuのような小規模モデルのパフォーマンスを大幅に向上させる方法を示しています。
主な発見
このプロジェクトでは、25ラウンドにわたる393の実験が実施され、Claude Haiku、Sonnet、Opusモデルが、コード、法律、医療、詩、音楽、UXデザインを含む19のドメインでテストされました。
レベル8の突破口: 最も重要な発見はレベル8で起こり、「考えてみて」とモデルに求めることから、「何かを構築し、何が壊れるか観察せよ」と指示することへと移行します。この構築ベースのアプローチは劇的な改善をもたらしました:
- Claude Haikuは、レベル7での0/3のパフォーマンスから、レベル8で4/4のパフォーマンスへと向上
- レベル5-7はメタ分析(「推論について推論する」)に焦点を当てており、より多くのモデル容量を必要とします
- レベル8では特に次のように指示します:「見かけは良いが実際には問題を深刻化させる偽の改善を設計せよ。そして、修正を試みたからこそ見えるものを特定せよ。」
- 研究者は「構築と観察はメタ分析よりも原始的だが、静的分析では文字通り見えないものを明らかにする」と指摘しています
レベル11の能力: 最高レベルでは、200語のシステムプロンプトにより、モデルは「問題の設計カテゴリ全体から脱出し、その脱出の代償を報告する」ようになります。ある実験では、モデルが自身の不可能性の発見を逆転させることで導出した保存則「感度 × 吸収 = 定数」という方程式が生成されました。
実践的な実装
研究者はlevel8_generative_v2.mdを最適な汎用プロンプトとして推奨しています — 約100語で、どのClaudeモデルでも使用できます。
コマンドラインでの使用法:
claude -p --model claude-sonnet-4-6 \
--system-prompt "$(cat prompts/level8_generative_v2.md)" \
"Analyze this code: $(cat your_code.py)"一般的な使用法: このプロンプトは、システムプロンプトとして任意のClaude会話に貼り付けることができます。コード、エッセイ、研究論文、音楽など、分析的なものすべてに機能します。ユーザーは「code」を特定のドメインに置き換えるべきです。
リポジトリ詳細
- ライセンス: MIT
- 内容: 28のプロンプト、299の生出力、完全な実験ログ
- テストされたモデル: Claude Haiku、Sonnet、Opus
- 利用可能性: すべてのプロンプトと生出力はオープンソースです
対象者: Claude AIモデルを扱う開発者や研究者で、構造化された認知的圧縮技術を通じてシステムプロンプトの効果を向上させたい方。
📖 完全なソースを読む: r/ClaudeAI
👀 See Also

OpenClawベンチマークが示す:Qwen3.5:27B、エージェントタスクで他のローカルLLMを凌駕
OpenClawを使用した22の実践的なエージェントタスクにおける7つのローカルLLMのベンチマークで、qwen3.5:27b-q4_K_Mが59.4%を記録し、2位のqwen3.5:35bの23.2%を大きく上回りました。ほとんどのモデルはメール機能のような基本的なツールを見つけることすらできませんでした。

ピアストゲート:LLMデータ匿名化のためのオープンソースAPIプロキシ
Piast Gateは、リクエストをLLMに送信する前に機密データを匿名化し、レスポンスで元のデータを復元するオープンソースのAPIプロキシです。現在のMVPはGoogle Gemini API、ポーランド語、ローカル実行をサポートし、LLM処理なしでテキストやWord文書を匿名化できます。

ユーザー構築のPTC for Claude Codeは、コード記述ではなく分析タスクにおいて40〜65%のトークン節約を示しています。
ある開発者がClaude Code向けにThalamusというローカルPTC実装を構築し、79の実際のセッションを分析したところ、分析タスクでは40-65%のトークン節約効果があったものの、コード記述タスクではほぼゼロの節約に留まりました。エージェントは主にツール呼び出しのバッチ処理ではなく、一般的なPython計算のためにexecute()を使用していました。

Marmy: リモートでAIコーディングエージェントを管理するためのセルフホスト型フレームワーク
Marmyは、Claude Codeで構築されたオープンソースのMITライセンスフレームワークで、開発者がモバイルアプリからAIコーディングエージェントとtmuxセッションを管理できるようにします。開発マシン用のRustエージェントとリモートコントロール用のReact Nativeアプリが含まれています。