Gemma 4 E2BをTypeScriptフレームワークにおけるマルチエージェント・コーディネーターとしてテスト

コーディネーター能力のテスト
このテストでは、Gemma 4 E2Bがマルチエージェントシステムにおけるコーディネーター役を処理できるかどうかを評価しました。具体的には、自然言語で与えられた目標を受け取り、タスクグラフに分解し、エージェントを割り当て、ツールを呼び出し、結果を統合する能力を検証しました。
技術的実装
使用されたフレームワークは、OllamaをOpenAI互換API経由で使用するopen-multi-agent(TypeScript、オープンソース)でした。コーディネーターは目標とエージェントリストを受け取り、タイトル、説明、担当者、依存関係を含むJSONタスク配列を出力します。エージェントは、bashやファイル読み書き操作を含むツール呼び出し機能を備えて実行されます。
モデル詳細
Gemma 4 E2B(「Effective 2B」)は、2.3Bの有効パラメータと5.1Bの総パラメータを持っています。追加の約2.8Bパラメータは、140以上の言語とマルチモーダル機能をサポートする埋め込み層に使用されています。
テストシナリオ
与えられた目標は次の通りです:「このマシンのNode.jsバージョン、npmバージョン、OS情報を確認し、短いMarkdownサマリーレポートを/tmp/report.mdに書き込む」
E2Bは正しく以下を実行しました:
- 依存関係(研究者 → 要約者)を持つ2つのタスクに分解
- 各タスクを適切なエージェントに割り当て
- bashを使用してシステムコマンドを実行
- file_writeを使用してレポートを保存
- 最終出力を統合
runTasks()(明示的なパイプライン)とrunTeam()(モデルがすべて自律的に計画)の両方が機能しました。
パフォーマンスと観察結果
16GB RAMのM1マシンでの結果:
- 完全な
runTeam()は約2分かかる - 内部で6〜9回の連続したLLM呼び出し(コーディネーター計画 → 研究者のマルチターンツール使用 → 要約者 → コーディネーター統合)
- M1では呼び出しごとに約10〜15秒
- E2Bはメモリ圧力なしで約3〜4 GB RAMを使用
うまく機能した点:
- JSON出力:コーディネーターはタスク分解のための正しいスキーマを生成しました。フレームワークには、最初に囲みブロックを試し、次に生の配列抽出にフォールバックする寛容なパーシングがあります。
- ツール呼び出し:OpenAI互換エンドポイントを介して機能し、呼び出すタイミングの決定、引数の解析、マルチターン結果の処理を正しく行います。
指摘された制限:
- 出力品質:最終統合における文章の質は、より大きなモデルよりも明らかに劣ります。機能的ではありますが、洗練されていません。
再現手順
ollama pull gemma4:e2b
git clone https://github.com/JackChen-me/open-multi-agent
cd open-multi-agent && npm install
no_proxy=localhost npx tsx examples/08-gemma4-local.tsテストファイルはexamples/08-gemma4-local.tsにあり、約190行です。no_proxy=localhost設定は、HTTPプロキシが設定されている場合にのみ必要です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Zap Code: 子供たちに本物のHTML/CSS/JSを教えるAIコードジェネレーター
Zap Codeは、8歳から16歳の子供向けに、平易な英語の説明から動作するHTML、CSS、JavaScriptを生成します。3つのインタラクションモードを提供し、段階的な複雑化エンジンを備えたサンドボックス化されたiframeで実行されます。

インド市場分析と取引のためのOpenClawスキルサーバー
インド市場向けのオープンソース取引端末がOpenClawスキルサーバーとして統合され、エージェントがHTTP経由で市場データを取得し、マルチエージェント分析を実行できるようになりました。このシステムは、3つのリスクプロファイルにわたるエントリー価格、ストップロス、目標価格を含む構造化された取引計画を提供します。

テンセントのモデルを試用:エージェントワークフローに強く、複雑なコーディングに弱い
Tencentのモデルはエージェントタスクで8/10、幻覚率は低いが、Notion APIスキーマのような複雑なコーディングでは失敗。バックエンドロジックには非推奨。

Pi Coding AgentとQwen 35B Q2:ファイルシステムを外部メモリとして使用し、コンテキストガードを強制する
あるRedditユーザーが、PiコーディングエージェントとQwen 35B Q2_K_XL量子化モデルを組み合わせたスタックを構築。100行以上の編集を拒否し、思考ブロックを2000文字に制限、コンテキスト使用率が65%/80%に達すると監視するガードを実装し、ファイルシステムをモデルのメモリとして扱う(コンテキストウィンドウではなく)。