Omnicoder-9B パフォーマンスレビュー:速度 vs. ツール呼び出しの問題

技術概要
Omnicoder-9Bは、Tesslateが開発したQwen 3.5アーキテクチャをベースとしたコード生成特化モデルです。Qwen3.5 9Bをベースに、Opus 4.6、GPT 5.4、GPT 5.3 Codex、Gemini 3.1 Proなど複数のモデルの出力を用いてファインチューニングされています。
性能特性
このモデルは中級ハードウェアで強力な性能を発揮します。12GBのVRAMでは、コンテキストサイズを100kに設定しても、一貫して15トークン/秒の生成速度を維持します。プロンプト処理は約265トークン/秒と特に高速です。システムクラッシュや性能劣化を引き起こすことなく動作します。
制限と問題点
速度面での利点にもかかわらず、Omnicoder-9Bは実践的なコーディングシナリオでいくつかの制限を示します:
- ワンショットプロンプトでスタンドアロンHTMLファイル内の完全なスーパーマリオクローンを生成できなかった
- MCPサーバーとのツール呼び出しに失敗し、データ取得中にMCPエラーが発生した
- Claude Codeからの書き込みツール呼び出しの実行に問題がある(互換性要因が関与している可能性あり)
IDE統合テスト
開発環境でのテストでは、以下のような結果が得られました:
- LM StudioとRoo Codeでのテスト:トークンサイズが4kに増加すると切断が発生(統合問題であり、モデル固有の問題ではないと思われる)
- トークンサイズ2-3kの範囲では、小さなスクリプトの更新・書き込みに成功
- 4kを超えるトークンではエラーメッセージなしにAPIリクエストが失敗
- Claude Codeでのテスト:Roo Codeと比較してトークン生成が遅く感じられ、出力生成後の書き込みツール呼び出しの実行に失敗
ユーザーは、Continueや他のテスト済みオプションの中で、ローカルLLM用の拡張機能としてはRoo Codeが最も効果的だったと述べています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

バーンスタイン:検証とモデルポリシーを備えたAIコーディングエージェント向けKubernetes風オーケストレーター
Bernsteinは、AIコーディングエージェントのオーケストレーターであり、エージェント出力の独立検証、モデルポリシー制御、13種類のエージェントアダプター、決定論的なPythonベースのスケジューリングを備えています。このプロジェクトには5000以上のテストがあり、サーキットブレーカー、コスト異常検知、PIIスキャンなどの機能を特徴としています。

Nudge: コンテキストトリガーを通じてClaude生成の計画を表示するローカルファーストアプリ
Nudgeは、Claude、ChatGPT、Notesなどからマークダウン形式の計画を貼り付け、時間、場所、Wi-Fi、非アクティブ、または一回限りのトリガーを設定して、ローカル通知で表示できる無料のiOS/Androidアプリです。データはすべて端末内に保存され、アカウントやサーバーは不要です。

ブラウザネイティブのリアルタイムコヒーレンス制御システム for Claude with SDEバンドおよびカルマンフィルタリング
開発者が、ブラウザ内で完全にClaudeアーティファクトとして動作するリアルタイム一貫性制御システムを構築しました。このシステムは会話を確率過程として扱い、ライブのモンテカルロSDEパス、デュアルカルマンフィルタリング、および行動信号検出を適用しています。

オープンソースのClaudeコードプラグインによるエージェント型コマースプロトコル
OrcaQubitsは、UCP、ACP、AP2、A2Aなどのエージェント型コマースプロトコルを実装した8つのオープンソースClaude Codeプラグインをリリースしました。MITライセンスで提供され、Magento 2、BigCommerce、WooCommerceなどのプラットフォームをサポートしています。