Omnicoder-9B パフォーマンスレビュー：速度とツール呼び出し問題

技術概要

Omnicoder-9Bは、Tesslateが開発したQwen 3.5アーキテクチャをベースとしたコード生成特化モデルです。Qwen3.5 9Bをベースに、Opus 4.6、GPT 5.4、GPT 5.3 Codex、Gemini 3.1 Proなど複数のモデルの出力を用いてファインチューニングされています。

性能特性

このモデルは中級ハードウェアで強力な性能を発揮します。12GBのVRAMでは、コンテキストサイズを100kに設定しても、一貫して15トークン/秒の生成速度を維持します。プロンプト処理は約265トークン/秒と特に高速です。システムクラッシュや性能劣化を引き起こすことなく動作します。

制限と問題点

速度面での利点にもかかわらず、Omnicoder-9Bは実践的なコーディングシナリオでいくつかの制限を示します：

ワンショットプロンプトでスタンドアロンHTMLファイル内の完全なスーパーマリオクローンを生成できなかった
MCPサーバーとのツール呼び出しに失敗し、データ取得中にMCPエラーが発生した
Claude Codeからの書き込みツール呼び出しの実行に問題がある（互換性要因が関与している可能性あり）

IDE統合テスト

開発環境でのテストでは、以下のような結果が得られました：

LM StudioとRoo Codeでのテスト：トークンサイズが4kに増加すると切断が発生（統合問題であり、モデル固有の問題ではないと思われる）
トークンサイズ2-3kの範囲では、小さなスクリプトの更新・書き込みに成功
4kを超えるトークンではエラーメッセージなしにAPIリクエストが失敗
Claude Codeでのテスト：Roo Codeと比較してトークン生成が遅く感じられ、出力生成後の書き込みツール呼び出しの実行に失敗

ユーザーは、Continueや他のテスト済みオプションの中で、ローカルLLM用の拡張機能としてはRoo Codeが最も効果的だったと述べています。

📖 Read the full source: r/LocalLLaMA

Omnicoder-9B パフォーマンスレビュー：速度 vs. ツール呼び出しの問題

技術概要

性能特性

制限と問題点

IDE統合テスト

👀 See Also

バーンスタイン：検証とモデルポリシーを備えたAIコーディングエージェント向けKubernetes風オーケストレーター

Nudge: コンテキストトリガーを通じてClaude生成の計画を表示するローカルファーストアプリ

ブラウザネイティブのリアルタイムコヒーレンス制御システム for Claude with SDEバンドおよびカルマンフィルタリング

オープンソースのClaudeコードプラグインによるエージェント型コマースプロトコル