OmniCoder-9B:425Kのエージェント軌跡でファインチューニングされた90億パラメータのコーディングエージェント

Tesslateは、Qwen3.5-9Bのハイブリッドアーキテクチャをベースにファインチューニングされた90億パラメータのコーディングエージェントモデル「OmniCoder-9B」をリリースしました。このアーキテクチャは、標準的なアテンションと交互に配置されたゲーテッドデルタネットワークを使用しています。
トレーニングデータとソース
このモデルは、実世界のソフトウェアエンジニアリングタスクにわたる42万5,000以上の厳選されたエージェント的コーディング軌跡でトレーニングされました。トレーニングデータは、Claude Opus 4.6のエージェント的およびコーディング推論トレースから特に構築され、以下のスキャフォールディングパターンを対象としています:
- Claude Code
- OpenCode
- Codex
- Droid
データセットには、Claude Opus 4.6、GPT-5.4、GPT-5.3-Codex、Gemini 3.1 Proなどのモデルからの成功した軌跡が含まれています。
主な特徴
- 最先端エージェント軌跡でのトレーニング:Claude Code、OpenCode、Codex、DroidのスキャフォールディングにわたるClaude Opus 4.6、GPT-5.3-Codex、GPT-5.4、Gemini 3.1 Proのエージェント的コーディング軌跡から構築
- ハイブリッドアーキテクチャ:効率的な長文脈処理のために、標準的なアテンションと交互に配置されたQwen3.5のゲーテッドデルタネットワークを継承
- 262Kネイティブコンテキスト:完全な262,144トークンのコンテキストウィンドウ、100万以上への拡張可能
- エラー回復:書き込み前読み取りパターンを学習し、LSP診断に応答し、完全な書き換えではなく最小限の編集差分を適用
- 思考モード:複雑な問題分解のための<think>...</think>推論チェーンをサポート
- Apache 2.0:完全にオープンな重み、制限なし
エージェント的挙動
このモデルは、トレーニングに使用された実世界のエージェント軌跡から直接学習した強力なエージェント的挙動を示します。書き込み前読み取りパターンを使用してエラーから回復し、LSP診断に応答し、完全な書き換えではなく適切な編集差分を使用します。
このモデルはhttps://huggingface.co/Tesslate/OmniCoder-9Bで利用可能です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

MCPサーバーがClaude Codeに永続メモリと検索スコアリングを追加
開発者が「engram-mcp」というMCPサーバーを構築し、Claude Codeにセッションやプロジェクトを超えた永続的な記憶を提供しています。このシステムは、結果の成功に基づく自動的な検索スコアリングと、古くなった知識の検出機能を備えています。

UnslothとNVIDIA、LLMトレーニングを約25%高速化するために協力
UnslothとNVIDIAがLLMトレーニングの最適化をリリース:パックシーケンスメタデータのキャッシュ(約14.3%高速化)とダブルバッファ非同期勾配チェックポインティング(約8%高速化)、精度低下なし。RTXノートPC、データセンターGPU、DGX Sparkで自動有効化。

Claude Code Handoffのための自動セッション状態管理
GitHubプロジェクトは、Claudeとの会話全体を通じてライブセッション状態ファイル(.claude/session-state.md)を維持する自動化フックを提供し、自動圧縮によるコンテキスト消失や会話中のコンテキスト劣化に対処します。このシステムは、重要なイベントやファイル編集を追跡するためにjqを使用した4つのbashスクリプトを利用しています。

Claude-Code v2.1.111では、Opus 4.7 xhigh effort、/ultrareview、およびPowerShellツールが追加されました。
Claude-Code v2.1.111では、highとmaxの間に位置するOpus 4.7 xhighエフォートレベルを導入し、クラウドベースのマルチエージェントコードレビュー用の/ultrareviewコマンドを追加、WindowsでのPowerShellツールサポートの提供を開始しました。このアップデートには、インタラクティブな/effortコントロール、自動テーママッチング、多数のバグ修正も含まれています。