OmniCoder-9B: 9B Coding Agent Fine-Tuned on 425K Trajectories

Tesslate hat OmniCoder-9B veröffentlicht, ein 9-Milliarden-Parameter-Modell für Coding-Agenten, das auf der hybriden Architektur von Qwen3.5-9B feinabgestimmt wurde. Die Architektur verwendet Gated Delta Networks, die mit Standard-Attention verschachtelt sind.

Trainingsdaten und Quellen

Das Modell wurde mit über 425.000 kuratierten agentischen Coding-Trajektorien trainiert, die reale Softwareentwicklungsaufgaben abdecken. Die Trainingsdaten wurden speziell aus agentischen und codierenden Denkpfaden von Claude Opus 4.6 erstellt und zielen auf Gerüstmuster von:

Claude Code
OpenCode
Codex
Droid

Der Datensatz umfasst erfolgreiche Trajektorien von Modellen wie Claude Opus 4.6, GPT-5.4, GPT-5.3-Codex und Gemini 3.1 Pro.

Hauptmerkmale

Trainiert mit Spitzen-Agenten-Trajektorien: Basierend auf agentischen Coding-Trajektorien von Claude Opus 4.6, GPT-5.3-Codex, GPT-5.4 und Gemini 3.1 Pro über Claude Code, OpenCode, Codex und Droid Gerüsten
Hybride Architektur: Übernimmt Qwen3.5's Gated Delta Networks, verschachtelt mit Standard-Attention für effiziente Langkontextverarbeitung
262K Nativer Kontext: Volles 262.144 Token Kontextfenster, erweiterbar auf 1M+
Fehlerbehebung: Lernt Lesen-vor-Schreiben-Muster, reagiert auf LSP-Diagnosen und wendet minimale Edit-Diffs anstatt vollständiger Neuschreibungen an
Denkmodus: Unterstützt <think>...</think> Denkketten für komplexe Problemzerlegung
Apache 2.0: Vollständig offene Gewichte, keine Einschränkungen

Agentisches Verhalten

Das Modell zeigt starkes agentisches Verhalten, das direkt von den realen Agenten-Trajektorien gelernt wurde, mit denen es trainiert wurde. Es erholt sich von Fehlern durch Lesen-vor-Schreiben-Muster, reagiert auf LSP-Diagnosen und verwendet korrekte Edit-Diffs anstatt vollständiger Neuschreibungen.

Das Modell ist verfügbar unter https://huggingface.co/Tesslate/OmniCoder-9B.

📖 Read the full source: r/LocalLLaMA

OmniCoder-9B: Ein 9-Milliarden-Parameter-Codierungsagent, feinabgestimmt auf 425.000 agentische Trajektorien

Trainingsdaten und Quellen

Hauptmerkmale

Agentisches Verhalten

👀 Siehe auch

audio-analyzer-rs: Ein MCP-Server zur Audioanalyse mit Claude

ToolLoop: Open-Source Agenten-Framework für Claude-ähnliche Tools mit beliebigen Modellen

MCP-Server fügt Claude Code persistenten Speicher mit Abruf-Bewertung hinzu

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %