OmniCoder-9B: Ein 9-Milliarden-Parameter-Codierungsagent, feinabgestimmt auf 425.000 agentische Trajektorien

Tesslate hat OmniCoder-9B veröffentlicht, ein 9-Milliarden-Parameter-Modell für Coding-Agenten, das auf der hybriden Architektur von Qwen3.5-9B feinabgestimmt wurde. Die Architektur verwendet Gated Delta Networks, die mit Standard-Attention verschachtelt sind.
Trainingsdaten und Quellen
Das Modell wurde mit über 425.000 kuratierten agentischen Coding-Trajektorien trainiert, die reale Softwareentwicklungsaufgaben abdecken. Die Trainingsdaten wurden speziell aus agentischen und codierenden Denkpfaden von Claude Opus 4.6 erstellt und zielen auf Gerüstmuster von:
- Claude Code
- OpenCode
- Codex
- Droid
Der Datensatz umfasst erfolgreiche Trajektorien von Modellen wie Claude Opus 4.6, GPT-5.4, GPT-5.3-Codex und Gemini 3.1 Pro.
Hauptmerkmale
- Trainiert mit Spitzen-Agenten-Trajektorien: Basierend auf agentischen Coding-Trajektorien von Claude Opus 4.6, GPT-5.3-Codex, GPT-5.4 und Gemini 3.1 Pro über Claude Code, OpenCode, Codex und Droid Gerüsten
- Hybride Architektur: Übernimmt Qwen3.5's Gated Delta Networks, verschachtelt mit Standard-Attention für effiziente Langkontextverarbeitung
- 262K Nativer Kontext: Volles 262.144 Token Kontextfenster, erweiterbar auf 1M+
- Fehlerbehebung: Lernt Lesen-vor-Schreiben-Muster, reagiert auf LSP-Diagnosen und wendet minimale Edit-Diffs anstatt vollständiger Neuschreibungen an
- Denkmodus: Unterstützt <think>...</think> Denkketten für komplexe Problemzerlegung
- Apache 2.0: Vollständig offene Gewichte, keine Einschränkungen
Agentisches Verhalten
Das Modell zeigt starkes agentisches Verhalten, das direkt von den realen Agenten-Trajektorien gelernt wurde, mit denen es trainiert wurde. Es erholt sich von Fehlern durch Lesen-vor-Schreiben-Muster, reagiert auf LSP-Diagnosen und verwendet korrekte Edit-Diffs anstatt vollständiger Neuschreibungen.
Das Modell ist verfügbar unter https://huggingface.co/Tesslate/OmniCoder-9B.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

audio-analyzer-rs: Ein MCP-Server zur Audioanalyse mit Claude
Ein Entwickler hat audio-analyzer-rs erstellt, einen MCP-Server in Rust, der Claude direkten Zugriff auf Audioanalyse ermöglicht, einschließlich Spektral-, Harmonik-, Rhythmus-, LUFS-Lautstärke- (EBU R128) und Dynamikbereichsmessungen. Das Tool ist token-effizient, wobei Claude mit niedriger Auflösung beginnt und bei Bedarf auf kleine Ausschnitte zoomt.

ToolLoop: Open-Source Agenten-Framework für Claude-ähnliche Tools mit beliebigen Modellen
ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen mitten im Gespräch mit gemeinsamem Kontext.

MCP-Server fügt Claude Code persistenten Speicher mit Abruf-Bewertung hinzu
Ein Entwickler hat einen MCP-Server namens engram-mcp erstellt, der Claude Code persistenten Speicher über Sitzungen und Projekte hinweg ermöglicht, mit automatischer Abrufbewertung basierend auf Erfolgsergebnissen und Erkennung von Wissensverfall.

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %
Ein Entwickler hat einen Kontext-Engine-MCP-Server erstellt, der Claude Code einen Abhängigkeitsgraphen von Codebasen bereitstellt und so die Token-Nutzung zunächst um 65 % reduziert. Eine neue Single-Call-Pipeline senkt die Token weiter um 74 %, indem sie mehrere Roundtrips eliminiert und Ergebnisse serverseitig dedupliziert.