Kimi K2.7-Code: Open-Source Codierungsmodell mit besserer Token-Effizienz

Moonshot AI hat Kimi K2.7-Code veröffentlicht, ein Open-Source-Coding-Modell, das auf Hugging Face unter dem Namespace moonshotai/Kimi-K2.7-Code verfügbar ist. Das Modell ist als image-text-to-text getaggt und verwendet die Transformers-Bibliothek. Es positioniert sich als token-effiziente Alternative für Codegenerierung und -verständnis.
Hauptfunktionen
- Inferenzanbieter: Novita bietet das Modell mit Live-Status, Tool-Calling-Unterstützung (
toolCalling: true) und derzeit nicht verfügbarer strukturierter Ausgabe. Der Durchsatz wird mit 36,1 Token/Sekunde gemessen. - Modellarchitektur: Das Modell kommt in 64 Shards (safetensors-Format:
model-00001-of-000064.safetensors). - Token-Effizienz: Das Modell verwendet eine benutzerdefinierte Chat-Vorlage, die Reasoning-Inhalte bewahrt (
preserve_thinking: true) und die Token-Nutzung optimiert, indem es Verlaufs- und Suffix-Nachrichten trennt. Die Vorlage enthält spezielle Tokens wie<|im_user|>,<|im_assistant|>und<|im_system|>für die Rollenverwaltung sowie<think>/</think>-Blöcke, um Gedankengänge zu kapseln. - Tool-Calling: Native Unterstützung für Tool-Aufrufe mit strukturierter Argumentformatierung unter Verwendung der Marker
<|tool_call_begin|>und<|tool_call_end|>. - Community-Engagement: 334 Likes auf Hugging Face, mit 4 HN-Kommentaren und 41 Punkten zum Zeitpunkt der Veröffentlichung.
Praktische Auswirkungen
Das Vorlagendesign vermeidet explizit das Einbetten von Reasoning-Tokens im Verlauf, wenn preserve_thinking auf false gesetzt ist, wodurch der Kontext-Overhead reduziert wird. Für Entwickler, die KI-Coding-Agenten verwenden, bedeutet dies einen geringeren Token-Verbrauch pro Interaktion – besonders vorteilhaft bei langen Agentenschleifen, in denen Reasoning-Ketten wiederholt werden. Das Tool-Calling-Format ist JSON-konform und lässt sich leicht in bestehende Funktionsaufruf-Pipelines integrieren.
Das Modell ist sofort über Novita nutzbar, und das Hugging-Face-Repository enthält die vollständige Tokenizer-Konfiguration und die Vorlagenquelle.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

Forbes: Die KI-Entlassungsrechnung wird fällig — CTOs zahlen doppelt
Forbes argumentiert, dass die Kosten von KI-bedingten Entlassungen Unternehmen doppelt treffen werden: zuerst durch Abfindungen und sinkende Moral, dann durch Wiedereinstellungen, wenn die erwarteten Effizienzgewinne ausbleiben.

Coding Agents ersetzen menschliche Code-Reviews: Studie argumentiert, traditionelle Überprüfung sei tot
Ein arXiv-Papier argumentiert, dass Coding-Agenten die Schwelle zur Ersetzung der menschlichen Code-Überprüfung überschritten haben, mit geringeren Kosten und höherem Durchsatz.

Anthropic beschränkt Claude-Abonnements über Drittanbieter-Schnittstellen wie OpenClaw.
Anthropic beendet ab dem 4. April die Claude-Abonnementabdeckung für Drittanbieter-Tools wie OpenClaw. Nutzer müssen dann eine nutzungsabhängige Zusatznutzung aktivieren, die separat abgerechnet wird. Ein einmaliger Guthaben in Höhe des monatlichen Abonnementpreises ist bis zum 17. April verfügbar.

Anthropic schränkt OpenClaw mit neuem Kreditsystem ein: Details und Auswirkungen
Anthropic drosselt OpenClaw erneut: Ab dem 15. Juni 2026 wird die gesamte programmatische Nutzung in einen separaten Credit-Pool mit monatlichen Obergrenzen, ohne Übertrag und mit API-Überlastungsabrechnung verlagert.