Kimi K2.7-Code: Open-Source Codierungsmodell mit besserer Token-Effizienz

✍️ OpenClawRadar📅 Veröffentlicht: 13. Juni 2026🔗 Source
Kimi K2.7-Code: Open-Source Codierungsmodell mit besserer Token-Effizienz
Ad

Moonshot AI hat Kimi K2.7-Code veröffentlicht, ein Open-Source-Coding-Modell, das auf Hugging Face unter dem Namespace moonshotai/Kimi-K2.7-Code verfügbar ist. Das Modell ist als image-text-to-text getaggt und verwendet die Transformers-Bibliothek. Es positioniert sich als token-effiziente Alternative für Codegenerierung und -verständnis.

Hauptfunktionen

  • Inferenzanbieter: Novita bietet das Modell mit Live-Status, Tool-Calling-Unterstützung (toolCalling: true) und derzeit nicht verfügbarer strukturierter Ausgabe. Der Durchsatz wird mit 36,1 Token/Sekunde gemessen.
  • Modellarchitektur: Das Modell kommt in 64 Shards (safetensors-Format: model-00001-of-000064.safetensors).
  • Token-Effizienz: Das Modell verwendet eine benutzerdefinierte Chat-Vorlage, die Reasoning-Inhalte bewahrt (preserve_thinking: true) und die Token-Nutzung optimiert, indem es Verlaufs- und Suffix-Nachrichten trennt. Die Vorlage enthält spezielle Tokens wie <|im_user|>, <|im_assistant|> und <|im_system|> für die Rollenverwaltung sowie <think>/</think>-Blöcke, um Gedankengänge zu kapseln.
  • Tool-Calling: Native Unterstützung für Tool-Aufrufe mit strukturierter Argumentformatierung unter Verwendung der Marker <|tool_call_begin|> und <|tool_call_end|>.
  • Community-Engagement: 334 Likes auf Hugging Face, mit 4 HN-Kommentaren und 41 Punkten zum Zeitpunkt der Veröffentlichung.
Ad

Praktische Auswirkungen

Das Vorlagendesign vermeidet explizit das Einbetten von Reasoning-Tokens im Verlauf, wenn preserve_thinking auf false gesetzt ist, wodurch der Kontext-Overhead reduziert wird. Für Entwickler, die KI-Coding-Agenten verwenden, bedeutet dies einen geringeren Token-Verbrauch pro Interaktion – besonders vorteilhaft bei langen Agentenschleifen, in denen Reasoning-Ketten wiederholt werden. Das Tool-Calling-Format ist JSON-konform und lässt sich leicht in bestehende Funktionsaufruf-Pipelines integrieren.

Das Modell ist sofort über Novita nutzbar, und das Hugging-Face-Repository enthält die vollständige Tokenizer-Konfiguration und die Vorlagenquelle.

📖 Vollständige Quelle lesen: HN AI Agents

Ad

👀 Siehe auch