Kimi K2.6 vs Claude Opus 4.7: Praxistest eines Minetest-Bounty-Board-Mods

Interessanter realer Vergleich zweier Modelle bei einer ungewöhnlichen Codieraufgabe: Bauen eines Minetest/Luanti-Bounty-Board-Spielmods mit einem TypeScript-Backend, dann Erweiterung um Google-Sheets-Protokollierung über Composio. Beide Modelle erhielten die gleichen Prompts. Details aus dem Quellbeitrag.
Setup
- Claude Opus 4.7: via Claude Code
- Kimi K2.6: via OpenCode auf OpenRouter
- Aufgabe: Spieler tritt Welt bei, führt
/bountyaus, erhält Aufgabe, erledigt sie, erhält Belohnung, Backend zeichnet Abschluss auf. Zweiter Test: Abschlüsse via Composio in Google Sheets protokollieren.
Preise
- Opus 4.7: 5 $/M Eingabe, 25 $/M Ausgabe
- Kimi K2.6: 0,95 $/M Eingabe, 4 $/M Ausgabe (Cache-Eingabe 0,16 $/M)
Test 1: Lokales Bounty-Board
Opus 4.7: Sauberes MVP. Express/Zod/Vitest-Backend, Lua-Mod, /bounty-Ablauf, Belohnungen, Bestenliste, Tests bestanden. Statistiken:
- Kosten: ~3,59 $
- Zeit: 12 min API, 23 min gesamt
- Code: +1.688 / -0
- Ausgabetokens: 54,8k
- Cache-Lesevorgänge: 2,8M
Kimi K2.6: Das lokale Board funktionierte auch, aber chaotischer. Schrieb 4.671 Codezeilen (+4.671 / -0) im Vergleich zu Opus' 1.688 – über 2× mehr Code. Kosten: ~0,39 $. Zeit: ~9 min 27 s. Der lästige Teil: Minetest-Konfiguration. Es schrieb secure.http_mods = bountykimi in die globale Konfiguration, erstellte aber eine weltweite Konfiguration mit einem anderen Mod-Namen, sodass die HTTP-API für den laufenden Mod nicht aktiviert war. Der Tester brauchte über 30 Minuten zur Fehlersuche.
Test 2: Composio + Google Sheets
Opus 4.7: Google-Sheets-Synchronisation funktionierte. Nach etwas Hin und Her bezüglich tsx watch und Umgebungsvariablen-Ladens konnte das Backend eine Belohnung abschließen und in Sheets anhängen. Statistiken:
- Kosten: 16,03 $
- Zeit: 28 min API, 1 h 17 min gesamt
- Code: +1.848 / -507
- Cache-Lesevorgänge: 22,3M
- Ausgabe: 123,3k Tokens
Kimi K2.6: Fehlgeschlagen. Blieb bei Dev-Server-Problemen, Tests und Build-Problemen hängen. Hat die Composio-Integration nie in einen funktionierenden Zustand gebracht. Nach ~25 min und 135k+ Tokens brach der Tester ab. Kosten: ~5,03 $.
Fazit
- Bestes lokales MVP: Opus, aber Kimi bietet viel besseres Preis-Leistungs-Verhältnis
- Beste echte Integration: Opus bei weitem
- Saubererer Code: Opus
- Günstigeres Experimentiermodell: Kimi
Tests zeigen, dass Kimi K2.6 für günstigere lokale Codieraufgaben interessant ist – für 0,39 $ einen funktionierenden Lua+TypeScript-Mod zu bekommen, ist nicht schlecht. Aber sobald die Aufgabe externe Werkzeuge, Konfigurationsprobleme und echte Integrationsarbeit umfasste, war Opus 4.7 klar überlegen.
Die vollständige Aufschlüsselung mit Commits, Screenshots, Demos und Kosten finden Sie im Quelllink.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

Pentagon übermittelt Anthropic letztes Angebot für militärische KI-Nutzung im Streit
Das Pentagon hat Anthropic ein endgültiges und bestes Angebot für die uneingeschränkte militärische Nutzung seines Claude-KI-Modells übermittelt, mit einer Frist bis Freitag, um vollen Zugriff zu gewähren, andernfalls droht der Verlust von Militärgeschäften und die Einstufung als Lieferkettenrisiko.

Claude Code v2.1.154: Opus 4.8, dynamische Workflows und wichtige Fehlerbehebungen
Das neue Release bringt Opus 4.8 mit Standard-Hohem-Aufwand, dynamische Workflows zur Orchestrierung von Dutzenden bis Hunderten von Agents, einen schnellen Modus zum doppelten Tarif für 2,5-fache Geschwindigkeit und über ein Dutzend Fehlerbehebungen.

Claude.ai, API und Claude Code verzeichnen erhöhte Fehlerraten
Claude.ai, die Claude API und Claude Code verzeichnen derzeit erhöhte Fehlerraten, wobei die Web-Oberfläche und die Entwicklerkonsole ausgefallen sind. Die Anmeldung bei Claude Code über Claude.ai funktioniert nicht, obwohl bereits angemeldete Nutzer es weiterhin verwenden können.

Anthropic trennt Claude-Abonnements von der Nutzung von Drittanbieter-Tools.
Anthropic beendet ab dem 4. April die Abdeckung von Claude Pro/Team-Abonnements für die Nutzung über OpenClaw und verlangt separate Pay-as-you-go-Abrechnungen für Drittanbieter-Tools. Benutzer müssen in ihren Kontoeinstellungen 'zusätzliche Nutzung' aktivieren, um Claude weiterhin über OpenClaw zu verwenden.