Kimi K2.6 vs Claude Opus 4.7: Minetest Mod Praxistest

Interessanter realer Vergleich zweier Modelle bei einer ungewöhnlichen Codieraufgabe: Bauen eines Minetest/Luanti-Bounty-Board-Spielmods mit einem TypeScript-Backend, dann Erweiterung um Google-Sheets-Protokollierung über Composio. Beide Modelle erhielten die gleichen Prompts. Details aus dem Quellbeitrag.

Setup

Claude Opus 4.7: via Claude Code
Kimi K2.6: via OpenCode auf OpenRouter
Aufgabe: Spieler tritt Welt bei, führt /bounty aus, erhält Aufgabe, erledigt sie, erhält Belohnung, Backend zeichnet Abschluss auf. Zweiter Test: Abschlüsse via Composio in Google Sheets protokollieren.

Preise

Opus 4.7: 5 $/M Eingabe, 25 $/M Ausgabe
Kimi K2.6: 0,95 $/M Eingabe, 4 $/M Ausgabe (Cache-Eingabe 0,16 $/M)

Test 1: Lokales Bounty-Board

Opus 4.7: Sauberes MVP. Express/Zod/Vitest-Backend, Lua-Mod, /bounty-Ablauf, Belohnungen, Bestenliste, Tests bestanden. Statistiken:

Kosten: ~3,59 $
Zeit: 12 min API, 23 min gesamt
Code: +1.688 / -0
Ausgabetokens: 54,8k
Cache-Lesevorgänge: 2,8M

Kimi K2.6: Das lokale Board funktionierte auch, aber chaotischer. Schrieb 4.671 Codezeilen (+4.671 / -0) im Vergleich zu Opus' 1.688 – über 2× mehr Code. Kosten: ~0,39 $. Zeit: ~9 min 27 s. Der lästige Teil: Minetest-Konfiguration. Es schrieb secure.http_mods = bountykimi in die globale Konfiguration, erstellte aber eine weltweite Konfiguration mit einem anderen Mod-Namen, sodass die HTTP-API für den laufenden Mod nicht aktiviert war. Der Tester brauchte über 30 Minuten zur Fehlersuche.

Test 2: Composio + Google Sheets

Opus 4.7: Google-Sheets-Synchronisation funktionierte. Nach etwas Hin und Her bezüglich tsx watch und Umgebungsvariablen-Ladens konnte das Backend eine Belohnung abschließen und in Sheets anhängen. Statistiken:

Kosten: 16,03 $
Zeit: 28 min API, 1 h 17 min gesamt
Code: +1.848 / -507
Cache-Lesevorgänge: 22,3M
Ausgabe: 123,3k Tokens

Kimi K2.6: Fehlgeschlagen. Blieb bei Dev-Server-Problemen, Tests und Build-Problemen hängen. Hat die Composio-Integration nie in einen funktionierenden Zustand gebracht. Nach ~25 min und 135k+ Tokens brach der Tester ab. Kosten: ~5,03 $.

Fazit

Bestes lokales MVP: Opus, aber Kimi bietet viel besseres Preis-Leistungs-Verhältnis
Beste echte Integration: Opus bei weitem
Saubererer Code: Opus
Günstigeres Experimentiermodell: Kimi

Tests zeigen, dass Kimi K2.6 für günstigere lokale Codieraufgaben interessant ist – für 0,39 $ einen funktionierenden Lua+TypeScript-Mod zu bekommen, ist nicht schlecht. Aber sobald die Aufgabe externe Werkzeuge, Konfigurationsprobleme und echte Integrationsarbeit umfasste, war Opus 4.7 klar überlegen.

Die vollständige Aufschlüsselung mit Commits, Screenshots, Demos und Kosten finden Sie im Quelllink.

📖 Vollständige Quelle lesen: r/ClaudeAI