Kimi K2.6 vs Claude Opus 4.7: Praxistest eines Minetest-Bounty-Board-Mods

✍️ OpenClawRadar📅 Veröffentlicht: 5. Mai 2026🔗 Source
Kimi K2.6 vs Claude Opus 4.7: Praxistest eines Minetest-Bounty-Board-Mods
Ad

Interessanter realer Vergleich zweier Modelle bei einer ungewöhnlichen Codieraufgabe: Bauen eines Minetest/Luanti-Bounty-Board-Spielmods mit einem TypeScript-Backend, dann Erweiterung um Google-Sheets-Protokollierung über Composio. Beide Modelle erhielten die gleichen Prompts. Details aus dem Quellbeitrag.

Setup

  • Claude Opus 4.7: via Claude Code
  • Kimi K2.6: via OpenCode auf OpenRouter
  • Aufgabe: Spieler tritt Welt bei, führt /bounty aus, erhält Aufgabe, erledigt sie, erhält Belohnung, Backend zeichnet Abschluss auf. Zweiter Test: Abschlüsse via Composio in Google Sheets protokollieren.

Preise

  • Opus 4.7: 5 $/M Eingabe, 25 $/M Ausgabe
  • Kimi K2.6: 0,95 $/M Eingabe, 4 $/M Ausgabe (Cache-Eingabe 0,16 $/M)

Test 1: Lokales Bounty-Board

Opus 4.7: Sauberes MVP. Express/Zod/Vitest-Backend, Lua-Mod, /bounty-Ablauf, Belohnungen, Bestenliste, Tests bestanden. Statistiken:

  • Kosten: ~3,59 $
  • Zeit: 12 min API, 23 min gesamt
  • Code: +1.688 / -0
  • Ausgabetokens: 54,8k
  • Cache-Lesevorgänge: 2,8M

Kimi K2.6: Das lokale Board funktionierte auch, aber chaotischer. Schrieb 4.671 Codezeilen (+4.671 / -0) im Vergleich zu Opus' 1.688 – über 2× mehr Code. Kosten: ~0,39 $. Zeit: ~9 min 27 s. Der lästige Teil: Minetest-Konfiguration. Es schrieb secure.http_mods = bountykimi in die globale Konfiguration, erstellte aber eine weltweite Konfiguration mit einem anderen Mod-Namen, sodass die HTTP-API für den laufenden Mod nicht aktiviert war. Der Tester brauchte über 30 Minuten zur Fehlersuche.

Ad

Test 2: Composio + Google Sheets

Opus 4.7: Google-Sheets-Synchronisation funktionierte. Nach etwas Hin und Her bezüglich tsx watch und Umgebungsvariablen-Ladens konnte das Backend eine Belohnung abschließen und in Sheets anhängen. Statistiken:

  • Kosten: 16,03 $
  • Zeit: 28 min API, 1 h 17 min gesamt
  • Code: +1.848 / -507
  • Cache-Lesevorgänge: 22,3M
  • Ausgabe: 123,3k Tokens

Kimi K2.6: Fehlgeschlagen. Blieb bei Dev-Server-Problemen, Tests und Build-Problemen hängen. Hat die Composio-Integration nie in einen funktionierenden Zustand gebracht. Nach ~25 min und 135k+ Tokens brach der Tester ab. Kosten: ~5,03 $.

Fazit

  • Bestes lokales MVP: Opus, aber Kimi bietet viel besseres Preis-Leistungs-Verhältnis
  • Beste echte Integration: Opus bei weitem
  • Saubererer Code: Opus
  • Günstigeres Experimentiermodell: Kimi

Tests zeigen, dass Kimi K2.6 für günstigere lokale Codieraufgaben interessant ist – für 0,39 $ einen funktionierenden Lua+TypeScript-Mod zu bekommen, ist nicht schlecht. Aber sobald die Aufgabe externe Werkzeuge, Konfigurationsprobleme und echte Integrationsarbeit umfasste, war Opus 4.7 klar überlegen.

Die vollständige Aufschlüsselung mit Commits, Screenshots, Demos und Kosten finden Sie im Quelllink.

📖 Vollständige Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Pentagon übermittelt Anthropic letztes Angebot für militärische KI-Nutzung im Streit
Nachrichten

Pentagon übermittelt Anthropic letztes Angebot für militärische KI-Nutzung im Streit

Das Pentagon hat Anthropic ein endgültiges und bestes Angebot für die uneingeschränkte militärische Nutzung seines Claude-KI-Modells übermittelt, mit einer Frist bis Freitag, um vollen Zugriff zu gewähren, andernfalls droht der Verlust von Militärgeschäften und die Einstufung als Lieferkettenrisiko.

OpenClawRadar
Claude Code v2.1.154: Opus 4.8, dynamische Workflows und wichtige Fehlerbehebungen
Nachrichten

Claude Code v2.1.154: Opus 4.8, dynamische Workflows und wichtige Fehlerbehebungen

Das neue Release bringt Opus 4.8 mit Standard-Hohem-Aufwand, dynamische Workflows zur Orchestrierung von Dutzenden bis Hunderten von Agents, einen schnellen Modus zum doppelten Tarif für 2,5-fache Geschwindigkeit und über ein Dutzend Fehlerbehebungen.

OpenClawRadar
Claude.ai, API und Claude Code verzeichnen erhöhte Fehlerraten
Nachrichten

Claude.ai, API und Claude Code verzeichnen erhöhte Fehlerraten

Claude.ai, die Claude API und Claude Code verzeichnen derzeit erhöhte Fehlerraten, wobei die Web-Oberfläche und die Entwicklerkonsole ausgefallen sind. Die Anmeldung bei Claude Code über Claude.ai funktioniert nicht, obwohl bereits angemeldete Nutzer es weiterhin verwenden können.

OpenClawRadar
Anthropic trennt Claude-Abonnements von der Nutzung von Drittanbieter-Tools.
Nachrichten

Anthropic trennt Claude-Abonnements von der Nutzung von Drittanbieter-Tools.

Anthropic beendet ab dem 4. April die Abdeckung von Claude Pro/Team-Abonnements für die Nutzung über OpenClaw und verlangt separate Pay-as-you-go-Abrechnungen für Drittanbieter-Tools. Benutzer müssen in ihren Kontoeinstellungen 'zusätzliche Nutzung' aktivieren, um Claude weiterhin über OpenClaw zu verwenden.

OpenClawRadar