Kimi K2.6 vs Claude Opus 4.7: Minetest Bounty Board Modを使った実機テスト

奇妙なコーディングタスクにおける2つのモデルの興味深い実世界比較:TypeScriptバックエンドでMinetest/Luantiのバウンティボードゲームmodを構築し、さらにComposioを介したGoogle Sheetsログで拡張。両モデルに同じプロンプトが与えられました。詳細はソース記事をご覧ください。
セットアップ
- Claude Opus 4.7:Claude Code経由
- Kimi K2.6:OpenCode on OpenRouter経由
- タスク:プレイヤーがワールドに参加し、
/bountyを実行し、タスクを取得し、完了し、報酬を受け取り、バックエンドが完了を記録。2番目のテスト:Composioを介してGoogle Sheetsに完了を記録。
料金
- Opus 4.7:入力$5/百万トークン、出力$25/百万トークン
- Kimi K2.6:入力$0.95/百万トークン、出力$4/百万トークン(キャッシュ入力$0.16/百万トークン)
テスト1:ローカルバウンティボード
Opus 4.7:クリーンなMVP。Express/Zod/Vitestバックエンド、Lua mod、/bountyフロー、報酬、リーダーボード、テスト合格。統計:
- コスト:約$3.59
- 時間:API 12分、実時間23分
- コード:+1,688 / -0
- 出力トークン:54.8k
- キャッシュ読み取り:2.8M
Kimi K2.6:ローカルボードも動作したが、より乱雑。Opusの1,688行に対して4,671行のコードを記述(+4,671 / -0)— 2倍以上のコード量。コスト:約$0.39。時間:約9分27秒。厄介な点:Minetestの設定。グローバル設定にsecure.http_mods = bountykimiと記述したが、異なるmod名のワールドレベル設定を作成したため、HTTP APIが実行中のmodで有効にならなかった。テスト担当者が30分以上かけてデバッグ。
テスト2:Composio + Google Sheets
Opus 4.7:Google Sheets同期が動作。tsx watchと環境変数読み込みに関するやり取りの後、バックエンドがバウンティを完了してSheetsに追加できるようになった。統計:
- コスト:$16.03
- 時間:API 28分、実時間1時間17分
- コード:+1,848 / -507
- キャッシュ読み取り:22.3M
- 出力:123.3kトークン
Kimi K2.6:失敗。開発サーバーの問題、テスト、ビルド問題で行き詰まり。Composio統合を動作状態にできず。約25分と135k+トークンの後、テスト担当者が中止。コスト:約$5.03。
結論
- 最良のローカルMVP:Opus、しかしKimiははるかにコストパフォーマンスが良い
- 最良の実際の統合:Opusが圧倒的
- よりクリーンなコード:Opus
- より安価な実験モデル:Kimi
テストにより、Kimi K2.6はより安価なローカルコーディングタスクには興味深いことが示されました。0.39ドルで動作するLua+TypeScript modを入手できるのは悪くありません。しかし、タスクに外部ツール、設定の問題、実際の統合作業が含まれると、Opus 4.7が明らかに優れていました。
コミット、スクリーンショット、デモ、コストを含む完全な内訳はソースリンクをご覧ください。
📖 完全なソースを読む: r/ClaudeAI
👀 See Also

クアンブル収束プロトコル v5:クロスアーキテクチャLLM実験結果
クアンブル収束プロトコルv5は、独立したLLMインスタンスが無意味語を与えられたとき、音韻的プライミングだけでは予測できないほどの特異性を持つ想像上の生物の記述に収束するかどうかを検証する再現可能な実験です。結果として、Claude(Opus 4.6 & Sonnet 4.6)とGPT-5.3の両方が、単語「quumble」から、小さくて丸く、柔らかく、薄紫色で、生物発光し、ハミングする生物を独立して生成しました。

Claude-Code v2.1.38 リリース:主要な修正と改善点
Claude-Code v2.1.38は、VS Codeターミナルのリグレッション、Tabキーの問題、bashコマンドの権限修正に対応しています。また、ヒアドキュメントの解析とサンドボックスモードのセキュリティも改善されています。

OpenAIのサム・アルトマンは、Anthropicの国防総省に対する「レッドライン」を支持し、技術的保護措置を提案している。
OpenAIのCEOサム・アルトマンは、大量監視や自律兵器へのAI利用に対するAnthropicの倫理的立場を支持しつつ、クラウド限定展開などの技術的保護措置を解決策として提案した。

OpenClaw: r/clawdbotでの初めてのAMAに飛び込もう
エキサイティングなAMAセッションで、OpenClawチームはRedditのr/clawdbotでAIコーディングエージェントの未来について議論しました。このインタラクティブなイベントから得られた主要な洞察と要点をご紹介します。