Claude AIエージェントがシミュレーターを構築、ゲームアルゴリズムを最適化して人間のスコアを上回る

ある開発者が、プログラミングゲーム『The Farmer Was Replaced』において、AIエージェントが人間を上回れるかどうかをテストしました。AIエージェントはグラフィカルインターフェースの直接操作に苦戦するため、戦略として、まずClaudeエージェントのチームに、ゲームの仕組みとルールを完全に再現したPythonベースのシミュレーターを構築させました。シミュレーターが完成したら、2つ目のエージェントチームがそれを使用して、ヒマワリ収穫の最適なアルゴリズムを反復的に発見することに取り組みました。
開発プロセスと課題
プロセスは、Claude Codeの「エージェントチーム」機能を使って簡単な三目並べゲームを構築する実験から始まりました。これは成功し、より複雑な農業プロジェクトへの自信につながりました。しかし、規模を拡大すると課題が生じました:エージェントチームのリーダーがボトルネックとなり、セッショントークンの91%を消費しながら、実際のゲームに対してシミュレーターを調整するための人間のフィードバックを積極的に求めませんでした。この特定のタスクに対してエージェントチームのインフラが過剰に設計され、コストがかかりすぎていることに気づいた開発者は、Cursorとより直接的なプロンプト手法に戻ることで、シミュレーターを無事に完成させました。
結果とアルゴリズムの反復
Claude Opusを一晩中実行させた結果、ヒマワリアルゴリズムの10の段階的に改善された反復が生成されました。これらは、基本的な収穫から、最寄りのタイル選択や蛇行ナビゲーションといった微調整まで多岐に渡りました。最終的な反復では、AIは5分21秒という記録を達成し、開発者の自己ベストを公式に上回り、グローバルリーダーボードで30位にランクインしました。
この実験は、AIにドキュメントとアイデアをテストするためのサンドボックスを提供することで、少なくともこの特定のゲームコンテキストにおけるヒマワリ収穫量の最適化において、人間のプログラマーに取って代わることが可能であることを示しました。
このプロジェクトで作成されたシミュレーターは、他のユーザーがさまざまなAIモデルで使用・テストできるよう公開されています。
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude エンジニアリングコンプライアンス向け:6ヶ月ワークフロー内訳
ある技術系企業が、ClaudeのProjects、Artifacts、制約遵守機能を活用して、顧客向け仕様書でのハルシネーションを回避する方法を紹介。

Claudeを活用したマルチエージェント動画制作パイプライン:スクリプト契約アーキテクチャとリサーチファンアウト
Claudeを使用したマルチエージェントパイプラインが、トピックとペルソナから15〜20分の教育用YouTube動画を生成。クロスチャプターの一貫性を保つためのナラティブコントラクトアーキテクチャと、競合するアウトラインを排除する並列リサーチファンアウトが特徴。

開発者が、GoogleのMV3移行でオリジナルが使えなくなった後、Claudeを使って7日間でChrome拡張機能を再構築
ある開発者が、GoogleのManifest V2からV3への移行で元のバージョンが使えなくなった後、Claudeを使って7日間でChrome拡張機能、API、ウェブサイト、QAエージェントを再構築しました。この拡張機能は21のドメインで実際のAmazon割引を見つけ、最初の1週間で4,000件のインストールを獲得しました。

Claude Opus 4.6がGhidra MCPを使って7分でゲーム認証をリバースエンジニアリング
開発者がClaude Opus 4.6をGhidraのMCPサーバープラグインと組み合わせて使用し、『Command & Conquer: Kane's Wrath』の認証検証方法をリバースエンジニアリングしました。AIはクリーンなバイナリを分析し、検証関数を特定、パッチを作成し、すべての関数とデータ構造の名前を約7分で変更しました。