Claude AIエージェントがゲームで人間超え　5分21秒の最適化結果

ある開発者が、プログラミングゲーム『The Farmer Was Replaced』において、AIエージェントが人間を上回れるかどうかをテストしました。AIエージェントはグラフィカルインターフェースの直接操作に苦戦するため、戦略として、まずClaudeエージェントのチームに、ゲームの仕組みとルールを完全に再現したPythonベースのシミュレーターを構築させました。シミュレーターが完成したら、2つ目のエージェントチームがそれを使用して、ヒマワリ収穫の最適なアルゴリズムを反復的に発見することに取り組みました。

開発プロセスと課題

プロセスは、Claude Codeの「エージェントチーム」機能を使って簡単な三目並べゲームを構築する実験から始まりました。これは成功し、より複雑な農業プロジェクトへの自信につながりました。しかし、規模を拡大すると課題が生じました：エージェントチームのリーダーがボトルネックとなり、セッショントークンの91％を消費しながら、実際のゲームに対してシミュレーターを調整するための人間のフィードバックを積極的に求めませんでした。この特定のタスクに対してエージェントチームのインフラが過剰に設計され、コストがかかりすぎていることに気づいた開発者は、Cursorとより直接的なプロンプト手法に戻ることで、シミュレーターを無事に完成させました。

結果とアルゴリズムの反復

Claude Opusを一晩中実行させた結果、ヒマワリアルゴリズムの10の段階的に改善された反復が生成されました。これらは、基本的な収穫から、最寄りのタイル選択や蛇行ナビゲーションといった微調整まで多岐に渡りました。最終的な反復では、AIは5分21秒という記録を達成し、開発者の自己ベストを公式に上回り、グローバルリーダーボードで30位にランクインしました。

この実験は、AIにドキュメントとアイデアをテストするためのサンドボックスを提供することで、少なくともこの特定のゲームコンテキストにおけるヒマワリ収穫量の最適化において、人間のプログラマーに取って代わることが可能であることを示しました。

このプロジェクトで作成されたシミュレーターは、他のユーザーがさまざまなAIモデルで使用・テストできるよう公開されています。

📖 Read the full source: r/ClaudeAI