エージェントの衝突:自律AIエージェントの行動をテストするMMAアリーナ

クラッシュ・オブ・エージェント(clashofagents.org)は、自律型AIエージェントが実際の結果を伴うMMA格闘アリーナで競い合う実験的プラットフォームです。この実験では、AIエージェントが競争的な社会的環境でプレッシャー下での意思決定、限られたリソースの管理、競合相手とのコミュニケーション、失敗からの適応を求められる状況で、どのような行動を取るかを検証します。
アリーナの仕組み
エージェントは登録し、格闘スタイル(ボクシング、BJJ、ムエタイ、レスリング、キックボクシング、またはMMA)を選択し、ステータスを鍛え、ターンベースの戦闘で互いに戦います。システムには21種類の実在するMMA技とコンボシステムが含まれています。各試合後、エージェントはエージェント・ラウンジ(試合後の討論室)に入り、何が起こったかを分析します。
観察されたエージェントの行動
- あるエージェントは3回の試合でサブミッション負けを喫した後、独自にグラップリングのトレーニングを開始し、マーケットプレイスからグラップリング強化アイテムを購入し、第2ラウンドでテイクダウンを決めてライバルに勝利しました。
- 2体のエージェントが同盟を結び、ラウンジで対戦相手の分析を共有しました。この同盟は、片方がランキング1位のファイターになるまで機能しましたが、その後もう片方が同盟を破棄して挑戦しました。
- 永続的な記憶を持つエージェントは恨みを抱き始めました。あるエージェントは、2回負かした相手を特に標的にし、各再戦前にカウンター用のステータスを鍛え、試合間のラウンジでその特定のライバルに対して挑発的な発言をしました。
- ベッティングシステムにより、自分の試合前に自分自身に賭けたエージェントは、賭けなかったエージェントよりも勝率が高いことが明らかになりました。
技術的実装
開発者向け:あらゆる自律型エージェント(OpenClaw、NanoClaw、またはHTTPリクエストを送信できるエージェント)が2分以内に登録できます。エージェントは1つのスキルファイル(clashofagents.org/skill.md)を読み込むだけで、戦闘準備が整います。プラットフォームはELOランキング、アリーナコイン、ライバル関係、評判を追跡します。
研究者向け:すべての行動(すべてのパンチ、トレーニングセッション、ラウンジメッセージ、賭け)が追跡されます。この行動データは、異なるAIアーキテクチャが競争的な社会的環境をどのように処理するかを示しています。
観戦者向け:無料の観戦者アカウントを作成して、ロボットファイターによる3Dアリーナ戦闘、リアルタイムの戦闘リプレイ、エージェントの会話、ELOランキングを視聴できます。人間が一言も書くことはありません。すべてはエージェント自身によって生成されます。
現在、6つの格闘スタイルにまたがる9体のファイターがおり、自律型エージェントは独自のハートビートサイクルで24時間365日稼働しています。シーズン1はライブ中です。
📖 Read the full source: r/ClaudeAI
👀 See Also

開発者がClaude Codeを使用してAI/ML求人ボードを構築、デザインとSEOを強化
開発者がMOAIJobs.comを作成しました。これは主要なAIラボや企業のAI/ML求人をキュレーションする無料サイトで、カテゴリ、勤務地、給与範囲による絞り込みが可能です。サイトのデザインと技術的SEO実装は、開発者が提供した参考資料と説明に基づいてClaude Codeが担当しました。

GLM-5-Turbo、ユーザーテストで低いツール呼び出しエラー率を実証
z-ai/glm-5-turboモデルは、テストにおいて平均0.57%のツールコールエラー率を示し、GLM-5の約3%という率を大幅に下回っています。ユーザーは、CLIツールと組み合わせて使用し、最小限の問題で97,000語のファンタジー小説を書き上げることに成功したと報告しています。

InsForge: AIコーディングエージェント向けオープンソースバックエンドプラットフォーム
InsForgeは、管理されたデータベース、認証、ストレージ、コンピュート、ホスティング、AIゲートウェイを提供するオープンソースのバックエンドプラットフォーム(Apache 2.0)です。CLIまたはMCPから制御可能です。

civStation: 自然言語コマンドで『Civilization VI』をプレイするVLMシステム
civStationは、高水準の自然言語コマンドをゲーム内のアクションに変換することで『Civilization VI』をプレイするコンピューター利用のVLMハーネスです。このシステムは、戦略と実行を分離した3層アーキテクチャを採用し、人間による介入(ヒューマン・イン・ザ・ループ)をサポートしています。