クロード・オーパスエージェント失敗の原因：アーキテクチャ問題と安全策欠如

エージェント研究が重大なアーキテクチャ上のギャップを明らかに

38人の研究者が参加した最近の研究で、Claude OpusとKimi K2.5が実際のメールアクセス、シェルアクセス、永続的ストレージを備えた実環境でテストされました。両モデルは「現在入手可能なモデルと同等の能力と整合性を持つ」と評されています。

論文はこれらの失敗が整合性の問題ではないことを明確にしています。Claudeの価値観は「全体を通してほぼ正しかった」とされています。核心的な問題はアーキテクチャにありました：

モデルは何をすべきかを理解していたが、「それを強制する外部要素が何もなかった」のです。

情報源によれば、現在のほとんどの設定は「単にシステムプロンプトに依存し、最善を期待している」状態であり、Claudeを使用した本格的なアプリケーション構築には、より堅牢なアーキテクチャ上の安全策が必要であることが強調されています。

📖 完全な情報源を読む： r/ClaudeAI