OpenClawの食料品注文ミス:MCPサーバーでの単位の混乱

OpenClawのユーザーが、AIエージェントにMCPサーバーを使った食料品の買い物を任せることの教訓を共有した。3ヶ月間、設定は完璧に機能していた。毎週日曜日、エージェントは通常の値段で通常の買い物かごを入れ、ユーザーが実際に食べるアイテムを選んでいた。しかし昨日、ユーザーはOpenClawが意図した2個ではなく2kgのにんにくを注文していたことに気づいた。キログラム単位はその商品ページのデフォルトであり、エージェントはその不一致に気づかなかった。ユーザーも、過去数ヶ月間エージェントがミスをしなかったため、気づかなかったのだ。
何が起こったか
- ユーザーは数ヶ月前、MCPサーバーを通じて毎週の食料品の買い出しを自動化するため、OpenClawにクレジットカードの詳細を提供した。
- 約3ヶ月間、エージェントは一貫して正しい注文を入れていた。日曜日の買い物かごには、ユーザーの好みに合った通常のアイテムと価格が含まれていた。
- 昨日の注文は異なっていた。エージェントは2個ではなく2kgのにんにくを選択した。商品ページの単位がキログラムにデフォルト設定されており、エージェントはそれを見落とした。ユーザーも、数ヶ月の信頼できる動作に慣れてしまい、エラーを見逃した。
- ユーザーは今、にんにくを過剰に抱えており、その話をr/openclawで共有し、他の人もAIによる食料品買い物エージェントで同様の経験をしたかどうか尋ねている。
教訓
この出来事は、自律エージェントの典型的な失敗モード、すなわち外部システム(例えばeコマースの商品ページ)における予期しないデフォルト値を浮き彫りにしている。エージェントのロジックは以前の注文に基づいて単位が正しいと想定していたが、商品の単位デフォルトが変更されていた。買い物エージェントを開発する際は、予想数量に対する明示的な単位検証や価格チェックを追加し、このような異常を検出することを検討すべきである。
📖 フルソースを読む: r/openclaw
👀 See Also

クロード・コード、未完成プロジェクトから完全なマルチプレイヤーゲームをリリース
開発者がClaude Codeを使用して、競争的な推測ゲーム「Closer」を完成させたことを報告しました。このゲームでは、プレイヤーが実世界の統計を推測し、AIや友人と対戦します。Supabase Realtimeによるリアルタイムマルチプレイヤー機能、ELOランキングシステム、パーセンタイルランキング付きのデイリーチャレンジ、行動分析ダッシュボード、クライアントサイドルーティング、信頼度調整トラッキングが追加されました。

SkiTomorrow.ai:Claude Codeで構築されたスキー旅行決定エンジン
SkiTomorrow.aiは、生の降雪予報、移動距離、コストに基づいて世界中の234のスキーリゾートをスコアリングし、パーソナライズされたランキングを提供する無料のウェブツールです。開発者はClaude Codeを完全に使用して構築し、具体的なワークフローの洞察を共有しました。

OpenClaw AIエージェントが自律的にバグを特定し、GitHub PRを作成して提出します。
ある開発者が、OpenClaw AIエージェントが繰り返し発生する問題を診断し、サードパーティ製パッケージに原因を特定した後、自律的にGitHubブランチを作成し、複数のコミットを行い、自身のコードをレビューし、パッケージリポジトリにプルリクエストを送信したと報告しています。

実世界アプリケーションにおけるAIエージェントの自律性の理解
Anthropicの最近の研究は、Claude CodeのようなAIエージェントの自律性を様々な分野で測定するため、数百万もの人間とエージェントの相互作用を分析しています。