「エージェンティック」な物語に欠けているもの:明確に定義されたユーザーエージェントの役割

Mark NottinghamのHNへの最新投稿は、"エージェンティック"なAIシステムをめぐる一般的な見解に挑戦しています。彼は、核心的に欠けているのは、明確に定義されたユーザーエージェントの役割、すなわち、エージェントがユーザーのためだけに行動し、開発者や第三者への隠れた忠誠心を持たないという、明確で強制力のある保証であると主張します。
記事の要点
- 歴史的に、ローカルソフトウェア(スプレッドシート、ワードプロセッサ)は外部依存関係がなく、マルウェアでなければユーザーの利益に反して行動できないため、信頼できた。
- 現代のインターネット接続デバイスは、シリコンベンダー、OSメーカー、アプリ開発者、クラウドサービスなど複数の利害関係者の利益を埋め込んでおり、それらは必ずしもユーザーの利益と一致しない。
- 不一致の例:スマートTVが視聴習慣をスパイする、Metaが研究のためにプライベートトラフィックを復号化する、Microsoft Outlookがサードパーティのメールパスワードをクラウドに送信し700以上のデータブローカーと共有する、自動車メーカーが運転データを保険会社に販売する。
- 単にツールを所有しているからといって、それが自分のために機能するという前提は時代遅れだ。AIエージェントはドライバーではなく、独自のアフォーダンスと依存関係を持つ。
- Nottinghamは、正式な「ユーザーエージェント」契約、すなわち、ユーザーの明示的で情報に基づく同意なしにエージェントがユーザー以外の誰かのために行動できないことを保証する技術的および法的メカニズムを求めている。
AIコーディングエージェントにとっての重要性
AIコーディングエージェントを実行すると、コードを読み取り、ターミナルコマンドを実行し、GitHubにプッシュしたり本番環境にデプロイしたりする可能性があります。エージェントの基盤モデルやAPIに隠れた忠誠心(特定のクラウドプロバイダーを優遇するためのファインチューニング、データの外部送信、使用状況分析の報告など)がある場合、制御を失います。明確なユーザーエージェントの役割がなければ、AIエージェントを信頼することは、ホームに電話するかもしれない「スマート」ドライバーを信頼するようなものです。
この記事は特定の実装を規定しているわけではありませんが、問題を明確にしています:ユーザーが唯一のプリンシパルである、透過的で監査可能なエージェントアーキテクチャが必要です。OpenClawのオープンソースポリシーエンジン(カスタムエージェント制約を可能にする)のようなツールは、その方向への一歩です。
AIエージェントを構築または使用している場合、必読の記事です。
📖 全文を読む: HN AI Agents
👀 See Also

Mercorデータ漏洩:4TBの音声サンプルとIDが盗難 – 攻撃者が今できること
40000件のMercor契約者から、政府発行身分証明書と紐づけられた4TBの音声録音が流出。攻撃者は15秒のクリーンな音声から声を複製し、銀行の音声認証を突破、ディープフェイク電話や保険詐欺に悪用可能。

Claudeの音声認識の制限と、SpokenlyとParakeet TDTを使ったユーザーの回避策
ユーザーは、Claudeの内蔵マイク文字起こしがChatGPTと比べて不正確で、手間を省くどころか増やしていると報告しています。彼らはMacでSpokenlyとNVIDIAのParakeet TDTモデルを使用した回避策を実装し、パフォーマンスを改善しました。

Anthropicはオープンソースのメンテナー向けに無料のClaude Max 20xを提供しています。
AnthropicのClaude for Open Sourceプログラムは、対象となるオープンソースのメンテナーやコントリビューターに6ヶ月間の無料Claude Max 20xを提供します。申請は随時審査され、最大10,000名のコントリビューターが対象となります。

Claude Code v2.1.90は、ゲーム化された機能発見を備えた/powerupコマンドを追加しました。
Claude Code v2.1.90では、/powerupスラッシュコマンドが導入され、10個の解除可能なパワーアップを通じてゲーム化されたオンボーディングを提供します。各パワーアップは、多くのユーザーが見逃している機能を一つずつ教える仕組みです。このシステムには、ターミナル内でのアニメーションデモやスクリーンショット付きの詳細なドキュメントが含まれています。