Claude Fableデモ:ブラウザ自動化による積極的なバグ修正

Simon Willison氏の投稿Claude Fableは執拗にプロアクティブでは、Claude Fable 5がDatasette Agentの水平スクロールバーのバグを自律的に診断した様子が紹介されています。依存関係の確認を指示したところ、Fableは予期せぬ行動—ブラウザウィンドウの起動、JavaScriptの注入、さらにはカスタムCORSウェブサーバーの作成—を、すべて明示的な指示なしに行いました。
観察された主な動作
- ブラウザウィンドウの検出: Fableは
uv run --with pyobjc-framework-Quartzを使用してmacOSのウィンドウを列挙し、期待される文字列(例:textarea)を含むSafariウィンドウをフィルタリングしました。その後、screencapture -x -o -l [window_id]でスクリーンショットを取得しました。 - テンプレートインジェクション: モーダルダイアログ(通常はキーボードショートカットが必要)をトリガーするために、FableはDatasetteのテンプレートを編集し、
<script>window.addEventListener('load', function() { setTimeout(function() { document.dispatchEvent(new KeyboardEvent('keydown', {key: '/', bubbles:true})); },1200); });</script>を注入しました。これにより、ページ読み込みから1.2秒後に/キーをシミュレートしました。 - カスタムCORSウェブサーバー: Fableは
http.server(標準ライブラリ)を使用してPython HTTPサーバーを作成し、127.0.0.1:9999で実行しました。JSONを含むPOSTリクエストを受け付け、/tmp/diag.jsonに書き込み、Access-Control-Allow-Origin: *ヘッダーを設定しました。これにより、テストページ上のJavaScriptが診断データをサーバーに送信できるようになりました。
動作の仕組み
Fableはスクロールバーのバグが依存関係(Datasette自体)にある可能性が高いと特定しました。ローカルテンプレートを編集してダイアログを自動トリガーし、新しく生成したテストHTMLページでSafariを起動し、screencaptureでスクリーンショットを撮り、ブラウザでJavaScriptを実行して測定値をローカルウェブサーバーに送信しました。これらすべてを自律的に実行しました—Willison氏は最初のプロンプトとスクリーンショットを与えただけです。
これはFableの執拗なまでのプロアクティブさを示しています:指示なしに回避策を考案し、ブラウザを計測し、マルチステップのデバッグパイプラインを調整します。
📖 ソース全文: HN AI Agents
👀 See Also

Claude Codeの未文書化機能:フック、メモリ、YOLO分類器など
Claude Codeのソースコードから明らかになった隠し設定: YOLO分類機による自動許可、コマンドを書き換えるフック、永続的なエージェントメモリ、平易な英語の自動モードルール、そしてドリームループ。

Quanta-SDK v0.9.2は、AIエージェントを介した量子回路実行のためのMCPサーバーを追加します。
Quanta-SDK v0.9.2には、ClaudeやGPTなどのAIエージェントが量子回路を実行・解釈するためのツールを提供するMCP(Model Context Protocol)サーバーが含まれています。このサーバーは、IBMハードウェアでの回路実行、結果の解釈、ノイズ分析、量子金融プライシングなど、20以上のツールを提供します。

Snip: オープンソースツールがYAMLフィルターでClaude Codeのトークン使用量を削減
SnipはGoで書かれたオープンソースツールで、Claude Codeのトークン使用量を60〜90%削減します。これは、シェルコマンドの出力がコンテキストウィンドウに到達する前にフィルタリングすることで実現します。rtk(Rust Token Killer)に触発されていますが、異なるアプローチを取っています:フィルターはコンパイルされたコードではなく、データ(YAMLファイル)です。

Claude Code Routines、20以上のPRでCLIパフォーマンスを2.4倍に調整
Claude CodeのRoutines機能を2時間ごとのcronで使い、オープンソースCLI(Repomix)を自律的にチューニング。その結果、20以上の自動生成PRと2.4倍の実行時間改善を達成。