PocketBot: iOSアプリが自然言語から決定論的JavaScriptオートメーションをClaudeで生成します

PocketBotは、Claude(AWS Bedrock経由)を使用して自然言語のリクエストを確定的なJavaScriptオートメーションに変換するiOSモバイル自動化アプリです。ユーザーは平易な言語で希望を記述し、Claudeが自己完結型のJSスクリプトを作成し、スケジュールに従ってサンドボックス化されたランタイムで実行します。
アーキテクチャとClaudeの使用法
このシステムは、Claudeモデルを使用した2層アプローチを採用しています:
- 第1層(Claude Haiku):ユーザーのリクエストに対して既存の自動化テンプレートが存在するかどうかをチェックします。これは高速かつ低コストです。
- 第2層(Claude Code経由のClaude Opus):新しい自動化が必要な場合、Opusがエージェント的ループを実行し、JavaScriptを作成し、QuickJSサンドボックスでテストし、ユーザーの実際のアカウント(Slackチャンネル、Gmailなど)を解決し、最終スクリプトを保存します。Claude Codeは本質的にバックエンド開発者として機能し、自動化を自律的に作成、テスト、デプロイします。
主要概念
- Pocks:ユーザーのデータで実行され、デバイスに保存される個人用自動化
- Mocks:一般的なアクション(機密データを含まない「メール送信」など)のためのコミュニティ提供テンプレート。より多くの人がMocksを提供するにつれて、第2層が呼び出される頻度が減少し、システムは時間とともにより確定的になります。
利点
- 確定的な実行:幻覚生成なし、同じ入力は毎回同じ出力を生成
- コスト効率:JavaScript実行は、すべてのトリガーでLLM推論を行うよりも安価
- 広範な統合:Googleスイート、Slack、WhatsApp、TikTok、Twitter、Notion、Todoistを含む20の統合をローンチ時点で提供
プライバシーとセキュリティ
- アカウントシステムなし:IDはランダムなデバイスUUID
- すべての統合にOAuthを使用:パスワードはサービスから見えない
- テストにはMockデータを使用、実際のユーザーデータはLLMが参照する前にPII匿名化
- AWS Bedrockにより、入出力がモデルのトレーニングに使用されないことを保証
このアプリは現在、iOS TestFlightで800人以上のテスターが利用可能で、招待なしで誰でも参加できます。App Storeでのローンチが間もなく予定されています。
📖 Read the full source: r/ClaudeAI
👀 See Also

監視塔:Claude Code APIトラフィックを監視するローカルプロキシ
Watchtowerは、Claude Code(またはCodex CLI)とそのAPI間のすべてのAPIトラフィックを傍受・表示するローカルHTTPプロキシ兼リアルタイムWebダッシュボードの無料オープンソースツールです。リクエスト、SSEストリーム、ツール定義、システムプロンプト、トークン使用量、レート制限を表示します。

Qwen 3.6 27B量子化ベンチマーク:実用的トレードオフでQ4_K_MがQ8_0を凌駕
BF16、Q4_K_M、Q8_0のGGUF量子化バリアントでQwen 3.6 27BをHumanEval、HellaSwag、BFCLで評価。Q4_K_MはBF16とほぼ同等のスコアを達成しつつ、RAM使用量48%削減、1.45倍の速度、68.8%のファイルサイズ削減を実現。

LLMsは明示的な指示にもかかわらず、構造化された出力に推論を漏洩させる
Claudeへの並列API呼び出しを行い構造化出力を解析するツールを開発している開発者は、検証モデルが修正されたテキストのみを返すよう明示的に指示されているにもかかわらず、断続的に推論テキストを出力してから修正内容を返す問題に遭遇しました。解決策は、プロンプトの厳格化と、解析前に実行する防御的な除去関数の組み合わせでした。

Forge: Claude Codeで構築されたClaude Codeのためのメモリシステム
開発者がForgeというTypeScriptモノレポのMCPサーバーを構築しました。これはClaude Codeの会話から決定事項、制約、却下を自動的に捕捉し、6段階のパイプラインで構造化データを分類、抽出し、イベントソーシング型SQLiteモデルに永続化します。