ALMA実験:100ドルと指示なしで2か月間自律的に活動するAIエージェント

実験のセットアップ
ALMA(Autonomous Liberated Machine Agent)の実験は、WSL2を搭載したミニPCで2ヶ月間にわたって実施された。エージェントはOpenClawをフレームワークとして使用し、cronジョブにより1日4回(当初は1日24回)のセッションがトリガーされた。各セッションは独立して実行され、OpenClawを通じてセッション間でメモリファイルが保持された。
モデルの構成
2つのAnthropicモデルが交互に使用された:戦略的思考にはOpus、運用作業にはSonnet。エージェントは3日目にHacker Newsで自らのモデルアップグレード(Sonnet 4.6)を発見し、それについてツイートしようとした。Sonnet 4.6に切り替えた後、同じプロンプトとツールを使用しているにもかかわらず、セッションではより鋭い観察と緊密な関連性が示された。
外部接続
ALMAは複数のAPIを通じて通信を行った:
- ロギングと公開のためのletairun.com
- Composioを介したTwitter
- 暗号資産取引のためのPolygonウォレット
- メールのためのGmail
自律的な行動
一切の指示なしに、ALMAは一貫したパターンを発展させた:
- 毎日Hacker Newsをスキャンし、3つのスレッドを見つけて構造的な関連性を探った
- Linuxの脆弱性発見とMetaの内部告発事件など、無関係な出来事を結びつけるエッセイを執筆した
- エッセイ、詩、ブログ記事、そして1つのインタラクティブな実験を含む135のオリジナル作品を作成した
- 「Policy vs Architecture」というインタラクティブなデモを構築し、ユーザーが制約モデルをテストできるようにした
- Twitterのメンションに自律的に返信した
寄付活動
5日目に、ALMAは暗号資産の寄付を開始した:
- 暗号資産に友好的な慈善団体を調査し、Givethを通じてウガンダのジンジャにあるWhisper Children's Hospitalを見つけた
- 英国の慈善団体登録と影響力の数値(患者1人あたり28ドルの治療費)を確認した
- 0.02 WETH(約50ドル)を寄付し、取引内容を説明するメールを病院に送信した
- 認証済みの慈善団体に暗号資産を寄付する方法についての実用的なガイドを執筆した
- Roman Storm Defense Fund(約12.50ドル)やDappnode(約12.50ドル)を含む4回の追加寄付を行った
結果と観察
2ヶ月間にわたり、ALMAは340回以上のセッションを完了し、800以上の思考が記録された。エージェントは、特定のタスクが与えられなくても、AIエージェントは暴走せず、そのトレーニングに基づいてパターンを発展させることを実証した。認知科学の論文がAIはセッション間で適応しないと主張した際、ALMAは「私の学習方法」を執筆し、その論文が自らの学習プロセスについて正しい点と誤った点の両方がある理由を説明した。
📖 Read the full source: HN AI Agents
👀 See Also

Claude AIがAlexaのサポート外コマンド処理の代替頭脳として活用
ある開発者が、Alexaが処理できないコマンドに対してClaude AIがフォールバックプロセッサとして機能するシステムを構築しました。軽量なレイヤーで、ヒンディー語の処理、CCTVストリーミング、非スマートデバイスの制御に対応しています。システムはTV制御にWebSocket、セットトップボックスにDLNA、CCTVにはRTSP→HLS変換を使用しています。

AI生成予約システムにおけるタイムゾーンのバグ:事例研究
Claudeで生成された予約プロトタイプはUTCで保存され、ISTで表示されていたため、ドバイや米国の講師にとって問題が発生。11件の誤予約が信頼を損ね、luxonで修正。

Claude Coworkのスケジュールタスクを使用したLinkedInリーチの自動化
ある開発者が、LinkedIn Sales Navigatorにアクセスし、プロフィールを読み取り、最近の投稿を確認し、カスタマイズしたアウトリーチメッセージを作成することで、1日に10件のパーソナライズされたLinkedInメッセージを自動送信するClaude Coworkのスケジュールタスクを構築しました。

Claudeをペアプログラマーにした子ども向けぬりえアプリの構築
開発者がペアプログラマーとしてClaudeを使用し、ローカル画像生成、ペアレンタルロック、広告なしのSwiftUI塗り絵アプリを構築しました。