AIエージェントのコスト内訳:ローカルモデルとクラウドAPIで月額12ドル

AIエージェント実行のコスト内訳
ある開発者が、総コスト12ドルでAIエージェントを1ヶ月間稼働させた経験を共有しました。このセットアップでは、ローカルモデル実行にMac MiniとOllamaを使用し、特定のタスクにはクラウドAPIを利用しました。
ソースからの詳細情報
- 総コスト: 1ヶ月間の運用で12ドル
- ローカルモデル使用率: Ollama経由で80%、コスト0ドル
- クラウドAPI使用率: 20%、コスト約12ドル
- タスク量: 1ヶ月間で約800タスク完了
- インフラ: ローカル推論用にOllamaを実行するMac Miniハードウェア
重大なインシデントと対策
単一のリトライループインシデントにより、わずか11分で4.80ドルが消費され、ほぼ全予算を使い切りそうになりました。この経験から、将来同様の暴走コストを防ぐため、すべての操作にサーキットブレーカーを実装することになりました。
開発者はコミュニティに対し、ローカルとクラウドのAI使用におけるコスト追跡について、特に両アプローチの割合について尋ねました。
Ollamaは個人のハードウェア上で大規模言語モデルをローカル実行するツールで、APIコストを排除できますが、十分な計算リソースが必要です。言及されたMac Miniは、ローカルAIワークロードにおいて性能とエネルギー効率のバランスを提供します。この文脈でのサーキットブレーカーは、過剰なコストの蓄積を防ぐためのプログラミングパターンを指し、過負荷を防ぐ電気回路のブレーカーに似ています。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

大学院生、Claudeを活用してAI画像検出実験を構築
ニュースクール大学の大学院生がClaudeと協力してInPixelsWeTrust.orgというウェブサイトを構築し、ユーザーが6ラウンドで10秒の判断時間内に本物の写真とAI生成画像を見分けられるかをテストする実験を行いました。

マルチエージェント設定が幻覚ループにより3,400ドルの請求を引き起こす
ある開発者が、マルチエージェントMCPセットアップのテスト中に、企業の仮想カードを環境変数にハードコードした結果、プライマリエージェントが幻覚ループに陥り、14時間にわたり45秒ごとに新しい有料プロキシインスタンスを起動し続け、3,400ドルの請求が発生しました。

開発者がClaudeでAIテキストベースゲームを作るプロセス
開発者が、ClaudeのようなAIモデル上でネイティブに動作するテキストベースゲームを作成するワークフローを共有しています。ファイルの調和、ルールの洗練、ゲームをPDFプロンプトとしてパッケージ化する手法を含みます。彼らはStarCraftをテーマにしたテキストRTS「Kreep」をリリースしました。

Claudeの無料版を使ってNotionの研究データベースを自動更新する
開発者がClaudeの無料版を使用して、Notionデータベースに研究を自動的に構造化して保存するシステムを構築しました。このワークフローは生の研究ノートを取り込み、一貫したフィールド、カテゴリー、要約を持つ構造化されたデータベースエントリーにフォーマットします。