Claude Opus 4.8 リリース:より高速、より低コストの高速モード、動的ワークフロー、誠実性の向上

Anthropicは本日、Claude Opus 4.8をリリース。Opus 4.7をアップグレードし、コーディング、エージェントスキル、推論、ナレッジワークにおいてベンチマークが向上。新バージョンは従来モデルと同じ価格で利用可能。
主な機能
- 努力量コントロール(claude.ai)— ユーザーがタスクにかけるClaudeの努力量を設定可能に。
- 動的ワークフロー(Claude Code)— 大規模な問題に対応。
- 高速モードが2.5倍の速度で動作し、従来モデルより3倍低価格に。
ベンチマークのハイライト
発表によると、Claude Opus 4.8はAnthropicのSuper-Agentベンチマークで全ケースをエンドツーエンドで完了した唯一のモデルであり、Opus 4.7を上回り、GPT-5.5と同等のコスト。Online-Mind2Web(コンピューター利用・ブラウザエージェントタスク)では84%を達成 — Opus 4.7およびGPT-5.5を大きく上回る。CursorBenchでは、すべての努力レベルでOpus 4.7を上回る結果に。
Legal Agentベンチマークでは、Opus 4.8はall-pass基準で初めて10%を突破。初期テスターからは、ツール呼び出し効率(同知能でステップ数削減)、引用精度、検索ワークフローでのトークン効率の改善も報告。
正直性トレーニング
Opus 4.8は明示的な正直性の改善を導入 — 根拠のない主張を避け、入出力の問題を積極的に指摘するようトレーニング。これにより、テスターの評価で高品質な分析と優れたシグナル・ノイズ比を実現。
価格
Opus 4.8はOpus 4.7と同じ価格。高速モードは従来の3分の1の価格。Genie(DatabricksのAIエージェント)向けマルチモーダルトークンコストはOpus 4.7比61%削減。
📖 出典全文: HN AI Agents
👀 See Also

チューリッヒ工科大学の研究、AIコーディングエージェントにおけるAGENTS.mdファイルの価値に疑問を投げかける
ETHチューリッヒの新研究によると、LLM生成のAGENTS.mdファイルはAIエージェントのタスク成功率を3%低下させ、推論コストを20%以上増加させる一方、人間が作成したファイルはわずか4%の改善しかもたらさず、同様のコスト増加を伴うことが判明しました。

Claude-Code v2.1.84は、PowerShellツール、環境変数、および複数の修正を追加しました。
Claude-Code v2.1.84では、Windows用PowerShellツールのオプトインプレビューが導入され、モデル構成とストリーミングタイムアウトの環境変数が追加され、多数のバグ修正とパフォーマンス改善が含まれています。

分析:AnthropicがClaude Codeユーザーに対して実際に負担している計算コストは、報告されている5,000ドルという数字よりもはるかに低いものです。
最近の記事では、Anthropicの月額200ドルのClaude Code Maxプランが5,000ドルのコンピューティングコストを消費するという主張を分析し、OpenRouterの競合オープンウェイトモデルと比較すると、実際の推論コストはAPI価格の約10%であることを明らかにしています。

PrismMLのBonsai 1-bit Qwenモデルをテスト:8GB VRAMで107 t/sの生成速度を達成
PrismMLのBonsaiモデルは、Qwen3 8B、4B、1.7Bの1ビット量子化バージョンで、RTX 4060(8GB VRAM)上で107トークン/秒の生成速度と>1114トークン/秒のプロンプト処理を実現し、メモリ要件を大幅に削減しています。