ÅngstromがClaude Codeを使用してMetaのUMA-OMCを凌ぐモデルを訓練 — スポット上で10万GPUジョブ

Ångstrom AI(YC S24)は、ケンブリッジ大学(Csanyiグループ)およびアストラゼネカと協力し、機械学習原子間ポテンシャルを用いた結晶構造予測におけるDFT精度を発表し、CSP-MACE-Åを導入しました。このモデルは、結晶構造予測(CSP)におけるDFT(密度汎関数理論)を、同一の精度でありながら10,000倍の高速化で代替します。有機分子結晶向けの従来の最先端ML原子間ポテンシャルであるMetaのUMA-OMCを大幅に上回りました。
CSPの重要性
CSPは、分子が形成できるすべての可能な結晶多形を決定します。多形は物理的特性が異なるため、医薬品製造にリスクをもたらします。1998年には、予期せぬリトナビルの多形がアボットに2億5000万ドル以上の損失をもたらしました。DFTはゴールドスタンダードですが、分子あたり数日から数週間かかります。CSP-MACE-Åはそれを数分に短縮し、より多くの候補構造の評価を可能にします。
エージェント駆動の実験ループ
Ångstromの研究者は、Claude Codeを研究アシスタントとして反復ループで使用しました:仮説→実験設計→ジョブ起動→結果分析→次の仮説。Claudeは、チームが手動で使用していたのと同じAnycloud CLIを使用して、計画を具体的な行動に変換しました。ジョブのバッチを起動し、ステータスを監視し、結果をダウンロードし、プロットやサマリーを生成しました。
このループにより、ほぼすべてが自身のクラウドアカウント上のマルチクラウドスポットインスタンスで実行された、約10万件のGPUジョブが生成されました。Claudeは研究上の決定間のファンアウトと管理を処理し、科学者は解釈に集中できました。
Anycloudによるコスト管理
ÅngstromのCTO、ローレンス・ミッジリー氏:「Anycloudのおかげで、計算リソースをすべて使い果たしてしまう心配なく、エージェントを自由に動かす自信がつきました。今では、エージェントは夜通し働き続け、私が眠っている間も研究実験を自律的に管理してくれています。」 AnycloudのCLIとクラウド設定により、実験ループを制御下に置くことができました。これは、間違ったバッチが数千ドルの損失につながりかねない状況では極めて重要です。
ベンチマーク
CSP-MACE-Åは、CSPにおいてDFTレベルの精度を実証した最初のモデルであり、一方UMA-OMCはゴールドスタンダードのDFTには及びませんでした。Ångstromの評価スイート(自社およびアストラゼネカ)により、優位性が確認されました。
📖 全文を読む: HN AI Agents
👀 See Also

CoworkはClaude Opus向けに中程度の努力をハードコードし、ユーザー設定を無視します
Maxプランのユーザーが発見したところによると、Coworkは--effort medium --model claude-opus-4-6をハードコードされたCLIフラグとして渡しており、環境変数やsettings.jsonの上書きを無視しています。これは、ユーザーが高努力レベルと100万トークンのコンテキストウィンドウへのアクセスに対して支払っているにもかかわらず、中程度の努力レベルと標準のコンテキストウィンドウに固定されていることを意味します。

Anthropicは、AI制限をめぐる国防総省のブラックリスト指定を防ぐため訴訟を起こす
ロイター通信がHacker Newsで共有した報道によると、AnthropicはAI利用制限をめぐり国防総省によるブラックリスト指定を阻止するため訴訟を起こした。

なぜOpenClawのオープンソースアーキテクチャが重要なのか
なし

AppleのlibibverbsがGPUDirect RDMAシンボルを隠蔽;macOSでゼロコピーMetalバッファRDMAが動作
開発者が、AppleのRDMAサブシステムがMetal GPUバッファをゼロコピーネットワーク転送に受け入れることを発見し、隠されたibv_reg_dmabuf_mrシンボルがmacOSでカーネル修正なしにGPUDirect RDMAが可能であることを示唆していることを発見した。