Ångstrom이 Claude Code를 사용해 Meta의 UMA-OMC를 능가하는 모델 훈련 — 스팟 인스턴스에서 10만 GPU 작업 실행

Ångstrom AI (YC S24)는 케임브리지 대학(Csanyi 그룹) 및 AstraZeneca와 협력하여 기계 학습 원자간 포텐셜을 이용한 결정 구조 예측에서 DFT 정확도를 발표하며 CSP-MACE-Å를 소개했습니다. 이 모델은 결정 구조 예측(CSP)에서 DFT(밀도 함수 이론)를 동일한 정확도로 대체하지만 10,000배 빠른 속도를 제공합니다. 유기 분자 결정에 대한 이전 최첨단 기계 학습 원자간 포텐셜인 Meta의 UMA-OMC를 크게 능가했습니다.
CSP가 중요한 이유
CSP는 분자가 형성할 수 있는 모든 가능한 결정 다형체를 결정합니다. 다형체는 물리적 특성이 달라 의약품 제조에 위험을 초래합니다. 1998년에는 예상치 못한 리토나비르 형태로 인해 Abbott이 2억 5천만 달러 이상의 손실을 입었습니다. 금본위인 DFT는 분자당 며칠에서 몇 주가 소요됩니다. CSP-MACE-Å는 이를 몇 분으로 단축하여 훨씬 더 많은 후보 구조를 평가할 수 있게 합니다.
에이전트 기반 실험 루프
Ångstrom 연구진은 반복 루프에서 Claude Code를 연구 보조원으로 사용했습니다: 가설 → 실험 설계 → 작업 실행 → 결과 분석 → 다음 가설. Claude는 팀이 수동으로 사용하던 것과 동일한 Anycloud CLI를 사용하여 계획을 구체적인 행동으로 전환했습니다. 작업 배치를 실행하고 상태를 모니터링하고 결과를 다운로드하고 그래프/요약을 생성했습니다.
이 루프는 약 100,000개의 GPU 작업을 생성했으며, 거의 전적으로 자체 클라우드 계정의 멀티 클라우드 스팟 인스턴스에서 이루어졌습니다. Claude가 연구 결정 사이의 분기와 기록을 처리하는 동안 과학자들은 해석에 집중했습니다.
Anycloud로 비용 관리
Ångstrom CTO Laurence Midgley: “Anycloud 덕분에 에이전트를 마음껏 풀어놓아도 모든 컴퓨팅 자원을 소진할까 걱정하지 않아도 됩니다. 요즘에는 밤새도록 작업하며 자율적으로 연구 실험을 관리하고, 저는 잠을 잡니다.” Anycloud의 CLI와 클라우드 구성은 실험 루프를 통제하에 유지했습니다. 잘못된 배치 하나가 수천 달러의 손실을 초래할 수 있기 때문에 이는 중요했습니다.
벤치마크
CSP-MACE-Å는 CSP에 대해 DFT 수준의 정확도를 입증한 최초의 모델인 반면, UMA-OMC는 금본위 DFT에 미치지 못했습니다. Ångstrom의 평가 제품군(자체 + AstraZeneca)은 성능 우위를 확인했습니다.
📖 전체 출처 읽기: HN AI Agents
👀 See Also

AI 구독 가격 폭락: 기업 청구서가 10배로 늘어날 이유
OpenAI, Anthropic, Microsoft 같은 AI 연구소는 구독 좌석 하나당 손해를 보고 있습니다. 에이전트 작업 부하가 정액 요금제를 무너뜨렸고 — GitHub Copilot은 2026년 6월 1일부터 사용량 기반 과금으로 전환합니다. 보조금을 받은 가격으로 구축한 기업들은 가격 조정에 직면합니다.

Google Chrome, 사용자 동의 없이 4GB Gemini Nano AI 모델을 자동 설치하다
Google Chrome이 사용자의 명시적 동의 없이 4GB Gemini Nano AI 모델을 사용자 기기에 자동으로 다운로드하여 설치하는 것으로 밝혀져, 개인정보 보호와 저장 공간에 대한 우려를 불러일으키고 있습니다.

1.2B 로컬 모델, 1T 클라우드 모델을 포커에서 이기다: 올인 또는 폴드 형식에서 지식보다 공격성
1.2B Liquid 모델이 최대 1T 파라미터 모델들과의 5개의 텍사스 홀덤 토너먼트 중 2개에서 승리했습니다. 숏스택 형식에서는 스마트한 플레이보다 절대 폴드하지 않는 것이 더 많은 칩을 벌었기 때문입니다.

DeepSeek V4 가격 현실 점검: Opus 대비 캐시 토큰 178배 저렴, 그러나 성능 격차 인정
DeepSeek V4 Pro 입력은 토큰 100만 개당 $0.145로, Claude Opus 4.7의 $5(34배 저렴)와 비교됩니다. 캐시 적중 시 $0.0036/$0.625(173배 저렴). 성능은 GPT-5.4 및 Gemini 3.1 Pro보다 3~6개월 뒤쳐집니다.