Ångstrom использовал Claude Code для обучения модели, превзошедшей Meta UMA-OMC — 100 тысяч задач на GPU по спотовым ценам

Ångstrom AI (YC S24) в коллаборации с Кембриджским университетом (группа Csanyi) и AstraZeneca опубликовали работу DFT Accuracy on Crystal Structure Prediction with Machine Learning Interatomic Potentials, представив CSP-MACE-Å. Модель заменяет DFT (теорию функционала плотности) в предсказании кристаллических структур (CSP) с идентичной точностью, но в 10 000 раз быстрее. Она значительно превзошла UMA-OMC от Meta — предыдущий лучший ML-потенциал для органических молекулярных кристаллов.
Почему CSP важен
CSP определяет все возможные кристаллические полиморфы, которые может образовать молекула. Полиморфы имеют разные физические свойства, что создаёт риски для производства лекарств — в 1998 году неожиданная форма ритонавира обошлась Abbott в более $250 млн. DFT, золотой стандарт, занимает от дней до недель на молекулу. CSP-MACE-Å сокращает это до минут, позволяя оценивать гораздо больше структур-кандидатов.
Агентно-управляемый цикл экспериментов
Исследователи Ångstrom использовали Claude Code в качестве ассистента в итеративном цикле: гипотеза → дизайн эксперимента → запуск задачи → анализ результатов → следующая гипотеза. Claude преобразовывал планы в конкретные действия с помощью того же Anycloud CLI, которым команда пользовалась вручную. Он запускал пакеты задач, отслеживал статус, загружал результаты и строил графики/сводки.
Цикл породил примерно 100 000 GPU-задач, почти полностью на мультиоблачных спотовых инстансах в их собственных облачных аккаунтах. Claude обрабатывал разветвление и учёт между исследовательскими решениями, пока учёные сосредотачивались на интерпретации.
Контроль затрат с Anycloud
Технический директор Ångstrom Лоуренс Миджли: «Anycloud даёт мне уверенность отпускать агентов на волю, не беспокоясь, что они сожгут все наши вычислительные ресурсы. Теперь они продолжают работать всю ночь, автономно управляя моими экспериментами, пока я сплю.» CLI Anycloud и облачная конфигурация держали цикл экспериментов под контролем — критически важно, когда неудачный пакет может стоить тысячи долларов.
Бенчмарки
CSP-MACE-Å — первая модель, демонстрирующая точность уровня DFT для CSP, тогда как UMA-OMC не дотягивала до золотого стандарта DFT. Оценочные наборы Ångstrom (собственные + от AstraZeneca) подтвердили превосходство.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Slurm Coding: Искусственный интеллект в разработке, где время исчезает
Разработчик описывает 'сламовое кодирование' как интенсивный паттерн разработки, который стал возможен благодаря инструментам ИИ-кодирования, когда небольшие идеи быстро превращаются в полноценные системы через цикл быстрой реализации и выброса дофамина.

ИИ-модели не обладают самосознанием в отношении собственных инструментов и пользовательского интерфейса.
ИИ-модели, такие как ChatGPT и Claude, часто предоставляют неверную или устаревшую информацию о собственных функциях и интерфейсах, например, отрицают существование новых слеш-команд или описывают старые версии интерфейса, поскольку они обучены на прошлых снимках данных, в то время как продукты постоянно развиваются.

sseanliu/VisionClaw предоставляет помощь ИИ в реальном времени для умных очков Meta Ray-Ban.
VisionClaw от sseanliu предлагает революционного помощника ИИ для умных очков Meta Ray-Ban, объединяя голосовые команды, визуальные данные и агентные действия с использованием Gemini Live и OpenClaw.

Claude планирует добавить ежемесячный программный кредит для использования API
Планы Claude от Anthropic будут включать выделенный ежемесячный кредит для программного (API) использования, согласно твиту ClaudeDevs в X.