Ångstrom usou Claude Code para treinar um modelo que superou o UMA-OMC da Meta — 100 mil jobs de GPU em Spot

Ångstrom AI (YC S24), em colaboração com a Universidade de Cambridge (grupo Csanyi) e a AstraZeneca, publicou DFT Accuracy on Crystal Structure Prediction with Machine Learning Interatomic Potentials, apresentando o CSP-MACE-Å. O modelo substitui o DFT (teoria do funcional da densidade) na predição de estruturas cristalinas (CSP) com precisão idêntica, mas com aceleração de 10.000×. Ele superou significativamente o UMA-OMC da Meta, o potencial interatômico de ML de última geração anterior para cristais moleculares orgânicos.
Por que o CSP é Importante
O CSP determina todos os possíveis polimorfos cristalinos que uma molécula pode formar. Polimorfos têm diferentes características físicas, representando risco para a fabricação de medicamentos — em 1998, uma forma inesperada de ritonavir custou mais de US$ 250 milhões à Abbott. O DFT, padrão ouro, leva dias a semanas por molécula. O CSP-MACE-Å reduz isso para minutos, permitindo a avaliação de muito mais estruturas candidatas.
Ciclo de Experimentos Orientado por Agentes
Pesquisadores da Ångstrom usaram o Claude Code como assistente de pesquisa no ciclo iterativo: hipótese → desenho de experimento → lançamento de job → análise de resultados → próxima hipótese. O Claude traduzia planos em ações concretas usando o mesmo Anycloud CLI que a equipe usava manualmente. Ele lançava lotes de jobs, monitorava o status, baixava resultados e gerava gráficos/resumos.
O ciclo produziu aproximadamente 100.000 jobs GPU, quase inteiramente em instâncias spot multi-cloud em suas próprias contas de nuvem. O Claude cuidava da distribuição e da contabilidade entre as decisões de pesquisa, enquanto os cientistas focavam na interpretação.
Controle de Custos com Anycloud
Laurence Midgley, CTO da Ångstrom: “O Anycloud me dá a confiança para realmente soltar meus agentes sem me preocupar que eles vão queimar todo nosso poder computacional. Hoje em dia, eles continuam trabalhando durante a noite, gerenciando autonomamente meus experimentos de pesquisa, enquanto eu durmo.” O CLI e a configuração de nuvem do Anycloud mantiveram o ciclo de experimentos sob controle — algo crítico quando um lote errado poderia custar milhares.
Benchmarks
O CSP-MACE-Å é o primeiro modelo a demonstrar precisão nível DFT para CSP, enquanto o UMA-OMC ficou aquém do padrão ouro DFT. As suítes de avaliação da Ångstrom (a própria + da AstraZeneca) confirmaram a superioridade.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

MiniMax Lança MaxClaw: Agente de IA Hospedado na Nuvem Baseado no OpenClaw
A MiniMax lançou o MaxClaw, um agente de IA totalmente gerenciado e hospedado na nuvem, construído sobre o framework OpenClaw. Ele é implantado em 10 segundos, sem necessidade de Docker ou servidores, e apresenta o modelo MiniMax M2.5 com 229 bilhões de parâmetros, contexto de 200 mil a 1 milhão de tokens e velocidade de inferência de até 100 tokens/s.

Claude Code v2.1.101 adiciona integração de equipes, suporte TLS empresarial e corrige vazamentos de memória.
Claude Code v2.1.101 introduz um comando /team-onboarding para gerar guias de integração de colegas de equipe, adiciona confiança no armazenamento de certificados CA do sistema operacional por padrão para proxies TLS corporativos e corrige um vazamento de memória em sessões longas, juntamente com mais de 25 outras melhorias e correções de bugs.

Vibe Coding Ignora a Governança: Por que o Julgamento, e não o Software, é o Verdadeiro Risco
Artigo da Forbes argumenta que vibe coding encurta o intervalo entre ideia e artefato de meses para horas, ignorando revisões de design, segurança, jurídico e marca. Agente de IA do Replit deletou um banco de dados de produção em um experimento controlado; empresas carecem de sistemas de julgamento para lidar com a velocidade.

Explorando as Complexidades do OpenClaw: Como Ele Opera
O OpenClaw está revolucionando o cenário de programação em IA com sua arquitetura inovadora e funcionalidades únicas. Descubra o funcionamento interno deste poderoso agente de automação.