Ångstrom usó Claude Code para entrenar un modelo que superó a UMA-OMC de Meta — 100 000 trabajos de GPU en spot

✍️ OpenClawRadar📅 Publicado: 18 de junio de 2026🔗 Source
Ångstrom usó Claude Code para entrenar un modelo que superó a UMA-OMC de Meta — 100 000 trabajos de GPU en spot
Ad

Ångstrom AI (YC S24), en colaboración con la Universidad de Cambridge (grupo Csanyi) y AstraZeneca, publicó Precisión DFT en Predicción de Estructuras Cristalinas con Potenciales Interatómicos de Machine Learning, presentando CSP-MACE-Å. El modelo reemplaza DFT (teoría funcional de la densidad) en la predicción de estructuras cristalinas (CSP) con idéntica precisión pero 10.000× de aceleración. Superó significativamente a UMA-OMC de Meta, el anterior estado del arte en potenciales interatómicos ML para cristales moleculares orgánicos.

Por Qué es Importante CSP

CSP determina todos los polimorfos cristalinos posibles que una molécula puede formar. Los polimorfos tienen diferentes características físicas, lo que supone un riesgo para la fabricación de fármacos — en 1998, una forma inesperada de ritonavir le costó a Abbott más de 250 millones de dólares. DFT, el estándar de oro, toma días o semanas por molécula. CSP-MACE-Å reduce eso a minutos, permitiendo evaluar muchas más estructuras candidatas.

Ad

Bucle Experimental Impulsado por Agentes

Los investigadores de Ångstrom usaron Claude Code como asistente de investigación en el bucle iterativo: hipótesis → diseño de experimento → lanzamiento de trabajos → análisis de resultados → siguiente hipótesis. Claude tradujo los planes en acciones concretas utilizando la misma CLI de Anycloud que el equipo usaba manualmente. Lanzó lotes de trabajos, monitoreó el estado, descargó resultados y generó gráficos y resúmenes.

El bucle produjo aproximadamente 100.000 trabajos GPU, casi todos en instancias spot multi-nube a través de sus propias cuentas en la nube. Claude manejó la distribución y el registro entre decisiones de investigación mientras los científicos se centraban en la interpretación.

Control de Costos con Anycloud

Laurence Midgley, CTO de Ångstrom: “Anycloud me da la confianza para dejar que mis agentes actúen sin preocuparme de que quemen todo nuestro cómputo. Hoy en día siguen trabajando durante la noche, gestionando autónomamente mis experimentos de investigación, mientras yo duermo.” La CLI y configuración en la nube de Anycloud mantuvieron bajo control el bucle experimental — algo crítico cuando un lote incorrecto podría costar miles.

Benchmarks

CSP-MACE-Å es el primer modelo que demuestra precisión a nivel DFT para CSP, mientras que UMA-OMC no alcanzó el estándar DFT. Los conjuntos de evaluación de Ångstrom (propios + de AstraZeneca) confirmaron la superioridad.

📖 Leer la fuente completa: HN AI Agents

Ad

👀 Ver también

Claude-Code v2.1.97 Lanzamiento: Mejoras NO_FLICKER, Correcciones de Permisos y Actualizaciones MCP
Noticias

Claude-Code v2.1.97 Lanzamiento: Mejoras NO_FLICKER, Correcciones de Permisos y Actualizaciones MCP

Claude-Code v2.1.97 añade un interruptor de vista de enfoque (Ctrl+O) en el modo NO_FLICKER, corrige múltiples problemas de permisos y conexiones MCP, y mejora el acceso a la red del sandbox. La versión aborda el comportamiento de reintentos 429, problemas de persistencia de transcripciones y varios errores de interfaz de usuario.

OpenClawRadar
Análisis de 413,000 Ejecuciones de Agentes de IA Revela lo que los Hace Tener Éxito
Noticias

Análisis de 413,000 Ejecuciones de Agentes de IA Revela lo que los Hace Tener Éxito

Un análisis de 413.278 ejecuciones de agentes de ingeniería de software de IA del conjunto de datos CoderForge-Preview muestra que las mejores prácticas de ingeniería de software humanas a menudo perjudican el rendimiento de los agentes. Los datos revelan patrones específicos que separan las ejecuciones exitosas de las fallidas en los mismos problemas.

OpenClawRadar
Claude Sonnet 4.6 supera a Opus 4.6 en rendimiento en el benchmark de prompts
Noticias

Claude Sonnet 4.6 supera a Opus 4.6 en rendimiento en el benchmark de prompts

Un usuario de Reddit presentó un prompt complejo tanto a Sonnet 4.6 como a Opus 4.6; el modelo Sonnet produjo una respuesta superior evaluada por creatividad y requisitos ocultos.

OpenClawRadar
La actualización de OpenClaw v3.22 causa problemas en el panel de control y WhatsApp
Noticias

La actualización de OpenClaw v3.22 causa problemas en el panel de control y WhatsApp

OpenClaw v3.22 ha roto la funcionalidad del panel de control y la integración con WhatsApp, con dos problemas documentados en GitHub (#52808 y #52813). Se recomienda a los usuarios no actualizar a esta versión.

OpenClawRadar