Ångstrom nutzte Claude Code, um ein Modell zu trainieren, das Metas UMA-OMC schlug — 100k GPU-Jobs auf Spot

Ångstrom AI (YC S24) hat in Zusammenarbeit mit der University of Cambridge (Csanyi-Gruppe) und AstraZeneca die Arbeit DFT Accuracy on Crystal Structure Prediction with Machine Learning Interatomic Potentials veröffentlicht und stellt darin CSP-MACE-Å vor. Das Modell ersetzt DFT (Dichtefunktionaltheorie) in der Kristallstrukturvorhersage (CSP) mit identischer Genauigkeit, aber 10.000× Beschleunigung. Es übertraf deutlich Metas UMA-OMC, das bisher führende ML-Interatompotential für organische Molekülkristalle.
Warum CSP wichtig ist
CSP bestimmt alle möglichen Kristallpolymorphe, die ein Molekül bilden kann. Polymorphe haben unterschiedliche physikalische Eigenschaften, was ein Risiko für die Arzneimittelherstellung darstellt – 1998 kostete eine unerwartete Ritonavir-Form Abbott über 250 Millionen Dollar. DFT, der Goldstandard, benötigt Tage bis Wochen pro Molekül. CSP-MACE-Å reduziert dies auf Minuten und ermöglicht die Bewertung weitaus mehrerer Kandidatenstrukturen.
Agentengesteuerter Experimentierzyklus
Ångstrom-Forscher nutzten Claude Code als Forschungsassistenten im iterativen Zyklus: Hypothese → Versuchsplanung → Jobstart → Ergebnisanalyse → nächste Hypothese. Claude übersetzte Pläne mit der gleichen Anycloud CLI, die das Team manuell nutzte, in konkrete Aktionen. Es startete Job-Batches, überwachte den Status, lud Ergebnisse herunter und erstellte Diagramme/Zusammenfassungen.
Der Zyklus produzierte etwa 100.000 GPU-Jobs, fast vollständig auf Multi-Cloud-Spot-Instanzen in ihren eigenen Cloud-Konten. Claude kümmerte sich um die Verteilung und Buchhaltung zwischen Forschungsentscheidungen, während sich die Wissenschaftler auf die Interpretation konzentrierten.
Kostenkontrolle mit Anycloud
Ångstrom-CTO Laurence Midgley: „Anycloud gibt mir das Vertrauen, meine Agenten wirklich loszulassen, ohne zu befürchten, dass sie unsere gesamte Rechenleistung verschlingen. Heutzutage arbeiten sie die ganze Nacht weiter, verwalten meine Forschungsexperimente autonom, während ich schlafe.“ Die CLI und Cloud-Konfiguration von Anycloud hielten den Experimentierzyklus unter Kontrolle – entscheidend, wenn ein falscher Batch Tausende kosten könnte.
Benchmarks
CSP-MACE-Å ist das erste Modell, das DFT-Genauigkeit für CSP demonstriert, während UMA-OMC hinter dem Goldstandard DFT zurückblieb. Die Evaluierungssuiten von Ångstrom (eigene + von AstraZeneca) bestätigten die Überlegenheit.
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Navigieren des OpenClaw 2026.2.6-3 und des OpenRouter-Integrationsproblems
Nutzer von OpenClaw 2026.2.6-3 in Verbindung mit OpenRouter sehen sich hartnäckigen '401 Benutzer nicht gefunden'-Fehlern gegenüber. Nehmen Sie an der Gemeinschaftsdiskussion teil, während sie Lösungen erkunden und Tipps zur Fehlersuche austauschen.

OpenClaw 2026.4.2 und 2026.3.31 unterbrechen lokale LLM-Verbindungen
Die OpenClaw-Versionen 2026.4.2 und 2026.3.31 verursachen Verbindungszeitüberschreitungen bei lokal gehosteten Ollama-Instanzen. Das Problem tritt auf, wenn Verbindungen zu lokal laufenden Ubuntu-Systemen hergestellt werden sollen, wobei Fehlerprotokolle LLM-Anfragezeitüberschreitungen und Failover-Entscheidungen anzeigen.

Claude Code v2.1.181: /config Syntax, Sandbox Apple Events, Streaming Fixes
Claude Code v2.1.181 führt die /config key=value-Syntax für Inline-Einstellungen, sandbox.allowAppleEvents unter macOS und die CLAUDE_CLIENT_PRESENCE_FILE ein. Zudem wurde Bun auf 1.4 aktualisiert, Probleme mit Prompt-Caching bei benutzerdefinierten API-URLs und Netzwerklaufwerk-Schreibvorgängen behoben sowie zahlreiche Startregressionen korrigiert.

Claude Opus 4.6 Genauigkeit sinkt im BridgeBench-Halluzinationstest
Claude Opus 4.6 zeigt einen deutlichen Rückgang der Genauigkeit beim BridgeBench-Halluzinationstest, von 83 % auf 68 %, laut einem Twitter-Post von BridgeMind AI.