Antigravitation 2.0 führt OpenSCAD-Architektur-3D-Benchmark an – ModelRift testet 6 LLMs am Pantheon

ModelRift führte einen praktischen Benchmark durch: Sie baten sechs KI-Programmierwerkzeuge, das Pantheon in OpenSCAD anhand von Referenzbildern zu bauen. Ziel war es zu testen, wie gut jedes System architektonisches Referenzmaterial in parametrischen CAD-Code umwandelt. Der Prompt verwendete zwei Bilder (Frontfassade und Luftaufnahme) und erforderte die Nutzung der OpenSCAD-CLI zur Vorschau und Iteration.
Warum Pantheon + OpenSCAD?
Einfache Prompts wie „Würfel mit Loch“ testen nur einfache Syntax (difference, cube, cylinder). Das Pantheon befindet sich in der Mitte: Es hat radiale Symmetrie (Rotunde, Kuppel, Oculus), gerade Portikus-Fassaden, Säulen, abgestufte Sockel und einen dreieckigen Giebel. Diese Mischung testet die Fähigkeit eines LLMs, mit verschachtelten Transformationen, Booleschen Operationen, Schleifen und benannten Modulen umzugehen – alles native Elemente der Klartext-Darstellung von OpenSCAD. OpenSCAD hält Geometrie als Artefakt und vermeidet die Indirektion von Blender-MCPs oder UI-Aktionen.
Benchmark-Ergebnisse
Sechs Systeme wurden getestet. Jede Ausgabe wurde nach Qualität (1-5) bewertet und mit einer Zusammenfassung versehen. Die folgende Tabelle zeigt die besten Ergebnisse:
| Tool & Modell | Zeit | Qualität | Zusammenfassung |
|---|---|---|---|
| Antigravity 2.0 | ●●●○○ (3/5) | ●●●●○ (4,5/5) | Beste Qualität. Pantheon-Proportionen, Kuppel mit Oculus, Portikus, Säulen, Giebel und Fassadendetails erfasst. Architektur am originalgetreuesten. |
| Codex 5.5 High | ●●●●○ (4/5) | ●●●○○ (3,0/5) | Starke Detaildichte, einschließlich Inschrift auf dem Gebälk. Aber die endgültige STL entsprach nicht der PNG-Vorschau, was die Bewertung senkte. |
| Cursor 3.5 / Composer 2.5 | ●●●●● (5/5) | ●○○○○ (1,4/5) | Schnellster Durchlauf, aber schwächste Ausgabe: schlechte Proportionen, Farbdisziplin und architektonische Details. |
Die vollständigen Ergebnisse enthalten drei weitere Einträge (hier nicht detailliert). Der Benchmark-Code und Render-Vergleiche sind im Originalbeitrag verfügbar.
Praktische Erkenntnisse
- Antigravity 2.0 erzeugte den architektonisch genauesten OpenSCAD-Code mit korrekten Kuppelringen, Säulenabständen und Fassadenbeziehungen.
- Codex 5.5 fügte feine Details (Inschrift) hinzu, hatte aber einen Export-Konflikt – die Vorschau sah besser aus als die endgültige STL.
- Cursor 3.5 war schnell, aber die Geometrie war grob; er eignet sich für schnelles Prototyping, aber nicht für CAD-Produktion.
- Der Benchmark bestätigt, dass OpenSCAD ein starkes Ziel für LLM-generierte Geometrie ist: Klartext, kompaktes Vokabular und einfache Iteration über die CLI.
Wenn Sie KI-Programmieragenten für parametrische 3D-Modellierung verwenden, insbesondere für architektonische oder mechanische Teile mit radialer Symmetrie und Booleschen Operationen, gibt dieser Benchmark ein klares Signal: Antigravity 2.0 führt derzeit in der Qualität. Für geschwindigkeitsorientierte Aufgaben kann Cursor 3.5 dennoch nützlich sein, wenn Sie bereit sind, stark zu iterieren.
📖 Vollständige Quelle lesen: HN LLM Tools
👀 Siehe auch

EctoLedger: Open-Source-MicroVM-Sandbox für lokale KI-Agenten mit Terminalzugriff
EctoLedger ist eine Open-Source-Laufzeit-Firewall und ein Ledger, der Mikro-VM-Isolierung für lokale KI-Agenten mit Terminalzugriff bietet und vier Präventionsschichten ausführt, bevor Befehle in Apple Hypervisor.framework (macOS) oder Firecracker-Mikro-VM-Umgebungen (Linux) ausgeführt werden.

Mit kostenlosen LLM-APIs und Tool-Calling erstellte Pokémon-Kampf-KI-Agenten
Ein System, das Llama 3, Qwen, Gemma über kostenlose API-Stufen nutzt, um autonom Pokémon-Showdown-Kämpfe mit strukturierten Tool-Aufrufen zu spielen. Unterstützt Mensch gegen KI und KI gegen KI Modi.

Öffentlich gehostete MCP-Server für Gesundheits-, Bildungs- und Regierungsdaten
Ein Entwickler hat 14 öffentlich gehostete MCP-Server erstellt und bereitgestellt, die Zugriff auf CDC-Datensätze, klinische Studien, FDA-Daten, akademische Publikationen, Kongressinformationen, Wetterdaten und andere Hilfsmittel bieten. Diese Server erfordern keine Einrichtung, API-Schlüssel oder lokale Installation.

Claude Usage Bar Colorizer Browser-Erweiterung, erstellt mit Claude Code
Ein Entwickler hat eine Browser-Erweiterung erstellt, die die Nutzungsbalken von Claude basierend auf Prozentgrenzwerten von Grün über Gelb nach Rot einfärbt, ein Popup mit Live-Nutzungsdaten hinzufügt und die Anpassung von Grenzwerten und Farben ermöglicht. Die Erweiterung läuft nur auf Claudes Nutzungsseite, speichert Einstellungen lokal und stellt keine externen Netzwerkanfragen.