Antigravity 2.0 en tête du benchmark OpenSCAD LLM : construction du Panthéon

ModelRift a mené un benchmark pratique : ils ont demandé à six outils d'IA de codage de construire le Panthéon en OpenSCAD à partir d'images de référence. L'objectif était de tester la capacité de chaque système à transformer des documents architecturaux de référence en code CAO paramétrique. Le prompt utilisait deux images (façade avant et vue aérienne) et nécessitait l'utilisation de l'interface en ligne de commande OpenSCAD pour prévisualiser et itérer.

Pourquoi Panthéon + OpenSCAD ?

Les prompts basiques comme "cube avec un trou" ne testent que la syntaxe simple (différence, cube, cylindre). Le Panthéon se situe entre les deux : il possède une symétrie radiale (rotonde, dôme, oculus), un portique rectiligne, des colonnes, des bases étagées et un fronton triangulaire. Ce mélange teste la capacité d'un LLM à gérer les transformations imbriquées, les opérations booléennes, les boucles et les modules nommés — tous natifs de la représentation textuelle d'OpenSCAD. OpenSCAD maintient la géométrie comme artefact, évitant l'indirection des MCP Blender ou des actions d'interface.

Résultats du Benchmark

Six systèmes ont été testés. Chaque sortie a été notée sur la qualité (1-5) et accompagnée d'un résumé. Le tableau ci-dessous montre les meilleurs résultats :

Outil & Modèle	Temps	Qualité	Résumé
Antigravity 2.0	●●●○○ (3/5)	●●●●○ (4,5/5)	Meilleure qualité. A capturé les proportions du Panthéon, le dôme avec oculus, le portique, les colonnes, le fronton et les détails de façade. Architecture la plus fidèle aux références.
Codex 5.5 High	●●●●○ (4/5)	●●●○○ (3,0/5)	Forte densité de détails, y compris l'inscription sur l'entablement. Mais le STL final ne correspondait pas à l'aperçu PNG, ce qui a réduit le score.
Cursor 3.5 / Composer 2.5	●●●●● (5/5)	●○○○○ (1,4/5)	Exécution la plus rapide mais résultat le plus faible : mauvaises proportions, discipline des couleurs et détails architecturaux.

Les résultats complets incluent trois autres entrées (non détaillées ici). Le code du benchmark et les comparaisons de rendu sont disponibles sur l'article original.

Enseignements Pratiques

Antigravity 2.0 a produit le code OpenSCAD le plus précis architecturalement, avec des anneaux de dôme corrects, un espacement des colonnes et des relations de façade.
Codex 5.5 a ajouté des détails fins (inscription) mais a souffert d'une incohérence d'export — l'aperçu était meilleur que le STL final.
Cursor 3.5 était rapide mais la géométrie était grossière ; c'est bien pour le prototypage rapide mais pas pour la CAO de production.
Le benchmark confirme qu'OpenSCAD est une cible solide pour la géométrie générée par LLM : texte brut, vocabulaire compact et itération facile via CLI.

Si vous utilisez des agents de codage IA pour la modélisation 3D paramétrique, en particulier pour des pièces architecturales ou mécaniques avec symétrie radiale et opérations booléennes, ce benchmark donne un signal clair : Antigravity 2.0 est actuellement leader en qualité. Pour les tâches où la vitesse prime, Cursor 3.5 pourrait encore être utile si vous êtes prêt à itérer lourdement.

📖 Lire la source complète : HN LLM Tools

Antigravité 2.0 domine le benchmark architectural 3D OpenSCAD – ModelRift teste 6 LLM sur le Panthéon

Pourquoi Panthéon + OpenSCAD ?

Résultats du Benchmark

Enseignements Pratiques

👀 See Also

Vyra : Éditeur vidéo Web intelligent pour les agents Claude via MCP

Serveur MCP pour les projets TypeScript remplace les motifs Grep de Claude Code par des recherches de symboles indexés

Prefex : Un proxy local pour Claude Code qui automatise la mise en cache des invites et la mémoire de session

Claude Code Flux de travail dynamiques : Sous-agents parallèles et mode UltraCode