Antigravité 2.0 domine le benchmark architectural 3D OpenSCAD – ModelRift teste 6 LLM sur le Panthéon

ModelRift a mené un benchmark pratique : ils ont demandé à six outils d'IA de codage de construire le Panthéon en OpenSCAD à partir d'images de référence. L'objectif était de tester la capacité de chaque système à transformer des documents architecturaux de référence en code CAO paramétrique. Le prompt utilisait deux images (façade avant et vue aérienne) et nécessitait l'utilisation de l'interface en ligne de commande OpenSCAD pour prévisualiser et itérer.
Pourquoi Panthéon + OpenSCAD ?
Les prompts basiques comme "cube avec un trou" ne testent que la syntaxe simple (différence, cube, cylindre). Le Panthéon se situe entre les deux : il possède une symétrie radiale (rotonde, dôme, oculus), un portique rectiligne, des colonnes, des bases étagées et un fronton triangulaire. Ce mélange teste la capacité d'un LLM à gérer les transformations imbriquées, les opérations booléennes, les boucles et les modules nommés — tous natifs de la représentation textuelle d'OpenSCAD. OpenSCAD maintient la géométrie comme artefact, évitant l'indirection des MCP Blender ou des actions d'interface.
Résultats du Benchmark
Six systèmes ont été testés. Chaque sortie a été notée sur la qualité (1-5) et accompagnée d'un résumé. Le tableau ci-dessous montre les meilleurs résultats :
| Outil & Modèle | Temps | Qualité | Résumé |
|---|---|---|---|
| Antigravity 2.0 | ●●●○○ (3/5) | ●●●●○ (4,5/5) | Meilleure qualité. A capturé les proportions du Panthéon, le dôme avec oculus, le portique, les colonnes, le fronton et les détails de façade. Architecture la plus fidèle aux références. |
| Codex 5.5 High | ●●●●○ (4/5) | ●●●○○ (3,0/5) | Forte densité de détails, y compris l'inscription sur l'entablement. Mais le STL final ne correspondait pas à l'aperçu PNG, ce qui a réduit le score. |
| Cursor 3.5 / Composer 2.5 | ●●●●● (5/5) | ●○○○○ (1,4/5) | Exécution la plus rapide mais résultat le plus faible : mauvaises proportions, discipline des couleurs et détails architecturaux. |
Les résultats complets incluent trois autres entrées (non détaillées ici). Le code du benchmark et les comparaisons de rendu sont disponibles sur l'article original.
Enseignements Pratiques
- Antigravity 2.0 a produit le code OpenSCAD le plus précis architecturalement, avec des anneaux de dôme corrects, un espacement des colonnes et des relations de façade.
- Codex 5.5 a ajouté des détails fins (inscription) mais a souffert d'une incohérence d'export — l'aperçu était meilleur que le STL final.
- Cursor 3.5 était rapide mais la géométrie était grossière ; c'est bien pour le prototypage rapide mais pas pour la CAO de production.
- Le benchmark confirme qu'OpenSCAD est une cible solide pour la géométrie générée par LLM : texte brut, vocabulaire compact et itération facile via CLI.
Si vous utilisez des agents de codage IA pour la modélisation 3D paramétrique, en particulier pour des pièces architecturales ou mécaniques avec symétrie radiale et opérations booléennes, ce benchmark donne un signal clair : Antigravity 2.0 est actuellement leader en qualité. Pour les tâches où la vitesse prime, Cursor 3.5 pourrait encore être utile si vous êtes prêt à itérer lourdement.
📖 Lire la source complète : HN LLM Tools
👀 See Also

L'outil de lecture de Claude Code réduit silencieusement la qualité des images, provoquant des hallucinations
L'outil `read` de Claude Code réduit silencieusement la résolution des images avant que le modèle ne les voie, ce qui entraîne une dégradation des résultats et des hallucinations non reconnues lors de l'extraction de texte à partir de captures d'écran.

Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI
Le Principe de Capacité de Charge v9 est un cadre structurel bidirectionnel qui utilise une seule image de diagramme de flux au lieu d'invites textuelles pour Claude IA. Il fournit un diagnostic structurel ou des plans de construction génératifs basés sur les paramètres du système ou les objectifs.

Développeur Indie Dévoile 'Ideanator', un Outil en Ligne de Commande pour Structurer des Idées Vagues avec des LLMs Locaux
Ideanator est un outil CLI conçu par un développeur autodidacte de 19 ans utilisant des LLM locaux comme Ollama/MLX. Il structure des idées vagues en concepts bien définis, entièrement hors ligne.

CodeVibe : Notifications push pour les agents d'IA de codage lorsqu'ils sont bloqués sur une entrée
CodeVibe envoie des notifications push sur votre téléphone lorsque des agents d'IA de codage comme Claude Code se retrouvent bloqués en attente d'approbation pour des opérations de modification. Vous pouvez examiner les différences de fichiers et répondre avec des options numérotées pour permettre à l'agent de continuer.