反重力2.0在OpenSCAD建筑3D基准测试中拔得头筹——ModelRift在万神殿上测试6种大语言模型

ModelRiftが実用的なベンチマークを実施:6つのAIコーディングツールに、参照画像からOpenSCADでパンテオンを構築するよう依頼しました。目標は、各システムが建築参照資料をパラメトリックCADコードに変換する能力をテストすることです。プロンプトでは2枚の画像(正面ファサードと航空写真)を使用し、OpenSCAD CLIでプレビューと反復作業を行うよう要求しました。
なぜパンテオン+OpenSCADなのか?
「穴のあいた立方体」のような基本的なプロンプトは、単純な構文(difference、cube、cylinder)のみをテストします。パンテオンはその中間に位置します:放射対称性(ロトンダ、ドーム、オクルス)、まっすぐなポルティコの正面、列柱、階段状の基壇、三角ペディメントを持ちます。この組み合わせは、LLMがネストされた変換、ブール演算、ループ、名前付きモジュールを処理する能力をテストします。これらはすべてOpenSCADのプレーンテキスト表現にネイティブです。OpenSCADは幾何学を成果物として保持し、Blender MCPやUIアクションのような間接性を避けます。
ベンチマーク結果
6つのシステムがテストされました。各出力は品質(1-5)でスコア化され、要約が付けられました。以下の表はトップ結果を示しています:
| ツールとモデル | 時間 | 品質 | 要約 |
|---|---|---|---|
| Antigravity 2.0 | ●●●○○ (3/5) | ●●●●○ (4.5/5) | 最高品質。パンテオンのプロポーション、ドームとオクルス、ポルティコ、列柱、ペディメント、ファサードの細部を捉えた。建築が参照に最も忠実。 |
| Codex 5.5 High | ●●●●○ (4/5) | ●●●○○ (3.0/5) | エンタブラチュアの碑文を含む強力なディテール密度。しかし最終STLがPNGプレビューと一致せず、スコアを押し下げ。 |
| Cursor 3.5 / Composer 2.5 | ●●●●● (5/5) | ●○○○○ (1.4/5) | 最速実行だが最も弱い出力:プロポーション、カラーディシプリン、建築の細部が貧弱。 |
完全な結果にはさらに3つのエントリー(ここでは詳述せず)が含まれます。ベンチマークコードとレンダリング比較は元の投稿で入手可能です。
実用的な教訓
- Antigravity 2.0は最も建築的に正確なOpenSCADコードを生成。ドームリング、列柱間隔、ファサード関係が正確。
- Codex 5.5は細かいディテール(碑文)を追加したが、エクスポートの不一致が発生。プレビューは最終STLより優れて見えた。
- Cursor 3.5は迅速だが幾何学が粗雑。ラピッドプロトタイピングには適するが、プロダクションCADには不向き。
- ベンチマークはOpenSCADがLLM生成幾何学の強力なターゲットであることを確認:プレーンテキスト、コンパクトな語彙、CLIによる容易な反復。
AIコーディングエージェントをパラメトリック3Dモデリングに、特に放射対称性やブール演算を伴う建築部品や機械部品に使用している場合、このベンチマークは明確なシグナルを示します:現在のところAntigravity 2.0が品質でリードしています。スピード優先のタスクには、Cursor 3.5がまだ有用かもしれませんが、大幅な反復が必要です。
📖 出典全文: HN LLM Tools
👀 See Also

HTMLアーティファクトは技術文書向けにGoogleドキュメントを代替するが、コメント機能が不足している
Claudeが生成するHTMLアーティファクトが、スパイク読み取りやアーキテクチャノートなどの長文の技術コンテンツでGoogleドキュメントに取って代わりつつあるが、サンドボックス化されたiframeの性質上、インラインコメントやレビュー機能が利用できない。

ClawCallが専用電話番号を取得:エージェントが発信番号を予約可能に
ClawCallは、OpenClawエージェント向けAI電話スキルで、エリアコードで電話番号を予約できるようになりました。エージェントが発信時にデフォルトで使用します。1万ダウンロード、1日300コール。

Sandbox0: AIエージェントのためのオープンソースKubernetesネイティブサンドボックスインフラストラクチャ
Sandbox0は、JuiceFSによる永続ストレージと自動スケーリングを備えたKubernetes上に構築された、AIエージェント向けのオープンソースサンドボックスインフラストラクチャです。既存ソリューションに見られる同時実行数の制限や一時的な実行といった課題に対応しています。

Sovr MCP Proxyは、LLMの破壊的コマンドを防ぐための安全層を追加します。
ある開発者が、ローカルLLMがホームフォルダに対してrm -rfを実行しそうになった後、sovr-mcp-proxyを構築しました。このツールはコマンド実行前に割り込み、rm -rf、DROP TABLE、curl | sh、chmod 777などの破壊的なパターンをブロックします。