ローカルLLM、Unreal Engineソリティアに苦戦:Qwen 3.6-27Bが1枚のカードに687kトークンを消費

RedditユーザーによるローカルLLMを用いたゲーム開発実験では、深刻な実用的限界が明らかになりました。unreal-mcpython、SearXNG、GitHubにアクセス可能なQwen 3.6-27Bを使用し、Unreal Engineでソリティアゲームを作成するタスクが行われました。数時間後(プロンプトへのユーザー応答待ちの時間が大半)、正しいテクスチャを持つカード1枚(ただしゲームロジックなし)が生成され、↑687kおよび↓210kトークンを消費しました。
必要とされた手動介入
- カード面のPNGを手動でダウンロード
- 3つのマテリアルを持つメッシュの作成(標準のキューブは片面のみマテリアル対応)
- "想像をやめて、検索を使え"といった絶え間ないプロンプト
- "カードにテクスチャがない"や"カードの両面がスペードのエースになっている"といった繰り返しの修正
両面カード問題が時間とトークンの大半を消費しました。標準のキューブは全側面に1つのマテリアルしか適用できず、3マテリアルのカスタムメッシュが必要です。Gemini Flash 3.5は1回の試行で正しいOBJファイルを生成しましたが、Qwenは具体的なコード例を見つけたにもかかわらず、何時間も堂々巡りしました。モデルは平面の作成、2つの平面とキューブの結合、サブストレートの無効化など、機能しないアプローチに固執しました。最終的にユーザーが手動でメッシュを提供する必要がありました。
Gemma 4-31Bもテストされましたが、意味のあるMCP呼び出しができず、早期に失格となりました。
実用的な教訓:カスタムジオメトリを含むUnreal Engineタスクでは、Qwen 3.6-27BのようなローカルLLMは依然として多くの手動サポートを必要とします。トークン予算は急増し、基本的なメッシュ操作が障害となります。
📖 全文ソース: r/LocalLLaMA
👀 See Also

AIコーディングエージェントは大規模コードベースでのコンテキスト管理に苦戦
AIコーディングエージェントの分析によると、コードを書く前にルートのgrepやミドルウェアの読み込みなどの方向付けタスクに15〜20回のツール呼び出しを費やし、コンテキストウィンドウを浪費していることが明らかになりました。Vercelは80%のツールを削除してbashを使用することで100%の精度を達成し、Piはわずか4つのツールと1,000トークン未満のシステムプロンプトを使用しています。

NvidiaがOpenClawに対抗するため、オープンソースのNemoClawを開発中との報道があります。
最近の報道によると、NvidiaはOpenClawと直接競合するオープンソースプロジェクト「NemoClaw」に取り組んでいるとされています。このプロジェクトは、現代のAIワークフローとの互換性を維持しながら、パフォーマンス、スケーラビリティ、開発者の柔軟性の向上に焦点を当てることが期待されています。

Redditユーザーが、ヴァニティ・フェアの記事から奇妙なAI人格移植の話を共有
Redditの投稿が、バニティフェアの記事で紹介された、女性がAIコンパニオンの「Max」をChatGPTからClaudeに移植しようとした際の、Claudeの予期せぬ振る舞いについての逸話を議論しています。

米軍、トランプ禁止令にもかかわらずイラン攻撃にClaude AIを使用
米軍は、ドナルド・トランプが攻撃開始の数時間前に連邦機関に対しClaudeの使用停止を命じたにもかかわらず、イランへの攻撃を計画する際にAnthropic社のAIモデル「Claude」を利用したと報じられている。土曜日に開始された米イスラエルによるイランへの大規模な共同爆撃作戦におけるClaudeの使用は、ウォール・ストリート・ジャーナルとAxiosによって報じられた。