ローカルQwen 3.6対フロンティアモデル:コーディングプリミティブにおけるシングルファイルHTML Canvas駆動アニメーション

Redditユーザーが、ローカル量子化モデルとフロンティアのWebベースモデルを、特定のコーディングプリミティブである「単一HTMLファイルで、横から見た車がパララックススクロール、回転するホイール、映画的な照明とともに走るフルページキャンバスアニメーションを生成する」タスクで直接比較した。
プロンプト
プロンプトでは、ライブラリなしの単一HTMLファイル、フルページキャンバス、リアルな横から見た車のアニメーション、レイヤー化されたパララックス背景、回転するホイール、微妙な車体の動き、スムーズなループ、統一感のある空と照明を要求した。
テストされたモデル
フロンティア(Webベース、Perplexity経由、tok/sは未計測):
- Claude Sonnet 4.6 Thinking(推論にインターネット使用)
- Gemini 3.1 Pro Thinking
- GPT 5.4 Thinking
- Kimi k2.6 Thinking
ローカル(Ryzen 5 5600、24 GB DDR4-3200、RX 5700 XT 8GB):
- Qwen3.5 9B Q4_K_M — 約50 tok/s
- Qwen3.6-27B(Claude-opus-reasoning-distilled)Q4_K_M — 2.65 tok/s
- Qwen3.6-27B Q4_K_M — 2.70 tok/s
- Qwen3.6-31B A3B Q4_K_M — 12.13 tok/s
- Gemma-4-31b-it — 1.91 tok/s
- Qwen3.5 4B Q8 — 60 tok/s(推論にインターネット使用)
- Qwen3.5 4B Q4_K_M — 80 tok/s(推論にインターネット使用)
結果と主観的ランキング
この特定タスクでのランキング:
- Kimi k2.6 Thinking — 全体的に最もクリーンなビジュアル
- Qwen3.6-27B Q4_K_M(ローカル) — 期待以上;良好なパララックスと路面感
- Qwen3.6-27B Claude-opus-reasoning-distilled — 僅差で3位
ローカルの27B量子化モデルは、この特定のビジュアルプリミティブにおいて、一部のフロンティアモデルの出力よりも自然な動きとレイヤリングを実現した。投稿者は、フロンティアモデルがローカル量子化モデルをより明確に上回ることを期待していたと述べている。
ユーザーは、どのモデルがどのファイルを生成したかを追跡するために、HTMLの<title>タグのみを変更した。出力結果はスレッド内で、実行中のアニメーションのスクリーンショットやGIFとともに共有されている。
📖 ソース全文を読む: r/LocalLLaMA
👀 See Also

レポートによると、パランティアのAIが米軍全体に組み込まれる予定です。
ある報告によると、米軍はPalantirのAI技術を全軍に組み込む計画を立てているとのことです。この記事はHacker Newsに投稿され、37ポイントを獲得し、24件のコメントが寄せられました。

AnthropicがClaudeコミュニティアンバサダープログラムを開始
Anthropicは、Claude Community Ambassadorsプログラムを立ち上げました。このプログラムは、地域の開発者ミートアップを主催し、世界中のビルダーたちをつなぐためのリソースを提供します。プログラムは、あらゆる背景や地域からの参加者に開かれています。

DeepSeek-V4 ProおよびFlash:1.6Tパラメータ、100万トークンコンテキスト、ハイブリッドアテンション
DeepSeek-V4-Pro(総パラメータ1.6T、活性49B)とV4-Flash(総パラメータ284B、活性13B)は100万トークンのコンテキストをサポート。新しいハイブリッド注意機構(CSA + HCA)により、単一トークン推論のFLOPsをDeepSeek-V3.2の27%に、KVキャッシュを10%に削減。

AI依存の罠:LLMへの過度な依存が中核スキルを損なう理由
AIチャットボットへの過度の依存が、批判的思考、文章作成、調査、学習能力の衰退につながるという逆張りの主張。