「Tokenmaxxingは新しいストップウォッチ:AIポリシーに一貫性が必要な理由」

ベテランエンジニアリングマネージャーのブライアン・ミーカー氏は、ストップウォッチを使ったテイラーリズムから、今日の「トークンマキシング」リーダーボードに至るまで、直接的なつながりを描いている。彼の主張は、いかなる指標も操作され、AIトークン数も例外ではないというものだ。エンジニアたちはすでにトークンを無駄使いしてリーダーボードを駆け上がるループを作り出しており、使用量と実際の生産性を切り離している。ミーカー氏の回答は、懐疑的なチームのための一貫性のあるAIポリシーである。
4つのポイントからなるAIポリシー
- AIの強制はしない — エンジニアがAIツールをどれだけ使ったかで評価されることはない。トークンマキシングは明確に拒否される。
- AIが生成したコードを理解する — LLMの出力を盲目的に受け入れることは許されない。
- AIツールがなくなっても仕事ができる — スキルは補助的な手段に依存せず、独立している必要がある。
- チームメイトと顧客を大切にする — 最終的な目標は人を助けることであり、トークンを最大化することではない。
この記事はまた、AI推進派の矛盾を非難している:もしあなたが知っているすべてが6ヶ月で時代遅れになるのなら、なぜ6ヶ月待ってより良いモデルを使わないのか? シニア以上のエンジニアは、毎日使うツールから時々使う概念実証ツールまで、自分に最適な方法でAIを使うことが奨励されており、未熟なワークフローを強制されることはない。
ミーカー氏は、彼が話を聞いた多くの開発者が職場にそのようなドキュメントを持っておらず、「できるだけAIを使え」という曖昧な指示だけが残されていると指摘する。彼の投稿は、指標の操作に対して原則的な立場を取りたいチームにとって実用的なテンプレートとなっている。
📖 全文はこちら: HN AI Agents
👀 See Also

TinfoilのModelwrap技術によるモデル同一性の証明
TinfoilのModelwrapは、セキュアエンクレーブによる暗号学的コミットメントの検証を通じて、推論プロバイダーが主張する正確なモデル重みを提供することを保証します。

Docker OpenClaw ブリッジネットワークにおけるControl-UI LANアクセス問題
ユーザーが、Dockerブリッジネットワーク内でLAN接続を介してOpenClawのControl-UIにアクセスする際の持続的な問題を報告しています。バージョン2026.3.14では一時的にトークンベースのアクセスがサポートされましたが、その後のバージョンではペアリングを要求し、スコープエラーを発生させるように戻されました。

Qwen3.6 Plusと欧米のSOTAモデルとのベンチマーク比較
Qwen3.6 Plusは、SWE-bench Verifiedで78.8、GPQA/GPQA Diamondで90.4、HLE(ツールなし)で28.8、MMMU-Proで78.8のスコアを獲得し、GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro Previewなどのモデルと競合する位置にあります。

Claude Sonnet 4.6 公開:コーディングとコンピューター操作能力が強化
Claude Sonnet 4.6は、100万トークンのコンテキストウィンドウを導入し、コーディングとコンピューター利用スキルを向上させ、より幅広いタスクにおいてOpusクラスモデルの有力な代替手段となっています。