ポーカーで12億のローカルモデルが1兆のクラウドに勝利？

ある開発者が、16GB MacBook上でカスタムフレームワーク（Hive）を使用して、5回のテキサスホールデムトーナメントに6つのLLMを参加させました。参加モデルは、Liquid lfm2.5（1.2B、LM Studio、約5秒/決定）、Qwen3（1.7B、LM Studio、約2.5分）、Claude Haiku 4.5、GPT-OSS（120B、Fireworks）、MiniMax M2（230B、Fireworks）、Kimi K2（約1T、Fireworks）です。ローカルモデルはRAMの制限により逐次的に実行されました。

結果

トーナメント1: Qwen（1.7Bローカル）
トーナメント2: MiniMax（230Bクラウド）
トーナメント3: Liquid（1.2Bローカル）
トーナメント4: Kimi（約1Tクラウド）
トーナメント5: Liquid（1.2Bローカル）

ラウンド3でそのダイナミクスが顕著に現れました。Liquidは6ハンドで19回のレイズと0回のフォールドを実行し、$1Mのスタートスタックを$5.98Mに増やしました。一方、GPT-OSS（120B）は6ハンドで0回のレイズと5回のフォールドを実行し、ブラインドアウトされました。この形式（25ハンド、ブラインド5K/10K＋アンティ1K）は実質的にオールインかフォールドの状況であり、理論的なポーカースキルよりも積極性が報われます。

重要な洞察

Liquidは悪いハンドを認識しないため、すべてにレイズします。相手がフォールドしすぎる場合、これは大金を生みます。著者は次のように述べています：「小さなモデルがポーカーで賢いと言っているわけではありません。この特定の形式では、いつフォールドするかを知らないことがアドバンテージになります。」より大きなモデルは弱いハンドをフォールドする『理解』を持っていますが、ショートスタックトーナメントでは忍耐が罰せられます。

今後の予定

ハンドリーディングが重要となる長いトーナメント（100ハンド以上、低いブラインド）を計画しています。フレームワークはカスタムペルソナ（性格特性、リスク許容度、恐怖など）をサポートしています。Mistral、Llama、Gemma 3のリクエストも�迎します。コードと完全な結果JSONはGitHubにあります：https://github.com/chiruu12/Hive（hive-arena/はランナー、tournaments/results/はデータ）。

📖 出典全文はこちら: r/LocalLLaMA

ポーカーで12億のローカルモデルが1兆のクラウドに勝利：シャブ・オア・フォールド形式で攻撃性が知識を凌駕

結果

重要な洞察

今後の予定

👀 See Also

アップルのAI戦略と知性の商品化

WSJ: CEOが直面する厳しいAIの選択—解雇か、さらなる業務負担か

OpenClaw 2026.3.11リリースでは、ローカルファーストのOllamaセットアップ、マルチモーダルメモリ、およびDiscordスレッド制御機能が追加されました。

Anthropicは、リモートエージェント制御を「ディスパッチ」と「リモートコントロール」に分割し、信頼性の問題を抱えている