FixAI Dev: Claude Haikuを使用した厳格なJSON契約による消費者権利ゲーム

開発者が、Claude Haikuを企業AIとして消費者要求を不当に拒否するシミュレーションを行うブラウザゲーム「FixAI Dev」を作成しました。プレイヤーは実際の消費者保護法を使って反論し、法的に適切な主張をするとAIの確信度が低下します。
アーキテクチャと実装
このシステムは厳密な関心の分離を採用しています:Claude Haikuは言語生成のみを担当し、サーバー側でどの法的主張が抵抗をどれだけ減少させるかを定義します。両コンポーネント間には厳格なJSON契約があり、ゲームロジックが自由形式のLLM出力に触れることはありません。
ゲーム詳細
- EU、米国、英国、オーストラリアの37のケース
- フライト返金、ブロックされた銀行カード、ビザ拒否、保険請求などのシナリオ
- 最初の1か月で約700人のプレイヤー
- 無料でアカウント不要
現在の課題と将来計画
開発者は、高い抵抗値(85-95)の場合、Haikuが強力な主張に対して予想される完全な低下ではなく部分的な減少を与えることがある問題に直面しています。現在はシステムプロンプト内の明示的な抵抗帯で対応しており、より洗練されたアプローチを模索中です。
今後の方向性:
- 学習パス完了のための証明書システム
- 企業が同じエンジン上で独自のトレーニングシナリオを構築するB2Bレベルエディター
- 企業向けアピールのためのFixAI Devからの潜在的なリブランディング
開発者は、敵対的AIシミュレーションやロールプレイシナリオのプロンプトエンジニアリングの経験を持つ協力者を探しており、ボットの挙動をより現実的にすることを目指しています。
📖 Read the full source: r/ClaudeAI
👀 See Also

Claudeを用いたObsidian用エージェント型RAGの構築と幻覚検出のための評価ハーネス
ある開発者が、自身のObsidian Vault上にエージェンティックRAGシステムを構築し、Claudeが工学書の質問に回答できるようにした。さらに、Claude Sonnetを判定役とする評価ハーネスを作成し、エージェントが誤った内容を自信満々に出力するケースを検出できるようにした。ルーブリックの反復改良により、判定者と人間の一致率が39%から94%に向上した。

オープンソースのWebダッシュボードが、リモートワークフローのClaudeトークン使用量を追跡します
開発者がreact-ai-token-monitorを構築しました。これは、ローカルのClaudeプロジェクトファイルをリアルタイムで解析してコストを計算し、モデルの内訳を表示し、使用パターンを追跡する軽量なWebダッシュボードです。このツールにより、2026年3月にMax 20xプランで4,808ドル相当のClaudeトークンが消費されたことが明らかになりました。

Blackwell LLMツールキット:RTX Pro 6000上でのTensorRT-LLM用NVFP4構成、ホイール、ベンチマーク
コミュニティリポジトリが、Blackwell GPU向けのTensorRT-LLM設定、sm_120対応のプリビルドLMCacheホイール、ベンチマークを提供。Nemotron-3-Nano-Omni V3は、1枚のRTX Pro 6000で8Kコンテキストにおいて270 tok/sを達成。

開発者が108のツールを備えたPower Automate MCPサーバーを構築、クロスプラットフォーム対応
ある開発者が、ベンダー提供のソリューションを断り、カスタムのPower Automate MCPサーバーを構築し、ツールを12から108に拡張しました。これにより、ODataを介したDataverseのCRUD操作、Graphを介したSharePoint管理、Power Appsのバージョン管理と権限設定、環境管理(作成、コピー、バックアップ、復元)、そしてWindows、macOS、Linuxのクロスプラットフォームサポートをカバーするようになりました。