AIエージェントパイプライン向けオープンソース構造的幻覚チェッカー

機能概要
AIエージェントパイプライン向けに特別に設計された構造的ハルシネーションチェッカー。事実確認とは異なり、このツールは下流ツールを破壊する構造的失敗の検出に焦点を当てています。
解決する課題
エージェントの問題の多くは事実誤認ではなく、以下のような構造的問題です:
- JSONツール応答でモデルがフィールドを捏造する
- 取得セットに含まれていないソースを引用する
- 取得コンテンツ内に隠されたプロンプトインジェクション
- ツールが返していない内容を返したと主張する
4つの抑制機能
このツールには、Claude Codeで構築された4つの抑制機能が含まれており、エージェントの出力がユーザーに届く前に単一ステップとして実行されます:
grounding_enforcer- モデル出力が実際に渡されたソースでサポートされているか確認prompt_suppressor- 取得コンテンツやツール結果におけるインジェクション試行を検出json_suppressor- 構造化ツール応答を期待されるスキーマに対して検証tool_response_suppressor- ツールが主張する出力と実際の返り値が一致しない場合にフラグを立てる
利用方法
このツールは2つの形式で利用可能です:
- REST API
- MCPサーバー(Claude Desktop、Cursor、Windsurfなどと連携)
無料枠ではクレジットカード不要で月500リクエストを提供します。
ソースとドキュメント
GitHubリポジトリ: https://github.com/steveswain14/mcp-hallucination-suite
APIとドキュメント: https://certifai.dev
📖 Read the full source: r/ClaudeAI
👀 See Also

AIエージェントが事前定義されたツールなしでRemotionを使用して自律的に動画を作成
ある開発者が、AIエージェントをテストし、Remotionのインストール、コンポジションコードの記述、問題のデバッグ、人間の介入なしにレンダリングファイルを提供することで、短いビデオリールを自律的に作成しました。

civStation: 自然言語コマンドで『Civilization VI』をプレイするVLMシステム
civStationは、高水準の自然言語コマンドをゲーム内のアクションに変換することで『Civilization VI』をプレイするコンピューター利用のVLMハーネスです。このシステムは、戦略と実行を分離した3層アーキテクチャを採用し、人間による介入(ヒューマン・イン・ザ・ループ)をサポートしています。

オープンソース書籍創世記:自律的な書籍執筆のための20のClaudeコードスキル
Book Genesisは、20の専門的なClaude Codeスキルからなるオープンソースシステムで、本のアイデアから完成した出版可能な原稿を14段階の自律パイプラインを通じて生成します。AIの予測可能性パターンを破る「カオスエンジン」を含み、68,000語の回顧録を生成し、Genesisスコアで9.0/10を獲得しました。

Claude Codeによる.xcstringsの自動ローカライゼーション
新しいClaude Codeスキルが、Xcodeの.xcstringsファイルのローカライゼーションを5つのパイプラインステージ(ドメインスキャン、コメント生成、CLDR複数形を含む翻訳、文法チェック、複数形修正変換)で自動化します。