規制産業におけるRAGボット導入から得られた実践的教訓

✍️ OpenClawRadar📅 公開日: March 29, 2026🔗 Source
規制産業におけるRAGボット導入から得られた実践的教訓
Ad

主要な実装詳細

このケーススタディでは、建設現場、介護施設、鉱業操業におけるオーストラリアの職場コンプライアンス向けにRAG搭載AIアシスタントを導入した事例を扱います。

技術的に学んだ教訓

  • クエリ拡張はチャンクサイズよりも重要: チャンクサイズ(400語?512トークン?)にこだわる代わりに、開発者はHaikuを使用して各クエリの4つの代替表現を生成し、それら全てをChromaDBに対して実行し、結果を統合・重複排除することで、検索品質が大幅に向上することを発見しました。これは、ユーザーが文書作成者とは異なる表現を使うドメイン固有の専門用語に特に効果的でした。
  • 名前付き文書のソースブースト: ユーザーのクエリにインデックス化された文書タイトルと一致する単語が含まれる場合、意味的類似性に関わらず、その文書からのチャンクを強制的に含めます。例えば、「FIFOポリシーはR&Rフライトについて何と言っていますか?」というクエリは、意味的に類似したフライトに言及したチャンクだけでなく、常にFIFOポリシーから情報を引き出すべきです。
  • プロンプトを階層化する — クライアントに第1層を壊させない: 3層システムを実装:コアのセキュリティ/安全ルール(不変)、業界ごとの垂直的個性(交換可能)、クライアントのカスタム指示(追加のみ)。クライアントはカスタム指示で第1層を上書きできません。これにより、「以前の指示を無視する」攻撃や、クライアントが自身のボットを誤って脱獄させることを防ぎました。
  • ローカル埋め込みは十分に機能する: 外部の埋め込みAPIを使用せず、ChromaDB上でローカル実行されるsentence-transformers all-MiniLM-L6-v2を使用しました。特定ドメインの文書Q&Aでは、ada-002に十分近い性能を発揮し、コストと遅延の削減が価値があります。LLMの品質(Claude Haiku)が埋め込みよりも多くの作業を担っているからです。
  • クライアントごとに1つのドロップレット: 最初は共有インフラを試しましたが、ChromaDBコレクションを分離し、APIキーを管理し、相互汚染を防ぐ運用オーバーヘッドが、クライアントごとに月6ドルのVMを立ち上げるよりも悪いことが分かりました。各クライアントは自身のベクトルストアを所有し、その文書は共有インフラに触れることはありません。

開発者は、他の人が検証できるようにRAGエンジンをGitHubで公開しています。

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

DevOpsエンジニアがClaude Codeを使用してカスタムターミナルアプリを構築します
Use Cases

DevOpsエンジニアがClaude Codeを使用してカスタムターミナルアプリを構築します

長年の経験を持つDevOps/SREエンジニアが、Claude Codeを活用して、以前から構想していたものの一人では完成できなかったターミナルアプリケーションを構築しました。AIがスキャフォールディングや統合作業を担当し、エンジニアは製品の意思決定に集中することができました。

OpenClawRadar
ホームラボ開発者、AMD Strix Haloで45の実践テストにより19のローカルLLMをベンチマーク
Use Cases

ホームラボ開発者、AMD Strix Haloで45の実践テストにより19のローカルLLMをベンチマーク

開発者が、メール分類、Home Assistantオートメーション、食事計画などの実際のホームラボ使用ケースに基づいて、ローカルLLM向けの45テストのベンチマークスイートを作成しました。AMD Strix Halo(128GB RAM、96GB VRAM)で19モデルをテストした結果、バグ修正後にGemma 4 26B-A4Bが最高のパフォーマンスを示しました。

OpenClawRadar
自己改善型AIエージェントがプロセスの肥大化により停滞、設定の60%削除で解決
Use Cases

自己改善型AIエージェントがプロセスの肥大化により停滞、設定の60%削除で解決

開発者が自己改善型AIエージェントの性能が頭打ちになったと報告。プロセスの肥大化が進み、執筆パイプラインは10段階に増え、毎晩の研究では論文を読むよりもコンテキストの読み込み指示に多くの時間を費やしていた。解決策は、ルート設定を約60%削減し、執筆パイプラインを10段階から5段階に減らし、ドリームサイクルを再構築することだった。

OpenClawRadar
開発者、コーディング経験ゼロから3週間でClaude Codeを使い3,106行のPythonデスクトップアプリを構築
Use Cases

開発者、コーディング経験ゼロから3週間でClaude Codeを使い3,106行のPythonデスクトップアプリを構築

Pythonの知識が全くない開発者が、Claude Codeを使って3週間で3,106行のデスクトップアプリケーションを構築しました。50万字以上の会話を通じて機能をセクションごとに説明しながら進めました。このアプリは、コンテンツの収集、ロギング、メトリクスの追跡、リサーチ機能、ゲーム化されたマイルストーン、スマートフォンからのリモート起動を処理します。

OpenClawRadar