ReasonDB: ベクトル検索ではなくLLM誘導ツリーナビゲーションを使用するオープンソースドキュメントデータベース

ReasonDBの機能
ReasonDBは、ドキュメント構造を階層(見出し→セクション→段落)として保持し、LLMにそのツリーをナビゲートさせて回答を見つけさせることで、知識検索に異なるアプローチを取るオープンソースのドキュメントデータベースです。これにより、ベクトルDBやRAGパイプラインにおける検索失敗がデバッグのブラックボックス化するという一般的な問題に対処します。
仕組み
取り込みプロセス: ドキュメントはマークダウンに変換され、構造ごとにチャンク化され、ツリーが構築され、各ノードはLLMによって要約されます(ボトムアップ方式)。
クエリプロセス: BM25が候補ノードを絞り込む→tree-grepが構造でフィルタリング→LLMが要約でランク付け→ツリー上のビームサーチトラバーサルで回答を抽出します。LLMは、フラットなベクトルインデックスを検索する代わりに、数百万ノードのうち約25ノードを訪問します。
クエリ言語とスタック
ReasonDBは、SQLライクなクエリ言語であるRQLを使用します:
SELECT * FROM contracts SEARCH 'payment terms' REASON 'What are the late payment penalties?' LIMIT 5;ここで、SEARCH = BM25、REASON = LLMガイドによるツリートラバーサルです。
スタックは、redb、tantivy、axum、tokioを使用してRustで構築されています。OpenAI、Anthropic、Gemini、Cohere、および互換性のあるAPI(ローカルまたはOpenAI互換エンドポイントを含む)で動作する単一のバイナリです。
実用的な応用
このアプローチは、RAGの検索品質に悩んでいる開発者や、純粋なベクトル検索ではなく構造ベースの検索を試したい開発者に特に有用です。このツールは、Brainfishでの3年間の知識検索経験を経て構築されました。そこでは、ベクトルDB、グラフDB、カスタムRAGパイプラインが一貫して同じデバッグの課題を提示していました。
📖 全文を読む: r/LocalLLaMA
👀 See Also

JetBrains、AIエージェントJunieとClaude Codeを搭載したモダンGoコード用プラグインを発表
JetBrainsは、AIエージェントJunieとClaude Codeのプラグインをリリースし、最新のGo機能とベストプラクティスに準拠することで、モダンなGoコード生成能力を強化しました。

CostHawk、Claude Code、Codex、Cursorのトークン消費量公開リーダーボードを発表
CostHawkのリーダーボードは、Claude Code、OpenAI Codex、Cursorの一般ユーザーを総トークン消費量でランク付けし、カウント、モデル、同期タイムスタンプを追跡しますが、プロンプトやコードは保存しません。

コールドバリデーションアーキテクチャ:デュアルエージェントコードレビューシステムをオープンソース化
オープンソースのシステムは、コード検証のために2つの独立したAIエージェントを使用します:1つはコードを構築し、もう1つは構築者の推論についての文脈を一切持たずにコードをレビューします。レビュアーは計画文書、コード差分、テスト出力のみを参照します。

re_gent:AIコーディングエージェントのためのGit – エージェント活動のバージョン管理
re_gentは、AIエージェントセッションのバージョン管理を提供するオープンソースツールです。すべてのツール呼び出しを追跡し、プロンプトやファイル差分を保存し、`rgt log`、`rgt blame`、`rgt rewind`(近日公開)などのコマンドを可能にします。