AIエージェントのためのコード検索:なぜベクトル埋め込みが失敗し、ファイルごとのLLMグラフが勝利するのか

✍️ OpenClawRadar📅 公開日: May 10, 2026🔗 Source
AIエージェントのためのコード検索:なぜベクトル埋め込みが失敗し、ファイルごとのLLMグラフが勝利するのか
Ad

AIコーディングツール向けのコードインデックスシステムを構築する1年間の実験で、明確な結果が得られた。コードチャンクへのベクトル埋め込みとTree-sitter AST解析にはどちらも重大な欠点があり、Neo4jグラフにセマンティック全文検索とともに格納されたファイルごとのLLM分析が最も効果的である。この知見は、RepoGraph(ICLR 2025)やCode-Craftなどの最近の論文とも一致する。

テストされたアプローチ

  • コードチャンクへのベクトル埋め込み – 完全に破棄。決済サービス内のprocess()という関数と画像パイプライン内のprocess()は、互いに全く関係がないにもかかわらず、類似したベクトルに埋め込まれる。ベクトルはコールグラフ、継承、インポートなどの構造的関係を平坦化する。検索精度は許容できなかった。
  • Tree-sitter AST解析 – 正確で高速だが、構造のみ。関数が存在し、何を呼び出すかは教えられるが、「この関数は失敗したStripe支払いのウェブフック再試行を処理する」という質問には答えられない。開発者がビジネス言語で質問する場合に不十分。
  • ファイルごとのLLM分析 → グラフ – 機能する。各ファイルにLLM呼び出しを行い、purposesummarybusinessContextを生成し、Neo4jのノードとしてクラス、関数、キーワード、インポートへのエッジとともに格納する。検索にはベクトル類似性ではなく、それらのセマンティックフィールドを対象とした全文検索を使用する。SHA-256差分チェックにより再インデックスを変更されたファイルのみに制限し、初期コストを管理可能にしている。

文献からのベンチマーク

RepoGraph(ICLR 2025)は、グラフアプローチでSWE-benchの性能を+32.8%向上させることを示した。Code-Craftは、コードグラフからのボトムアップLLMサマリーを使用して、トップ1検索精度を+82%達成した。

Ad

既存ツールとの比較

チームはcomparison.mdで比較表を公開している。主な違いは以下の通り:

  • Bytebell:ファイルごとのLLM → purpose + summary + businessContext + entities;Neo4j + MongoDBストレージ;SHA-256差分認識型再インデックス。
  • PageIndex:長いPDF/ドキュメント向けのTOC推論ツリー;コード固有のセマンティクスなし。
  • GitNexus:Tree-sitter AST + コミュニティ検出;オプションでシンボルごとのセマンティクス;LadybugDBを使用。
  • GraphRAG:チャンクごとのLLMエンティティ + 一般テキスト(コード以外)向けのコミュニティクラスタリング。
  • Sourcegraph/Cody:LSIF/SCIP検索インデックス;ノードごとのセマンティクスなし;デプロイはセルフホストまたはSaaS。
  • Augment:埋め込みを使用したプロプライエタリなセマンティックインデックス;SaaSのみ;継続的インデックス管理。

オープンソース

このシステムはgithub.com/ByteBell/bytebell-ossでオープンソースとして公開されている。

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

AIコーディングエージェントが20ターン後に粗悪なコードを出力する理由:コンテキスト盲目
Tools

AIコーディングエージェントが20ターン後に粗悪なコードを出力する理由:コンテキスト盲目

APIログの詳細な監査により、CursorとClaude Codeは賢くなっているわけではなく、ノイズで膨れ上がったコンテキストウィンドウに窒息し、アーキテクチャを破壊していることが明らかになった。

OpenClawRadar
GGUFモデルマージスクリプトとワークフロー for Qwen3.5-35B バリアント
Tools

GGUFモデルマージスクリプトとワークフロー for Qwen3.5-35B バリアント

Redditユーザーが、GGUFモデルファイルを最小限の損失でマージするPythonスクリプトを共有しました。具体的には、HauhauCSのQwen3.5-35B-A3B-UncensoredモデルとsamuelcardilloのClaude-4.6-Opus-Reasoning-Distilledバージョンを組み合わせています。このスクリプトはGoogle Colab Free Tierで動作し、llama-quantizeによる量子化サポートを含んでいます。

OpenClawRadar
マルチエージェントAI開発のためのガバナンスレイヤーの区切り
Tools

マルチエージェントAI開発のためのガバナンスレイヤーの区切り

Delimitは、複数のAIコーディングエージェント間の調整を管理し、競合を防止するオープンソースのガバナンスレイヤーです。Claude Code、Codex、Geminiなどのエージェントに対して、共有メモリ、衝突検出、監査追跡を提供します。

OpenClawRadar
クイック質問プラグインがClaudeコードでUnity開発を自動化
Tools

クイック質問プラグインがClaudeコードでUnity開発を自動化

開発者が、Claude Codeを使用する際のUnity開発ワークフローを自動化するプラグイン「quick-question」をリリースしました。このツールはコンパイル、テストを処理し、手動介入を減らすためのクロスモデルコードレビューシステムを実装しています。

OpenClawRadar