グラフベースのコードインデックスでAIコーディングセッションコストを90%削減

Redditユーザーによると、Claude Codeのクエリごとに2〜6ドルを費やしていたのは、モデルがセッションごとに数十のファイルを再読み込みするためです。キャッシュを使用しても(トークンの70%がキャッシュから提供され、90%割引)、キャッシュはセッションごとにリセットされます。解決策は、コードベースをグラフデータベースにインデックス化するローカルサーバーで、Model Context Protocol(MCP)を介してクエリを実行し、生のファイル読み取りを回避します。
仕組み
- AST解析やベクトル埋め込みの代わりに、このツールはLLMを使用して各ファイルの目的、要約、ビジネスコンテキストを生成し、さらにその関数、クラス、インポートへのリンクを提供します。
- グラフはMCPサーバーを通じて公開されます。Claudeは、リポジトリ全体をコンテキストにダンプする代わりに、グラフにクエリを実行して対象を絞ったルックアップ(質問あたり2〜4ノード)を行います。
- セッションコストはドルからセントに削減されました。このアプローチは、DeepSeek-V4やKimi-2.6のようなオープンソースモデルでも同様に機能します。なぜなら、検索(モデルサイズではなく)が主要な処理を行うからです。
セットアップの詳細
すべてローカルで実行され、シングルテナントで、クラウド依存はありません。プロジェクトはGitHubでオープンソース化されています:github.com/ByteBell/bytebell-oss。ユーザーはAST解析やベクトルを使用していないと述べています。グラフはLLMが生成したファイル分析です。
対象読者
大規模なコードベースでClaude Code(またはトークンコストがかかるAIエージェント)を使用している開発者で、セッション間で構造的コンテキストをキャッシュすることでコストを削減したい方。
📖 Read the full source: r/ClaudeAI
👀 See Also

4ペインiTerm2セットアップによるClaudeコードCLIのAI役割分離
開発者が、コンテキストの逸脱と自己評価バイアスに対処するために、Claude Code CLI専用の4ペインiTerm2ターミナルセットアップを構築しました。各ペインは特定の役割に固定され、専用モデルと権限が割り当てられています。

Cloudflare Dynamic Worker Loader: AIエージェントをアイソレートでサンドボックス化
CloudflareのDynamic Worker Loader APIは、現在オープンベータ版で、V8 isolateを使用した隔離されたサンドボックス内で、ランタイム指定のコードで新しいWorkerをインスタンス化できるようにします。コンテナと比べて100倍高速な起動を実現し、グローバルな同時実行制限はありません。

OpenClawスマートルーターがオープンソース化、自動モデル選択に対応
開発者がOpenClaw用のスマートルーターをオープンソース化しました。このツールはクエリの複雑さを自動的に分類し、最適なモデルにルーティングすることで、ClaudeやGPT-4oのようなプレミアムモデルを常に使用する場合と比べてAPIコストを60〜80%削減します。

Auto-co: Claudeのコードを自律型AI企業に変える50行のBashスクリプト
Auto-coは、Claude Code CLIをループでラップする約50行のbashスクリプトです。CEO、エンジニア、批評家など14のAIエージェントが役割を担い、自律的に実行されます。FormReplyやChangelog.devを含む4つの製品をゼロから構築し、270以上のサイクルで総費用は268ドルでした。