Semble: コード検索AIエージェントがgrep+readより98%少ないトークンで実現

Sembleは、Claude Code、Cursor、Codex、OpenCodeなどのAIコーディングエージェント向けに特別に設計された、高速でトークン効率の良いコード検索ライブラリです。自然言語やコードクエリから関連するコードスニペットを返し、典型的なgrep+readのフォールバック手法と比較して約98%少ないトークンを使用します。
仕組み
Sembleは、静的Model2Vec埋め込み(独自のpotion-code-16Mモデルを使用)とBM25を組み合わせ、RRFで融合し、コード認識シグナルで再ランク付けします。すべての計算はCPU上で実行されます。GPU、APIキー、外部サービスは不要です。平均的なリポジトリのインデックス作成には約250ms、クエリはCPU上で約1.5msで完了します。
主な特徴
- トークン効率:grep+readより98%少ないトークン — 関連チャンクのみを返します。
- 高速:典型的なリポジトリのインデックス作成に約250ms、クエリごとに約1.5ms(非常に大きなリポジトリでは時間がかかる場合があります)。
- 高精度:63のリポジトリと19の言語にわたる約1250のクエリ/ドキュメントペアのベンチマークでNDCG@10が0.854 — 最高のトランスフォーマー設定(137Mパラメータ)の99%の品質を、インデックス作成で約200倍高速、クエリで約10倍高速で実現。
- 設定不要:APIキー、GPU、外部サービスは不要。
- MCPサーバー:Claude Code、Cursor、Codex、OpenCode、およびMCP互換の任意のエージェントにドロップインで使用可能。
- ローカル・リモート両対応:ローカルパスまたはgit URLを指定可能。インデックスはセッションごとにキャッシュされ、ファイルの変更時に自動更新されます。
インストールとセットアップ
MCPサーバー(エージェント推奨)
uvがインストールされている必要があります。Claude Codeの場合:
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble
Codexの場合、~/.codex/config.tomlに追加:
[mcp_servers.semble] command = "uvx" args = ["--from", "semble[mcp]", "semble"]
OpenCodeの場合、~/.opencode/config.jsonに追加:
{
"mcp": {
"semble": {
"type": "local",
"command": ["uvx", "--from", "semble[mcp]", "semble"]
}
}
}Cursorの場合、~/.cursor/mcp.jsonまたは.cursor/mcp.jsonに追加:
{
"mcpServers": {
"semble": {
"command": "uvx",
"args": ["--from", "semble[mcp]", "semble"]
}
}
}Bash統合(代替手段)
pipまたはuvでインストールし、コード検索スニペットをAGENTS.mdまたはCLAUDE.mdに追加:
pip install semble uv tool install semble
その後、AGENTS.mdに:
## コード検索 `grep`の代わりに、`semble search`を使用して、コードの機能説明やシンボル/識別子の名前でコードを検索します: ```bash semble search "authentication flow" ./my-project ```
MCPツール
MCPサーバーは2つのツールを提供します:
search— 自然言語またはコードクエリでコードベースを検索します。repoにはローカルディレクトリのパスまたはhttps://のgit URLを指定します。find_related— ファイルパスと行番号を指定すると、その位置のコードに意味的に類似したチャンクを返します。
📖 全文を読む: 出典:HN AI Agents
👀 See Also

ブラウザCLI:AIコーディングエージェント向けのトークン効率の良いブラウザ自動化ツール
Browser CLIは、プレーンなBashコマンドによるブラウザ自動化を提供する永続的なヘッドレスChromiumデーモンで、Playwright MCPと比較して約95%のトークン節約を実現し、約1,500トークンから約75トークンへコール数を削減します。

ローカル行動監視システム(MCPパイプラインとClaudeコード搭載)
開発者は、BRAINと呼ばれるローカル行動監視システムを構築しました。このシステムはアプリの切り替え、ファイル操作、開発セッションを追跡し、カスタムMCPサーバーを介してデータをClaude Codeに送信します。システムは100%ローカルで動作し、クラウドへの依存は一切ありません。

HN SOTA: ハッカーニュースのコメントによるコーディングモデルの人気追跡
HN SOTAは、Hacker Newsのコメントをスクレイピングし、Geminiを使用してOpenRouterリストからコーディングモデルを特定し、メンションごとの感情を公開Googleスプレッドシートに記録する、毎日更新されるパイプラインです。直近10日間のメンション数のトップ10モデルが表示されます。

AI終末ツールボックス v0.932は、AndroidローカルAI向けにベンチマーキング、データセット作成、エージェントワークスペースを追加しました。
AI Doomsday Toolbox v0.932では、Androidデバイス上でのローカルLLMのベンチマーク機能、テキスト/PDFファイルをAlpaca JSON形式に変換するデータセット作成ツール、Termux連携を備えたAIエージェントワークスペースが導入されました。このアップデートには、Whisperによる字幕焼き込み機能と組み込みのOllama管理ツールも含まれています。