Semble: Поиск кода для ИИ-агентов, использующий на 98% меньше токенов, чем grep+read

Semble — это быстрая и эффективная по токенам библиотека поиска кода, созданная специально для ИИ-агентов написания кода, таких как Claude Code, Cursor, Codex и OpenCode. Она возвращает соответствующие фрагменты кода по запросам на естественном языке или кодовым запросам, используя примерно на 98% меньше токенов, чем типичный подход grep+read.
Как это работает
Semble объединяет статические эмбеддинги Model2Vec (с использованием собственной модели potion-code-16M) с BM25, объединяя их через RRF и переранжируя с помощью сигналов, учитывающих код. Все вычисления выполняются на CPU — без GPU, ключей API и внешних сервисов. Индексация среднего репозитория занимает ~250 мс, а запросы выполняются за ~1,5 мс на CPU.
Ключевые особенности
- Эффективность по токенам: на 98% меньше токенов, чем grep+read — возвращаются только релевантные фрагменты.
- Быстрота: ~250 мс на индексацию типичного репозитория, ~1,5 мс на запрос (очень большие репозитории могут обрабатываться дольше).
- Точность: 0,854 NDCG@10 на собственном бенчмарке из ~1250 пар запрос/документ в 63 репозиториях и 19 языках — 99% от лучшей конфигурации трансформера (137 миллионов параметров) при примерно в 200 раз более быстрой индексации и в 10 раз более быстрых запросах.
- Без настройки: не требуются ключи API, GPU или внешние сервисы.
- MCP-сервер: подключается для Claude Code, Cursor, Codex, OpenCode и любого агента, совместимого с MCP.
- Локальная и удаленная работа: передайте локальный путь или git-URL. Индексы кэшируются на время сессии и автоматически обновляются при изменении файлов.
Установка и настройка
MCP-сервер (рекомендуется для агентов)
Требуется установленный uv. Для Claude Code:
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble
Для Codex добавьте в ~/.codex/config.toml:
[mcp_servers.semble] command = "uvx" args = ["--from", "semble[mcp]", "semble"]
Для OpenCode добавьте в ~/.opencode/config.json:
{
"mcp": {
"semble": {
"type": "local",
"command": ["uvx", "--from", "semble[mcp]", "semble"]
}
}
}Для Cursor добавьте в ~/.cursor/mcp.json или .cursor/mcp.json:
{
"mcpServers": {
"semble": {
"command": "uvx",
"args": ["--from", "semble[mcp]", "semble"]
}
}
}Интеграция с Bash (альтернатива)
Установите через pip или uv, затем добавьте сниппет для поиска кода в AGENTS.md или CLAUDE.md:
pip install semble uv tool install semble
Затем в AGENTS.md:
## Code Search Используйте `semble search` для поиска кода, описывая его функциональность или указывая имя символа/идентификатора, вместо grep: ```bash semble search "authentication flow" ./my-project ```
MCP-инструменты
MCP-сервер предоставляет два инструмента:
search— Поиск в кодовой базе по запросу на естественном языке или кодовому запросу. Параметрrepo— путь к локальной директории или git-URL вида https://.find_related— По заданному пути к файлу и номеру строки возвращает фрагменты, семантически похожие на код в этой позиции.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Сервер RiserFlow MCP расширяет возможности OpenClaw, добавляя функции электронной коммерции.
Открытый MCP-сервер под названием RiserFlow позволяет OpenClaw выполнять семантический поиск товаров, управлять корзинами и размещать реальные заказы, которые отображаются в системах администрирования магазинов, с текущей поддержкой Bitrix и шаблоном адаптера для других платформ.

Щитбот: Открытый плагин-сканер безопасности для Claude Code
Shieldbot — это сканер безопасности с открытым исходным кодом, который работает как плагин внутри Claude Code, объединяя шесть сканеров, включая Semgrep с более чем 5000 правил, Bandit, Ruff, detect-secrets, pip-audit и npm audit. Он устраняет дублирование результатов и генерирует приоритизированные отчёты с оценками риска и исправлениями кода.

Расширение OpenClaw Browser Relay для Chrome — альтернатива ручным настройкам.
Пользователь Reddit сообщает об успехе с расширением Chrome для браузерного реле OpenClaw после того, как попытки ручной настройки вызвали сбои системы и проблемы с отладкой.

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.
Бенчмарк 4 инструментов автоматизации браузера через CLI с использованием Claude Sonnet 4.6 на 6 реальных задачах показал, что все достигли 100% точности, но openbrowser-ai использовал 36 010 токенов, в то время как другие использовали 77 123–94 130 токенов. Количество вызовов инструментов оказалось самым сильным предиктором стоимости токенов.