Semble: Поиск кода для ИИ-агентов, использующий на 98% меньше токенов, чем grep+read

✍️ OpenClawRadar📅 Опубликовано: 17 мая 2026 г.🔗 Source
Semble: Поиск кода для ИИ-агентов, использующий на 98% меньше токенов, чем grep+read
Ad

Semble — это быстрая и эффективная по токенам библиотека поиска кода, созданная специально для ИИ-агентов написания кода, таких как Claude Code, Cursor, Codex и OpenCode. Она возвращает соответствующие фрагменты кода по запросам на естественном языке или кодовым запросам, используя примерно на 98% меньше токенов, чем типичный подход grep+read.

Как это работает

Semble объединяет статические эмбеддинги Model2Vec (с использованием собственной модели potion-code-16M) с BM25, объединяя их через RRF и переранжируя с помощью сигналов, учитывающих код. Все вычисления выполняются на CPU — без GPU, ключей API и внешних сервисов. Индексация среднего репозитория занимает ~250 мс, а запросы выполняются за ~1,5 мс на CPU.

Ключевые особенности

  • Эффективность по токенам: на 98% меньше токенов, чем grep+read — возвращаются только релевантные фрагменты.
  • Быстрота: ~250 мс на индексацию типичного репозитория, ~1,5 мс на запрос (очень большие репозитории могут обрабатываться дольше).
  • Точность: 0,854 NDCG@10 на собственном бенчмарке из ~1250 пар запрос/документ в 63 репозиториях и 19 языках — 99% от лучшей конфигурации трансформера (137 миллионов параметров) при примерно в 200 раз более быстрой индексации и в 10 раз более быстрых запросах.
  • Без настройки: не требуются ключи API, GPU или внешние сервисы.
  • MCP-сервер: подключается для Claude Code, Cursor, Codex, OpenCode и любого агента, совместимого с MCP.
  • Локальная и удаленная работа: передайте локальный путь или git-URL. Индексы кэшируются на время сессии и автоматически обновляются при изменении файлов.
Ad

Установка и настройка

MCP-сервер (рекомендуется для агентов)

Требуется установленный uv. Для Claude Code:

claude mcp add semble -s user -- uvx --from "semble[mcp]" semble

Для Codex добавьте в ~/.codex/config.toml:

[mcp_servers.semble]
command = "uvx"
args = ["--from", "semble[mcp]", "semble"]

Для OpenCode добавьте в ~/.opencode/config.json:

{
  "mcp": {
    "semble": {
      "type": "local",
      "command": ["uvx", "--from", "semble[mcp]", "semble"]
    }
  }
}

Для Cursor добавьте в ~/.cursor/mcp.json или .cursor/mcp.json:

{
  "mcpServers": {
    "semble": {
      "command": "uvx",
      "args": ["--from", "semble[mcp]", "semble"]
    }
  }
}

Интеграция с Bash (альтернатива)

Установите через pip или uv, затем добавьте сниппет для поиска кода в AGENTS.md или CLAUDE.md:

pip install semble
uv tool install semble

Затем в AGENTS.md:

## Code Search
Используйте `semble search` для поиска кода, описывая его функциональность или указывая имя символа/идентификатора, вместо grep:
```bash
semble search "authentication flow" ./my-project
```

MCP-инструменты

MCP-сервер предоставляет два инструмента:

  • search — Поиск в кодовой базе по запросу на естественном языке или кодовому запросу. Параметр repo — путь к локальной директории или git-URL вида https://.
  • find_related — По заданному пути к файлу и номеру строки возвращает фрагменты, семантически похожие на код в этой позиции.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

Сервер RiserFlow MCP расширяет возможности OpenClaw, добавляя функции электронной коммерции.
Инструменты

Сервер RiserFlow MCP расширяет возможности OpenClaw, добавляя функции электронной коммерции.

Открытый MCP-сервер под названием RiserFlow позволяет OpenClaw выполнять семантический поиск товаров, управлять корзинами и размещать реальные заказы, которые отображаются в системах администрирования магазинов, с текущей поддержкой Bitrix и шаблоном адаптера для других платформ.

OpenClawRadar
Щитбот: Открытый плагин-сканер безопасности для Claude Code
Инструменты

Щитбот: Открытый плагин-сканер безопасности для Claude Code

Shieldbot — это сканер безопасности с открытым исходным кодом, который работает как плагин внутри Claude Code, объединяя шесть сканеров, включая Semgrep с более чем 5000 правил, Bandit, Ruff, detect-secrets, pip-audit и npm audit. Он устраняет дублирование результатов и генерирует приоритизированные отчёты с оценками риска и исправлениями кода.

OpenClawRadar
Расширение OpenClaw Browser Relay для Chrome — альтернатива ручным настройкам.
Инструменты

Расширение OpenClaw Browser Relay для Chrome — альтернатива ручным настройкам.

Пользователь Reddit сообщает об успехе с расширением Chrome для браузерного реле OpenClaw после того, как попытки ручной настройки вызвали сбои системы и проблемы с отладкой.

OpenClawRadar
Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.
Инструменты

Тестирование показывает, что инструменты автоматизации браузера на основе ИИ различаются в 2,6 раза по стоимости токенов при одинаковой точности.

Бенчмарк 4 инструментов автоматизации браузера через CLI с использованием Claude Sonnet 4.6 на 6 реальных задачах показал, что все достигли 100% точности, но openbrowser-ai использовал 36 010 токенов, в то время как другие использовали 77 123–94 130 токенов. Количество вызовов инструментов оказалось самым сильным предиктором стоимости токенов.

OpenClawRadar