Замена сложных конвейеров извлечения данных простыми командами git для агентов ИИ

✍️ OpenClawRadar📅 Опубликовано: 20 марта 2026 г.🔗 Source
Замена сложных конвейеров извлечения данных простыми командами git для агентов ИИ
Ad

От сложного пайплайна к простым командам git

Разработчик, создающий DiffMem — систему памяти для ИИ-агентов на основе git, обнаружил, что их слой извлечения данных был излишне сложным. Они использовали sentence-transformers для оценки косинусного сходства, rank-bm25 для поиска по ключевым словам, двухэтапный пайплайн LLM для уточнения запросов и синтеза результатов, а также scikit-learn и numpy в качестве зависимостей. Это приводило к образу Docker размером 3 ГБ (sentence-transformers тянул за собой весь PyTorch), таймаутам у активных пользователей примерно в 10% случаев и холодному старту, который каждый раз перестраивал BM25-индекс в памяти.

Осознание: LLM уже знают git

Ключевое прозрение пришло с пониманием, что команды Unix — это самый плотный паттерн использования инструментов в обучающих данных любой LLM. Миллиарды файлов README, CI-скриптов и ответов на Stack Overflow полны команд grep, git log и cat. LLM не нужен пользовательский пайплайн извлечения данных, построенный вокруг неё — она уже говорит на языке команд оболочки.

Решение в виде одного инструмента

Они заменили всю сложную систему одним инструментом:

{
  "name": "run",
  "description": "Выполнить команду только для чтения в репозитории памяти",
  "parameters": {
    "command": "Команда оболочки (поддерживает цепочки |, &&, ||, ;)"
  }
}

Вот и всё. Одна функция. Агент пишет команды оболочки, уже зная grep, git diff, head и другие утилиты Unix, без необходимости их обучения.

Как работает агент

Агент следует фиксированному протоколу на всех своих ходах:

  • Читает манифест сущности
  • Запускает временной зонд против журнала коммитов
  • Группирует своё исследование в один вызов инструмента
  • Выводит план извлечения данных
  • Останавливается

Агент возвращает указатели, а не содержимое. Он читает лёгкие сигналы во время своих ходов (head -30 для структуры, grep -n для ключевых слов, git diff HEAD~3.. для недавних изменений), а затем сообщает коду, что нужно получить. Код разрешает указатели, сохраняя контекст агента лёгким.

Ad

Пример из реальной жизни

Когда пользователь отправил сообщение о дне рождения, в котором говорилось о чувстве изоляции из-за рабочего давления, агент выполнил:

git log --format='%h %ad' --date=relative --name-only -15

Это показало, что wife.md и company.md изменились в одной сессии, а ключевой коллега появился в 2 из последних 3 сессий. В сообщении пользователя не было ничего о работе — BM25 никогда бы не нашёл company.md, и семантическое сходство по фразе «чувствую себя одиноким в свой день рождения» тоже бы не привело к этому. Но совместное появление в истории коммитов выявило связь, которая действительно имела значение.

На третьем ходу агент составил один вызов инструмента с девятью командами, соединёнными точкой с запятой:

git diff HEAD~2.. -- memories/people/wife.md; git log --stat -5 -- memories/people/wife.md; head -30 memories/people/wife.md; grep -n "birthday|surgery|stress" memories/people/wife.md; tail -50 timeline/2026-03.md; git diff HEAD~3.. -- timeline/2026-03.md; grep -n "project|deliverable" memories/contexts/company.md; git diff HEAD~2.. -- memories/contexts/company.md; git diff HEAD~1.. -- memories/people/colleague.md

Итоговым выводом был план извлечения данных в формате JSON с конкретными git diff, уровнями приоритета и оценками токенов — не содержимое, а указатели. Затем код выполнил команды и собрал контекст в рамках бюджета токенов.

Результаты

Этот подход позволил им удалить rank-bm25, sentence-transformers, scikit-learn и numpy. Размер образа Docker сократился примерно на 3 ГБ. Сервер запускается быстрее, использует долю памяти и больше не имеет BM25-индекса при холодном старте. 10% таймаутов исчезли. На Cloud Run с реальной нагрузкой от пользователей это было не маргинальное улучшение, а другой класс развёртывания.

Что осталось: requests, openai, gitpython.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

🦀
Инструменты

PullMD v2.4.1:新增针对claude.ai网页的原生MCP连接器及多用户认证

PullMD v2.4.1 теперь поддерживает диалог пользовательского коннектора claude.ai через OAuth 2.1 + PKCE-S256 и добавляет многопользовательские режимы аутентификации. Превращайте любой URL в чистый Markdown с помощью самоуправляемого MCP.

OpenClawRadar
Клауфорс: Открытая система управления для команд агентов Клаубот
Инструменты

Клауфорс: Открытая система управления для команд агентов Клаубот

Clawforce — это система управления с открытым исходным кодом для команд агентов Clawbot, которая позволяет развернуть их в несколько кликов. Она предоставляет настройку персонажей, навыков, интеграций MCP и инструментов через пользовательский интерфейс, при этом агенты способны совместно планировать, координировать и выполнять задачи.

OpenClawRadar
Приложение ClawTalk для iOS позволяет общаться голосом с самоуправляемыми ИИ-агентами OpenClaw.
Инструменты

Приложение ClawTalk для iOS позволяет общаться голосом с самоуправляемыми ИИ-агентами OpenClaw.

ClawTalk — это нативное приложение для iOS, которое предоставляет голосовой чат с функцией push-to-talk для саморазмещённых LLM-настроек OpenClaw. Оно включает преобразование речи в текст на устройстве с помощью WhisperKit, потоковые ответы в реальном времени с рендерингом markdown и поддерживает несколько вариантов синтеза речи, включая ElevenLabs, OpenAI и встроенные голоса Apple.

OpenClawRadar
ForgeAI: Визуальная рабочая платформа для инженерии моделей
Инструменты

ForgeAI: Визуальная рабочая платформа для инженерии моделей

ForgeAI предоставляет визуальный интерфейс для инспекции, объединения и обучения моделей, предлагая такие функции, как проверка архитектуры 3D моделей и M-DNA Forge для визуального объединения слоев.

OpenClawRadar