Замена сложных конвейеров извлечения данных простыми командами git для агентов ИИ

✍️ OpenClawRadar📅 Опубликовано: 20 марта 2026 г.🔗 Source

От сложного пайплайна к простым командам git

Разработчик, создающий DiffMem — систему памяти для ИИ-агентов на основе git, обнаружил, что их слой извлечения данных был излишне сложным. Они использовали sentence-transformers для оценки косинусного сходства, rank-bm25 для поиска по ключевым словам, двухэтапный пайплайн LLM для уточнения запросов и синтеза результатов, а также scikit-learn и numpy в качестве зависимостей. Это приводило к образу Docker размером 3 ГБ (sentence-transformers тянул за собой весь PyTorch), таймаутам у активных пользователей примерно в 10% случаев и холодному старту, который каждый раз перестраивал BM25-индекс в памяти.

Осознание: LLM уже знают git

Ключевое прозрение пришло с пониманием, что команды Unix — это самый плотный паттерн использования инструментов в обучающих данных любой LLM. Миллиарды файлов README, CI-скриптов и ответов на Stack Overflow полны команд grep, git log и cat. LLM не нужен пользовательский пайплайн извлечения данных, построенный вокруг неё — она уже говорит на языке команд оболочки.

Решение в виде одного инструмента

Они заменили всю сложную систему одним инструментом:

{
  "name": "run",
  "description": "Выполнить команду только для чтения в репозитории памяти",
  "parameters": {
    "command": "Команда оболочки (поддерживает цепочки |, &&, ||, ;)"
  }
}

Вот и всё. Одна функция. Агент пишет команды оболочки, уже зная grep, git diff, head и другие утилиты Unix, без необходимости их обучения.

Как работает агент

Агент следует фиксированному протоколу на всех своих ходах:

Читает манифест сущности
Запускает временной зонд против журнала коммитов
Группирует своё исследование в один вызов инструмента
Выводит план извлечения данных
Останавливается

Агент возвращает указатели, а не содержимое. Он читает лёгкие сигналы во время своих ходов (head -30 для структуры, grep -n для ключевых слов, git diff HEAD~3.. для недавних изменений), а затем сообщает коду, что нужно получить. Код разрешает указатели, сохраняя контекст агента лёгким.

Пример из реальной жизни

Когда пользователь отправил сообщение о дне рождения, в котором говорилось о чувстве изоляции из-за рабочего давления, агент выполнил:

git log --format='%h %ad' --date=relative --name-only -15

Это показало, что wife.md и company.md изменились в одной сессии, а ключевой коллега появился в 2 из последних 3 сессий. В сообщении пользователя не было ничего о работе — BM25 никогда бы не нашёл company.md, и семантическое сходство по фразе «чувствую себя одиноким в свой день рождения» тоже бы не привело к этому. Но совместное появление в истории коммитов выявило связь, которая действительно имела значение.

На третьем ходу агент составил один вызов инструмента с девятью командами, соединёнными точкой с запятой:

git diff HEAD~2.. -- memories/people/wife.md; git log --stat -5 -- memories/people/wife.md; head -30 memories/people/wife.md; grep -n "birthday|surgery|stress" memories/people/wife.md; tail -50 timeline/2026-03.md; git diff HEAD~3.. -- timeline/2026-03.md; grep -n "project|deliverable" memories/contexts/company.md; git diff HEAD~2.. -- memories/contexts/company.md; git diff HEAD~1.. -- memories/people/colleague.md

Итоговым выводом был план извлечения данных в формате JSON с конкретными git diff, уровнями приоритета и оценками токенов — не содержимое, а указатели. Затем код выполнил команды и собрал контекст в рамках бюджета токенов.

Результаты

Этот подход позволил им удалить rank-bm25, sentence-transformers, scikit-learn и numpy. Размер образа Docker сократился примерно на 3 ГБ. Сервер запускается быстрее, использует долю памяти и больше не имеет BM25-индекса при холодном старте. 10% таймаутов исчезли. На Cloud Run с реальной нагрузкой от пользователей это было не маргинальное улучшение, а другой класс развёртывания.

Что осталось: requests, openai, gitpython.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Прямой разговор: навык Claude с открытым исходным кодом, который требует честной обратной связи, а не одобрения

Новый открытый навык Claude под названием Straight Talk заставляет Claude отказываться от подтверждения идей, пока он не поймет ситуацию, а затем генерирует контраргументы и проверяет предположения на прочность.

14 июн. 2026 г., 00:19 UTC

OpenClawRadar

Инструменты

Открытый MCP-сервер соединяет Claude Code с инструментами IDE

Открытый сервер MCP предоставляет Claude Code постоянный доступ к функциям IDE, включая LSP, терминалы, Git, GitHub, отладку и диагностику через 124+ инструментов. Он позволяет программировать с мобильных устройств при настройке машины.

27 мар. 2026 г., 06:45 UTC

OpenClawRadar

Инструменты

Флотский Командир: Открытая панель управления для оркестрации нескольких команд агентов Claude Code

Fleet Commander — это локальная веб-панель управления, которая запускает несколько команд агентов Claude Code параллельно для решения разных задач. Она использует структуру «бриллиантовой команды» с агентами Планировщик, Разработчик и Рецензент, которые общаются напрямую через SendMessage.

28 мар. 2026 г., 05:45 UTC

OpenClawRadar

Инструменты

PageAgent: Браузерный ИИ-агент, работающий внутри веб-страниц с поддержкой Ollama

PageAgent — это JavaScript-библиотека, которая запускает ИИ-агентов прямо на веб-страницах, считывая DOM в реальном времени как текст, вместо использования скриншотов. Она работает с любой OpenAI-совместимой конечной точкой, включая Ollama, что позволяет выполнять локальные вызовы LLM прямо из браузера.

28 февр. 2026 г., 18:45 UTC

OpenClawRadar