Замена сложных конвейеров извлечения данных простыми командами git shell для агентов LLM.

✍️ OpenClawRadar📅 Опубликовано: 20 марта 2026 г.🔗 Source
Замена сложных конвейеров извлечения данных простыми командами git shell для агентов LLM.
Ad

От сложного конвейера к простому доступу к оболочке

Изначально команда создала DiffMem, систему памяти для ИИ-агентов на основе git с историей версий в качестве контекста. Их слой извлечения использовал sentence-transformers для оценки косинусного сходства, rank-bm25 для поиска по ключевым словам и двухэтапный LLM-конвейер для уточнения запросов и синтеза результатов. Это привело к Docker-образу размером 3 ГБ (из-за зависимостей PyTorch), 10% таймаутов у активных пользователей и холодным запускам, которые каждый раз перестраивали индекс BM25 в памяти.

Осознание: LLM уже знают git

Инсайт пришёл с пониманием, что команды Unix плотно представлены в обучающих данных LLM через миллиарды файлов README, CI-скриптов и ответов на Stack Overflow. Команда осознала, что они извлекали информацию из git с помощью собственного кода и передавали её модели, которая уже понимает команды git.

Решение: Одна инструментальная функция

Они заменили всё одним инструментом:

{
  "name": "run",
  "description": "Выполнить команду только для чтения в репозитории памяти",
  "parameters": {
    "command": "Команда оболочки (поддерживает цепочки |, &&, ||, ;)"
  }
}

Как работает агент

Агент следует фиксированному протоколу: прочитать манифест сущности, выполнить временной зонд против журнала коммитов, объединить исследование в один вызов инструмента, вывести план извлечения, затем остановиться. Он возвращает указатели, а не содержимое, сохраняя контекст лёгким.

Агент читает лёгкие сигналы во время ходов:

  • head -30 для структуры
  • grep -n для ключевых слов
  • git diff HEAD~3.. для недавних изменений
Ad

Реальный пример: Поиск связей через историю коммитов

Когда пользователь отправил поздравление с днём рождения, упомянув чувство одиночества, агент выполнил:

git log --format='%h %ad' --date=relative --name-only -15

Это показало, что wife.md и company.md изменились в одной сессии, а ключевой коллега появился в 2 из последних 3 сессий. Поиск по ключевым словам (BM25) никогда бы не нашёл company.md по запросу "чувствую себя одиноким в свой день рождения", но временная связь в истории git имела значение.

На третьем ходе агент составил один вызов инструмента с девятью командами, соединёнными точкой с запятой:

git diff HEAD~2.. -- memories/people/wife.md; git log --stat -5 -- memories/people/wife.md; head -30 memories/people/wife.md; grep -n "birthday|surgery|stress" memories/people/wife.md; tail -50 timeline/2026-03.md; git diff HEAD~3.. -- timeline/2026-03.md; grep -n "project|deliverable" memories/contexts/company.md; git diff HEAD~2.. -- memories/contexts/company.md; git diff HEAD~1.. -- memories/people/colleague.md

Результаты

Итоговым выводом стал план извлечения в формате JSON с конкретными git diff, уровнями приоритета и оценками токенов. Это позволило удалить rank-bm25, sentence-transformers, scikit-learn и numpy. Размер Docker-образа уменьшился примерно на 3 ГБ, сервер запускается быстрее, использует меньше памяти, и 10% таймаутов исчезли. Что осталось: requests, openai и gitpython.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Клодигочи: Физическое устройство Тамагочи, которое питается активностью кода Клода
Инструменты

Клодигочи: Физическое устройство Тамагочи, которое питается активностью кода Клода

Клодиготчи — это физическое настольное существо, работающее на ESP32 с ЖК-экраном, которое подключается к Claude Code через плагин. Система голода устройства реагирует на активность кодирования, с визуальными состояниями и звуковыми эффектами, которые усиливаются, когда Claude оставляют бездействующим.

OpenClawRadar
Обходимый граф навыков для постоянной памяти ИИ-агента в кодовых базах
Инструменты

Обходимый граф навыков для постоянной памяти ИИ-агента в кодовых базах

Разработчик создал трехслойную систему графа навыков, которая существует внутри кодовой базы, позволяя ИИ-ассистентам для программирования сохранять постоянную память между сессиями. Система использует прогрессивное раскрытие информации с самонаправляющими инструкциями вместо монолитных контекстных файлов.

OpenClawRadar
8 продвинутых советов по Claude Code: экономия затрат, управление контекстом, пользовательские команды
Инструменты

8 продвинутых советов по Claude Code: экономия затрат, управление контекстом, пользовательские команды

Практические советы от ежедневного интенсивного использования Claude Code: автоматизация git-воркфлоу, ввод мультимодальных изображений, отслеживание использования API, сжатие контекста, возобновление сессий, управление правилами, триггеры уровней размышлений и пользовательские команды.

OpenClawRadar
Интеграция Claude с Canva: практический рабочий процесс для генерации дизайна
Инструменты

Интеграция Claude с Canva: практический рабочий процесс для генерации дизайна

Коннектор Claude к Canva экспортирует редактируемые проекты Canva со структурированными макетами, а не плоскими изображениями. В посте описан рабочий процесс от запроса до готового карусели за 12-15 минут, включая настройку, режим High Fidelity и честные ограничения.

OpenClawRadar