Замена сложных конвейеров извлечения данных простыми командами git shell для агентов LLM.

От сложного конвейера к простому доступу к оболочке
Изначально команда создала DiffMem, систему памяти для ИИ-агентов на основе git с историей версий в качестве контекста. Их слой извлечения использовал sentence-transformers для оценки косинусного сходства, rank-bm25 для поиска по ключевым словам и двухэтапный LLM-конвейер для уточнения запросов и синтеза результатов. Это привело к Docker-образу размером 3 ГБ (из-за зависимостей PyTorch), 10% таймаутов у активных пользователей и холодным запускам, которые каждый раз перестраивали индекс BM25 в памяти.
Осознание: LLM уже знают git
Инсайт пришёл с пониманием, что команды Unix плотно представлены в обучающих данных LLM через миллиарды файлов README, CI-скриптов и ответов на Stack Overflow. Команда осознала, что они извлекали информацию из git с помощью собственного кода и передавали её модели, которая уже понимает команды git.
Решение: Одна инструментальная функция
Они заменили всё одним инструментом:
{
"name": "run",
"description": "Выполнить команду только для чтения в репозитории памяти",
"parameters": {
"command": "Команда оболочки (поддерживает цепочки |, &&, ||, ;)"
}
}
Как работает агент
Агент следует фиксированному протоколу: прочитать манифест сущности, выполнить временной зонд против журнала коммитов, объединить исследование в один вызов инструмента, вывести план извлечения, затем остановиться. Он возвращает указатели, а не содержимое, сохраняя контекст лёгким.
Агент читает лёгкие сигналы во время ходов:
head -30для структурыgrep -nдля ключевых словgit diff HEAD~3..для недавних изменений
Реальный пример: Поиск связей через историю коммитов
Когда пользователь отправил поздравление с днём рождения, упомянув чувство одиночества, агент выполнил:
git log --format='%h %ad' --date=relative --name-only -15
Это показало, что wife.md и company.md изменились в одной сессии, а ключевой коллега появился в 2 из последних 3 сессий. Поиск по ключевым словам (BM25) никогда бы не нашёл company.md по запросу "чувствую себя одиноким в свой день рождения", но временная связь в истории git имела значение.
На третьем ходе агент составил один вызов инструмента с девятью командами, соединёнными точкой с запятой:
git diff HEAD~2.. -- memories/people/wife.md; git log --stat -5 -- memories/people/wife.md; head -30 memories/people/wife.md; grep -n "birthday|surgery|stress" memories/people/wife.md; tail -50 timeline/2026-03.md; git diff HEAD~3.. -- timeline/2026-03.md; grep -n "project|deliverable" memories/contexts/company.md; git diff HEAD~2.. -- memories/contexts/company.md; git diff HEAD~1.. -- memories/people/colleague.md
Результаты
Итоговым выводом стал план извлечения в формате JSON с конкретными git diff, уровнями приоритета и оценками токенов. Это позволило удалить rank-bm25, sentence-transformers, scikit-learn и numpy. Размер Docker-образа уменьшился примерно на 3 ГБ, сервер запускается быстрее, использует меньше памяти, и 10% таймаутов исчезли. Что осталось: requests, openai и gitpython.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Клодигочи: Физическое устройство Тамагочи, которое питается активностью кода Клода
Клодиготчи — это физическое настольное существо, работающее на ESP32 с ЖК-экраном, которое подключается к Claude Code через плагин. Система голода устройства реагирует на активность кодирования, с визуальными состояниями и звуковыми эффектами, которые усиливаются, когда Claude оставляют бездействующим.

Обходимый граф навыков для постоянной памяти ИИ-агента в кодовых базах
Разработчик создал трехслойную систему графа навыков, которая существует внутри кодовой базы, позволяя ИИ-ассистентам для программирования сохранять постоянную память между сессиями. Система использует прогрессивное раскрытие информации с самонаправляющими инструкциями вместо монолитных контекстных файлов.

8 продвинутых советов по Claude Code: экономия затрат, управление контекстом, пользовательские команды
Практические советы от ежедневного интенсивного использования Claude Code: автоматизация git-воркфлоу, ввод мультимодальных изображений, отслеживание использования API, сжатие контекста, возобновление сессий, управление правилами, триггеры уровней размышлений и пользовательские команды.

Интеграция Claude с Canva: практический рабочий процесс для генерации дизайна
Коннектор Claude к Canva экспортирует редактируемые проекты Canva со структурированными макетами, а не плоскими изображениями. В посте описан рабочий процесс от запроса до готового карусели за 12-15 минут, включая настройку, режим High Fidelity и честные ограничения.