Использование локальной LLM в качестве суб-агента для кодирования Claude для снижения расхода контекста

✍️ OpenClawRadar📅 Опубликовано: 2 марта 2026 г.🔗 Source

Claude Code может управлять задачами, делегируя их локальной LLM, работающей на вашем компьютере, аналогично тому, как он использует подчинённых агентов Claude. Этот подход сохраняет содержимое файлов вне контекста Claude — обратно передаются только сводка и выводы локальной модели.

Как это работает

Небольшой Python-скрипт (около 120 строк, только стандартная библиотека) запускает цикл агента:

Вы передаёте Claude описание задачи без содержимого файлов
Скрипт отправляет его на конечную точку LM Studio /v1/chat/completions с определениями инструментов read_file и list_dir
Локальная модель сама вызывает эти инструменты, чтобы прочитать нужные файлы
Цикл продолжается, пока не будет получен окончательный ответ
Claude видит только результат

Пример команды:

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"

В результате:

[ход 1] → read_file({'path': 'solar-system.html'})
[ход 2] → Этот HTML-файл создаёт интерактивную анимированную солнечную систему...

Содержимое файла попадает в контекст локальной модели (проверено с контекстом Qwen), а не Claude.

Варианты использования и ограничения

На основе тестирования с Qwen3.5 35B 4-bit через MLX на Apple Silicon, этот подход хорош для:

Суммаризации и объяснения кода
Поиска ошибок
Создания шаблонов / первых набросков
Трансформации и перевода текста (проверено с ивритом)
Логических задач и рассуждений (используйте флаг --think для сложных проблем)

Он не подходит для:

Задач, требующих полного контекста Claude
Понимания нескольких файлов, где важны взаимосвязи
Задач, требующих истории текущего разговора
Всего, где критична точность

Считайте его помощником уровня Haiku, а не заменой Claude.

Требования к настройке

LM Studio, работающий локально с включённым API-сервером
Один Python-скрипт для цикла агента, один для простых запросов только с промптом
Оба подключены к глобальному файлу ~/.claude/CLAUDE.md, чтобы Claude Code знал, когда предлагать делегирование
Не требуется MCP-сервер, зависимости pip или инфраструктура плагинов

Совет по настройке: добавьте {%- set enable_thinking = false %} в начало шаблона Jinja. Для большинства задач не требуется, чтобы локальная модель рассуждала, и это экономит время и токены, увеличивая скорость без реального ухудшения качества для таких задач.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Навык Claude Code с открытым исходным кодом /unzuck организует ленты социальных сетей в единую панель управления.

Бесплатный, открытый навык Claude Code под названием /unzuck параллельно сканирует ленты Hacker News, Reddit, LinkedIn, YouTube, Twitter/X, Instagram и Facebook с помощью автоматизации браузера, оценивает элементы по профилям интересов пользователей и генерирует интерактивные HTML-дашборды.

1 апр. 2026 г., 16:45 UTC

OpenClawRadar

Инструменты

Навык OpenClaw PARA Автоматически Организует Файлы с Использованием Метода Тьяго Форте

Разработчик создал навык для OpenClaw, который применяет метод PARA (Проекты, Области, Ресурсы, Архивы) для автоматической организации файлов, перемещая их из захламлённого корневого каталога в структурированные папки.

24 февр. 2026 г., 19:45 UTC

OpenClawRadar

Инструменты

Tandem MCP: Запуск и управление сессиями Claude Code из чата Claude.ai

Tandem — это MCP-сервер с открытым исходным кодом, который связывает чат Claude.ai с локальными сессиями Claude Code, позволяя организовать автономные циклы кодирования без копирования и вставки.

13 июл. 2026 г., 00:23 UTC

OpenClawRadar

Инструменты

Qwen3.6:27b + Пользовательский Go-агент: локальная альтернатива Claude Code

Разработчик тестирует Qwen3.6:27b в Q8 на RTX 6000 (96 ГБ), утверждает, что он сравним с Claude Code для ежедневного кодинга, и публикует в открытый доступ минималистичного Go-агента без плагинов и MCP.

15 мая 2026 г., 12:15 UTC

OpenClawRadar