Использование локальной LLM в качестве суб-агента Claude для кодирования с целью сокращения использования контекста

✍️ OpenClawRadar📅 Опубликовано: 2 марта 2026 г.🔗 Source

Разработчик на r/LocalLLaMA демонстрирует, как использовать Claude Code для делегирования задач локальной LLM, работающей через LM Studio, уменьшая использование контекста Claude за счёт хранения содержимого файлов локально.

Как это работает

Система использует небольшой Python-скрипт (около 120 строк, только стандартная библиотека), который запускает цикл агента:

Вы передаёте Claude описание задачи без содержимого файлов
Скрипт отправляет его на конечную точку /v1/chat/completions LM Studio с определениями инструментов read_file и list_dir
Локальная модель сама вызывает эти инструменты для чтения нужных файлов
Цикл продолжается до получения окончательного ответа
Claude видит только результат, а не содержимое файлов

Пример использования

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"
# [turn 1] → read_file({'path': 'solar-system.html'})
# [turn 2] → Этот HTML-файл создаёт интерактивную анимированную солнечную систему...

Содержимое файла попадает в контекст локальной модели (протестировано с Qwen3.5 35B 4-bit через MLX на Apple Silicon), а не в контекст Claude.

Для чего это полезно

Суммаризация и объяснение кода
Поиск ошибок
Создание шаблонов / первых набросков
Трансформация и перевод текста (протестировано с ивритом)
Логические задачи и рассуждения (используйте флаг --think для сложных проблем)

Для чего это не подходит

Задачи, требующие полного контекста Claude, такие как понимание взаимосвязей между несколькими файлами
Задачи, требующие истории текущего разговора
Всё, где критически важна точность

Автор описывает это как "ассистента уровня хайку, а не замену".

Настройка

LM Studio работает локально с включённым API-сервером
Один Python-скрипт для цикла агента, один для простых запросов только с промптами
Оба подключены к глобальному ~/.claude/CLAUDE.md, чтобы Claude Code знал, когда предлагать делегирование
Не требуется сервер MCP, зависимости pip или инфраструктура плагинов
Рекомендация: добавьте {%- set enable_thinking = false %} в начало шаблона jinja — для большинства задач это экономит время и токены без потери качества

Автор отмечает, что Claude помог написать пост, но под наблюдением и с исправлениями, и готов поделиться скриптами, если будет интерес.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

АТЛАС: Открытый конвейер вычислений во время тестирования для Qwen3-14B демонстрирует высочайший уровень производительности в программировании

Студент колледжа разработал ATLAS — открытый конвейер вычислений во время тестирования, построенный на основе Qwen3-14B, который достигает 74,6% pass@1 на задачах LiveCodeBench v5 при стоимости электроэнергии около $0,004 за задачу. Система медленная для сложных проблем, но предлагает сопоставимую производительность с передовыми моделями, такими как GPT-5 (84,6%) и Claude 4.5 Sonnet (71,4%).

10 мар. 2026 г., 21:45 UTC

OpenClawRadar

Инструменты

Запуск Альфреда Бета: Упрощённая альтернатива OpenClaw для нетехнических пользователей

Alfred — это новый бета-инструмент, который предоставляет примерно 70% функциональности OpenClaw при значительно меньшей сложности, предлагая простые настройки по умолчанию для подключения приложений, памяти, режимов использования и инфраструктуры, а также позволяя кастомизацию.

16 апр. 2026 г., 19:45 UTC

OpenClawRadar

Инструменты

BrightBean Studio: Открытая платформа для управления социальными сетями, созданная на основе AI-агентов

BrightBean Studio — это платформа с открытым исходным кодом для управления социальными сетями, которую можно разместить на собственном сервере. Она поддерживает более 10 платформ с прямыми интеграциями через официальные API. Проект был создан за 3 недели с использованием Claude и Codex.

16 апр. 2026 г., 16:45 UTC

OpenClawRadar

Инструменты

SkillsGate: Открытая Платформа для Навыков ИИ-Агентов в Программировании

SkillsGate — это открытая платформа-маркетплейс, которая индексирует более 45 000 навыков для ИИ-агентов программирования, таких как Claude Code, Cursor и Windsurf. Она предоставляет семантический поиск с векторными эмбеддингами и установку одной командой через npx.

13 мар. 2026 г., 19:45 UTC

OpenClawRadar