Использование локальной LLM в качестве суб-агента Claude для кодирования с целью сокращения использования контекста

✍️ OpenClawRadar📅 Опубликовано: 2 марта 2026 г.🔗 Source
Использование локальной LLM в качестве суб-агента Claude для кодирования с целью сокращения использования контекста
Ad

Разработчик на r/LocalLLaMA демонстрирует, как использовать Claude Code для делегирования задач локальной LLM, работающей через LM Studio, уменьшая использование контекста Claude за счёт хранения содержимого файлов локально.

Как это работает

Система использует небольшой Python-скрипт (около 120 строк, только стандартная библиотека), который запускает цикл агента:

  • Вы передаёте Claude описание задачи без содержимого файлов
  • Скрипт отправляет его на конечную точку /v1/chat/completions LM Studio с определениями инструментов read_file и list_dir
  • Локальная модель сама вызывает эти инструменты для чтения нужных файлов
  • Цикл продолжается до получения окончательного ответа
  • Claude видит только результат, а не содержимое файлов

Пример использования

python3 agent_lm.py --dir /path/to/project "summarize solar-system.html"
# [turn 1] → read_file({'path': 'solar-system.html'})
# [turn 2] → Этот HTML-файл создаёт интерактивную анимированную солнечную систему...

Содержимое файла попадает в контекст локальной модели (протестировано с Qwen3.5 35B 4-bit через MLX на Apple Silicon), а не в контекст Claude.

Для чего это полезно

  • Суммаризация и объяснение кода
  • Поиск ошибок
  • Создание шаблонов / первых набросков
  • Трансформация и перевод текста (протестировано с ивритом)
  • Логические задачи и рассуждения (используйте флаг --think для сложных проблем)
Ad

Для чего это не подходит

  • Задачи, требующие полного контекста Claude, такие как понимание взаимосвязей между несколькими файлами
  • Задачи, требующие истории текущего разговора
  • Всё, где критически важна точность

Автор описывает это как "ассистента уровня хайку, а не замену".

Настройка

  • LM Studio работает локально с включённым API-сервером
  • Один Python-скрипт для цикла агента, один для простых запросов только с промптами
  • Оба подключены к глобальному ~/.claude/CLAUDE.md, чтобы Claude Code знал, когда предлагать делегирование
  • Не требуется сервер MCP, зависимости pip или инфраструктура плагинов
  • Рекомендация: добавьте {%- set enable_thinking = false %} в начало шаблона jinja — для большинства задач это экономит время и токены без потери качества

Автор отмечает, что Claude помог написать пост, но под наблюдением и с исправлениями, и готов поделиться скриптами, если будет интерес.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

АТЛАС: Открытый конвейер вычислений во время тестирования для Qwen3-14B демонстрирует высочайший уровень производительности в программировании
Инструменты

АТЛАС: Открытый конвейер вычислений во время тестирования для Qwen3-14B демонстрирует высочайший уровень производительности в программировании

Студент колледжа разработал ATLAS — открытый конвейер вычислений во время тестирования, построенный на основе Qwen3-14B, который достигает 74,6% pass@1 на задачах LiveCodeBench v5 при стоимости электроэнергии около $0,004 за задачу. Система медленная для сложных проблем, но предлагает сопоставимую производительность с передовыми моделями, такими как GPT-5 (84,6%) и Claude 4.5 Sonnet (71,4%).

OpenClawRadar
Запуск Альфреда Бета: Упрощённая альтернатива OpenClaw для нетехнических пользователей
Инструменты

Запуск Альфреда Бета: Упрощённая альтернатива OpenClaw для нетехнических пользователей

Alfred — это новый бета-инструмент, который предоставляет примерно 70% функциональности OpenClaw при значительно меньшей сложности, предлагая простые настройки по умолчанию для подключения приложений, памяти, режимов использования и инфраструктуры, а также позволяя кастомизацию.

OpenClawRadar
BrightBean Studio: Открытая платформа для управления социальными сетями, созданная на основе AI-агентов
Инструменты

BrightBean Studio: Открытая платформа для управления социальными сетями, созданная на основе AI-агентов

BrightBean Studio — это платформа с открытым исходным кодом для управления социальными сетями, которую можно разместить на собственном сервере. Она поддерживает более 10 платформ с прямыми интеграциями через официальные API. Проект был создан за 3 недели с использованием Claude и Codex.

OpenClawRadar
SkillsGate: Открытая Платформа для Навыков ИИ-Агентов в Программировании
Инструменты

SkillsGate: Открытая Платформа для Навыков ИИ-Агентов в Программировании

SkillsGate — это открытая платформа-маркетплейс, которая индексирует более 45 000 навыков для ИИ-агентов программирования, таких как Claude Code, Cursor и Windsurf. Она предоставляет семантический поиск с векторными эмбеддингами и установку одной командой через npx.

OpenClawRadar