Разработчик делится гибридным рабочим процессом в AI-кодинге: Claude для планирования, локальные модели для выполнения.

✍️ OpenClawRadar📅 Опубликовано: 16 апреля 2026 г.🔗 Source
Разработчик делится гибридным рабочим процессом в AI-кодинге: Claude для планирования, локальные модели для выполнения.
Ad

Гибридный рабочий процесс ИИ-кодирования снижает облачные расходы

Разработчик на r/LocalLLaMA поделился подробным рабочим процессом, который сочетает облачные и локальные модели ИИ для снижения стоимости токенов при сохранении качества кода. Этот подход решает проблему осознания того, что многие задачи по кодированию не требуют дорогих облачных моделей.

Архитектура рабочего процесса

Система следует логике «Рассуждай в облаке, выполняй локально»:

  • Планировщик (Claude 3.5 Sonnet): Получает задачу и генерирует точный файл task_context.md, содержащий инструкции, пути к файлам и логику. Это стоит примерно 300–500 токенов.
  • Кодер (Локальный Qwen2.5-Coder 30B через Ollama): Принимает спецификацию и фактическое содержимое файла для написания кода. Работает локально с нулевой стоимостью.
  • Валидатор: Простой Bash-скрипт запускает tsc --noEmit или mypy для проверки типов.
  • Рецензент (Локальный Qwen2.5-Coder 7B): Работает параллельно, чтобы проверить на наличие очевидных логических ошибок.
  • Автоисправление: Если сборка не удалась, журнал ошибок возвращается локальному кодеру на 2–3 итерации.
Ad

Детали реализации

Весь конвейер обёрнут в набор Bash-скриптов, использующих только jq и curl для связи с API Ollama. Система автоматически определяет языковые стандарты (TypeScript, Python, C++ и т.д.) на основе вывода планировщика и не требует тяжёлых сред выполнения Python/Node.

Разработчик отмечает, что локальные модели (даже 30B) часто не справляются со сложными архитектурными рассуждениями, но удивительно хорошо выполняют задачи, когда им дают кристально ясные спецификации.

Результаты и экономия

В недавнем проекте на TypeScript с изменением 12 файлов:

  • Использование Claude было ограничено только начальной фазой планирования
  • Локальные модели обработали всё остальное: написание 12 файлов, линтинг и рецензирование
  • Общая экономия: примерно 85% сокращение токенов по сравнению с выполнением всего внутри Claude Code CLI

Разработчик сделал скрипты доступными в репозитории под названием ai-orchestrator на GitHub (имя пользователя: Mybono) для тех, кто интересуется деталями реализации.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Microsoft VibeVoice: ASR модели на 60 минут и TTS модели на 90 минут с открытым исходным кодом
Инструменты

Microsoft VibeVoice: ASR модели на 60 минут и TTS модели на 90 минут с открытым исходным кодом

VibeVoice — это семейство голосовых AI-моделей с открытым исходным кодом от Microsoft, включающее ASR (однопроходная обработка до 60 минут, диаризация дикторов, более 50 языков) и TTS (мультиспикер до 90 минут, потоковый режим в реальном времени). Использует непрерывные токенизаторы речи с частотой 7,5 Гц и диффузию следующего токена.

OpenClawRadar
Sentinel: Самостоятельно размещаемая платформа агентов для подписчиков Claude Code
Инструменты

Sentinel: Самостоятельно размещаемая платформа агентов для подписчиков Claude Code

Sentinel — это бесплатная платформа с открытым исходным кодом, которая работает напрямую на вашем существующем токене OAuth Claude Code без накладных расходов на API. Она предоставляет чистый интерфейс оператора с автоматизацией браузера в реальном времени через встроенный VNC и включает такие функции, как Git-контроль, журналы трассировки сессий и структурированную иерархическую память.

OpenClawRadar
Сообщество выпустило патч, добавляющий поддержку языков с письмом справа налево в Claude Desktop для Windows.
Инструменты

Сообщество выпустило патч, добавляющий поддержку языков с письмом справа налево в Claude Desktop для Windows.

Разработчик создал патч, добавляющий правильную поддержку языков с письмом справа налево в Claude Desktop для Windows, исправляя некорректное отображение для иврита, арабского и других RTL-языков. Патч внедряет логику определения RTL в рендерер Electron-приложения и включает функции резервного копирования и восстановления.

OpenClawRadar
🦀
Инструменты

Агентальманах: Каталог 23 MCP-серверов с готовыми к вставке JSON-конфигами

Пользователь Reddit составил каталог из 23 MCP-серверов с готовыми к вставке конфигами для Claude Desktop, Cursor и Continue. Обходит заархивированные серверы, указывая на поддерживаемые альтернативы. Демо-версия работает на Cloudflare Workers.

OpenClawRadar