Практический опыт замены стека автоматизации на MCP-серверы и локальные LLM.

✍️ OpenClawRadar📅 Опубликовано: 1 марта 2026 г.🔗 Source

Настройка и оборудование

Разработчик использует смесь моделей Qwen 2.5 32B (квантованная) и Llama 3.3 70B на системе с двумя видеокартами 3090. Каждая задача автоматизации получает свой MCP-сервер, который предоставляет инструменты, которые модель может вызывать, функционируя как API, потребляемый LLM, а не человеком.

Что работает хорошо

Автоматизация ревью кода: Направление модели на git diff через инструменты MCP выявляет реальные проблемы, включая логические ошибки, отсутствие обработки ошибок и состояния гонки. Работает примерно на 70% так же хорошо, как ревью старшего разработчика.
Анализ логов и оповещения: MCP-сервер подключается к стеку ELK, а модель отслеживает аномальные паттерны. Она обнаружила 3 производственные проблемы до срабатывания оповещений Grafana. Ключ в том, чтобы дать достаточно контекста о том, что выглядит "нормальным" для вашей системы.
Генерация документации: Модель читает кодовую базу через инструменты MCP для работы с файлами и генерирует/обновляет API-документацию, экономя часы в неделю с действительно хорошим качеством вывода.

Что не работает (пока)

Цепочки многошаговых рассуждений: Всё, что требует более 3-4 последовательных вызовов инструментов, начинает сбиваться с пути, так как модель теряет контекст исходной цели. Меньшие окна контекста усугубляют это. Подсказки в виде цепочки мыслей помогают, но не решают проблему.
Принятие решений в реальном времени: Задержка в моделях на 70B означает, что их нельзя использовать для задач, чувствительных ко времени. Конвейер ревью кода занимает 2-3 минуты на PR, что делает его подходящим для асинхронных рабочих процессов, но бесполезным для приложений реального времени.
Творческое решение проблем: Локальные модели испытывают трудности с задачами, требующими подходов, недостаточно представленных в обучающих данных. API-модели (Claude, GPT-4) здесь заметно лучше.

Ключевые архитектурные уроки

Держите MCP-серверы без состояния. Пусть модель управляет состоянием через вызовы инструментов, а не через сессию на стороне сервера.
Встраивайте логику повторных попыток в ваш MCP-клиент, а не в сервер. Модели будут делать некорректные вызовы инструментов примерно в 5% случаев.
Логируйте каждый вызов инструмента и ответ для отладки, когда модель делает что-то неожиданное.
Используйте структурированный вывод (режим JSON) для всего, что потребляется нижестоящими системами. Вывод в свободной текстовой форме — это кошмар для отладки.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Кейсы

Ошибки часовых поясов в системах бронирования, созданных ИИ: пример из практики

Сгенерированный Клодом прототип бронирования хранил время в UTC, отображал в IST — сломался для преподавателей из Дубая и США. 11 ошибочных бронирований подорвали доверие. Исправлено с помощью luxon.

18 мая 2026 г., 14:16 UTC

OpenClawRadar

Кейсы

Использование Claude Code для автоматического обновления OAuth-токенов OpenClaw

Разработчик делится методом использования Claude Code для автоматического обновления токенов OpenClaw OAuth каждые 8 часов, предотвращая их истечение во время длительных сессий программирования. Для этого требуется держать компьютер включенным с активной сессией Claude Code.

19 апр. 2026 г., 11:45 UTC

OpenClawRadar

Кейсы

Некодер создает локальный загрузчик видео с помощью Claude AI за один вечер.

Пользователь без знаний программирования использовал Claude AI для создания AZ Downloader — локального загрузчика видео, работающего на 14 из 16 платформ, включая YouTube, TikTok, Instagram и Reddit. Инструмент был создан за один вечер и теперь доступен на GitHub.

25 февр. 2026 г., 19:45 UTC

OpenClawRadar

Кейсы

Система управления личными проектами с использованием Claude Code и Obsidian: архитектура и вопросы

Разработчик описывает трёхуровневую персональную операционную систему, использующую Claude Code в качестве движка обработки данных, Obsidian для отслеживания знаний и OneDrive для хранения файлов, с конкретными командами, такими как /daily и /pm-sync, для маршрутизации записей и задач управления проектами.

26 мар. 2026 г., 15:45 UTC

OpenClawRadar