Локальный рабочий процесс ИИ-агента с использованием OpenCode, FastMCP и DeepSeek-r1

Разработчик на r/LocalLLaMA описывает переход от использования LLM как "усовершенствованного автодополнения" к реализации локального агентного рабочего процесса с OpenCode, FastMCP и моделью DeepSeek-r1.
Стандарт AGENTS.md для детерминированных промптов
Разработчик использует файл AGENTS.md как детерминированное руководство, которое внедряет строгие правила в системный промпт ИИ. Примеры включают: "Используй Python 3.9, форматируй с помощью Ruff, абсолютно никаких глобальных переменных". Этот подход направлен на устранение галлюцинаций с самого начала.
Локальные под-агенты с DeepSeek-r1
Вместо использования облачных API, таких как Claude или GPT-4o, для тривиальных задач, они настроили Ollama с бесплатной моделью deepseek-r1. Они создали конкретные под-агенты, например, для тестирования, определённого в файле pytest.md. Ключевые настройки включают:
- Температура установлена на 0.1
- Инструменты ограничены: "pytest": true и "bash": false
Это позволяет ИИ автономно запускать наборы тестов, читать трассировки и исправлять синтаксические ошибки, при этом блокируя потенциально опасные команды, такие как rm -rf.
FastMCP для стандартизированного предоставления локальных функций
FastMCP описывается как "'USB-C' для ИИ" — аналогично FastAPI, но для ИИ-агентов. Примерно в 5 строках Python можно запустить локальный сервер для предоставления безопасных локальных функций (например, запросов к базе данных разработки) стандартизированным способом, который может использовать любой агент OpenCode.
Важный совет по реализации: направляйте все логи Python в stderr, потому что протокол MCP работает через stdio. Оставленный стандартный оператор print() может повредить пакет JSON-RPC и разорвать соединение.
Разработчик отмечает, что записал видео, где кодирует всю эту архитектуру с нуля и настраивает локальное окружение примерно за 15 минут.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Открытое хранилище памяти ИИ для проектов на NodeJS
Mind Palace — это система хранения и извлечения памяти с открытым исходным кодом для NodeJS, которая сохраняет информацию между сессиями чата LLM. Она поддерживает основные LLM и векторные хранилища, автоматически извлекая и векторизуя суммированные воспоминания из взаимодействий.

Exasol выпускает MCP-сервер для интеграции контекста базы данных в рабочие процессы AI-агентов
Exasol выпустила MCP Server, который позволяет базам данных предоставлять AI-агентам контекст о доступных данных, бизнес-правилах и безопасных методах взаимодействия. Сервер по умолчанию работает в режиме только для чтения, поддерживает рабочие процессы с высокой параллельной нагрузкой и может быть развернут в локальной среде, в облаке или в гибридных средах.

Открытые навыки Claude для продуктовых менеджеров: генератор PRD, пользовательские истории, протоколы встреч
Разработчик выпустил пять бесплатных навыков Claude AI для продуктовых менеджеров, которые генерируют форматированные файлы .docx для PRD, пользовательских историй, синтеза встреч, маркетинговых исследований и обновлений для стейкхолдеров. Инструменты избегают выдуманного контента и используют структурированные шаблоны.

Профилировщик затрат на LLM: инструмент с открытым исходным кодом отслеживает расходы на API, чтобы обосновать использование локальных моделей.
LLM Cost Profiler — это инструмент на Python, который отслеживает каждый API-вызов к OpenAI/Anthropic, показывая, на что именно и сколько вы тратите. Он выявляет задачи, стоимость которых завышена относительно их сложности, предоставляя конкретные суммы в долларах для обоснования перехода на локальные модели.