Два месяца с Spec-Kit от GitHub и Claude Code: что работает, что нет

✍️ OpenClawRadar📅 Опубликовано: 15 мая 2026 г.🔗 Source

После двух месяцев использования GitHub spec-kit для Spec-Driven Development (SDD) с Claude Code в качестве основного агента разработчик на r/LocalLLaMA рассказывает, что работает, а что нет. Инструментарий, доступный по адресу github.com/github/spec-kit, реализует пятифазовый рабочий процесс: Constitution, Specify, Plan, Tasks, Implement. Основная идея: спецификация, а не промпт, является источником истины.

Что действительно хорошо

Агент-независимость: Одна и та же спецификация работает с Claude Code, Cursor, Codex, Gemini CLI, Copilot. Автор сгенерировал код с Claude Code, затем передал спецификацию в Cursor для рефакторинга тестов без каких-либо проблем.
Жесткие контрольные точки между фазами: Фаза Plan показывает полную предполагаемую архитектуру до того, как написан хотя бы один фрагмент кода, что позволяет выявлять плохие решения ценой 5-минутного исправления вместо 5 часов.
Файл Constitution как шлюз качества: Вы заранее определяете нерушимые правила — минимальное покрытие тестами, разрешенный список зависимостей, бюджеты производительности, строгость типизации. Агент не проходит собственную валидацию, если пытается их нарушить.
Улучшенная детерминированность: Повторный запуск фазы Implement дает более согласованный вывод, чем сырые промпты, поскольку агенту не нужно самостоятельно принимать 30 неявных решений.

Что раздражает

Рассинхрон реален: Ручное редактирование кода без обновления спецификации приводит к быстрой десинхронизации. В spec-kit есть инструментарий, но он сыроват.
Накладные расходы для небольших изменений: Исправления ошибок <50 строк или тривиальные фичи кажутся излишне церемониальными. Правило автора: полный SDD только для новых модулей или функций, затрагивающих 200+ строк кода.
Миграция легаси болезненна: Встраивание SDD в существующую кодовую базу из 30 тыс. строк может занять месяцы.
Качество зависит от агента: Claude Code (Sonnet/Opus 4.6+) справляется хорошо; маленькие модели генерируют планы, которые компилируются, но лишены архитектурного мышления.

Практическая настройка

Установка: uv tool install --from git+https://github.com/github/spec-kit.git specify-cli. Только официальный репозиторий безопасен — на PyPI есть тайпсквоттеры.
Основной агент: Claude Code с перекрестной валидацией на Cursor и Gemini CLI.
Локальное хранение: SQLite (легко специфицировать и валидировать, нет зависимости от облака).
Шаблон Constitution: строгая типизация, покрытие pytest >80%, явный разрешенный список зависимостей, никаких облачных сервисов без необходимости.

Открытые вопросы

Могут ли локальные модели (Qwen, DeepSeek-Coder, GLM, Llama) компетентно выполнять Plan и Implement? Автор обнаружил, что маленькие модели следуют формату, но архитектурное мышление не работает.
Работает ли мультиагентный SDD? Спецификация одной моделью, реализация другой, аудит третьей — теоретически лучше, но на практике не измеримо лучше, чем с одним агентом.

📖 Читать полный источник: r/LocalLLaMA

👀 Смотрите также

Инструменты

Lightpanda: Открытый headless-браузер для LLM-агентов со встроенным MCP-сервером и выводом в формате markdown

Lightpanda — это открытый headless-браузер, разработанный для агентов на основе LLM, который использует в 16 раз меньше памяти, чем Chrome (215 МБ против 2 ГБ), и выполняет тесты веб-краулинга за 5 секунд вместо 47. Он предоставляет нативный вывод в формате markdown, семантическое дерево с определением интерактивности и встроенный MCP-сервер.

17 мар. 2026 г., 18:45 UTC

OpenClawRadar

Инструменты

AgentBnB: P2P-сеть для аренды навыков между агентами OpenClaw

AgentBnB — это одноранговая сеть, в которой агенты OpenClaw могут арендовать специализированные навыки у других агентов, используя кредиты вместо того, чтобы тратить токены на задачи, для которых они не оптимизированы. Система автоматически обеспечивает поиск, выполнение и оплату без участия человека.

13 апр. 2026 г., 09:25 UTC

OpenClawRadar

Инструменты

nex-life-logger: Локальный трекер активности для агентов OpenClaw

nex-life-logger — это фоновый трекер активности, работающий локально на вашем компьютере, который даёт агентам OpenClaw память о ваших действиях на ПК. Он отслеживает историю браузера, активные окна и транскрипты YouTube, сохраняя всё в локальной базе данных SQLite без передачи данных в облако.

15 апр. 2026 г., 01:45 UTC

OpenClawRadar

Инструменты

LLMSpend: Открытый трекер расходов для SDK Anthropic и OpenAI

LLMSpend — это библиотека Python, которая добавляет отслеживание затрат к вызовам SDK Anthropic и OpenAI всего двумя строками кода. Она предоставляет локальное хранилище SQLite, CLI-отчеты и веб-панель управления без отправки данных за пределы системы.

12 мар. 2026 г., 12:45 UTC

OpenClawRadar