GSD-Lite: Конечный автомат для кода Claude, обеспечивающий TDD и предотвращающий пропуск тестов

✍️ OpenClawRadar📅 Опубликовано: 13 апреля 2026 г.🔗 Source
GSD-Lite: Конечный автомат для кода Claude, обеспечивающий TDD и предотвращающий пропуск тестов
Ad

GSD-Lite — это сервер MCP с открытым исходным кодом, который подключается к Claude Code и проводит проекты через 12-шаговый рабочий процесс. Инструмент распространяется по лицензии MIT и состоит примерно из 15 исходных файлов.

Как это работает

После планирования задачи в диалоге с Claude, GSD-Lite автоматически берёт управление на себя: пишет код, проверяет его, подтверждает и переходит к следующей фазе. Цикл выполнения следует этой схеме:

  • Оркестратор выбирает следующую задачу
  • Исполнитель пишет код (TDD, контрольная точка)
  • Рецензент проверяет (отдельный контекст, спецификация + качество)
  • Принято? Следующая задача. Отклонено? Переработка.
  • Все задачи выполнены? Проверка завершения фазы
  • Фаза пройдена? Следующая фаза
  • Все фазы завершены? Работа окончена

Ключевые особенности

Принудительное TDD: «Железное правило» встроено в каждую задачу: без провального теста — никакого рабочего кода. В подсказке перечислены типичные рационализации Claude для пропуска тестов («Это просто изменение конфигурации», «Существующие тесты уже покрывают это») и помечаются как известные отговорки.

Раздельные контексты агентов: Проверки выполняются в отдельном контексте агента, где рецензент не видит рассуждений исполнителя — только изменения и спецификацию задачи. Это предотвращает формальное одобрение и помогает выявлять реальные ошибки.

Агент-отладчик: Если задача терпит неудачу 3 раза, вместо повторной попытки запускается агент-отладчик. Этот отдельный агент воспроизводит сбой, формирует гипотезы, проверяет их, определяет место для исправления и передаёт результаты исполнителю.

Отслеживание зависимостей: Если одна задача изменяет сигнатуру API, все зависимые задачи автоматически аннулируются и возвращаются в очередь.

Ad

Технические детали

Система использует 6 команд, 4 агентов и 11 инструментов MCP. Состояние управляется в одном JSON-файле с проверкой схемы, а конфликты версий обрабатываются через оптимистичный параллелизм.

Почему не оригинальная версия

Первая версия содержала 32 команды, 12 агентов, более 100 исходных файлов и установщик на 2400 строк. Автор отказался от неё и переписал с нуля, поскольку большая часть этой сложности расходовала контекстное окно без добавления ценности.

Неожиданные результаты

Антирационализационный подход работает — перечисление конкретных фраз, которые Claude использует для пропуска шагов, прямо в подсказке агента снизило частоту пропусков. Автор отмечает, что негативные примеры направляют модель лучше, чем простое указание «всегда пиши тесты». Самым сложным вызовом реализации стала поддержка сохранения сессии.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Strale.io предоставляет бесплатный API для проверки IBAN и электронной почты для AI-агентов без необходимости регистрации.
Инструменты

Strale.io предоставляет бесплатный API для проверки IBAN и электронной почты для AI-агентов без необходимости регистрации.

Strale.io предоставляет бесплатный API с пятью возможностями, включая проверку IBAN, проверку электронной почты, DNS-поиск, преобразование URL в markdown и исправление JSON. Регистрация или API-ключ не требуются, и он включает MCP-сервер для интеграции с Claude или Cursor.

OpenClawRadar
Открытая SQLite-основная система постоянной памяти для Claude
Инструменты

Открытая SQLite-основная система постоянной памяти для Claude

Разработчик выпустил memchat — локальную систему с лицензией GPL, которая извлекает знания из сессий Claude в контрольных точках, сохраняет их в SQLite и собирает заново для новых сессий, чтобы поддерживать контекст между разговорами.

OpenClawRadar
Проблемы и обходные пути сжатия сессий Claude AI
Инструменты

Проблемы и обходные пути сжатия сессий Claude AI

Стандартное сжатие в сессиях Claude AI может снизить точность извлечения информации с ~9,75/10 до ~5/10, вызывая галлюцинации. Пользователь провёл тест с 418 тыс. токенов и обнаружил, что ручное сжатие с использованием Opus сохраняет точность, тогда как стандартное сжатие её нарушает.

OpenClawRadar
DoomVLM: Инструмент с открытым исходным кодом для тестирования моделей "визуальный язык" в дуэлях на выживание в Doom
Инструменты

DoomVLM: Инструмент с открытым исходным кодом для тестирования моделей "визуальный язык" в дуэлях на выживание в Doom

DoomVLM теперь имеет открытый исходный код в виде единого блокнота Jupyter, который позволяет тестировать визуально-языковые модели, играющие в Doom через совместимые с OpenAI API. Инструмент поддерживает режимы deathmatch, где могут соревноваться до 4 моделей, с полными настройками системных промптов, описаний инструментов и параметров сэмплирования.

OpenClawRadar