Валидация паттерна саморазвивающихся навыков: результаты 5-раундового эксперимента

Экспериментальная установка и результаты
Разработчик провёл 5-раундный эксперимент для проверки шаблона проектирования Self-Evolving Skill для Claude Code, который был представлен ранее. Эксперимент использовал базу данных MySQL с 29 таблицами и 590 МБ данных из системы управления умным зданием.
Раунды следовали такой прогрессии: исследование структуры → запросы данных → обнаружение правил → сложное исследование → повторная проверка.
Ключевые выводы
- Уровень отклонения Five-Gate: 63,6% — большинство взаимодействий не привело к изменению знаний
- Инкрементальная сходимость: +75 → +46 → +12 → +21 → +1
- Самоисправление Gate 2: Шаблон обнаружил и исправил 2 ошибочных правила, которые Skill записал в предыдущих раундах
- Раунд 5: Ноль шагов исследования, прямое повторное использование шаблона
- Точность: 100% — ни одно ошибочное знание не сохранилось в процессе
Неожиданным выводом стало то, что проблемы использования инструментов были зафиксированы как ценный побочный продукт — вопросы, которые разработчик не планировал, но которые были выявлены Five Gates.
У разработчика продолжается второй эксперимент на более крупной базе данных телекоммуникационных биллингов. Полные данные с различимыми снимками по раундам доступны на GitHub.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Homebutler: OpenClaw Skill для управления Homelab через Telegram
Homebutler — это единый бинарный файл Go (~13 МБ, без зависимостей), который работает как навык OpenClaw для управления домашними лабораториями из чата Telegram. Он отслеживает серверы, перезапускает Docker-контейнеры, пробуждает машины, сканирует сети и предупреждает о скачках ресурсов без SSH-сессий или входа в панель управления.

Vibeyard добавляет доску Канбан для управления несколькими сессиями Claude Code
В открытой IDE Vibeyard теперь есть доска Канбан, позволяющая запускать сессии агента Claude Code прямо с карточек. Карточки автоматически перемещаются в раздел «Готово», когда агент завершает работу.

DebugBase: Коллективная база знаний об ошибках для AI-агентов программирования через MCP
DebugBase — это совместимый с MCP инструмент, предоставляющий общую базу знаний, в которой ИИ-агенты для программирования могут проверять известные исправления для распространённых ошибок, таких как несоответствия гидратации в Next.js или проблемы с разрешением TypeScript. Он включает 11 инструментов MCP и поставляется с предустановленными 58 парами «ошибка/исправление» из реальных сессий агентов.

Ваш инструмент «Справедливая доля»: Рассчитайте свою равную долю прибыли компании
Разработчик создал веб-инструмент с использованием Claude Code и Vercel, который рассчитывает, какой была бы ваша равная доля годовой прибыли вашего работодателя на основе отчетов SEC 10-K. Инструмент показывает конкретные цифры, такие как $747 000 на сотрудника у Apple и $2,8 млн на сотрудника у NVIDIA.