Claude Code: 60 автоэкспериментов, 3 изменения

Эксперимент по автоисследованию на рабочей кодовой базе

Разработчик протестировал подход автоисследования Карпати на реальной производственной системе с использованием Claude Code, запустив 60 итераций в двух раундах, находясь вдали от компьютера. Целью была гибридная поисковая система, построенная на Django, pgvector и Cohere embeddings.

Ключевые результаты и выводы

Из 60 итераций только 3 изменения были сохранены, а 57 — отменены. Общее улучшение оценки было незначительным (+0,03), но полученные знания оказались важными:

Сопоставление заголовков как сигнал поиска оказалось отрицательным, что было продемонстрировано всего за 2 итерации
Увеличение пула кандидатов не дало эффекта — проблема была в ранжировании, а не в полноте охвата
Ручная адаптивная взвешивание действительно работало — её удаление привело к ухудшениям
Корректировка формул демпфирования ключевых слов почти не влияла на оценки
Раунд 2, нацеленный на метаданные Haiku, не дал улучшений, потому что веса ранжирования из Раунда 1 были совместно оптимизированы под вывод исходного промпта
Обнаружена ошибка кэширования Redis: ключи были привязаны к хэшу запроса, а не к хэшу промпта, что могло остаться незамеченным в продакшене

Практические выводы

Главное понимание заключалось в том, что автоисследование помогает определить, где находится потолок, а не просто найти улучшения. Наличие 60 точек данных, говорящих «Вы можете прекратить настройку этого», дает конкретные доказательства вместо интуиции. Разработчик отмечает, что этот подход сэкономил время на ручные эксперименты с оптимизациями, которые не окупились бы.

Полный отчёт доступен по ссылке на блог, а открытый навык автоисследования Claude Code — на GitHub. Разработчик интересуется, пробовал ли кто-то это на немаркетинговых кодовых базах и какие метрики они используют.

📖 Read the full source: r/ClaudeAI

Автоисследование с Claude Code в рабочей кодовой базе: 60 экспериментов, 3 изменения сохранены

Эксперимент по автоисследованию на рабочей кодовой базе

Ключевые результаты и выводы

Практические выводы

👀 Смотрите также

Искусственный интеллект восстановил работу интернет-магазина после сбоя в 3 часа ночи без участия человека.

Бот OpenClaw автоматизирует извлечение данных из KMZ и объединение таблиц.

Практические уроки от создания кодовой базы на 350 тысяч строк в одиночку с помощью AI-агентов

Разработчик создает самообучающуюся систему для контента в LinkedIn с помощью навыков Claude