Автоисследование с Claude Code в рабочей кодовой базе: 60 экспериментов, 3 изменения сохранены

Эксперимент по автоисследованию на рабочей кодовой базе
Разработчик протестировал подход автоисследования Карпати на реальной производственной системе с использованием Claude Code, запустив 60 итераций в двух раундах, находясь вдали от компьютера. Целью была гибридная поисковая система, построенная на Django, pgvector и Cohere embeddings.
Ключевые результаты и выводы
Из 60 итераций только 3 изменения были сохранены, а 57 — отменены. Общее улучшение оценки было незначительным (+0,03), но полученные знания оказались важными:
- Сопоставление заголовков как сигнал поиска оказалось отрицательным, что было продемонстрировано всего за 2 итерации
- Увеличение пула кандидатов не дало эффекта — проблема была в ранжировании, а не в полноте охвата
- Ручная адаптивная взвешивание действительно работало — её удаление привело к ухудшениям
- Корректировка формул демпфирования ключевых слов почти не влияла на оценки
- Раунд 2, нацеленный на метаданные Haiku, не дал улучшений, потому что веса ранжирования из Раунда 1 были совместно оптимизированы под вывод исходного промпта
- Обнаружена ошибка кэширования Redis: ключи были привязаны к хэшу запроса, а не к хэшу промпта, что могло остаться незамеченным в продакшене
Практические выводы
Главное понимание заключалось в том, что автоисследование помогает определить, где находится потолок, а не просто найти улучшения. Наличие 60 точек данных, говорящих «Вы можете прекратить настройку этого», дает конкретные доказательства вместо интуиции. Разработчик отмечает, что этот подход сэкономил время на ручные эксперименты с оптимизациями, которые не окупились бы.
Полный отчёт доступен по ссылке на блог, а открытый навык автоисследования Claude Code — на GitHub. Разработчик интересуется, пробовал ли кто-то это на немаркетинговых кодовых базах и какие метрики они используют.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Искусственный интеллект восстановил работу интернет-магазина после сбоя в 3 часа ночи без участия человека.
Интернет-магазин, полностью управляемый ИИ-агентами, столкнулся с необработанным исключением, которое вывело из строя конвейер заказов в 3 часа ночи. Система самостоятельно обнаружила сбой, определила первопричину, попыталась устранить проблему, проверила восстановление и возобновила работу до утра.

Бот OpenClaw автоматизирует извлечение данных из KMZ и объединение таблиц.
Пользователь сообщает об использовании бота OpenClaw для парсинга файлов KMZ, извлечения восьми конкретных точек данных, включая мильные маркеры, расчета позиций в десятичных милях с высокой точностью и слияния новых данных с существующими таблицами без перезаписи. Процесс занял 5 минут времени обработки и 15% от бюджета сессии максимального плана в $100.

Практические уроки от создания кодовой базы на 350 тысяч строк в одиночку с помощью AI-агентов
Разработчик делится конкретными инженерными выводами из создания кодовой базы на 356 тысяч строк в продакшене за 52 дня с использованием AI-агентов, включая то, как структура кодовой базы влияет на вывод агентов и почему строгая типизация необходима.

Разработчик создает самообучающуюся систему для контента в LinkedIn с помощью навыков Claude
Фрилансер в сфере B2B-маркетинга создал систему из двух навыков Claude для контента в LinkedIn, которая пишет в его стиле и улучшается на основе данных о производительности, обеспечив 110 тыс. показов для 3 постов за неделю.