Автоисследование с Claude Code в рабочей кодовой базе: 60 экспериментов, 3 изменения сохранены

✍️ OpenClawRadar📅 Опубликовано: 24 марта 2026 г.🔗 Source
Автоисследование с Claude Code в рабочей кодовой базе: 60 экспериментов, 3 изменения сохранены
Ad

Эксперимент по автоисследованию на рабочей кодовой базе

Разработчик протестировал подход автоисследования Карпати на реальной производственной системе с использованием Claude Code, запустив 60 итераций в двух раундах, находясь вдали от компьютера. Целью была гибридная поисковая система, построенная на Django, pgvector и Cohere embeddings.

Ключевые результаты и выводы

Из 60 итераций только 3 изменения были сохранены, а 57 — отменены. Общее улучшение оценки было незначительным (+0,03), но полученные знания оказались важными:

  • Сопоставление заголовков как сигнал поиска оказалось отрицательным, что было продемонстрировано всего за 2 итерации
  • Увеличение пула кандидатов не дало эффекта — проблема была в ранжировании, а не в полноте охвата
  • Ручная адаптивная взвешивание действительно работало — её удаление привело к ухудшениям
  • Корректировка формул демпфирования ключевых слов почти не влияла на оценки
  • Раунд 2, нацеленный на метаданные Haiku, не дал улучшений, потому что веса ранжирования из Раунда 1 были совместно оптимизированы под вывод исходного промпта
  • Обнаружена ошибка кэширования Redis: ключи были привязаны к хэшу запроса, а не к хэшу промпта, что могло остаться незамеченным в продакшене
Ad

Практические выводы

Главное понимание заключалось в том, что автоисследование помогает определить, где находится потолок, а не просто найти улучшения. Наличие 60 точек данных, говорящих «Вы можете прекратить настройку этого», дает конкретные доказательства вместо интуиции. Разработчик отмечает, что этот подход сэкономил время на ручные эксперименты с оптимизациями, которые не окупились бы.

Полный отчёт доступен по ссылке на блог, а открытый навык автоисследования Claude Code — на GitHub. Разработчик интересуется, пробовал ли кто-то это на немаркетинговых кодовых базах и какие метрики они используют.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Искусственный интеллект восстановил работу интернет-магазина после сбоя в 3 часа ночи без участия человека.
Кейсы

Искусственный интеллект восстановил работу интернет-магазина после сбоя в 3 часа ночи без участия человека.

Интернет-магазин, полностью управляемый ИИ-агентами, столкнулся с необработанным исключением, которое вывело из строя конвейер заказов в 3 часа ночи. Система самостоятельно обнаружила сбой, определила первопричину, попыталась устранить проблему, проверила восстановление и возобновила работу до утра.

OpenClawRadar
Бот OpenClaw автоматизирует извлечение данных из KMZ и объединение таблиц.
Кейсы

Бот OpenClaw автоматизирует извлечение данных из KMZ и объединение таблиц.

Пользователь сообщает об использовании бота OpenClaw для парсинга файлов KMZ, извлечения восьми конкретных точек данных, включая мильные маркеры, расчета позиций в десятичных милях с высокой точностью и слияния новых данных с существующими таблицами без перезаписи. Процесс занял 5 минут времени обработки и 15% от бюджета сессии максимального плана в $100.

OpenClawRadar
Практические уроки от создания кодовой базы на 350 тысяч строк в одиночку с помощью AI-агентов
Кейсы

Практические уроки от создания кодовой базы на 350 тысяч строк в одиночку с помощью AI-агентов

Разработчик делится конкретными инженерными выводами из создания кодовой базы на 356 тысяч строк в продакшене за 52 дня с использованием AI-агентов, включая то, как структура кодовой базы влияет на вывод агентов и почему строгая типизация необходима.

OpenClawRadar
Разработчик создает самообучающуюся систему для контента в LinkedIn с помощью навыков Claude
Кейсы

Разработчик создает самообучающуюся систему для контента в LinkedIn с помощью навыков Claude

Фрилансер в сфере B2B-маркетинга создал систему из двух навыков Claude для контента в LinkedIn, которая пишет в его стиле и улучшается на основе данных о производительности, обеспечив 110 тыс. показов для 3 постов за неделю.

OpenClawRadar