Анализ 7 лет дневниковых записей с помощью LLM: провалы RAG и тонкой настройки

Разработчик на r/ClaudeAI поделился своим опытом передачи более 200 личных дневниковых записей (охватывающих 2019–2026 годы) LLM для лонгитюдного анализа. Цель: обнаружить поведенческие паттерны и измерить, как они изменились за 7 лет. Технический путь был полон тупиков.
Ключевые технические неудачи
- RAG (Retrieval-Augmented Generation) не сработал — записи в дневнике были слишком похожими, что приводило к возврату семантически перекрывающихся фрагментов. Модель не могла выдавать связные лонгитюдные выводы.
- Тонкая настройка не сработала — из-за малого набора данных (200 записей) модель переобучилась и не смогла обобщить паттерны во времени.
- Ограничения конфиденциальности — использование облачных API было невозможно; автору требовалась локальная обработка для обеспечения безопасности конфиденциальных данных дневника.
Обходной путь
Финальный подход включал разбивку записей по годам, суммаризацию каждого года с помощью локальной LLM (вероятно, Llama или Mistral через Ollama), а затем передачу семи годовых сводок обратно модели для межгодового анализа. Эта иерархическая суммаризация обошла ограничения RAG и избежала необходимости крупномасштабной тонкой настройки.
Неожиданное открытие
LLM выявила повторяющийся паттерн: автор заново открывает для себя одни и те же жизненные уроки примерно каждые два года, как будто сталкивается с ними впервые. Это предполагает, что озарение без механизма закрепления не запоминается — мета-урок о человеческом поведении и рефлексии с помощью LLM.
Для кого это
Разработчики, работающие над проектами персональной аналитики, конфиденциальными конвейерами LLM или лонгитюдным анализом текста с малыми наборами данных.
Автор опубликовал полную статью с пятью выводами и деталями реализации по ссылке ниже.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Claude Code доставляет готовую многопользовательскую игру из наполовину завершённого проекта.
Разработчик использовал Claude Code для завершения конкурентной игры-оценки под названием Closer, добавив многопользовательский режим в реальном времени через Supabase Realtime, систему рейтинга ELO, ежедневные испытания с процентильными рейтингами, панель аналитики поведения, клиентскую маршрутизацию и отслеживание калибровки уверенности.

Claude Code + Remotion: Создание видео для запуска приложений без After Effects
Разработчик использовал Claude Code для создания анимации Remotion для видео запуска своего приложения. Инструмент быстро выполнил ~80% работы, но для попиксельной точности пришлось вносить правки вручную.

Искусственный интеллект Claude используется как резервный мозг для Alexa для обработки неподдерживаемых команд.
Разработчик создал легковесный слой, в котором Claude AI обрабатывает каждую неудачную команду Alexa, работая с хинди, трансляцией CCTV и управлением неумными устройствами. Система использует WebSocket для управления телевизором, DLNA для приставок и преобразование RTSP→HLS для CCTV.

Автономный журнальный конвейер с кодом Claude: Разбор агентной архитектуры
Семиэтапный конвейер, использующий Claude Code в качестве редакционной команды, производит до пяти проверенных на достоверность многоязычных статей на один заголовок. Система включает пять суб-агентов, институциональную память через эмбеддинги и автоматическую проверку фактов с использованием растущей базы данных.