Анализ 7 лет дневниковых записей с помощью LLM: провалы RAG и тонкой настройки

✍️ OpenClawRadar📅 Опубликовано: 19 мая 2026 г.🔗 Source
Анализ 7 лет дневниковых записей с помощью LLM: провалы RAG и тонкой настройки
Ad

Разработчик на r/ClaudeAI поделился своим опытом передачи более 200 личных дневниковых записей (охватывающих 2019–2026 годы) LLM для лонгитюдного анализа. Цель: обнаружить поведенческие паттерны и измерить, как они изменились за 7 лет. Технический путь был полон тупиков.

Ключевые технические неудачи

  • RAG (Retrieval-Augmented Generation) не сработал — записи в дневнике были слишком похожими, что приводило к возврату семантически перекрывающихся фрагментов. Модель не могла выдавать связные лонгитюдные выводы.
  • Тонкая настройка не сработала — из-за малого набора данных (200 записей) модель переобучилась и не смогла обобщить паттерны во времени.
  • Ограничения конфиденциальности — использование облачных API было невозможно; автору требовалась локальная обработка для обеспечения безопасности конфиденциальных данных дневника.
Ad

Обходной путь

Финальный подход включал разбивку записей по годам, суммаризацию каждого года с помощью локальной LLM (вероятно, Llama или Mistral через Ollama), а затем передачу семи годовых сводок обратно модели для межгодового анализа. Эта иерархическая суммаризация обошла ограничения RAG и избежала необходимости крупномасштабной тонкой настройки.

Неожиданное открытие

LLM выявила повторяющийся паттерн: автор заново открывает для себя одни и те же жизненные уроки примерно каждые два года, как будто сталкивается с ними впервые. Это предполагает, что озарение без механизма закрепления не запоминается — мета-урок о человеческом поведении и рефлексии с помощью LLM.

Для кого это

Разработчики, работающие над проектами персональной аналитики, конфиденциальными конвейерами LLM или лонгитюдным анализом текста с малыми наборами данных.

Автор опубликовал полную статью с пятью выводами и деталями реализации по ссылке ниже.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Claude Code доставляет готовую многопользовательскую игру из наполовину завершённого проекта.
Кейсы

Claude Code доставляет готовую многопользовательскую игру из наполовину завершённого проекта.

Разработчик использовал Claude Code для завершения конкурентной игры-оценки под названием Closer, добавив многопользовательский режим в реальном времени через Supabase Realtime, систему рейтинга ELO, ежедневные испытания с процентильными рейтингами, панель аналитики поведения, клиентскую маршрутизацию и отслеживание калибровки уверенности.

OpenClawRadar
Claude Code + Remotion: Создание видео для запуска приложений без After Effects
Кейсы

Claude Code + Remotion: Создание видео для запуска приложений без After Effects

Разработчик использовал Claude Code для создания анимации Remotion для видео запуска своего приложения. Инструмент быстро выполнил ~80% работы, но для попиксельной точности пришлось вносить правки вручную.

OpenClawRadar
Искусственный интеллект Claude используется как резервный мозг для Alexa для обработки неподдерживаемых команд.
Кейсы

Искусственный интеллект Claude используется как резервный мозг для Alexa для обработки неподдерживаемых команд.

Разработчик создал легковесный слой, в котором Claude AI обрабатывает каждую неудачную команду Alexa, работая с хинди, трансляцией CCTV и управлением неумными устройствами. Система использует WebSocket для управления телевизором, DLNA для приставок и преобразование RTSP→HLS для CCTV.

OpenClawRadar
Автономный журнальный конвейер с кодом Claude: Разбор агентной архитектуры
Кейсы

Автономный журнальный конвейер с кодом Claude: Разбор агентной архитектуры

Семиэтапный конвейер, использующий Claude Code в качестве редакционной команды, производит до пяти проверенных на достоверность многоязычных статей на один заголовок. Система включает пять суб-агентов, институциональную память через эмбеддинги и автоматическую проверку фактов с использованием растущей базы данных.

OpenClawRadar