LLMを用いた7年分の日記エントリの分析:RAGとファインチューニングの失敗比較

r/ClaudeAIの開発者が、2019年から2026年までの200以上の個人日記エントリをLLMに与え、縦断的分析を行った経験を共有した。目的は行動パターンを検出し、7年間でどのように変化したかを測定することだった。技術的な道のりは行き詰まりの連続だった。
主な技術的失敗
- RAG(検索拡張生成)の失敗 — 日記エントリが類似しすぎていたため、検索で意味的に重複するチャンクが返された。モデルは一貫した縦断的洞察を生成できなかった。
- ファインチューニングの失敗 — データセットが小さすぎたため(200エントリ)、モデルが過学習し、時間を超えたパターンを一般化できなかった。
- プライバシー制約 — クラウドAPIの使用は不可能で、機密性の高い日記データを保護するためローカル処理が必要だった。
回避策
最終的なアプローチは、エントリを年ごとにチャンク化し、ローカルLLM(おそらくOllama経由のLlamaかMistral)で各年を要約し、その7つの年次要約をモデルに再度与えて年をまたいだ分析を行うというものだった。この階層的要約により、RAGの限界を回避し、大規模なファインチューニングの必要性を回避できた。
驚きの洞察
LLMは、開発者が約2年ごとに同じ人生の教訓を再発見し、あたかも初めて遭遇したかのように振る舞うという繰り返しパターンを特定した。これは、実行メカニズムのない洞察は定着しないことを示唆している——人間の行動とLLM支援による内省に関するメタ教訓である。
こんな人におすすめ
個人分析プロジェクト、プライバシー保護型LLMパイプライン、または小規模データセットによる縦断的テキスト分析に取り組む開発者。
著者は、以下のリンク先で5つの洞察と実装詳細を含む完全な記事を公開している。
📖 全文を読む: r/ClaudeAI
👀 See Also

開発者がClaude Codeで匿名の愛の告白アプリを構築
ある開発者が、Claude Codeを活用してNext.jsやSupabase Realtimeの経験がなくとも、アーキテクチャ、セキュリティ、デプロイを処理し、匿名のラブプロポーザルプラットフォーム「BlushDrop」をリアルタイム追跡機能付きで作成しました。

開発者がデザインツールを使わずにClaude AIでアプリのアイコンをデザイン
ある開発者が、macOS用のプロセスマネージャー「PIDKill」を作成し、そのアプリアイコンをClaude AI、具体的にはClaude CodeとClaude webのみを使用してデザインしました。最終的なデザインは、プロセスの終了を表現するために、グリッチ効果と赤い取り消し線を施したSF Monoフォントを使用しています。

Claude CodeがHTMLとPlaywrightで印刷可能な名刺をデザイン
あるユーザーが、猫の写真とウェブサイトのリンクをClaudeに与え、Playwrightでスクリーンショットを撮りながら納得がいくまで繰り返し、最終的に2x5グリッドのHTMLテンプレートを使ってAveryのカードストックに印刷することで、名刺デザインを自動化しました。

Claudeを活用したマルチエージェント動画制作パイプライン:スクリプト契約アーキテクチャとリサーチファンアウト
Claudeを使用したマルチエージェントパイプラインが、トピックとペルソナから15〜20分の教育用YouTube動画を生成。クロスチャプターの一貫性を保つためのナラティブコントラクトアーキテクチャと、競合するアウトラインを排除する並列リサーチファンアウトが特徴。