ローカルLLMパイプラインのコンテキストドリフト問題

LLMパイプライン2ヶ月間のテストから得られた実用的な知見

開発者が最近、2ヶ月間にわたって実行した多段階の求職自動化パイプラインの結果を共有しました。このパイプラインには、リサーチ、履歴書作成、カバーレター生成が含まれていました。テストはLlama-3.3-70b-versatileを使用し、Groqの無料枠とローカルのOllamaの両方で、数週間にわたる夜間実行で実施されました。

ローカルモデルが劣勢になった点

ローカルモデルはプライバシー、コスト、セッションごとのクォータを気にする必要がない点で優れていましたが、エージェント的なワークフローでは重大な問題に直面しました：

多段階パイプラインでの文脈のずれ：ローカルモデルはステップ2を成功裏に完了しますが、ステップ4に到達するまでにステップ1で確立された内容を忘れてしまうことがありました。開発者は、一貫した文脈の維持が重要な5〜6ノードのパイプライン全体でこの現象を観察しました。
クラウドモデルとの比較：Groqの無料枠で使用したClaudeは、この文脈のずれの問題をほとんど示さず、連続したタスク間で文脈を維持する性能が優れていることを示唆しました。