LLMドリフト対策：Calmkeep外部連続性レイヤーの効果とベンチマーク結果

プロフェッショナルワークフローにおけるLLMドリフトへの対応

Calmkeepは、長時間セッション中にLLMで発生する「構造的ドリフト」に対抗するために特別に構築された外部連続性レイヤーです。このドリフトは、ClaudeのようなLLMが、完全なコンテキストウィンドウに含まれているにもかかわらず、幻覚ではなく確立されたパターンの体系的な放棄を通じて、以前の決定、パターン、またはフレームワークを徐々に放棄するときに発生します。

テスト結果と方法論

作成者は、Claude自体を評価システムとして使用した敵対的監査を実施し、最初の5ターンで確立された基準に対して盲検法とスコアリングを行いました。Claudeは一貫してCalmkeepのトランスクリプトを自身の出力よりも高く評価しました。

25ターンバックエンド構築テスト

標準Claude: 最終整合性60%、8つのアーキテクチャ違反、ドリフト係数40%
Calmkeep: 整合性85%、3つのアーキテクチャ違反、ターン14以降の後退ゼロ

最も示唆に富む例：Claudeはターン14でZodミドルウェアを導入しましたが、その後すぐに次の3つのモジュールで生のparseIntに戻り、アップグレードが一度も行われなかったかのようでした。

25ターン法的/戦略的セッション

標準Claude: 戦略的整合性50%、以前の法的枠組みを無効にした管轄権の変更を含む5つの違反、過失責任リスク約35%
Calmkeep: 整合性100%、違反ゼロ、リスク5%未満

技術的実装

Calmkeepには以下が含まれます：

MCPコネクタ
Claude Codeプラグイン
Python SDK

このシステムは外部ランタイムとしてのみ動作し、独自のAnthropicキーが必要で、隠れたメモリはなく、基礎となるモデルの重みを変更しません。

利用可能性とテスト

Stripe経由で14日間の無料トライアルが利用可能です：https://calmkeep.ai。完全なテストレポート、方法論、AVE分類、採点基準、ターンごとの詳細は以下で利用できます：

https://calmkeep.ai/codetestreport
https://calmkeep.ai/legaltestreport

📖 Read the full source: r/ClaudeAI

Calmkeep：長時間セッションにおけるLLMのドリフトに対抗する外部連続性レイヤー

プロフェッショナルワークフローにおけるLLMドリフトへの対応

テスト結果と方法論

25ターンバックエンド構築テスト

25ターン法的/戦略的セッション

技術的実装

利用可能性とテスト

👀 See Also

Org Studio: マルチエージェントAIチームを管理するためのオープンソースダッシュボード

クランカーランク：クロード・ハイクによるAI支援コーディングスキルのベンチマーク

ノーションとMCPを使用した、コード不要のClaude用永続メモリシステム

Kubeez MCPサーバーがClaudeを70以上のAIメディアモデルに接続します