Calmkeep:長時間セッションにおけるLLMのドリフトに対抗する外部連続性レイヤー

プロフェッショナルワークフローにおけるLLMドリフトへの対応
Calmkeepは、長時間セッション中にLLMで発生する「構造的ドリフト」に対抗するために特別に構築された外部連続性レイヤーです。このドリフトは、ClaudeのようなLLMが、完全なコンテキストウィンドウに含まれているにもかかわらず、幻覚ではなく確立されたパターンの体系的な放棄を通じて、以前の決定、パターン、またはフレームワークを徐々に放棄するときに発生します。
テスト結果と方法論
作成者は、Claude自体を評価システムとして使用した敵対的監査を実施し、最初の5ターンで確立された基準に対して盲検法とスコアリングを行いました。Claudeは一貫してCalmkeepのトランスクリプトを自身の出力よりも高く評価しました。
25ターンバックエンド構築テスト
- 標準Claude: 最終整合性60%、8つのアーキテクチャ違反、ドリフト係数40%
- Calmkeep: 整合性85%、3つのアーキテクチャ違反、ターン14以降の後退ゼロ
最も示唆に富む例:Claudeはターン14でZodミドルウェアを導入しましたが、その後すぐに次の3つのモジュールで生のparseIntに戻り、アップグレードが一度も行われなかったかのようでした。
25ターン法的/戦略的セッション
- 標準Claude: 戦略的整合性50%、以前の法的枠組みを無効にした管轄権の変更を含む5つの違反、過失責任リスク約35%
- Calmkeep: 整合性100%、違反ゼロ、リスク5%未満
技術的実装
Calmkeepには以下が含まれます:
- MCPコネクタ
- Claude Codeプラグイン
- Python SDK
このシステムは外部ランタイムとしてのみ動作し、独自のAnthropicキーが必要で、隠れたメモリはなく、基礎となるモデルの重みを変更しません。
利用可能性とテスト
Stripe経由で14日間の無料トライアルが利用可能です:https://calmkeep.ai。完全なテストレポート、方法論、AVE分類、採点基準、ターンごとの詳細は以下で利用できます:
- https://calmkeep.ai/codetestreport
- https://calmkeep.ai/legaltestreport
📖 Read the full source: r/ClaudeAI
👀 See Also

Org Studio: マルチエージェントAIチームを管理するためのオープンソースダッシュボード
Org Studioは、組織設計の原則を適用してAIエージェントのチームを調整するオープンソースのダッシュボードで、OpenClawとHermes Agentの両方のランタイムをネイティブでサポートしています。チームトポロジー管理、イベント駆動型タスクボード、タスクコメントでエージェント同士が互いにメンションできるクロスランタイム通信などの機能を備えています。

クランカーランク:クロード・ハイクによるAI支援コーディングスキルのベンチマーク
開発者がClankerRankを構築し、ClaudeのHaiku 4.5モデルを使用したAI支援コーディングの習熟度を測定しています。このプラットフォームはユーザーに同じバグを提示し、隠れたテストスイートで出力を採点し、数百人の参加者間で明確なスキルギャップを明らかにしました。

ノーションとMCPを使用した、コード不要のClaude用永続メモリシステム
放射線科医がNotion内に「Cognitive Hub」を構築し、ClaudeがMCPを通じて読み書きすることで、構造化された知識ベースと、会話ごとに必要な情報のみを読み込むルーティングテーブルを実現。毎日使用して1ヶ月後には70ページ以上に成長。

Kubeez MCPサーバーがClaudeを70以上のAIメディアモデルに接続します
Kubeezは、Claudeを画像、動画、音楽、音声生成のための70以上のAIモデルに接続するMCPサーバーをリリースしました。このサーバーはOAuth認証をサポートし、非同期生成を提供し、Claudeがステータスをポーリングして完了時にCDN URLを返します。