CAL: LLMエージェントのためのオープンソースコンテキスト最適化レイヤー

CALの機能
CALは、既存のコードとLLM API呼び出しの間に位置するPythonライブラリで、各リクエストに対してコンテキストをインテリジェントに選択、圧縮、組み立てます。トークン使用量の多いエージェント設定におけるコストとコンテキストの問題に対処し、特に最近のClaude Pro/Maxサブスクリプションの変更に関連しています。
パフォーマンスベンチマーク
Claude Opus 4と103のコンテキストチャンクを使用した本番環境での結果:
- CALなし:すべてのリクエストで103チャンクすべて(約23,000トークン)を送信し、1リクエストあたり$0.043
- CALあり:約6チャンク、4,100トークンに減少し、1リクエストあたり$0.008
- 結果:トークン83%削減、コスト81%削減
5,000のWildChatプロンプト(57言語にわたる実際のLLM会話のオープンアカデミックデータセット)に対して検証され、平均97.6%の節約を実現。
主な機能
- セレクター: IDF加重スコアリングにより、クエリごとに関連するチャンクのみを選択。安定したプレフィックスとリクエストごとに動的に選択されるチャンクを使用。
- ツールスタブ: 3段階のレイジーローディングを実装し、モデルが特定のツールを使用する意図を示すまで軽量なスタブを使用。
- コストエンジン: プロバイダーを認識する節約計算機で、Anthropicの4つの入力階層とGoogleのキャッシュストレージ価格を把握。
- ノイズ抑制: IDFフロアとrequire-anyゲートにより、一般的な単語がすべてのリクエストで無関係なチャンクをロードするのを防止。
- キャッシュ安定順序付け: 選択にはスコアのみを使用し、位置はアルファベット順でキャッシュヒットを維持。
技術詳細
マルチターンコンテキスト処理:ツールスタブは履歴を認識。モデルが前のターンでツールを使用した場合、完全なスキーマがロードされたまま維持され、会話の連続性を保ちます。
プロバイダーサポート:CALはプロバイダーに依存せず、チャット完了エンドポイントを持つあらゆるプロバイダーで動作。コストエンジンは既にAnthropicの4つの入力階層とGoogleのキャッシュストレージ価格を処理。
エッジケース:曖昧なクエリに対してIDFフロアとノイズ抑制を使用。ハイブリッドキーワード+セマンティックスコアリングはロードマップに含まれています。
インストールとライセンス
pip install cal-context
MITライセンス。PyPI:https://pypi.org/project/cal-context/
GitHub:https://github.com/vjc-lab/context-assembly-layer
📖 Read the full source: r/openclaw
👀 See Also

プライバシーファーストのMCPサーバーディレクトリが、文書化されたデータ取り扱いポリシーと共にローンチ
toolora.dev/mcp-hubの新しいディレクトリには、データ処理ポリシーが文書化されたMCPサーバーが掲載されています。これには、ローカルとホストの分類、各ツールが送信するデータ、アカウントが必要かどうかなどの情報が含まれています。作成者はまた、プライバシー主張を検証するブラウザテスト方法を提供しています。

Claudeランク:AI検索可視性監査のためのClaudeコードプラグイン
Claude-rankは、AI検索可視性の技術的基盤を監査する無料のClaude CodeプラグインおよびCLIツールです。技術的SEO、AI引用可能性スコアリング、AIボット向けクローラビリティチェック、および可視性問題の自動修正を扱います。

ClawProxy:無料利用枠のAPIキーをローテーションするためのセルフホスト型AIルーティングプロキシ
ClawProxyは、レート制限やプロバイダーの過負荷を回避するために、複数の無料枠AI APIキーを管理するセルフホスト型AIルーティングプロキシです。機能には、インフライトキーローテーション、加重負荷分散、モデル翻訳、詳細解析ログ付きダッシュボードが含まれます。

ジェイク・ベンチマーク v1:OpenClaw AIエージェント向けローカルLLM性能テスト
開発者がOpenClawを使用したAIエージェントとして7つのローカルLLMをテストし、メール処理、会議スケジューリング、フィッシング検出を含む22の実用的なタスクで評価しました。結果はQwen 27Bの59.4%からNemotron 30Bの1.6%まで幅があり、詳細な会話ログが公開されています。