エングラムメモリSDK:ローカルモデル搭載AIエージェント向けグラフベースメモリ

ローカルAIモデル向けグラフメモリSDK
Engram Memory SDKは、LiteLLM統合を介してローカルモデルと連携するAIエージェント向けに設計されたオープンソースのグラフメモリシステムです。コアアーキテクチャは取り込みと呼び出しを分離しており、エンティティと関係性を抽出するためのLLMは取り込み時に1回のみ必要です。一方、想起は純粋なベクトル検索、グラフトラバーサル、スコアリングによって動作し、追加のLLM呼び出しを必要としません。
技術詳細
このSDKは非同期Pythonで構築され、バックエンドデータベースとしてNeo4jを使用しています。ソースによると、取り込み操作あたり平均〜735トークンを処理し、95msの想起レイテンシを達成しています。システムには、バックグラウンドで実行される減衰とクラスタリングを備えた自己再構築メモリ機能が含まれています。
セットアップとインストール
インストールは簡単です:
pip install engram-memory-sdk設定には、以下の変数を含む.envファイルが必要です:
LLM_MODEL=ollama/llama3 # またはLiteLLMがサポートする任意のローカルモデル
NEO4J_URI=bolt://localhost:7687このシステムは、Ollama、vLLM、text-generation-webuiを介したローカルデプロイメントを含む、LiteLLMを介したあらゆるモデルをサポートしています。主な利点はコスト効率です:小さなローカルモデルで抽出を処理するため、継続的な想起操作はLLMトークンを消費しないため、文字通り$0のコストで実行できます。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Atelier v0.3は、Claude Codeによるターゲットを絞ったマークダウン修正機能を追加します。
Atelier v0.3は、Markdown文書のセクションをハイライトしてClaude Codeに送信し、修正を依頼できる無料のVS Code拡張機能です。エージェントはエディター内で対象を絞った編集を返し、各修正がどのフィードバックに対応しているかを追跡できます。

エージェントワーキングメモリ:AIコーディングエージェントのためのローカルメモリシステム
AgentWorkingMemory(AWM)は、AIコーディングエージェントにおけるセッション間の記憶喪失問題を解決するローカルメモリシステムです。SQLiteデータベース、3つのローカルMLモデル(合計約124MB)、MCPによる自動統合を活用し、Claude Codeセッション間で永続的かつ文脈を意識したメモリを提供します。

OpenTabs: ブラウザベースAIツールアクセスのための100以上のプラグインを備えたMCPサーバー
OpenTabsは、Slack、Discord、GitHubなどのWebアプリケーションの内部APIにフックすることで、100以上のプラグインと約2,000のツールを提供するMCPサーバーおよびChrome拡張機能です。既存のブラウザセッションで動作するため、APIキーやOAuthフローが不要です。

開発者が共有するハイブリッドAIコーディングワークフロー:計画にはClaude、実行にはローカルモデル
開発者がClaude 3.5 Sonnetをタスク計画に、Ollama経由のローカルQwen2.5-Coderモデルをコード生成に使用するパイプラインを構築し、Claudeのみを使用する場合と比較して85%のトークン削減を達成しました。