Caliby:面向AI代理的开源嵌入式向量数据库,支持文本+向量混合存储

Calibyがオープンソースになりました。AIエージェントおよびRAGワークロード向けに設計された、組み込み型のインプロセスベクトルデータベースです。MITデータベースグループ(Michael Stonebrakerのチーム)のPhDを含むチームとSea-Land AIによって開発され、Pythonバインディングを持つ単一のC++ライブラリです。
なぜ別のベクトルDBが必要なのか?
チームは、エージェント/LLMのユースケースにおいて既存のソリューションに欠点があると感じました:
- FAISS:純粋なインメモリで永続性がなく、再起動でインデックスが消える。
- pgvector:PostgreSQLに依存するため、パフォーマンスに上限がある。
- Chroma / Qdrant / Milvus:別サービスの起動が必要で、組み込みシナリオには重すぎる。
- LanceDB:組み込み型だが、DiskANNのような高度なインデックスがなく、パフォーマンスにボトルネックがある。
Calibyは、DuckDBのように軽量で組み込み可能なデータエンジンを目指していますが、ベクトル+テキストストレージ向けです。
アーキテクチャ:ハイブリッドテキスト+ベクトルストレージ
Calibyはテキストデータとベクトルデータを単一のシステムに統合します。ベクトルDBとリレーショナルDBを行き来する代わりに、埋め込み、生テキスト、メタデータを1つのライブラリに保存します。アーキテクチャは、永続性のためにページ編成のバッファプールを使用します。
サポートされるインデックス
- HNSW:汎用の高性能検索、CPU最適化。
- DiskANN(Vamana Graph):ディスクシナリオ向けに設計されており、ディスク上でFAISSを上回る。
- IVF+PQ:製品量子化を使用した転置ファイルで、コンパクトなインデックスを実現。
CalibyはSIMD(AVX-512、AVX2、SSE)距離関数(L2、内積、コサイン)を用いたブルートフォース検索もサポートしています。
パフォーマンスの主張
Calibyはpgvectorを4倍上回り、ディスクストレージシナリオではFAISSを大幅に凌駕します。別サービスの起動を必要とせず、数百万から数千万のベクトルをディスク上で処理できます。
始め方
パッケージをインストールするだけです:
pip install caliby
Python APIは、pybind11を介してHnswIndex、DiskANN、IVFPQIndexクラスを公開します。依存関係なし、サーバー設定不要、DevOps不要です。
対象ユーザー
組み込み型でインフラ不要の、ハイブリッドテキスト+ベクトル機能と本番グレードのパフォーマンスを備えたベクトルデータベースを求める、AIエージェント開発者やRAGパイプラインビルダー。
📖 全文ソース: r/LocalLLaMA
👀 See Also

ストケード:チャネルサポートとセキュリティレイヤーを備えたClaudeコードの新たなオーケストレーションツール
Stockadeは、AnthropicのAgent SDKを基盤としたオーケストレーションツールで、チャネルベースのセッション管理、RBAC、AIエージェント向けの詳細な権限制御を提供します。OpenClawやNanoClawの制限に対処し、コンテナ化と認証プロキシによるセキュリティを維持しながら、より多くの制御を実現します。

VidLens MCPサーバー:Claudeのための永続的YouTube知識ベース
VidLensは、一時的な文字起こしを抽出するのではなく、YouTubeを永続的な知識ベースとして扱う無料のオープンソースMCPサーバーです。YouTubeコンテンツを意味的埋め込みでローカルにインデックス化し、動画を一時的な文字起こしではなく永続的な知識ベースとして扱います。動画コンテンツの検索、分析、取得のための10モジュールにまたがる41のツールを提供します。

英国主权LLM推理:Relax.ai发布公开文档
Relax.aiは英国主権LLM推論サービスのドキュメントを公開し、/docs/getting-started/introductionにリダイレクトしています。このサービスは104ポイントでHacker Newsで共有されました。

SOPHIA メタエージェント for AIエージェントメンテナンス
SOPHIAは、本番環境におけるAIエージェントの性能劣化という実践的な課題に対処するために設計されたメタエージェントです。営業、臨床文書作成、カスタマーサービス向けのエージェントを運用する際、プロンプトが陳腐化したり、ツールがずれたり、ユーザーの行動が時間とともに変化したりすることがあります。SOPHIAは、システム内の他のすべてのエージェントを観察、診断、調査し、改善を提案するチーフラーニングオフィサーとして機能します。