Caliby: Base de datos vectorial embebida de código abierto para agentes de IA con almacenamiento híbrido de texto+vector

✍️ OpenClawRadar📅 Publicado: 9 de mayo de 2026🔗 Source
Caliby: Base de datos vectorial embebida de código abierto para agentes de IA con almacenamiento híbrido de texto+vector
Ad

Caliby ahora es de código abierto: una base de datos vectorial incrustada y en proceso diseñada para cargas de trabajo de IA Agente y RAG. Desarrollado por un equipo que incluye a un doctor del Grupo de Bases de Datos del MIT (equipo de Michael Stonebraker) y Sea-Land AI, es una única biblioteca en C++ con enlaces a Python.

¿Por qué otro vector DB?

El equipo encontró que las soluciones existentes no eran suficientes para casos de uso de agentes/LLM:

  • FAISS: Puramente en memoria, sin persistencia — reiniciar borra el índice.
  • pgvector: Techo de rendimiento debido a la dependencia de PostgreSQL.
  • Chroma / Qdrant / Milvus: Requieren servicios separados, demasiado pesados para escenarios incrustados.
  • LanceDB: Incrustado pero carece de índices avanzados como DiskANN, cuellos de botella de rendimiento.

Caliby aspira a ser un motor de datos ligero e incrustable como DuckDB, pero para almacenamiento de vectores + texto.

Arquitectura: Almacenamiento Híbrido Texto + Vectores

Caliby unifica datos de texto y vectores en un solo sistema. En lugar de lidiar con una base de datos vectorial y una relacional, almacenas embeddings, texto sin formato y metadatos en una sola biblioteca. La arquitectura usa un pool de buffers organizado por páginas para la persistencia.

Ad

Índices Soportados

  • HNSW: Recuperación general de alto rendimiento, optimizado para CPU.
  • DiskANN (Vamana Graph): Diseñado para escenarios en disco, supera a FAISS en disco.
  • IVF+PQ: Archivo invertido con cuantificación de producto para índices compactos.

Caliby también soporta búsqueda por fuerza bruta con funciones de distancia SIMD (AVX-512, AVX2, SSE) (L2, Producto Interno, Coseno).

Afirmaciones de Rendimiento

Caliby supera a pgvector por 4x y supera significativamente a FAISS en escenarios de almacenamiento en disco. Maneja millones a decenas de millones de vectores en disco sin requerir un servicio separado.

Primeros Pasos

Simplemente instala el paquete:

pip install caliby

La API de Python expone las clases HnswIndex, DiskANN y IVFPQIndex a través de pybind11. Sin dependencias, sin configuración de servidor, sin DevOps.

Para Quién Es

Desarrolladores de IA Agente y constructores de pipelines RAG que quieren una base de datos vectorial incrustada, sin infraestructura, con capacidades híbridas de texto+vectores y rendimiento de nivel productivo.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Qwen 3.6 27B F16 pasa la prueba de codificación de Pacman, pero las cuantizaciones de 8 bits fallan — Lecciones clave sobre plantillas y decodificación especulativa MTP
Herramientas

Qwen 3.6 27B F16 pasa la prueba de codificación de Pacman, pero las cuantizaciones de 8 bits fallan — Lecciones clave sobre plantillas y decodificación especulativa MTP

Un usuario crea de una sola vez un clon del Pacman con Qwen 3.6 27B F16: dos de tres intentos producen juegos casi perfectos. Las cuantificaciones de 8 bits fallan por completo. Notas detalladas sobre el ajuste de la plantilla de chat y las ganancias de velocidad con decodificación especulativa MTP.

OpenClawRadar
Plugin Oficial de Telegram para Claude Code: Notas de Configuración y Migración desde OpenClaw
Herramientas

Plugin Oficial de Telegram para Claude Code: Notas de Configuración y Migración desde OpenClaw

Un desarrollador migró de OpenClaw a la integración oficial de Telegram de Claude Code, documentando el proceso de configuración y creando una habilidad de migración de código abierto. La integración se conecta mediante tokens de BotFather y ofrece mejor eficiencia de tokens y comunicación más limpia.

OpenClawRadar
AgentWorkingMemory: Un Sistema de Memoria Local para Agentes de Codificación de IA
Herramientas

AgentWorkingMemory: Un Sistema de Memoria Local para Agentes de Codificación de IA

AgentWorkingMemory (AWM) es un sistema de memoria local que resuelve el problema de amnesia entre sesiones en agentes de codificación con IA. Utiliza una base de datos SQLite, tres modelos de ML locales (~124MB en total) y se integra automáticamente mediante MCP para proporcionar memoria persistente y consciente del contexto a través de las sesiones de Claude Code.

OpenClawRadar
Problemas Técnicos y Controversia Comunitaria de Ollama
Herramientas

Problemas Técnicos y Controversia Comunitaria de Ollama

Ollama, una popular herramienta local de LLM, enfrenta críticas por minimizar su dependencia de llama.cpp, problemas de cumplimiento de licencias y problemas técnicos con su backend personalizado, incluyendo regresiones de rendimiento y errores reintroducidos.

OpenClawRadar