CogniLayer: Un servidor MCP para memoria persistente en Claude Code

CogniLayer es un servidor MCP construido específicamente para Claude Code que proporciona memoria persistente entre sesiones. La herramienta aborda el problema en el que Claude Code olvida todo al iniciar una nueva sesión—incluyendo la arquitectura del proyecto, decisiones pasadas y conocimientos de depuración—obligando a los usuarios a reexplicar el contexto repetidamente.
Implementación Técnica
El sistema utiliza una base de datos SQLite con búsqueda de texto completo FTS5 e incrustaciones vectoriales (fastembed + sqlite-vec) para almacenar conocimiento localmente. Implementa búsqueda híbrida que combina coincidencia de palabras clave con similitud vectorial semántica.
Características Principales
- Almacena 14 tipos de hechos: decisiones, patrones, dificultades, soluciones de errores, contratos de API y más
- Detección de obsolescencia: advierte cuando los hechos recordados hacen referencia a archivos modificados
- Puentes de sesión: pasa automáticamente el contexto entre sesiones
- Sistema de desvanecimiento de calor: los hechos envejecen con el tiempo (caliente/tibio/frío) manteniendo relevante la información accedida frecuentemente
- Sistema de Tarjeta de Identidad: evita implementar en el servidor incorrecto
- 3 ganchos: SessionStart, SessionEnd, PostToolUse
- 10 herramientas MCP y 7 comandos de barra diagonal
Configuración y Uso
Para instalar y usar CogniLayer:
git clone https://github.com/LakyFx/CogniLayer.git
python install.py
Después de iniciar Claude Code en cualquier proyecto, ejecuta el comando /onboard. La herramienta funciona completamente localmente con SQLite y opera en Windows, macOS y Linux.
El proyecto fue construido usando sesiones de Claude Code, con Claude ayudando a diseñar el esquema de la base de datos, escribir el servidor MCP, construir el sistema de ganchos, implementar el clasificador de búsqueda híbrida e iterar en la tubería de incrustaciones. La herramienta es 100% gratuita, de código abierto bajo GPL v3, con cadenas de interfaz actualmente en checo pero funcional con cualquier idioma.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Comparando Agentes de IA Locales vs. en la Nube: OpenClaw y Twin.so
OpenClaw es un agente de IA local de código abierto que se ejecuta en tu máquina con control total de los datos, mientras que Twin.so es una plataforma basada en la nube con más de 200,000 agentes creados por la comunidad para automatización 24/7.

Visdiff: Bucle de Retroalimentación Visual para la Generación de Código Frontend de Claude
Visdiff aborda la brecha de precisión visual en la generación de código frontend de Claude al comparar la salida renderizada píxel por píxel con los diseños de Figma y retroalimentar las diferencias en el ciclo hasta que coincidan.

Microsoft BitNet: Marco de inferencia de LLM de 1 bit para CPU y GPU
Microsoft lanzó BitNet, un marco de inferencia para LLMs de 1 bit que logra aceleraciones de 1.37x a 6.17x en CPUs y reduce el consumo de energía entre un 55.4% y un 82.2%. Puede ejecutar un modelo de 100B parámetros en una sola CPU a una velocidad de 5-7 tokens por segundo.

Token Enhancer reduce el uso de tokens en páginas web para agentes de IA.
Un desarrollador descubrió que el HTML sin procesar de las capturas web consume una cantidad excesiva de tokens en el contexto de los agentes de IA, con las páginas de Yahoo Finance utilizando 704K tokens. Usar Token Enhancer como servidor MCP redujo esto a 2.6K tokens.