Sistema de Memoria Local para Herramientas de Codificación de IA Extrae Más de 2,600 Datos de Registros de Conversación

Un desarrollador ha construido un sistema de memoria local para herramientas de codificación con IA que funciona completamente en su máquina, abordando el problema de tener que reexplicar el contexto en nuevas sesiones. El sistema funciona con Claude Code, Factory.ai y Codex CLI, escribiendo todos los registros de conversación en una única base de datos SQLite.
Cómo Funciona
El sistema utiliza varios procesos automatizados:
- Un trabajo cron se ejecuta cada 15 minutos para ingerir registros de conversación en SQLite
- Cada hora, genera incrustaciones vectoriales y extrae hechos estructurados usando un LLM local (el desarrollador ejecuta Nemotron 3 Super en un DGX Spark vía ollama)
- Cada nueva sesión de Claude Code comienza con un archivo memory-context.md inyectado automáticamente a través de CLAUDE.md
- Durante la sesión, Claude puede buscar en el historial completo mediante herramientas MCP que incluyen búsqueda por palabras clave, búsqueda semántica, consulta de hechos y exploración del gráfico de entidades
Estadísticas de Uso
Después de unos meses de uso normal:
- Más de 13,000 mensajes indexados en más de 400 sesiones
- Más de 2,600 hechos extraídos (preferencias, decisiones, pares error/solución, patrones de herramientas)
- Más de 330 entidades rastreadas (bibliotecas, servicios, idiomas con conteos de menciones)
- Tamaño de base de datos de 40 MB
El gráfico de entidades rastrea patrones de uso como "has usado pytest 45 veces, playwright 20 veces, jest 3 veces" basándose en datos de uso real.
Características y Limitaciones
El sistema incluye una interfaz de usuario basada en navegador para buscar, curar hechos y previsualizar lo que se inyecta en el contexto, además de una herramienta CLI y comandos con barra. No es plug-and-play: los usuarios necesitan configurar trabajos cron, configurar MCP y opcionalmente ejecutar ollama. El desarrollador señala que este es su primer proyecto de código abierto y agradece comentarios sobre la arquitectura, el enfoque de extracción de hechos, el diseño de herramientas MCP y mejoras en la estructura de Python/proyecto.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Modo Contexto: Un Servidor MCP que Comprime las Salidas de Herramientas para Claude Code
Context Mode es un servidor MCP que se sitúa entre Claude Code y las salidas de herramientas, procesándolas en entornos aislados y devolviendo solo resúmenes. Reduce 315 KB de salida MCP a 5.4 KB, extendiendo el tiempo de sesión antes de la ralentización de ~30 minutos a ~3 horas.

La Nueva API de Datos Estructurados Ofrece Precios por Suscripción para Agentes de LLM
Un desarrollador ha lanzado una API de datos estructurados que normaliza los precios de suscripción en plataformas de streaming, servicios de transporte compartido, aplicaciones de citas y otras plataformas basadas en suscripción. La API proporciona esquemas JSON consistentes, precios conscientes de la región cuando están disponibles y endpoints compatibles con MCP para que los agentes de LLM los consuman sin necesidad de scraping.

Conectar el Código de Claude a Aplicaciones de Chat para Interacción Remota
Un proyecto de GitHub llamado cc-connect conecta Claude Code a plataformas de mensajería como Slack y Telegram, permitiendo la interacción remota sin exponer tu máquina local. El agente se ejecuta localmente mientras un pequeño puente retransmite mensajes entre el agente y las aplicaciones de chat.

NarrateAI MCP Server Demo Muestra a Claude Agregando Voz en Off a Videos
Una demostración en vivo muestra a Claude usando el servidor MCP de NarrateAI para narrar automáticamente videos desde una URL, manejando sondeo asíncrono y generando narración analizando grabaciones de pantalla silenciosas.