AgentWorkingMemory: Un Sistema de Memoria Local para Agentes de Codificación de IA

Qué resuelve AgentWorkingMemory
Los agentes de codificación con IA como Claude Code carecen de memoria persistente entre sesiones. Los desarrolladores terminan reexplicando la arquitectura, los esquemas de bases de datos y las decisiones anteriores cada vez que inician una nueva sesión, perdiendo tiempo y espacio en la ventana de contexto. Aunque Claude Code ofrece algunas herramientas como --continue para reanudar conversaciones, memoria automática que guarda notas en archivos markdown y documentación de proyecto CLAUDE.md, estas tienen limitaciones:
--continueo--resumerestauran hilos de chat completos pero consumen espacio en la ventana de contexto y solo funcionan con un hilo a la vez- La memoria automática carga las primeras 200 líneas de
MEMORY.mdpero carece de inteligencia de recuperación—no sabe qué notas son relevantes para el trabajo actual - Los documentos de proyecto como
CLAUDE.mdfuncionan para información estable pero se vuelven obsoletos rápidamente en proyectos que evolucionan rápido
AgentWorkingMemory aborda estos problemas acumulando conocimiento a través de sesiones, mostrando contexto relevante para el trabajo actual y mejorando con el tiempo sin gestión manual.
Cómo funciona
AWM funciona completamente localmente en tu máquina sin dependencias en la nube. El sistema consiste en:
- Una base de datos SQLite para almacenamiento
- Tres modelos de ML locales (~124MB en total, descargados una vez y almacenados en caché)
- Un proceso Node.js
No hay servidor que ejecutar, no hay contenedor Docker y no hay demonio en segundo plano. Cuando inicias Claude Code, automáticamente activa AWM a través de MCP (Model Context Protocol). Cuando cierras la sesión, se detiene. Todo permanece local—sin nube, sin claves de API, sin datos que salgan de tu máquina. Para seguridad adicional, AWM admite autenticación con token de portador para bloquear el acceso a la API de memoria.
Configuración y uso
La instalación requiere dos comandos:
npm install -g agent-working-memory
awm setup --globalDespués de reiniciar Claude Code, aparecen automáticamente 14 herramientas de memoria. La primera sesión toma unos 30 segundos mientras se descargan los modelos de ML (~124MB, almacenados en caché después de eso). A partir de ese momento:
- El agente escribe recuerdos cuando aprende algo importante
- Recuerda recuerdos relevantes al comenzar un nuevo trabajo
- Guarda puntos de control de su estado para recuperarse después de interrupciones
El sistema se desarrolló mientras se reconstruía una base de código de 20 años (~1.4 millones de líneas) en una pila moderna (~250K líneas estimadas), específicamente para una plataforma de gestión de membresías con 88 tablas de base de datos y desarrollo multi-sprint usando múltiples agentes de IA en paralelo.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

AutoSkillUpdate: Un Complemento de Código Claude que Detecta Habilidades Desactualizadas
AutoSkillUpdate es un complemento de código abierto para Claude Code que escanea tu base de código, la compara con las habilidades existentes e identifica desviaciones. Proporciona informes de desviación con rutas de archivos y referencias de línea, y luego ofrece reescribir habilidades obsoletas con confirmación del usuario.

Una arquitectura de base de conocimiento de 4 niveles para mejorar la precisión del agente de IA.
Un desarrollador construyó una base de conocimiento estructurada con más de 200 artículos para proporcionar contexto específico del dominio a agentes de IA, implementando un pipeline de 4 niveles con clasificación de consultas que redujo los costos de tokens en aproximadamente un 40%.

Orchino: Sistema Local de Orquestación Multi-Agente para Windows con Automatización Paralela de Navegador e Interfaz de Usuario
Orchino es un sistema local de orquestación multiagente para Windows que ejecuta tareas paralelas en el navegador y en Windows sin secuestrar la interfaz de usuario. Una demostración muestra a 4 agentes completando 'Buscar auriculares Sony en Flipkart y Amazon, enviar los resultados por correo electrónico, guardar en el Bloc de notas' en 29.5 segundos utilizando ejecución verdaderamente paralela.

Almacenamiento de Memoria de IA de Código Abierto para Proyectos NodeJS
Mind Palace es un sistema de almacenamiento y recuperación de memoria de código abierto para NodeJS que conserva información entre sesiones de chat de LLM. Es compatible con los principales LLM y almacenes vectoriales, extrayendo y vectorizando automáticamente recuerdos resumidos de las interacciones.