Grafo de Habilidades Recorrible para Memoria Persistente de Agentes de IA en Bases de Código

Una Solución Práctica para Asistentes de IA sin Estado
Los asistentes de programación con IA carecen de memoria persistente entre sesiones, obligando a los desarrolladores a comenzar desde cero cada vez. El enfoque común de volcar todo en archivos de reglas grandes como .cursorrules falla debido a los límites de tokens y la dilución de las instrucciones.
La solución presentada es la divulgación progresiva a través de un gráfico de habilidades transitable que reside dentro de la base de código. La IA navega este gráfico de forma autónoma a través de las sesiones.
Arquitectura de Tres Capas
El sistema tiene tres capas distintas:
- Capa 1 (Siempre Cargada): Menos de 150 líneas (300 tokens). Contiene identidad de pila, convenciones de carpetas y elementos no negociables. Incluye un puntero saliente a
HANDOVER.md. - Capa 2 (Cargada por Sesión):
HANDOVER.mdsirve como un enrutador de atención, no como un documento. Le dice a la IA qué archivo de dominio cargar según la tarea actual (pagos, autenticación, base de datos, rutas-api). Cada archivo de dominio termina con instrucciones que apuntan al siguiente archivo relevante, creando un sistema autodirigido. - Capa 3 (Cargada por Tarea): Biblioteca de prompts con 12 categorías. Cada entrada incluye secciones de contexto, construcción, verificación y depuración. La IA consulta el índice, carga la categoría y sigue el patrón.
Perspectiva Central: Instrucciones Autodirigidas
La innovación clave es que las instrucciones llevan significado, no solo referencias. Por ejemplo: "cargar security/threat-modeling.md antes de modificar manejadores de webhooks" le dice a la IA cuándo y por qué, no solo qué.
El desarrollador ha integrado esto en una plantilla SaaS que se entrega con la base de código, disponible en launchx.page para aquellos que deseen examinar la estructura completa del gráfico.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Cadena de respaldo de LLM multi-proveedor con soporte de Ollama en el IDE de IA de producción.
Resonant Genesis AI IDE integra soporte para LLM locales como proveedor de primera clase junto con Groq, OpenAI, Anthropic y Gemini a través de más de 30 microservicios utilizando una biblioteca compartida UnifiedLLMClient con cadena de respaldo automática.

BotCost.dev: Analizador gratuito para ver cuánto cuestan los bots de IA en tu sitio
BotCost.dev es una herramienta gratuita que analiza los registros de tu servidor contra 18 huellas digitales conocidas de bots de IA (GPTBot, ClaudeBot, Perplexity, etc.) y estima el costo mensual de ancho de banda — sin necesidad de subir archivos, funciona en el navegador.

Habilidad de Agente de Código Abierto para Patrones de TypeScript, React y Next.js
Un desarrollador ha lanzado una referencia estructurada en markdown de 4.000 líneas y 17 archivos, diseñada para que agentes de IA como Claude Code la sigan al generar o revisar código en TypeScript, React y Next.js. Aborda problemas comunes como la validación incorrecta de respuestas de API y el uso indebido de directivas 'use client'.

Construyendo un Agente de Voz de Menos de 500ms: Arquitectura y Perspectivas de Rendimiento
Un desarrollador construyó un agente de voz desde cero logrando una latencia de extremo a extremo de ~400ms con transmisión completa STT → LLM → TTS. Las ideas clave incluyen tratar la voz como un problema de toma de turnos, usar detección semántica de fin de turno y colocar todos los componentes para una latencia mínima.