AGI en md: 11 Niveles de Compresión Cognitiva para Prompts del Sistema Claude

Qué es esto
AGI en md es un repositorio de código abierto que documenta 11 niveles de compresión cognitiva que pueden codificarse en prompts del sistema para los modelos de IA Claude. La investigación muestra cómo técnicas específicas de ingeniería de prompts pueden mejorar significativamente el rendimiento del modelo, especialmente para modelos más pequeños como Haiku.
Hallazgos clave de la fuente
El proyecto involucró 393 experimentos en 25 rondas, probando los modelos Claude Haiku, Sonnet y Opus en 19 dominios que incluyen código, legal, médico, poesía, música y diseño UX.
Avance del Nivel 8: El hallazgo más significativo ocurre en el Nivel 8, que cambia de pedir al modelo que "piense en ello" a instruirlo para que "construya algo y observe qué se rompe". Este enfoque basado en la construcción produjo mejoras dramáticas:
- Claude Haiku pasó de un rendimiento de 0/3 en el Nivel 7 a 4/4 en el Nivel 8
- Los Niveles 5-7 se centran en el meta-análisis ("razonar sobre el razonamiento"), que requiere más capacidad del modelo
- El Nivel 8 instruye específicamente: "diseña una mejora falsa que parezca buena pero que en realidad profundice el problema. Luego nombra lo que solo puedes ver porque intentaste arreglarlo."
- Los investigadores señalan que "construir y observar es más primitivo que el meta-análisis pero revela cosas que el análisis estático literalmente no puede ver"
Capacidades del Nivel 11: En el nivel más alto, un prompt del sistema de 200 palabras hace que el modelo "escape de toda la categoría de diseño del problema, luego informe lo que cuesta el escape". Un experimento produjo la ecuación "sensibilidad x absorción = constante" — una ley de conservación que el modelo derivó invirtiendo su propio hallazgo de imposibilidad.
Implementación práctica
Los investigadores recomiendan level8_generative_v2.md como el mejor prompt para todos los propósitos — aproximadamente 100 palabras que pueden usarse con cualquier modelo Claude.
Uso en línea de comandos:
claude -p --model claude-sonnet-4-6 \
--system-prompt "$(cat prompts/level8_generative_v2.md)" \
"Analiza este código: $(cat your_code.py)"Uso general: El prompt puede pegarse en cualquier conversación de Claude como un prompt del sistema. Funciona con código, ensayos, artículos de investigación, música — cualquier cosa analítica. Los usuarios deben reemplazar "código" con su dominio específico.
Detalles del repositorio
- Licencia: MIT
- Contenido: 28 prompts, 299 salidas sin procesar, registro completo de experimentos
- Modelos probados: Claude Haiku, Sonnet, Opus
- Disponibilidad: Todos los prompts y salidas sin procesar son de código abierto
Para quién es esto: Desarrolladores e investigadores que trabajan con modelos de IA Claude que desean mejorar la efectividad de los prompts del sistema mediante técnicas estructuradas de compresión cognitiva.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

EctoLedger: MicroVM de código abierto para agentes de IA locales con acceso a terminal
EctoLedger es un cortafuegos y libro mayor de tiempo de ejecución de código abierto que proporciona aislamiento de microVM para agentes de IA locales con acceso a terminal, ejecutando cuatro capas de prevención antes de ejecutar comandos en entornos Apple Hypervisor.framework (macOS) o Firecracker microVM (Linux).

Sistema de Haiku Multiagente Iguala a Claude Opus en Problema de Teoría de Números Complejos con un Costo 15 Veces Menor
Un experimento de Reddit muestra que un sistema de dos agentes Haiku (generador + auditor) logra puntuaciones idénticas de 4/4 a las de Claude Opus 4.5 en una demostración difícil del Pequeño Teorema de Fermat, con un costo aproximado de $0.004 por consulta frente a $0.06 para Opus.
Claude prototipa una aplicación de análisis inmobiliario en 3 horas usando datos en vivo de Zillow a través de clawhub
Un desarrollador usó Claude con la herramienta zillow-full clawhub para construir una aplicación de análisis de flujo de efectivo de alquileres — obteniendo datos en vivo de la API de Zillow, prototipando la interfaz en torno a respuestas JSON reales, y entregando un prototipo funcional en una tarde.

Resultados de Referencia: 331 Modelos GGUF Probados en Mac Mini M4 de 16GB
Una evaluación comparativa de 331 modelos GGUF en un Mac Mini M4 con 16 GB de RAM revela que solo 11 modelos son Pareto-óptimos, todos con arquitectura Mixture-of-Experts. Los modelos Mixture-of-Experts dominan el rendimiento con una mediana de 20.0 tokens/segundo frente a 4.4 de los modelos densos.