Agentes de Codificación Paralela con tmux y Especificaciones en Markdown

Manuel Schipper ha estado ejecutando agentes de codificación en paralelo con una configuración ligera que utiliza tmux, archivos Markdown, alias de bash y seis comandos de barra diagonal. Estos son agentes estándar sin perfiles de subagentes u orquestadores, utilizando una convención de nombres de roles por ventana de tmux: Planificador (construye especificaciones en Markdown), Trabajador (implementa a partir de especificaciones terminadas) y Gerente de Proyecto (refinamiento de backlog y volcado de ideas).
Sistema de Diseño de Funcionalidades
La mayor parte de la escritura de código ocurre a partir de especificaciones terminadas llamadas Diseños de Funcionalidades (FDs). Un FD es un archivo Markdown que contiene:
- El problema que se está resolviendo
- Todas las soluciones consideradas con pros y contras para cada una
- La solución final con el plan de implementación, incluyendo los archivos a actualizar
- Pasos de verificación
Después de adoptar este sistema, Schipper puede trabajar en paralelo con 4-8 agentes. Más allá de 8 agentes, la calidad de las decisiones se ve afectada. El sistema fue construido manualmente en un proyecto con más de 300 especificaciones, luego portado a nuevos proyectos usando un comando /fd-init que inicializa la configuración en cualquier repositorio.
Seguimiento y Ciclo de Vida de los FD
Cada FD obtiene un archivo de especificación numerado (FD-001, FD-002...) rastreado en un índice a través de todos los FDs. Los archivos residen en docs/features/ y avanzan a través de 8 etapas:
- Planificado: Identificado, aún no diseñado
- Diseño: Diseñando activamente la solución
- Abierto: Diseñado, listo para implementación
- En Progreso: Actualmente siendo implementado
- Pendiente de Verificación: Código completo, esperando verificación en tiempo de ejecución
- Completo: Verificado como funcional, listo para archivar
- Diferido: Postergado indefinidamente
- Cerrado: No se hará
Comandos de Barra Diagonal
Seis comandos de barra diagonal manejan el ciclo de vida completo:
/fd-new: Crear un nuevo FD a partir de un volcado de ideas/fd-status: Mostrar el índice: qué está activo, pendiente de verificación y terminado/fd-explore: Inicializar una sesión: cargar documentación de arquitectura, guía de desarrollo, índice de FDs/fd-deep: Lanzar 4 agentes Opus en paralelo para explorar un problema de diseño difícil/fd-verify: Revisar código, proponer un plan de verificación, hacer commit/fd-close: Archivar el FD, actualizar el índice, actualizar el registro de cambios
Cada commit se vincula a su FD (por ejemplo, "FD-049: Implementar reconstrucción incremental del índice"). El registro de cambios se acumula automáticamente a medida que los FDs se completan.
Ejemplo de Archivo FD
FD-051: Clasificación de documentos multi-etiqueta Estado: Abierto Prioridad: Media Esfuerzo: Medio Impacto: Mejor recuperación para filtrado descendenteProblema
Los documentos entrantes obtienen una única etiqueta de categoría, pero muchos abarcan múltiples temas. Los filtros descendentes pierden documentos relevantes porque el clasificador fuerza un único mejor ajuste.
Solución
Reemplazar la clasificación de etiqueta única por multi-etiqueta:
- Usar un LLM para asignar puntajes de confianza por categoría.
- Aceptar todas las etiquetas por encima de 0.90 de confianza.
- Para puntajes ambiguos (0.50-0.90), ejecutar una segunda pasada de LLM con ejemplos de pocos disparos para confirmar.
- Almacenar todas las etiquetas con puntajes para que las consultas descendentes puedan umbralizar de manera flexible.
Archivos a Modificar
- src/classify/multi_label.py (nuevo: lógica multi-etiqueta basada en LLM)
- src/classify/prompts.py (nuevo: plantillas de pocos disparos para casos ambiguos)
- sql/01_schema.sql (agregar tabla document_labels con puntajes)
- sql/06_classify_job.sql (nuevo: clasificación programada después de la ingesta)
Verificación
- Ejecutar clasificador en la tabla de documentos de staging
- Verificar que no haya errores en el registro de operación, ejecutar comprobaciones de salud
- Verificación puntual: documentos con contenido conocido de múltiples temas tienen las etiquetas esperadas
- Ejecutar pruebas, confirmar que los filtros descendentes respetan el umbral de confianza
Inicialización del Sistema
Al ejecutar /fd-init en cualquier repositorio:
- Infiere el contexto del proyecto desde CLAUDE.md, configuraciones de paquetes y registro de git
- Crea la estructura de directorios (
docs/features/,docs/features/archive/) - Genera un FEATURE_INDEX.md personalizado para el proyecto
- Crea una plantilla de FD
- Instala los seis comandos de barra diagonal
- Añade las convenciones del ciclo de vida de FD al CLAUDE.md del proyecto
Los archivos creados incluyen docs/features/FEATURE_INDEX.md (índice de funcionalidades), docs/features/TEMPLATE.md (plantilla de archivo FD), docs/features/archive/ (directorio de archivo), CHANGELOG.md (formato Keep a Changelog), y actualizaciones a CLAUDE.md con las convenciones del proyecto incluyendo el sistema FD.
📖 Read the full source: HN AI Agents
👀 Ver también

Integración de OpenClaw para los Mercados Bursátiles Indios: Terminal de Análisis y Negociación Multiagente
Una terminal de trading de código abierto para los mercados indios se ha conectado como un servidor de habilidades de OpenClaw, permitiendo que cualquier agente de OpenClaw obtenga datos del mercado de valores indio y ejecute análisis completos a través de HTTP sin instalación local. El sistema utiliza siete agentes especialistas trabajando en paralelo para generar análisis estructurado con planes de trading.

Biblioteca de Registro de Artículo 12 de Código Abierto para el Cumplimiento de la Ley de IA de la UE
Una biblioteca gratuita y de código abierto en TypeScript para aplicaciones Node.js que utilizan Vercel AI SDK, que implementa los requisitos de registro del Artículo 12 con registros JSONL de solo anexo, encadenamiento de hash SHA-256 para detección de manipulaciones y aplicación de retención de 180 días.

Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA
Culpa es una herramienta de código abierto que registra sesiones de agentes LLM con contexto de ejecución completo, permitiendo reproducción determinista utilizando respuestas grabadas como stubs en lugar de acceder a APIs reales. Funciona con las APIs de Anthropic y OpenAI mediante modo proxy o SDK de Python.

El benchmark muestra que el motor de contexto reduce los costos del agente de codificación de IA en 3 veces en SWE-bench.
Una evaluación comparativa de 4 agentes de codificación utilizando Claude Opus 4.5 en SWE-bench Verified muestra que un motor de contexto logró una tasa de aprobación del 73% a $0.67/tarea, mientras que otros agentes costaron hasta $1.98/tarea para un rendimiento similar o inferior.