Presentando operate.txt: Una especificación YAML para agentes de IA que navegan productos SaaS.

Un desarrollador ha creado operate.txt, una especificación para documentar cómo los agentes de IA deben interactuar con aplicaciones web. El archivo aborda problemas encontrados al usar la función de uso informático de Claude para navegar un producto SaaS, donde el agente de IA cuestionaba repetidamente si las pantallas de carga indicaban funcionalidad rota.
Problema y solución
Al usar Claude Code + uso informático para navegar BrandyBee (un producto SaaS) como usuario por primera vez, el desarrollador identificó puntos problemáticos específicos donde Claude tuvo dificultades:
- Durante un análisis de marca que toma 90-120 segundos, Claude preguntó "¿Es esto un estado de carga o hay algo mal?" al 28% de completado
- Un botón "Aprobar" que activa llamadas API pagadas sin confirmación en la interfaz
- Un menú desplegable de Idioma que solo se llena después de seleccionar País
- Procesos asíncronos que toman 2-5 minutos y parecen estancados
Cada vez, la respuesta fue "no, eso es normal, solo espera". Esto llevó a la creación de operate.txt como equivalente a robots.txt para rastreadores o sitemap.xml para motores de búsqueda, pero específicamente para agentes de IA que operan productos.
Especificación operate.txt
El archivo operate.txt es un archivo YAML alojado en yourdomain.com/operate.txt que documenta:
- Qué es cada pantalla
- Cómo se ven los estados de carga y cuánto tiempo toman
- Qué acciones son irreversibles
- La ruta paso a paso para tareas comunes
- Qué los agentes nunca deben hacer
La sección más útil es async_actions, que le dice a los agentes detalles como "este proceso toma 90-120 segundos, no actualices, no navegues fuera, aquí están las etapas por las que pasa".
Proceso de creación y ejemplos
El desarrollador hizo de código abierto la especificación con ejemplos reales incluyendo su propio SaaS, una plantilla de comercio electrónico y una plantilla de panel de control SaaS en https://github.com/serdem1/operate.txt.
El proceso de creación implica hacer que Claude navegue tu producto, observar dónde duda, luego hacer que Claude redacte el archivo operate.txt. El desarrollador corrige lo que Claude entiende mal, creando un ciclo de retroalimentación donde la IA encuentra brechas y el humano las llena.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Habilidad OpenClaw para Transcripción de Reuniones Locales con Whisper
Una nueva habilidad de OpenClaw llamada ghostmeet proporciona transcripción local de reuniones usando Whisper. Captura audio de pestañas del navegador mediante una extensión de Chrome y puede generar resúmenes usando Claude, procesando todo el audio y la transcripción localmente en tu máquina.
MartinLoop: Plano de Control de Código Abierto para Agentes de Codificación de IA con Límites de Presupuesto y Registros de Auditoría
MartinLoop es un plano de control de código abierto que añade límites de presupuesto estrictos, registros de auditoría en JSONL, clasificación de fallos y verificaciones de finalización basadas en pruebas a los agentes de codificación de IA.

Renderizador 3D Basado en Terminal Construido con el Sistema de Código Multi-Agente Claude
Un desarrollador creó tortuise, un renderizador 3D basado puramente en terminal que muestra splats gaussianos usando símbolos Unicode y ASCII, construido en 3 días utilizando 70-80 agentes de IA coordinados a través de una configuración Claude Code con subagentes dentro de subagentes.

Planificación de modo de refactorización Claude Code Prompt Improver v0.5.3 e investigación priorizando subagentes
v0.5.3 añade un hook PreToolUse para mejorar la legibilidad del modo plan (reescrituras limpias, sin historial de decisiones) y traslada la investigación de prompts vagos a subagentes Task/Explore en Haiku para ahorrar tokens del contexto principal. El plugin ahora funciona en Windows y tiene más de 1.4K estrellas en GitHub.