bad-ass-mcp: MCP gratuito para control GUI nativo vía API Accesibilidad

bad-ass-mcp es un servidor MCP que otorga a los agentes de IA control directo sobre tu escritorio utilizando la capa de accesibilidad nativa del sistema operativo. A diferencia de Computer Use de Anthropic u Operator de OpenAI, no depende de ciclos de mirar-mover-mirar basados en capturas de pantalla, y a diferencia de UiPath, es gratuito y de código abierto.

Cómo funciona

En lugar de analizar capturas de pantalla, bad-ass-mcp utiliza la misma API de accesibilidad que usan los lectores de pantalla. Esto significa que puede navegar, señalar, hacer clic y escribir más rápido y de manera más confiable que los enfoques basados en visión. El desarrollador señala que los frameworks de WebView (Electron, Tauri, etc.) tienen una exposición de accesibilidad pobre, pero la herramienta sigue funcionando — y es más rápida que tomar una captura de pantalla. Están impulsando proyectos para mejorar el soporte de accesibilidad, lo que también beneficia a los usuarios con discapacidad visual.

Capacidades clave

Controlar aplicaciones GUI en macOS, Windows y Linux
Interactuar y probar aplicaciones GUI de forma autónoma
Optimizar flujos de trabajo en múltiples aplicaciones y estaciones de trabajo
Grabar y guardar video de sus propias acciones (como se muestra en el video de demostración)

Casos de uso de ejemplo

El desarrollador planea demostrar la organización de material de archivo por tipo de toma en Adobe Premiere Pro y la gradación de color en DaVinci Resolve. La herramienta se grabó a sí misma y guardó el video en una demostración simple.

Para quién es

Desarrolladores que usan agentes de codificación de IA y necesitan automatizar tareas GUI de escritorio sin herramientas empresariales costosas o enfoques lentos basados en capturas de pantalla.

📖 Lee la fuente completa: r/ClaudeAI

bad-ass-mcp: MCP gratuito y de código abierto para control de GUI de escritorio nativo mediante API de Accesibilidad

Cómo funciona

Capacidades clave

Casos de uso de ejemplo

Para quién es

👀 Ver también

Más de 200 especificaciones de diseño de aplicaciones en Markdown – Arrástralas a Claude o Cursor para obtener clones exactos de la interfaz de usuario

Construyendo un Agente de Voz de Menos de 500ms: Arquitectura y Perspectivas de Rendimiento

Escudo de Razonamiento: Detección de Bucles a Nivel de Proxy para Inferencia Local de LLM

El usuario de Claude Code crea el comando /discuss para conversaciones de solo lectura.