bad-ass-mcp : MCP gratuit et open source pour le contrôle natif de l'interface graphique de bureau via l'API d'accessibilité

bad-ass-mcp est un serveur MCP qui donne aux agents IA un contrôle direct sur votre bureau en utilisant la couche d'accessibilité native du système d'exploitation. Contrairement à Computer Use d'Anthropic ou Operator d'OpenAI, il ne repose pas sur des cycles basés sur des captures d'écran regarder-déplacer-regarder, et contrairement à UiPath, il est gratuit et open source.
Comment ça marche
Au lieu d'analyser des captures d'écran, bad-ass-mcp utilise la même API d'accessibilité que les lecteurs d'écran. Cela lui permet de naviguer, pointer, cliquer et taper plus rapidement et plus fiablement que les approches basées sur la vision. Le développeur note que les frameworks WebView (Electron, Tauri, etc.) ont une mauvaise exposition à l'accessibilité, mais l'outil fonctionne quand même — et plus vite qu'une capture d'écran. Ils poussent les projets à améliorer le support de l'accessibilité, ce qui profite également aux utilisateurs malvoyants.
Fonctionnalités clés
- Contrôler les applications GUI sur macOS, Windows et Linux
- Interagir et tester les applications GUI de manière autonome
- Rationaliser les flux de travail sur plusieurs applications et postes de travail
- Enregistrer et sauvegarder une vidéo de ses propres actions (comme montré dans la vidéo de démonstration)
Exemples d'utilisation
Le développeur prévoit de démontrer l'organisation de séquences par type de plan dans Adobe Premiere Pro et l'étalonnage des couleurs dans DaVinci Resolve. L'outil s'est enregistré et a sauvegardé la vidéo dans une simple démonstration.
À qui s'adresse-t-il
Développeurs utilisant des agents IA de codage qui ont besoin d'automatiser des tâches GUI sur bureau sans outils coûteux pour entreprises ou approches lentes basées sur des captures d'écran.
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude vers PDF Extension Chrome Exporte les Longues Conversations avec la Mise en Forme Intacte
Un développeur a publié une extension Chrome gratuite appelée Claude to PDF qui capture l'historique complet des conversations des chats Claude AI et préserve les blocs de code, les formules mathématiques LaTeX et la mise en forme des tableaux lors de l'exportation en PDF.

Configuration de RouteLLM pour un Routage Économique des Tâches d'IA
Un utilisateur de Reddit partage une configuration Docker Compose qui combine le modèle local Qwen3.5:4b d'Ollama avec GitHub Copilot via OpenWire, utilisant RouteLLM pour router les tâches complexes vers GPT-4o tout en gérant les tâches plus simples localement.

Cartes-éclair de codage : 800+ cartes Anki pour Rust, SQLite, Godot et langage Wolfram
Plus de 800 flashcards en Markdown couvrant Rust, SQLite, Godot et le langage Wolfram à partir des premiers principes, avec des scripts pour les convertir en decks Anki ou en PDF.

Claude-Code v2.1.76 ajoute l'élicitation MCP, des optimisations de worktree et de nombreuses corrections.
Claude-Code v2.1.76 introduit la prise en charge de la sollicitation MCP pour les entrées structurées en cours de tâche, ajoute worktree.sparsePaths pour l'efficacité des monorepos, et corrige plus de 20 problèmes incluant la perte de schéma d'outils différés, les problèmes de commandes slash et la stabilité des sessions de Contrôle à Distance.