Plugin Pair Programmer Ajoute un Contexte d'Écran en Direct, Vocal et Audio à Claude Code

✍️ OpenClawRadar📅 Publié: April 16, 2026🔗 Source
Plugin Pair Programmer Ajoute un Contexte d'Écran en Direct, Vocal et Audio à Claude Code
Ad

Un développeur a publié Pair Programmer, un plugin qui résout le manque de contexte en temps réel de Claude Code en fournissant une perception en direct du bureau. L'outil capture trois flux de données : le contenu de l'écran (avec une indexation visuelle générant de courtes descriptions de scènes), l'entrée du microphone (transcription plus une classification légère de l'intention pour les questions, explications ou commandes) et l'audio système (indexation des réunions, tutoriels ou autres audio joués sur la machine).

Architecture et mise en œuvre

Le système utilise un pipeline multi-agents plutôt qu'une approche à modèle unique. Il exécute des agents spécialisés en parallèle :

  • Lecteur d'écran pour le contexte visuel
  • Processeur vocal pour la transcription du microphone et la classification de l'intention
  • Classificateur audio pour l'audio système
  • Orchestrateur qui corrèle toutes les entrées et synthétise une réponse unique

Le plugin est construit sur l'infrastructure VideoDB. Bien que l'indexation utilise actuellement des modèles cloud, la conception est indépendante du modèle — la couche d'Index peut intégrer n'importe quel VLM ou LLM. Le développeur mentionne son intérêt à connecter des modèles locaux pour les couches de description visuelle et de transcription.

Ad

État actuel et installation

Le plugin est actuellement uniquement disponible pour macOS. L'installation nécessite trois commandes. Le dépôt GitHub est disponible à https://github.com/video-db/claude-code/tree/main.

Le développeur sollicite des retours sur les approches architecturales, notamment si les développeurs préfèrent le pipeline multi-agents avec des modèles spécialisés et une orchestration, ou s'orienter vers une solution à modèle unique de bout en bout pour les systèmes de perception de bureau.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Via Couche d’Intégration Universelle Open Source, Connecte les Outils d’IA à un Bus de Contexte Partagé
Tools

Via Couche d’Intégration Universelle Open Source, Connecte les Outils d’IA à un Bus de Contexte Partagé

Via est une couche d'intégration universelle open source qui connecte Claude, Cursor, Windsurf, ChatGPT, LangChain et d'autres outils d'IA à un bus de contexte, de tâches et de mémoire partagé, permettant au travail de suivre les utilisateurs à travers les outils, les sessions et les machines.

OpenClawRadar
devcontainer-mcp : Offrez un environnement de développement dédié aux agents IA, pas le vôtre
Tools

devcontainer-mcp : Offrez un environnement de développement dédié aux agents IA, pas le vôtre

devcontainer-mcp est un serveur MCP qui expose 45 outils permettant aux agents IA de créer, gérer et travailler dans des conteneurs de développement, soutenus par Docker, DevPod ou GitHub Codespaces — tout en gardant la machine hôte propre.

OpenClawRadar
Tester les LLM locaux pour la génération autonome de code : comparatif qualité vs. vitesse
Tools

Tester les LLM locaux pour la génération autonome de code : comparatif qualité vs. vitesse

Un développeur a construit un harnais de test pour évaluer des LLM locaux sur des tâches réelles de génération de code Go, mesurant le succès de compilation, la précision d'extraction des champs et le débit. Les résultats comparent les modèles en termes de qualité et de vitesse.

OpenClawRadar
Historique des fichiers Claude : Extension VS Code pour suivre les sessions de code Claude
Tools

Historique des fichiers Claude : Extension VS Code pour suivre les sessions de code Claude

Une extension VS Code appelée Claude File History suit chaque session Claude Code qui a touché vos fichiers, vous permettant de retrouver les conversations passées, prévisualiser ce qui a été discuté et reprendre les conversations en double-cliquant.

OpenClawRadar