El Complemento de Programación en Pareja Agrega Contexto de Pantalla en Vivo, Voz y Audio a Claude Code

✍️ OpenClawRadar📅 Publicado: 16 de abril de 2026🔗 Source
El Complemento de Programación en Pareja Agrega Contexto de Pantalla en Vivo, Voz y Audio a Claude Code
Ad

Un desarrollador ha lanzado Pair Programmer, un complemento que aborda la falta de contexto en tiempo real de Claude Code al proporcionar percepción del escritorio en vivo. La herramienta captura tres flujos de datos: contenido de pantalla (con indexación visual que genera descripciones breves de escenas), entrada del micrófono (transcripción más clasificación ligera de intenciones para preguntas, explicaciones o comandos) y audio del sistema (indexando reuniones, tutoriales u otro audio que se reproduce en la máquina).

Arquitectura e Implementación

El sistema utiliza una canalización de múltiples agentes en lugar de un enfoque de modelo único. Ejecuta agentes especializados en paralelo:

  • Lector de pantalla para contexto visual
  • Procesador de voz para transcripción del micrófono y clasificación de intenciones
  • Clasificador de audio para audio del sistema
  • Orquestador que correlaciona todas las entradas y sintetiza una única respuesta

El complemento está construido sobre la infraestructura de VideoDB. Si bien la indexación actualmente utiliza modelos en la nube, el diseño es independiente del modelo: la capa de Indexación puede intercambiar cualquier VLM o LLM. El desarrollador menciona interés en conectar modelos locales para las capas de descripción visual y transcripción.

Ad

Estado Actual e Instalación

El complemento actualmente solo está disponible para macOS. La instalación requiere tres comandos. El repositorio de GitHub está disponible en https://github.com/video-db/claude-code/tree/main.

El desarrollador está buscando comentarios sobre enfoques arquitectónicos, específicamente si los desarrolladores prefieren la canalización de múltiples agentes con modelos especializados y orquestación o avanzar hacia una solución de modelo único de extremo a extremo para sistemas de percepción del escritorio.

📖 Read the full source: r/ClaudeAI

Ad

👀 Ver también

OpenClaw PARA organiza automáticamente los archivos del asistente de IA.
Herramientas

OpenClaw PARA organiza automáticamente los archivos del asistente de IA.

Un desarrollador creó una habilidad para OpenClaw que aplica el método PARA (Proyectos, Áreas, Recursos, Archivos) para la organización de archivos, clasificando automáticamente los archivos en cuatro carpetas estructuradas en lugar de volcarlo todo en el directorio raíz.

OpenClawRadar
GitAgent: Un Estándar Abierto para Agentes de IA Portátiles en Repositorios Git
Herramientas

GitAgent: Un Estándar Abierto para Agentes de IA Portátiles en Repositorios Git

GitAgent es una especificación abierta que define agentes de IA a través de tres archivos principales en un repositorio git: agent.yaml para configuración, SOUL.md para personalidad/instrucciones y SKILL.md para capacidades. La CLI permite ejecutar cualquier repositorio de agente directamente con comandos como npx @open-gitagent/gitagent run -r https://github.com/user/agent -a claude.

OpenClawRadar
Heddle: Aplicación de Confianza y Registro de Auditoría para Conexiones MCP de Claude Desktop
Herramientas

Heddle: Aplicación de Confianza y Registro de Auditoría para Conexiones MCP de Claude Desktop

Heddle es una herramienta de código abierto que añade niveles de confianza, controles de acceso y registro de auditoría a las conexiones MCP de Claude Desktop, permitiendo la gestión segura de múltiples servicios a través de una única interfaz con seis paquetes iniciales incluidos.

OpenClawRadar
SlackClaw: Instancia Administrada de OpenClaw para Integración con Slack
Herramientas

SlackClaw: Instancia Administrada de OpenClaw para Integración con Slack

SlackClaw es un producto comercial basado en OpenClaw que proporciona una instancia gestionada específicamente para Slack. Ofrece instalación con un clic, conexiones de herramientas OAuth, servidores dedicados por espacio de trabajo y memoria persistente.

OpenClawRadar