AgentHandover: Aplicación de la barra de menú de Mac que crea habilidades de agente observando tu pantalla

Qué hace AgentHandover
AgentHandover es una aplicación de código abierto para la barra de menú de Mac que observa tu pantalla a través de Gemma 4 (ejecutándose localmente vía Ollama) y convierte tus flujos de trabajo repetidos en archivos de Habilidades estructurados que cualquier agente puede seguir. Su creador lo desarrolló para evitar tener que explicar procesos desde cero cada vez que quería que un agente manejara algo, incluso para tareas diarias.
Características clave y funcionamiento
- Dos modos de grabación: Grabación Enfocada para tareas específicas y Descubrimiento Pasivo que se ejecuta en segundo plano y comienza a detectar patrones después de verte repetir algo varias veces
- Habilidades que se mejoran solas: Las Habilidades se vuelven más precisas con cada observación, actualizando pasos, salvaguardas y puntuaciones de confianza a medida que aprende más
- Procesamiento en el dispositivo: Todo el sistema es una canalización de 11 etapas que se ejecuta completamente en el dispositivo sin que nada salga de tu máquina y con los datos cifrados en reposo
- Integración con agentes: Integración de un clic con agentes a través de MCP (Model Context Protocol) para que Claude Code, Cursor, OpenClaw o cualquier cosa que hable MCP pueda tomar tus Habilidades
- CLI disponible: Incluye una interfaz de línea de comandos para usuarios de terminal
Detalles técnicos
La aplicación utiliza Gemma 4 ejecutándose localmente vía Ollama para la comprensión de pantalla. Tiene licencia Apache 2.0 y está disponible en GitHub. El creador busca comentarios sobre el enfoque y está interesado en otros modelos locales de visión o de sistema operativo para la comprensión de pantalla.
Este tipo de herramienta aborda el desafío de transferir flujos de trabajo humanos a agentes de IA sin documentación manual. Al observar interacciones reales en pantalla, captura los matices y variaciones que podrían pasarse por alto en instrucciones escritas.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Usando el kit de herramientas Obliteratus para eliminar los pesos de rechazo de los modelos de IA.
Un usuario de Reddit utilizó el kit de herramientas Obliteratus para eliminar quirúrgicamente pesos específicos responsables del comportamiento de rechazo en modelos de IA, demostrando en el modelo Qwen 1.5B de Alibaba que puede revelar los orígenes del entrenamiento sin necesidad de reentrenar.

Pipeline de Recapitulación de Películas Local-Primero Usando Whisper + CLIP + Ollama
Un pipeline completamente local que genera automáticamente videos de resúmenes narrados de películas usando Whisper, CLIP, Ollama, Edge TTS y FFmpeg. Introduce un archivo de película y obtén un resumen narrado en aproximadamente 15 minutos.

La arquitectura de doble modelo reduce el consumo de tokens a la mitad en conversaciones largas.
Un desarrollador creó un sistema de doble modelo donde un pequeño modelo 'subconsciente' comprime el historial de conversación en segundo plano, permitiendo que el modelo principal trabaje con un contexto curado de ~35K en lugar de 120K tokens de historial crudo. Esta arquitectura reduce aproximadamente a la mitad el consumo de tokens para trabajos de proyecto sostenidos.

OpenBridge: Control Remoto Gratuito y de Código Abierto para Claude Code a través de Slack/Discord
OpenBridge es una herramienta gratuita y de código abierto que te permite controlar Claude Code desde Slack o Discord, organizando proyectos como canales y conversaciones como hilos. Se ejecuta localmente o en un VPS y funciona con suscripciones existentes de Claude Code/Codex sin tarifas adicionales de API.