AgentHandover: 화면을 보면서 에이전트 스킬을 만드는 Mac 메뉴 바 앱

AgentHandover의 기능
AgentHandover는 Gemma 4(Ollama를 통해 로컬에서 실행)를 통해 화면을 감시하고 반복적인 워크플로우를 어떤 에이전트든 따를 수 있는 구조화된 Skill 파일로 변환하는 오픈소스 Mac 메뉴 바 애플리케이션입니다. 제작자는 매번 에이전트에게 무언가를 처리하도록 요청할 때마다 일상적인 작업이라도 처음부터 과정을 설명해야 하는 번거로움을 피하기 위해 이 도구를 만들었습니다.
주요 기능 및 작동 방식
- 두 가지 기록 모드: 특정 작업을 위한 Focus Record와 백그라운드에서 실행되며 사용자가 무언가를 몇 번 반복하는 것을 보고 패턴을 감지하기 시작하는 Passive Discovery
- 자기 개선 기술: Skill은 매 관찰마다 더욱 정교해지며, 더 많이 학습함에 따라 단계, 안전 장치, 신뢰도 점수를 업데이트합니다
- 기기 내 처리: 전체 시스템은 11단계 파이프라인으로 완전히 기기 내에서 실행되며, 어떤 데이터도 사용자의 기기를 떠나지 않고 저장 시 암호화됩니다
- 에이전트 통합: MCP(Model Context Protocol)를 통한 원클릭 에이전트 통합으로 Claude Code, Cursor, OpenClaw 또는 MCP를 지원하는 어떤 도구든 사용자의 Skill을 활용할 수 있습니다
- CLI 제공: 터미널 사용자를 위한 명령줄 인터페이스 포함
기술적 세부사항
이 애플리케이션은 화면 이해를 위해 Ollama를 통해 로컬에서 실행되는 Gemma 4를 사용합니다. Apache 2.0 라이선스로 제공되며 GitHub에서 이용 가능합니다. 제작자는 이 접근 방식에 대한 피드백을 구하고 있으며, 화면 이해를 위한 다른 로컬 비전 또는 OS 모델에 관심이 있습니다.
이러한 유형의 도구는 수동 문서화 없이 인간의 워크플로우를 AI 에이전트로 전달하는 과제를 해결합니다. 실제 화면 상호작용을 관찰함으로써, 문서화된 지시사항에서는 놓칠 수 있는 미묘한 차이와 변형을 포착합니다.
📖 전체 원문 읽기: r/LocalLLaMA
👀 See Also

일 처리하기: AI 코딩 에이전트를 위한 메타 프롬프팅 시스템
Get Shit Done(GSD)는 메타 프롬프팅, 컨텍스트 엔지니어링, 스펙 기반 개발 시스템으로 Claude Code, OpenCode, Gemini CLI, Codex, Copilot, Antigravity와 함께 작동합니다. 구조화된 프롬프트와 검증 워크플로우를 제공하여 컨텍스트 부패 문제를 해결합니다.

Eden AI: AI 모델을 위한 유럽 API 허브 – OpenRouter의 대안으로 전환
Eden AI는 스마트 라우팅, 폴백 메커니즘 및 지역 제어 기능을 통해 500개 이상의 AI 모델(LLM, 비전, OCR, 음성)에 접근할 수 있는 단일 통합 API를 제공합니다. OpenRouter의 유럽 대안으로 자리매김하고 있습니다.

MCP-인디아-스택: AI 에이전트를 위한 인도 금융 데이터 오프라인 우선 서버
MCP-India-Stack는 인증이나 외부 API 호출 없이 인도 금융 및 정부 API 기능을 제공하는 오프라인 우선 MCP 서버입니다. 세금 계산, 검증 도구 및 조회를 위해 데이터셋을 로컬에 번들로 제공합니다.

인라인 비주얼라이저: 로컬 AI 모델이 이제 대화형 HTML 시각화를 렌더링할 수 있습니다
인라인 비주얼라이저는 BSD-3 라이선스의 Open WebUI 플러그인으로, 툴 호출 기능을 지원하는 모든 로컬 AI 모델이 채팅 내에서 직접 대화형 HTML/SVG 시각화를 렌더링할 수 있게 해주며, JavaScript 브리지를 통해 요소들이 AI로 메시지를 다시 보낼 수 있습니다.