에이전트 브라우저 프로토콜: AI 에이전트용 오픈소스 Chrome 포크, Mind2Web 벤치마크에서 90% 달성

Agent Browser Protocol: AI 에이전트를 위해 만들어진 브라우저
Agent Browser Protocol(ABP)은 AI 에이전트를 위해 특별히 설계된 Chrome의 오픈소스 브라우저 포크입니다. 이 프로젝트는 에이전트 중심 브라우저를 구축하고 Online Mind2Web 벤치마크에서 최고 점수를 획득하기 위한 도전으로 시작되었습니다.
핵심 기술 접근법
ABP의 주요 통찰은 AI 에이전트가 턴 기반 채팅에는 뛰어나지만 연속적인 시간 의사 결정에는 어려움을 겪는다는 점입니다. 브라우저 작업에서 LLM 성능을 극대화하기 위해 ABP는 다음과 같이 웹 브라우징을 멀티모달 채팅으로 변환합니다:
- 모든 작업 후 JavaScript와 시간을 정지시켜 에이전트가 생각하는 동안 웹페이지가 고정되도록 함
- 파일 선택기, 다운로드, 권한 요청, 대화상자를 포함한 작업 결과의 모든 관련 이벤트를 캡처
- 이러한 이벤트를 고정된 페이지의 스크린샷과 함께 반환하여 에이전트가 전체 컨텍스트로 브라우저 상태를 종합적으로 추론할 수 있도록 함
성능 및 개발 과정
ABP는 Online Mind2Web 벤치마크에서 90.53%를 달성했으며, GPT-5.4가 92.8%로 추월하기 전까지 이틀 동안 최고 점수를 유지했습니다. 개발자는 야간과 주말에 Claude Opus-4.5를 사용하여 프로젝트에 작업하며 두 달 만에 완성했습니다.
실용적 응용 분야
출처에 따르면, ABP는 다음 작업에서 탁월한 성능을 보입니다:
- 양식 작성
- 온라인 쇼핑
- 파일 다운로드
- 파일 업로드
- 테이크아웃 주문
- 웹사이트의 문서화되지 않은 API 역공학
시작하기
Claude Code에 ABP를 추가하려면:
claude mcp add browser -- npx -y agent-browser-protocol --mcp그런 다음 Claude에게 다음과 같은 명령을 내릴 수 있습니다:
Find me kung pao chicken near 415 Mission St, San Francisco on Doordash.참고 자료
GitHub 저장소: https://github.com/theredsix/agent-browser-protocol
벤치마크 결과: https://github.com/theredsix/abp-online-mind2web-results
📖 Read the full source: r/ClaudeAI
👀 See Also
MartinLoop: 예산 중단 및 감사 추적 기능을 갖춘 AI 코딩 에이전트용 오픈 소스 제어 플레인
MartinLoop는 AI 코딩 에이전트에 하드 예산 중단, JSONL 감사 추적, 실패 분류 및 테스트 검증 완료 확인을 추가하는 오픈 소스 제어 평면입니다.

추출보다 지속적인 인덱스: YouTube MCP 서버 아키텍처
한 개발자가 YouTube MCP 서버를 구축한 상세한 아키텍처 노트를 공유했습니다. 이 서버는 기존 40개 이상의 서버에서 흔히 볼 수 있는 '추출 후 잊기' 패턴과 달리 지속적인 로컬 인덱스를 구현합니다. 주요 결정 사항으로는 3단계 폴백 시스템, 벡터 저장을 위한 SQLite + sqlite-vec, 임베딩 제공자 추상화, 별도의 시각 검색 인덱스 등이 포함됩니다.

로컬 AI를 위한 Ollama와 MCP로 구축된 다중 에이전트 커리어 멘토
한 개발자가 Ollama와 llama3를 로컬에서 사용하여 이력서를 분석하고 커리어 인텔리전스 보고서를 생성하는 5개의 에이전트 AI 시스템을 구축했습니다. 이 시스템은 에이전트 출력을 연결하여 각각이 이전 컨텍스트를 기반으로 구축되며, MCP가 도구 통합을 처리합니다.

오픈소스 MCP 제품군이 Claude 코드 생성 품질을 15-20% 향상시킵니다
오픈소스 MCP 스위트는 세 개의 로컬 서버와 프롬프트 스킬로 구성되어 있으며, AI 코드 생성의 '나쁜 토큰' 문제를 해결합니다. 한 고객은 Claude Code의 품질이 15-20% 향상되었다고 보고했습니다.