WebMCP 브라우저 API는 AI 에이전트의 웹 스크래핑 필요성을 줄일 수 있습니다.

웹 자동화에 대한 WebMCP의 변화
Google은 최근 WebMCP를 출시했는데, 이는 웹사이트가 AI 에이전트가 직접 호출할 수 있는 도구를 등록할 수 있게 하는 두 가지 새로운 브라우저 API입니다. DOM 요소를 스크래핑하거나 봇 방지 시스템과 싸우는 대신, 사이트는 표준화된 인터페이스를 통해 기능을 노출할 수 있습니다.
기술적 작동 방식
사이트는 navigator.modelContext.registerTool()을 사용하여 이름, 설명, 입력 스키마 및 실행 함수와 함께 도구를 등록합니다. 소스는 다음 예제를 제공합니다:
navigator.modelContext.registerTool({
name: "search_flights",
description: "가능한 항공편 검색",
inputSchema: { /* JSON 스키마 */ },
execute: async (input) => {
return await internalFlightAPI(input);
}
});이 접근 방식은 WebMCP를 구현하는 모든 사이트에 대해 CSS 선택자 체인, 재시도 로직, 헤드리스 브라우저 세션 관리 및 DOM 스크래핑을 제거합니다.
현재 구현 상태
사양은 아직 초기 단계에 있습니다 - W3C 초안에는 메서드 정의에 "TODO: 이 부분 채우기"라는 글자 그대로의 주석이 포함되어 있습니다. 현재는 Chrome 146에서만 초기 미리보기로 사용할 수 있습니다. 저자는 기존 스크래핑 코드의 어느 정도를 대체할 수 있는지 테스트하기 위해 초기 미리보기에 가입했습니다.
개발자를 위한 실질적 영향
이미 MCP 서버를 구축 중인 개발자들에게는 정신적 모델이 동일합니다: 도구 + 스키마 + 실행. 로컬 리소스를 MCP 도구로 노출하는 것에서 웹사이트가 스스로를 MCP 도구로 노출하는 것으로의 전환은 작습니다 - 동일한 아키텍처, 다른 전송 방식입니다.
기존 내부 API(예: Booking, Amazon, 항공사)를 가진 대형 사이트는 최소한의 변경으로 API를 WebMCP를 통해 노출할 수 있기 때문에 먼저 채택할 가능성이 높습니다. 스크래퍼가 완전히 사라지지는 않을 것입니다 - WebMCP 구현이 없는 사이트는 여전히 전통적인 접근 방식이 필요합니다.
저자는 계층적 접근 방식을 제안합니다: 에이전트는 먼저 WebMCP를 시도하고, 사용할 수 없는 경우 DOM 자동화로 대체한 다음, 최후의 수단으로 원시 스크래핑으로 대체합니다 - 사이트별로 사용 가능한 최상의 방법을 사용합니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

OpenClaw는 에이전트 기록 압축을 구현하여 컨텍스트 사용량을 줄입니다.
OpenClaw는 이제 완료된 하위 작업 로그를 구조화된 요약으로 대체하여 에이전트 기록을 압축하여 약 100만 토큰을 약 3만 토큰으로 줄입니다. 시스템은 작업 수명 주기를 식별하기 위해 4단계 스캐너를 사용하며, 에이전트 호환성을 유지하는 마스킹된 요약을 생성합니다.

OpenClaw 에이전트, 맞춤형 스킬로 전화 통화 기능 획득
한 개발자가 자체 호스팅 OpenClaw 에이전트를 위한 맞춤형 스킬을 만들어 전화 통화 기능을 추가했습니다. 이 스킬은 빌드 완료나 서버 장애 같은 트리거에 따라 에이전트가 전화를 걸 수 있게 해줍니다. 구현체는 웹 검색 및 알림 설정을 포함한 모든 채팅 기능을 갖춘 음성 상호작용을 제공합니다.

MCP 서버: 토론 기능을 통한 로컬 및 클라우드 LLM 비교
MCP 서버는 개발자들이 Ollama를 통해 로컬 모델과 다양한 클라우드 LLM을 함께 쿼리할 수 있도록 하며, 나란히 비교 및 구조화된 토론 기능과 같은 기능을 제공합니다.

로컬 Ollama 모델과 함께 OpenAI Codex IDE를 VSCodium에서 사용하기
OpenAI Codex IDE는 config.toml 파일의 특정 설정을 통해 VSCodium에서 로컬 Ollama 모델과 함께 작동하도록 구성할 수 있습니다.