AI 서브루틴: 제로 토큰으로 브라우저 자동화 결정론적 실행

AI 서브루틴의 역할

AI 서브루틴은 브라우저 작업을 한 번 기록하여 호출 가능한 도구로 저장하며, 토큰 비용 없이, LLM 추론 지연 없이, 100% 결정적으로 재실행됩니다. 생성된 스크립트는 프록시, 헤드리스 워커 또는 외부 프로세스 솔루션이 아닌 웹페이지 자체 내에서 실행됩니다.

핵심 아키텍처 결정

스크립트는 웹페이지의 실행 컨텍스트 내에서 실행되므로, 모든 인증, CSRF 토큰, TLS 세션 및 서명된 헤더가 요청에 자동으로 추가됩니다. 인증서 설치, TLS 지문 수정 또는 별도의 인증 스택 유지 관리가 필요하지 않습니다.

기록 메커니즘

기록 중에 확장 프로그램은 두 가지 계층을 사용하여 네트워크 요청을 가로챕니다:

페이지 스크립트 실행 전에 설치된 MAIN-world fetch/XHR 패치
CORS 및 서비스 워커 경로에 대한 상관된 대체 수단으로서의 Chrome의 webRequest API

JSON뿐만 아니라 FormData, Blob 및 원시 바이트를 포함한 요청 본문이 캡처됩니다.

네트워크 캡처 처리

시스템은 여러 신호를 기반으로 약 300개의 요청을 평가하고 약 5개로 정리합니다:

1자 대 3자 출처 (+20 / −15)
알려진 원격 측정 호스트 (Sentry, Segment, Hotjar, RUM): −80
DOM 이벤트와의 시간적 상관관계 (800ms 이내: +28, 2.5초 이내: +16)
메서드 및 페이로드 형태 (변경 POST/PUT/PATCH/DELETE: +35; GET: +5; 요청 본문 포함: +8)
응답 품질 (2xx: +12; 4xx+: −25; 비어 있지 않은 본문: +4)
변동성 있는 작업 식별자 (−18) - GraphQL queryId, doc_id, operationHash용

변동성 있는 GraphQL 작업 ID는 다음 실행에서 조용히 실패하기 전에 DOM 전용 대체 수단을 트리거합니다.

생성된 코드 구조

생성된 코드는 네트워크 호출과 DOM 작업(클릭, 입력, 찾기)을 rtrvr.* 헬퍼 네임스페이스를 통해 동일한 함수로 결합합니다. 상위 5개 순위의 요청과 DOM 상호작용이 생성기를 위한 12,000자 컨텍스트로 렌더링됩니다.

사용 패턴

AI 에이전트를 500행의 스프레드시트에 지정하면, 단 한 번의 LLM 호출로 매개변수가 할당되고 500개의 서브루틴이 시작됩니다.

주요 사용 사례

Instagram DM 전송을 기록한 후, 토큰 비용 없이 DM을 보낼 수 있는 재사용 가능한 루틴 보유
사이트 카탈로그에서 최신 제품을 가져오는 루틴 생성, 직접 GraphQL 쿼리를 통해 수천 개의 제품을 얻기 위해 호출
현재 페이지 컨텍스트에서 AI가 매개변수를 추론하여 EHR 양식 제출을 위한 루틴 설정
MCP 서버를 사용하여 LinkedIn/Slack/Gmail의 발신 메시지를 CRM에 동기화하기 위해 일일 루틴 재사용

이것이 중요한 이유

반복 작업을 위한 브라우저 에이전트의 근본적인 문제는 추론 루프를 거치는 것이 불필요하다는 점입니다. 한 번 기록하고 LLM이 가능한 모든 상호작용 방법(직접 API 호출, DOM 상호작용, 타사 도구/API/MCP 서버)을 활용하는 스크립트를 생성하도록 하면 결정적이고 비용 효율적인 자동화를 제공합니다.

📖 전체 Source 읽기: HN LLM Tools