AI 서브루틴: 제로 토큰 비용으로 결정론적 브라우저 자동화

AI 서브루틴의 역할
AI 서브루틴은 브라우저 작업을 한 번 기록하여 호출 가능한 도구로 저장하며, 토큰 비용 없이, LLM 추론 지연 없이, 100% 결정적으로 재실행됩니다. 생성된 스크립트는 프록시, 헤드리스 워커 또는 외부 프로세스 솔루션이 아닌 웹페이지 자체 내에서 실행됩니다.
핵심 아키텍처 결정
스크립트는 웹페이지의 실행 컨텍스트 내에서 실행되므로, 모든 인증, CSRF 토큰, TLS 세션 및 서명된 헤더가 요청에 자동으로 추가됩니다. 인증서 설치, TLS 지문 수정 또는 별도의 인증 스택 유지 관리가 필요하지 않습니다.
기록 메커니즘
기록 중에 확장 프로그램은 두 가지 계층을 사용하여 네트워크 요청을 가로챕니다:
- 페이지 스크립트 실행 전에 설치된 MAIN-world fetch/XHR 패치
- CORS 및 서비스 워커 경로에 대한 상관된 대체 수단으로서의 Chrome의 webRequest API
JSON뿐만 아니라 FormData, Blob 및 원시 바이트를 포함한 요청 본문이 캡처됩니다.
네트워크 캡처 처리
시스템은 여러 신호를 기반으로 약 300개의 요청을 평가하고 약 5개로 정리합니다:
- 1자 대 3자 출처 (+20 / −15)
- 알려진 원격 측정 호스트 (Sentry, Segment, Hotjar, RUM): −80
- DOM 이벤트와의 시간적 상관관계 (800ms 이내: +28, 2.5초 이내: +16)
- 메서드 및 페이로드 형태 (변경 POST/PUT/PATCH/DELETE: +35; GET: +5; 요청 본문 포함: +8)
- 응답 품질 (2xx: +12; 4xx+: −25; 비어 있지 않은 본문: +4)
- 변동성 있는 작업 식별자 (−18) - GraphQL queryId, doc_id, operationHash용
변동성 있는 GraphQL 작업 ID는 다음 실행에서 조용히 실패하기 전에 DOM 전용 대체 수단을 트리거합니다.
생성된 코드 구조
생성된 코드는 네트워크 호출과 DOM 작업(클릭, 입력, 찾기)을 rtrvr.* 헬퍼 네임스페이스를 통해 동일한 함수로 결합합니다. 상위 5개 순위의 요청과 DOM 상호작용이 생성기를 위한 12,000자 컨텍스트로 렌더링됩니다.
사용 패턴
AI 에이전트를 500행의 스프레드시트에 지정하면, 단 한 번의 LLM 호출로 매개변수가 할당되고 500개의 서브루틴이 시작됩니다.
주요 사용 사례
- Instagram DM 전송을 기록한 후, 토큰 비용 없이 DM을 보낼 수 있는 재사용 가능한 루틴 보유
- 사이트 카탈로그에서 최신 제품을 가져오는 루틴 생성, 직접 GraphQL 쿼리를 통해 수천 개의 제품을 얻기 위해 호출
- 현재 페이지 컨텍스트에서 AI가 매개변수를 추론하여 EHR 양식 제출을 위한 루틴 설정
- MCP 서버를 사용하여 LinkedIn/Slack/Gmail의 발신 메시지를 CRM에 동기화하기 위해 일일 루틴 재사용
이것이 중요한 이유
반복 작업을 위한 브라우저 에이전트의 근본적인 문제는 추론 루프를 거치는 것이 불필요하다는 점입니다. 한 번 기록하고 LLM이 가능한 모든 상호작용 방법(직접 API 호출, DOM 상호작용, 타사 도구/API/MCP 서버)을 활용하는 스크립트를 생성하도록 하면 결정적이고 비용 효율적인 자동화를 제공합니다.
📖 전체 Source 읽기: HN LLM Tools
👀 See Also

hiresTI: OpenClaw/MCP 지원을 갖춘 네이티브 Linux TIDAL 플레이어
hiresTI는 안정적인 재생, 고품질 오디오 출력, GTK4/Libadwaita UI, 그리고 MCP를 통한 OpenClaw 통합을 통한 원격 제어에 초점을 맞춘 TIDAL 전용 네이티브 리눅스 데스크톱 클라이언트입니다. 이 앱은 파이썬 UI 레이어와 러스트 오디오 코어를 결합합니다.

클로드 코드용 두 가지 MCP 도구: 아이디어 검증 및 트레이딩 에이전트 메모리
한 개발자가 Claude Code용 두 가지 MCP 도구를 만들었습니다: idea-reality-mcp는 코딩 전에 GitHub과 Hacker News를 확인해 중복을 피하고, tradememory-protocol은 AI 트레이딩 에이전트가 컨텍스트와 함께 거래를 저장하고 전략 성과를 추적할 수 있는 메모리를 제공합니다. 둘 다 오픈 소스이며 PyPI에서 이용 가능합니다.

스터링-8B: 토큰 수준 귀속 기능을 갖춘 해석 가능한 언어 모델
가이드 랩스는 생성된 모든 토큰을 입력 컨텍스트, 인간이 이해 가능한 개념, 그리고 학습 데이터 소스로 추적할 수 있는 1.35조 토큰으로 학습된 80억 파라미터 언어 모델인 Steerling-8B를 발표했습니다. 이 모델은 2-7배 더 많은 데이터로 학습된 모델들과 경쟁력 있는 성능을 달성합니다.

FixAI: 기업 AI 봇과 싸우며 소비자법을 배우는 브라우저 게임
FixAI는 실제 소비자 법률을 사용하여 기업 또는 정부 AI 시스템에 맞서 논쟁하는 36개의 레벨로 구성된 브라우저 게임입니다. Vanilla JS, Node/Express 및 Claude Haiku로 구축된 이 게임은 저항 점수 시스템과 법적 논증에 대한 교육적 설명을 특징으로 합니다.