커서의 AI 에이전트를 위한 빠른 정규식 검색 접근법

에이전트 워크플로우에서 정규식 성능 해결
Cursor는 AI 코딩 에이전트를 위해 특별히 색인화된 정규식 검색을 만들고 있습니다. 이는 대규모 코드베이스에서 ripgrep과 같은 기존 정규식 도구가 워크플로우를 중단시킬 수 있는 병목 현상을 해결합니다. 이 문제는 rg 호출이 15초를 초과하는 경우가 빈번한 기업용 모노레포에서 특히 심각하며, AI 에이전트의 대화형 안내를 방해합니다.
현재 도구의 근본적인 문제
대부분의 AI 에이전트 하네스(포함 Cursor)는 기본적으로 정규식 검색에 ripgrep을 사용합니다. ripgrep은 파일 무시에 대한 합리적인 기본값으로 클래식 grep보다 더 나은 성능을 제공하지만, 하나의 근본적인 한계가 있습니다: 모든 파일의 내용을 스캔해야 한다는 점입니다. 이는 개발자가 AI 에이전트와 실시간 상호작용이 필요한 대규모 코드베이스에서 문제가 됩니다.
고전 연구를 기반으로 한 색인 접근법
이 색인 접근법은 1993년 Zobel, Moffat 및 Sacks-Davis가 "압축된 역파일을 사용하여 부분적으로 지정된 용어에 대한 대규모 어휘 검색"에서 처음 발표한 연구를 기반으로 합니다. 이 방법은 n-gram(n개의 문자로 이루어진 문자열 세그먼트)을 사용하여 역색인을 생성하며, 정규 표현식을 색인에서 조회할 수 있는 n-gram 트리로 분해하기 위한 휴리스틱을 사용합니다.
역색인이 작동하는 방식
역색인은 검색 엔진 뒤에 있는 근본적인 데이터 구조입니다. 문서는 토큰화(이 경우 개별 단어를 토큰으로)를 통해 토큰으로 분할됩니다. 이러한 토큰은 사전과 유사한 구조에서 키가 되며, 값은 각 토큰을 포함하는 모든 문서를 식별하는 포스팅 리스트입니다. 여러 토큰을 검색할 때 시스템은 해당 포스팅 리스트를 로드하고 교차하여 지정된 모든 용어를 포함하는 문서를 찾습니다.
이 접근법은 전통적인 IDE가 Go To Definition과 같은 작업을 위해 구문 색인을 생성하는 방식과 유사하지만, 현대 AI 에이전트가 텍스트를 조회할 때 수행하는 정규식 검색 작업에 특화되어 있습니다.
📖 전체 소스 읽기: HN AI Agents
👀 See Also

하드웨어 위젯 및 Chrome 확장 프로그램으로 Claude API 요율 제한 모니터링
개발자가 ESP8266과 OLED 디스플레이를 사용하여 Claude의 속도 제한을 실시간으로 추적하는 하드웨어 위젯을 제작했으며, Claude의 내부 /usage API를 가로채 사용 패턴을 보여주는 Chrome 확장 프로그램도 함께 개발했습니다. 총 BOM 비용은 약 6.50달러입니다.

DELIGHT: 로컬 오케스트레이터가 여러 ChatGPT 세션을 조율된 에이전트로 활용합니다
DELIGHT는 여러 개의 숨겨진 ChatGPT 브라우저 세션을 동시에 실행하는 로컬 오케스트레이터로, API 키나 GPU 리소스 없이도 에이전트 팀처럼 조율합니다. 실제 파일에 변경을 적용하고 테스트를 실행하기 위해 OpenClaw를 액션 레이어로 연결합니다.

개발자가 28가지 기능을 갖춘 읽기/쓰기 WordPress MCP 플러그인을 제작했습니다
한 개발자가 WordPress 플러그인을 만들어 Claude Desktop 및 Claude Code와 같은 AI 코딩 에이전트를 위한 완전한 읽기/쓰기 MCP(Model Context Protocol) 접근을 제공합니다. 이 플러그인은 기존 솔루션의 한계를 해결합니다: 공식 WordPress MCP 어댑터는 읽기 전용이고, WordPress.com 커넥터에는 제한이 있으며, Jetpack AI는 Gutenberg 내부의 폐쇄형 시스템입니다.

클로드 코드 매트릭스 채널 플러그인, Rust로 구축된 E2EE 지원 포함
한 개발자가 Claude Code용 Matrix 채널 플러그인을 만들어 Discord와 Telegram 지원만 제공되던 공식 채널의 공백을 메웠습니다. 이 플러그인은 Rust로 Claude Code(CC)를 사용하여 개발되었으며, 개발에 약 24시간이 소요되었습니다.