TREX: 코드를 실행하는 Greptile의 AI 코드 리뷰어

✍️ OpenClawRadar📅 게시일: June 18, 2026🔗 Source
TREX: 코드를 실행하는 Greptile의 AI 코드 리뷰어
Ad

Greptile이 TREX(Test, Run, Execute)를 출시했습니다. TREX는 AI 기반 코드 리뷰 중 코드를 실행하는 실행 계층입니다. 단순히 diff를 읽는 대신, TREX는 변경된 코드를 실제로 실행하여 정적 분석이 잡을 수 없는 런타임 버그(UI 회귀, 상태 의존적 로직 오류, 경쟁 조건)를 표면화합니다.

아키텍처: 오케스트레이터 + 이슈별 서브에이전트

초기 버전에서는 별도의 에이전트나 단일 통합 에이전트를 사용했지만 둘 다 실패했습니다. 별도 에이전트는 공유 컨텍스트 없이 작업을 중복했고, 단일 에이전트는 설정, 스크린샷, 테스트를 관리하는 데 과부하가 걸렸습니다. 해결책은 오케스트레이터 에이전트(메인 Greptile 리뷰어)가 diff를 읽고 의심스러운 이슈를 식별한 후, 이슈별로 전용 TREX 서브에이전트를 병렬로 실행하는 것이었습니다. 각 서브에이전트는 오케스트레이터의 컨텍스트를 상속받고 자신의 조사 범위에 맞는 별도의 컨텍스트 창을 가집니다.

예: 인증 게이트 뒤에 있는 UI 기능. 서브에이전트가 자율적으로 환경을 설정하고, 인증을 처리하며, 기능 플래그를 토글한 후 렌더링된 기능의 스크린샷을 반환합니다.

멀티모달 아티팩트 vs. 글머리 기호

초기 TREX 출력은 글머리 기호 요약이었지만, 글머리 기호는 환각(예: 테스트가 통과했다고 주장했지만 실제로는 실패)을 허용하고 검증 방법이 없었습니다. 해결책: 각 TREX 결과는 멀티모달 아티팩트 세트(스크린샷, 실행 로그, API 추적, 실행 스크립트)로 뒷받침됩니다. 각 모달리티가 일부 스토리를 전달하여 실제 발생한 일을 정확히 추적할 수 있습니다. 팀을 감동시킨 첫 번째 아티팩트는 애니메이션 변경의 비디오 캡처로, 실제 런타임 효과를 보여주었습니다.

잡아내는 것

TREX는 코드 diff에 나타나지 않는 버그를 대상으로 합니다: 특정 상태 시퀀스가 필요한 로직 오류, 페이지 로드 후 UI 회귀, 실제 요청이 필요한 경쟁 조건. 테스트를 생성하고 실행하지만, 초점은 테스트 작성이 아닌 버그 찾기에 있습니다. 서브에이전트는 스스로 설정을 파악합니다.

TREX를 개발한 엔지니어 Shlok Mehrotra의 말: "diff를 완벽하게 읽어도 이런 유형의 버그를 완전히 놓칠 수 있습니다."

📖 전체 소스 읽기: HN AI Agents

Ad

👀 See Also

오픈소스 AI 구직 시스템은 Claude Code로 구축되어 채용 제안을 평가하고 맞춤형 이력서를 생성합니다.
Tools

오픈소스 AI 구직 시스템은 Claude Code로 구축되어 채용 제안을 평가하고 맞춤형 이력서를 생성합니다.

한 개발자가 Claude Code 프로젝트를 오픈소스로 공개하여 터미널을 구직 명령 센터로 변환했습니다. 이 시스템은 10가지 차원에서 채용 제안을 평가하고, ATS 최적화 PDF 이력서를 생성하며, 45개 이상의 기업 채용 페이지를 스캔하고, 14가지 스킬 모드를 포함합니다.

OpenClawRadar
에이전트 프레임워크는 세션당 35만 개 이상의 토큰을 정적 파일 재전송에 낭비합니다.
Tools

에이전트 프레임워크는 세션당 35만 개 이상의 토큰을 정적 파일 재전송에 낭비합니다.

로컬 Qwen 3.5 122B 설정에서 수행한 벤치마크 결과, 에이전트 프레임워크가 정적 파일을 반복적으로 재전송함으로써 세션당 350,000개 이상의 토큰을 낭비하는 것으로 나타났습니다. 컴파일 타임 접근법을 통해 쿼리 컨텍스트를 1,373개 토큰에서 73개로 줄여 95% 감소를 달성했습니다.

OpenClawRadar
로컬 LLM 추론을 위한 프록시 수준 루프 탐지
Tools

로컬 LLM 추론을 위한 프록시 수준 루프 탐지

vLLM 프록시 뒤에서 Qwen3.6 MoE를 실행하던 개발자가 일반적인 신뢰성 문제에 부딪혔습니다: 모델이 추론 블록 내에서 자신을 반복하며 토큰을 소모하고 에이전트를 지연시키는 폭주 추론 루프입니다. 180+ 토큰/초 속도에서는 20-30초의 루프도 GPU 시간을 낭비하고 클라이언트 요청을 차단합니다. 그들은 프록시 계층에 위치하여 클라이언트에 도달하기 전에 스트리밍 출력에 대해 결정론적 검사를 적용하는 경량 가드를 구축했습니다.

OpenClawRadar
OmniCoder-9B: 425K 에이전트 궤적으로 미세 조정된 90억 파라미터 코딩 에이전트
Tools

OmniCoder-9B: 425K 에이전트 궤적으로 미세 조정된 90억 파라미터 코딩 에이전트

테슬레이트가 Qwen3.5-9B의 하이브리드 아키텍처를 기반으로 파인튜닝한 90억 파라미터 코딩 에이전트 모델 OmniCoder-9B를 공개했습니다. 이 모델은 Claude Opus 4.6, GPT-5.4, GPT-5.3-Codex, Gemini 3.1 Pro의 425,000개 이상의 정제된 에이전트 코딩 트랙을 학습했습니다.

OpenClawRadar