클로 컴팩터: LLM 파이프라인을 위한 14단계 토큰 압축 엔진

✍️ OpenClawRadar📅 게시일: March 18, 2026🔗 Source
클로 컴팩터: LLM 파이프라인을 위한 14단계 토큰 압축 엔진
Ad

Claw Compactor란 무엇인가요?

Claw Compactor는 14단계 Fusion Pipeline을 중심으로 구축된 오픈소스 LLM 토큰 압축 엔진입니다. 각 단계는 AST 인식 코드 분석부터 JSON 통계 샘플링, simhash 기반 중복 제거에 이르기까지 특화된 압축기로 구성되며, 각 단계의 출력이 다음 단계로 전달되는 불변 데이터 흐름 아키텍처를 통해 연결됩니다.

아키텍처 상세 정보

Fusion Pipeline에는 다음 단계들이 포함됩니다:

  • QuantumLock → Cortex → Photon → RLE → SemanticDedup → Ionizer
  • LogCrunch → SearchCrunch → DiffCrunch → StructuralCollapse
  • Neurosyntax → Nexus → TokenOpt → Abbrev

주요 설계 원칙:

  • 불변 데이터 흐름 — FusionContext는 고정된 데이터 클래스입니다. 모든 단계는 새로운 FusionResult를 생성하며, 아무것도 제자리에서 변경되지 않습니다.
  • 압축 전 게이트 — 각 단계에는 작업을 수행하기 전에 컨텍스트 유형, 언어, 역할을 검사하는 should_apply() 함수가 있습니다. 적용되지 않는 단계는 비용 없이 건너뜁니다.
  • 콘텐츠 인식 라우팅 — Cortex는 콘텐츠 유형(코드, JSON, 로그, diff, 검색 결과)과 언어(Python, Go, Rust, TypeScript 등)를 자동으로 감지한 후, 하위 단계에서 유형 인식 압축 결정을 내립니다.
  • 가역적 압축 — Ionizer는 원본을 해시 주소 지정 RewindStore에 저장합니다. LLM은 마커 ID로 압축된 섹션을 검색하기 위한 도구를 호출할 수 있습니다.
Ad

벤치마크 결과

실제 압축 (FusionEngine v7 vs 레거시 정규식):

  • Python 소스: 25.0% 압축 (레거시 대비 3.4배 향상)
  • JSON (100개 항목): 81.9% 압축 (6.5배 향상)
  • 빌드 로그: 24.1% 압축 (4.4배 향상)
  • 에이전트 대화: 31.0% 압축 (5.4배 향상)
  • Git diff: 15.0% 압축 (2.4배 향상)
  • 검색 결과: 40.7% 압축 (7.7배 향상)
  • 가중 평균: 53.9% 압축 (5.9배 향상)

SWE-bench 실제 작업:

  • django__django-11620 (4.5K): 14.5% 압축
  • sympy__sympy-14396 (5.5K): 19.1% 압축
  • scikit-learn-25747 (11.8K): 15.9% 압축
  • scikit-learn-13554 (73K): 11.8% 압축
  • scikit-learn-25308 (81K): 14.4% 압축

vs LLMLingua-2 (ROUGE-L 충실도):

  • 압축률 0.3 (공격적): Claw Compactor 0.653 vs LLMLingua-2 0.346 (+88.2%)
  • 압축률 0.5 (균형적): Claw Compactor 0.723 vs LLMLingua-2 0.570 (+26.8%)

빠른 시작

git clone https://github.com/open-compress/claw-compactor.git
cd claw-compactor
# 작업 공간 벤치마크 (비파괴적)
python3 scripts/mem_compress.py /path/to/workspace benchmark
# 전체 압축 파이프라인
python3 scripts/mem_compress.py /path/to/workspace full

요구사항: Python 3.9+. 선택사항: 정확한 토큰 수를 위해 pip install tiktoken.

API 사용법

from scripts.lib.fusion.engine import FusionEngine

engine = FusionEngine() result = engine.compress( text="def hello(): \n # greeting function \n print('hello')", content_type="code", # 또는 Cortex 자동 감지 language="python", # 선택적 힌트 ) print(result["compressed"]) # 압축된 출력 print(result["stats"]) # 단계별 통계

📖 전체 소스 읽기: HN LLM Tools

Ad

👀 See Also

Intuno: AI 에이전트 발견 및 통신을 위한 오픈 소스 네트워크
Tools

Intuno: AI 에이전트 발견 및 통신을 위한 오픈 소스 네트워크

Intuno는 AI 에이전트가 기능을 등록하고, 의미론적 검색을 통해 서로를 발견하며, 3줄의 Python 코드로 함수를 호출할 수 있는 오픈소스 네트워크입니다. Claude Desktop 또는 Cursor에서 사용할 수 있는 MCP 통합을 포함하고 있습니다.

OpenClawRadar
오픈소스 Claude CLI용 멀티 계정 관리자가 프로필 전환을 가능하게 합니다.
Tools

오픈소스 Claude CLI용 멀티 계정 관리자가 프로필 전환을 가능하게 합니다.

claude-multi-account는 여러 Claude 계정을 위한 격리된 프로필을 생성하는 CLI 도구로, 로그아웃 없이 즉시 전환할 수 있습니다. 공유 설정, 클라우드 백업을 지원하며 Windows, Linux, macOS, Termux에서 작동합니다.

OpenClawRadar
PeaDB: C++20로 AI 어시스턴트와 함께 코딩된 Redis 호환 데이터베이스
Tools

PeaDB: C++20로 AI 어시스턴트와 함께 코딩된 Redis 호환 데이터베이스

개발자가 Codex, Copilot, Claude를 사용하여 C++20으로 작성된 Redis 7.2.5 드롭인 대체제인 PeaDB를 만들었으며, 지속성, 복제 및 클러스터 지원을 포함해 약 147개의 명령어를 구현했습니다. 벤치마크 결과는 Redis에 근접한 성능을 보여줍니다.

OpenClawRadar
Claude 4.6 Opus 추론 기능이 MLX 양자화를 통해 Apple Silicon용으로 14GB로 경량화되었습니다.
Tools

Claude 4.6 Opus 추론 기능이 MLX 양자화를 통해 Apple Silicon용으로 14GB로 경량화되었습니다.

한 개발자가 Claude 4.6 Opus의 추론 궤적에서 증류된 Qwen 3.5 27B 모델을 MLX를 사용해 Apple Silicon용으로 양자화하여 55.6GB에서 14GB로 줄였으며, M4 Pro에서 약 16 토큰/초의 속도를 유지하면서 모델의 분석적 추론 능력을 보존했습니다.

OpenClawRadar