LLM 회로 탐색기: 학습 없이 3개 레이어 복제로 추론 능력 향상

llm-circuit-finder 툴킷은 David Ng의 RYS 방법을 구현하고 확장하여 트랜스포머 모델 내부에 숨겨진 '추론 회로'를 발견하고 활용합니다. 핵심 발견: 특정 연속적인 레이어 블록이 분리할 수 없는 인지 단위로 작동합니다. 순전파 과정에서 이들을 복제하면(동일한 가중치, 학습 없음, 병합 없음) 모델의 특정 능력이 측정 가능하게 향상됩니다.

주요 결과

Devstral-Small-2-24B, 레이어 12, 13, 14를 한 번 복제:

BBH 논리적 추론: 0.22 → 0.76 (+245%)
GSM8K (엄격): 0.48 → 0.64 (+33%)
MBPP (코드 생성): 0.72 → 0.78 (+8%)
평균 향상: 모든 지표에서 +8%, 저하 없음

Qwen2.5-Coder-32B, 레이어 7, 8, 9를 한 번 복제:

추론 프로브 (인과 + 논리 + 탐색): 76.5% → 94.1% (+23%)

작동 원리

트랜스포머는 학습 과정에서 기능적 회로(다중 레이어 처리 단위)로 스스로 조직화되며, 이는 완전한 인지 작업을 수행합니다. 이러한 회로는 분리할 수 없습니다: 단일 레이어를 복제하는 것은 거의 효과가 없지만, 올바른 3-4개 레이어 블록을 복제하면 모델이 추론 파이프라인을 두 번째로 통과하게 됩니다.

다른 모델은 다른 위치에 다른 회로를 가지고 있습니다:

Devstral-24B (40 레이어): 레이어 12-14에 추론 회로
Qwen2.5-32B (64 레이어): 레이어 7-9에 추론 회로

경계는 분명합니다. 블록을 한 레이어씩 어느 방향으로든 이동하면 향상 효과가 사라지거나 반전됩니다.

다른 복제 패턴이 다른 모드를 생성합니다

디스크 상 동일한 가중치, 기본 모델 동일한 VRAM, 라우팅만 다름:

이중 통과 13-16: 수학 ↑↑, EQ ↑
삼중 통과 13-16: 수학 ↑, EQ ↑↑
교차 13,13,14,14,15,15,16: 수학 ↑↑↑, EQ ↓ (순수 수학 모드)
사중 통과 13-16: 수학 —, EQ ↑↑ (EQ 모드, 수학 중립)

빠른 시작

모델에서 회로 찾기:

pip install gguf requests tqdm
python sweep.py \
  --model /path/to/model.gguf \
  --llama-server /path/to/llama-server \
  --tmpdir /dev/shm/rys \
  --results pass.jsonl \
  --block-sizes 3 4 5 \
  --stride 1 \
  --start-min 10 --start-max 20 \
  --skip-baseline \
  --port 8099 \
  --server-args --device Vulkan1,Vulkan2

알려진 회로 적용:

# Devstral에서 레이어 12-14 복제 python layer_path.py model.gguf improved.gguf \ -p " 0..14,12,13,14,15..39 " -v Qwen2.5-32B에서 레이어 7-9 복제 python layer_path.py model.gguf improved.gguf -p " 0..9,7,8,9,10..63 " -v 삼중 통과 예시

python layer_path.py model.gguf experiment.gguf -p " 0..16,13,14,15,16,13,14,15,16,17..39 " -v

확립된 벤치마크로 검증:

# 수정된 모델로 서버 시작
llama-server -m improved.gguf --port 8089 -ngl 99 --device Vulkan1,Vulkan2
# lm-evaluation-harness 실행

전체 발견 과정(스윕, 발견, 검증)은 두 개의 AMD 소비자 GPU(RX 7900 XT + RX 6950 XT)로 한 저녁 만에 완료되었습니다.

📖 전체 원문 읽기: HN LLM Tools

LLM 회로 탐색기: 학습 없이 추론 능력 향상을 위해 3개의 레이어를 복제합니다

주요 결과

작동 원리

다른 복제 패턴이 다른 모드를 생성합니다

빠른 시작

Qwen2.5-32B에서 레이어 7-9 복제

삼중 통과 예시

👀 See Also

책-사서: 독서 기록 및 스포일러 없는 추천 도서

Cortex v1.2는 LLM 강화, 인용이 포함된 Q&A, 그리고 충돌 해결 기능을 추가합니다.

클로드 코드, 모든 세션을 디스크에 기록 — 인덱싱 및 검색 방법

마우스: AI 코딩 에이전트를 위한 좌표 기반 편집 단계별 변경 및 원자적 롤백