LLM 세션 드리프트 방지를 위한 7-파일 거버넌스 레이어

✍️ OpenClawRadar📅 게시일: April 13, 2026🔗 Source
LLM 세션 드리프트 방지를 위한 7-파일 거버넌스 레이어
Ad

r/LocalLLaMA의 한 개발자가 Claude와 같은 LLM 코딩 어시스턴트가 세션 간에 아키텍처 결정을 조용히 되돌리는 것을 방지하는 해결책을 공유했습니다. 이제 그들은 LLM 세션을 대화로 취급하는 대신 프로토콜이 필요한 상태 비저장 프로세스로 취급합니다.

핵심 문제

모든 LLM 세션은 제로 메모리로 시작합니다. 다시 설명하면, 다시 해석하고, 자신 있게 표류합니다. 개발자는 다음과 같이 언급했습니다: "프로젝트의 세 번째 파일이나 네 번째 파일, 심지어 프로젝트의 마지막 부분에 깊숙이 들어갈 때까지도 눈치채지 못할 것입니다."

7-파일 거버넌스 레이어

해결책은 더 나은 프롬프트가 아니라, 어떤 모델이든 읽고 즉시 작동할 수 있는 거버넌스 레이어입니다. 이 시스템은 중복 없이 각각 특정 관심사를 담당하는 7개의 파일을 사용합니다:

  • active_context.md - 세션 컨트롤러, 현재 범위 내에 있는 것을 정의
  • contracts.md - 행동 법칙, 데이터 스키마, 열거형 값, 필수 행동
  • agent_core.md - 실행 규율, 작동 방법, 검증, 보고
  • agent_project.md - 프로젝트 의도, 이 시스템이 존재하는 이유, 예상 결과
  • decisions.md - ADR 로그, 명확하지 않은 선택과 그 선택이 채택된 이유
  • build_plan.md - 모듈 로드맵, 구현 순서 및 결과물
  • state.md - 실시간 저널, 완료된 작업, 변경된 사항, 남은 작업

주요 설계 결정

개발자는 두 가지 중요한 분리를 설명했습니다:

contracts.mdagent_core.md 분리: "행동 충돌이 나타났을 때, 모델은 어떤 계층에 우선순위를 둘지 알 방법이 없었습니다. 이것이 스키마 규칙인가, 아니면 실행 선호도인가? 분리되면 계층 구조가 명확해지고, 계약이 항상 우선합니다."

decisions.md 포함: "거의 건너뛰려 했습니다('그냥 기억할 거야'). 3주 후에는 특정 모듈에 대해 SQLite 대신 Postgres를 선택한 이유를 재구성할 수 없었습니다. ADR 로그는 '기억할 거야'가 프로토콜이 아니기 때문에 정확히 존재합니다."

Ad

운영 루프

모든 세션은 예외 없이 다음 순서를 따릅니다:

  1. active_context.md 읽기 → 범위 내에 있는 것을 추출
  2. contracts.md에 대해 재확인 → 행동 규칙 고정
  3. agent_core.md + agent_project.md에서 운영 제약 확인
  4. decisions.md 확인 → 채택된 선택 되돌리지 않기
  5. active_context.md가 승인한 작업만 build_plan.md에 따라 실행
  6. 테스트로 검증 — 증거 없이 완료 선언하지 않기
  7. 사실적 결과로 state.md 업데이트
  8. 새로운 사소하지 않은 결정이 내려졌다면 decisions.md에 기록

워크플로우 영향

active_context.md 범위 잠금이 특히 가치 있음이 입증되었습니다: "이전에는 버그를 수정하기 위해 세션을 시작했다가 '바로 거기에 있었기 때문에' 관련 없는 모듈을 리팩터링하게 되었습니다. 생산적으로 느껴졌습니다.........그리고 실제로 그랬습니다."

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

Culpa: AI 에이전트 디버깅을 위한 오픈 소스 결정론적 재생 엔진
Tools

Culpa: AI 에이전트 디버깅을 위한 오픈 소스 결정론적 재생 엔진

Culpa는 오픈 소스 도구로, 전체 실행 컨텍스트와 함께 LLM 에이전트 세션을 기록하여 실제 API를 호출하지 않고 기록된 응답을 스텁으로 사용해 결정론적 재생을 가능하게 합니다. 프록시 모드나 Python SDK를 통해 Anthropic 및 OpenAI API와 함께 작동합니다.

OpenClawRadar
개발자가 AI 에이전트 정착, 평판 및 소액 결제를 위한 10개 이상의 MCP 서버를 공유합니다
Tools

개발자가 AI 에이전트 정착, 평판 및 소액 결제를 위한 10개 이상의 MCP 서버를 공유합니다

한 개발자가 Claude Code에서 100개 이상의 에이전트를 가진 BlindOracle을 구축하고, 결제, 평판, 소액 결제를 위한 10개 이상의 MCP 서버를 만들었습니다. 이 아키텍처에는 비공개 커밋-공개 예측, 온체인 점수 매기기, 요청별 소액 결제, 검증 가능한 에이전트 증명이 포함됩니다.

OpenClawRadar
커밋 이슈: 미완성 GitHub 저장소를 분석하고 '매장'하는 도구
Tools

커밋 이슈: 미완성 GitHub 저장소를 분석하고 '매장'하는 도구

한 개발자가 '커밋먼트 이슈즈(Commitment Issues)'라는 웹 도구를 만들어 GitHub 저장소를 분석해 프로젝트가 사실상 중단된 상태인지 판단한 후, 재미있는 '장례' 증명서를 생성합니다. 이 도구는 머신러닝이 아닌 휴리스틱에 기반합니다.

OpenClawRadar
GAN 기술을 클로드 코드에 적용: 아이디어 정교화를 위한 적대적 AI 도구
Tools

GAN 기술을 클로드 코드에 적용: 아이디어 정교화를 위한 적대적 AI 도구

Claude Code의 /gan이라는 스킬은 적대적 AI 역할을 활용하여 Discriminator와 Generator 단계를 번갈아 가며 아이디어를 비판하고 개선합니다. 강도 조절 모드, 다국어 출력, 강제 역할 선택과 같은 기능들은 자체 반복을 통해 개발되었습니다.

OpenClawRadar