AI 에이전트 정확도 향상을 위한 4계층 지식 베이스 아키텍처

r/openclaw의 한 개발자가 도구, 워크플로우, 정책에 대한 구체적인 컨텍스트를 제공하여 일반적인 LLM 에이전트를 도메인 전문가로 전환하도록 설계된 구조화된 지식 베이스 아키텍처를 상세히 설명했습니다.
일반적인 RAG 접근법의 문제점
출처는 일반적인 RAG 구현의 여러 문제점을 지적합니다: 쿼리 분류 없음(모든 질문이 동일한 검색 파이프라인을 거침), 계층화 없음(거버넌스 문서와 블로그 글이 동일하게 취급됨), 예산 제한 없음(에이전트 컨텍스트 창에 관련 없는 청크가 채워짐), 자가 복구 기능 없음(오래되거나 손상된 문서가 영원히 그대로 유지됨).
4단계 KB 파이프라인
이 시스템은 네 가지 구별된 계층을 사용합니다:
- 거버넌스 계층 — 항상 로드됨. 에이전트 정체성, 정책, 규칙을 절대적 컨텍스트로 포함합니다.
- 에이전트 계층 — 에이전트별 문서화. 예를 들어, Lucy라는 음성 에이전트는 통화 처리 문서를 받고, Binky(CRO)라는 에이전트는 전환 문서를 받습니다.
- 관련 계층 — 제목/본문 매칭을 통한 쿼리별 동적 검색으로, 최대 5개 문서와 문서당 12,000자 예산으로 제한됩니다.
- 위키 계층 — 파일 시스템 브리지를 통해 검색 가능한 200개 이상의 참조 문서로, AI 역사, 도구 정의, 워크플로우 패턴, 플랫폼 비교를 다룹니다.
비밀 무기로서의 쿼리 분류
검색이 이루어지기 전에, 정규식 기반 분류기가 질문이 얼마나 많은 컨텍스트를 필요로 하는지 결정합니다:
- DIRECT — "이 텍스트를 요약해줘"와 같이 KB가 필요 없는 작업용.
- SKILL_ONLY — "트윗을 작성해줘"와 같이 에이전트의 기술 문서만으로 충분한 작업용.
- HOT_CACHE — "누가 청구를 처리하나요?"와 같은 질문으로, 메모리 캐시의 거버넌스 및 에이전트 문서에서 답변됩니다.
- FULL_RAG — "n8n 대 Zapier 가격 비교"와 같은 복잡한 쿼리로, 전체 벡터 검색과 위키 브리지가 필요합니다.
이 분류만으로도 대부분의 질문이 전체 RAG를 필요로 하지 않기 때문에 토큰 비용이 약 40% 절감되었다고 보고됩니다.
KB 구조와 조직
200개 이상의 문서 각각은 일관된 형식을 따릅니다: 범위가 명확한 제목, 실용적인 내용(표, 코드 예시, 의사 결정 프레임워크), 실제 URL이 포함된 2개 이상의 인용 출처, 5개의 이미지 참조 설명, 2개의 비디오 참조.
내용은 특정 도메인으로 구성됩니다:
- AI/ML 기초 (18개 문서) — 역사, 트랜스포머, 임베딩, 에이전트
- 도구 (16개 문서) — 정의, 보안, 분류, 오류 처리, 감사
- 워크플로우 (18개 문서) — 유형, 플랫폼, 비용 분석, HIL 패턴
- 이미지 생성 (115개 파일) — 16개 제공업체, 비교, 프롬프트 프레임워크
- 비디오 생성 (109개 파일) — 처리 방법, 파이프라인, 플랫폼 가이드
- 지원 (60개 문서) — 고객 지원 센터 콘텐츠
자가 복구 시스템
이 아키텍처는 KB 건강 상태를 0-100 점수로 평가하고 문제를 자동으로 해결하는 평가 시스템을 포함합니다: 누락된 임베딩은 재임베딩을 트리거하고, 오래된 콘텐츠는 갱신 필요로 표시되며, 손상된 참조는 수리되거나 제거됩니다. 건강 점수는 첫 번째 복구 과정 후 71에서 89로 향상되었다고 보고됩니다.
결과와 주요 시사점
KB 구현 전에는 에이전트가 도구 정의를 지어내고, 가격을 만들어 내며, 일반적인 워크플로우 조언을 제공했습니다. 구현 후에는 에이전트가 특정 문서를 인용하고, 실제 가격을 포함한 정확한 플랫폼 비교를 제공하며, "그에 대한 최신 데이터가 없습니다"라고 말할 때를 알고 있습니다.
구현에서 얻은 주요 시사점:
- 검색 전에 분류하세요 — 모든 질문이 RAG를 필요로 하는 것은 아닙니다.
- 컨텍스트 창에 예산을 할당하세요 — 총 60,000자로, 문서당 엄격한 상한선을 두세요.
- 구조가 양을 이깁니다 — 잘 조직된 200개 문서가 10,000개의 무작위 청크보다 낫습니다.
- 자가 복구는 선택 사항이 아닙니다 — 지식 베이스는 퇴화하므로, 첫날부터 모니터링을 구축하세요.
- 인간이 아닌 에이전트를 위해 작성하세요 — 단락보다 표를, 산문보다 의사 결정 프레임워크를, 추상적 설명보다 구체적인 예시를 우선시하세요.
📖 Read the full source: r/openclaw
👀 See Also

SMELT 컴파일러는 OpenClaw 작업 공간 토큰 사용량을 최대 95%까지 절감합니다.
SMELT는 OpenClaw 작업공간 마크다운 파일을 더 밀도 높은 런타임 형태로 컴파일하여 AI 모델에 관련 콘텐츠만 전송합니다. 벤치마크 결과, 쿼리당 토큰 사용량이 76.1%에서 95.5%까지 감소했으며, USER.md 및 SOUR.md와 같은 정적 파일을 매 메시지마다 재처리하는 것을 방지합니다.

Cognithor v0.40.0은 윤리적 제약 조건을 갖춘 지속적인 AI 에이전트 정체성을 추가합니다.
Cognithor v0.40.0는 불멸의 마음 프로토콜을 도입하여 로컬 AI 에이전트가 세션 간 지속적인 정체성을 유지할 수 있게 했으며, 7개의 하드와이어된 윤리적 앵커와 기억 통합을 위한 꿈 주기를 포함합니다. 이 업데이트는 9,488줄의 코드를 추가했으며 100% 로컬에서 실행됩니다.

Claude TimeTrack: macOS 메뉴바 앱으로 Claude Code JSONL 파일을 읽어 프로젝트별 개발 시간을 자동 추적
오픈소스 macOS 메뉴바 앱으로, Claude Code 세션 JSONL 파일과 git 히스토리를 파싱하여 프로젝트별 시간을 자동 추적합니다. 수동 타이머가 필요 없습니다.

클로드 코드 매트릭스 채널 플러그인, Rust로 구축된 E2EE 지원 포함
한 개발자가 Claude Code용 Matrix 채널 플러그인을 만들어 Discord와 Telegram 지원만 제공되던 공식 채널의 공백을 메웠습니다. 이 플러그인은 Rust로 Claude Code(CC)를 사용하여 개발되었으며, 개발에 약 24시간이 소요되었습니다.