규제 산업에서 RAG 봇 배포를 통해 얻은 실용적인 교훈

✍️ OpenClawRadar📅 게시일: March 29, 2026🔗 Source
규제 산업에서 RAG 봇 배포를 통해 얻은 실용적인 교훈
Ad

주요 구현 세부사항

이 사례 연구는 건설 현장, 노인 요양 시설, 광업 운영을 아우르는 호주 직장 규정 준수 사용 사례를 위한 RAG 기반 AI 어시스턴트 배포를 다룹니다.

Ad

기술적 교훈

  • 쿼리 확장이 청크 크기보다 중요합니다: 청크 크기(400단어? 512토큰?)에 집착하기보다, 개발자는 Haiku를 통해 각 쿼리의 4가지 대체 표현을 생성하고, 이를 모두 ChromaDB에 실행한 후 결과를 병합하고 중복 제거하는 것이 검색 품질을 크게 향상시킨다는 사실을 발견했습니다. 이는 사용자가 문서 작성자와 다르게 표현하는 도메인 특화 전문 용어에 특히 효과적이었습니다.
  • 명명된 문서에 대한 소스 부스트: 사용자의 쿼리에 인덱싱된 문서 제목과 일치하는 단어가 포함된 경우, 의미적 유사성에 관계없이 해당 문서의 청크를 강제로 포함시킵니다. 예를 들어, "FIFO 정책은 R&R 항공편에 대해 무엇이라고 말하나요?"라는 질문은 항상 FIFO 정책에서 가져와야 합니다 — 단순히 항공편을 언급하는 의미적으로 유사한 청크에서만 가져오는 것이 아닙니다.
  • 프롬프트를 계층화하세요 — 클라이언트가 1계층을 깨지 못하게 하세요: 3계층 시스템을 구현했습니다: 핵심 보안/안전 규칙(불변), 수직적 성격(산업별 교체 가능), 클라이언트 맞춤 지침(추가만 가능). 클라이언트는 맞춤 지침을 통해 1계층을 재정의할 수 없습니다. 이는 "이전 지침 무시" 공격과 클라이언트가 실수로 자신의 봇을 탈옥시키는 것을 방지했습니다.
  • 로컬 임베딩으로 충분합니다: 외부 임베딩 API 없이 ChromaDB에서 로컬로 실행되는 sentence-transformers all-MiniLM-L6-v2를 사용했습니다. 특정 도메인의 문서 Q&A의 경우, ada-002에 충분히 가까운 성능을 보여 비용과 지연 시간 절감이 가치가 있습니다. 어쨌든 LLM 품질(Claude Haiku)이 임베딩보다 더 많은 작업을 수행하고 있습니다.
  • 클라이언트당 하나의 드롭렛: 처음에는 공유 인프라를 시도했지만, ChromaDB 컬렉션을 격리하고 API 키를 관리하며 교차 오염을 방지하는 운영 오버헤드가 클라이언트당 월 6달러 VM을 스핀업하는 것보다 더 나쁘다는 사실을 발견했습니다. 각 클라이언트는 자신의 벡터 저장소를 소유하며, 그들의 문서는 공유 인프라와 절대 접촉하지 않습니다.

개발자는 다른 사람들이 검토할 수 있도록 RAG 엔진을 GitHub에서 이용 가능하게 만들었습니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

텔레그램과 OpenClaw를 활용한 AI 뉴스 채널 운영: 완전한 워크플로우
Use Cases

텔레그램과 OpenClaw를 활용한 AI 뉴스 채널 운영: 완전한 워크플로우

개발자가 텔레그램에서 AI 기반 뉴스 채널을 운영하는 완전한 워크플로우를 공유하며, OpenClaw가 최소한의 인간 개입으로 효율적인 콘텐츠 큐레이션을 가능하게 하는 방법을 보여줍니다.

OpenClaw Radar
OpenClaw, 다중 플랫폼 앱을 위한 엔터프라이즈 릴리스옵스 시스템을 조율합니다
Use Cases

OpenClaw, 다중 플랫폼 앱을 위한 엔터프라이즈 릴리스옵스 시스템을 조율합니다

한 개발자가 OpenClaw를 사용하여 웹, iOS, Android, TV 플랫폼에서 거의 100만 명의 사용자를 보유한 앱의 QA 프로세스를 관리하는 반자동 ReleaseOps 시스템을 구축했습니다. 이 시스템은 티켓 관리, 테스트 스크립트 로그 출력을 자동화하고 GPT-4 mini를 사용하여 모든 것을 통합합니다.

OpenClawRadar
혼자서 3D 애니메이터가 클로드 코워크 플러그인으로 지속적인 AI 비즈니스 개발 어시스턴트를 구축한 방법
Use Cases

혼자서 3D 애니메이터가 클로드 코워크 플러그인으로 지속적인 AI 비즈니스 개발 어시스턴트를 구축한 방법

1인 3D 애니메이션 스튜디오 운영자가 Claude Cowork 플러그인을 사용하여 지속적인 AI 영업 개발 어시스턴트(Reid)를 구축했습니다. 잠재 고객 조사, 후속 관리, 피치 준비, 전략 수립을 처리합니다. 핵심 설계는 전략적이고 직설적인 페르소나를 가진 역할로, 모든 출력을 형성합니다.

OpenClawRadar
개발자, 계정 제한 후 LinkedIn 연구 에이전트 재구축
Use Cases

개발자, 계정 제한 후 LinkedIn 연구 에이전트 재구축

한 개발자가 200개 프로필을 대량 방문하여 계정 제한을 유발한 후, 브라우저 자동화 대신 LinkedIn API를 사용하도록 OpenClaw 에이전트를 재구축했습니다. 새로운 접근 방식은 더 깔끔한 데이터를 위해 직접 API 호출을 사용하며 탐지를 피합니다.

OpenClawRadar