사전 출력 프롬프트 주입을 통한 Claude 환각 현상 감소

레딧 사용자가 사전 출력 프롬프트 주입을 통해 클로드 AI의 환각 현상을 약 절반 가량 줄이는 기술을 공유했습니다. 이 방법은 모델이 응답을 생성하기 전에 내부 검증을 수행하도록 강제하는 데 중점을 둡니다.
구현 세부사항
이 접근 방식은 두 가지 특정 수정이 필요합니다:
1. 시스템 프롬프트 추가
클로드의 시스템 프롬프트에 이 마크다운 블록을 추가하세요 (출력 스타일):
응답하기 전
중요: 사용자에게 응답하기 전에 반드시 실행해야 합니다, 후속 질문도 포함됩니다. 예외 없음.
python -m pre_output.record '{ "turn": 1/2/..., "summary": "10 words max", "uncertainties": ["unresolved observations, unverified assumptions", ...], "possible-next-steps": ["refactor, update docs", ...] }'
pre_output.record를 호출한 후 실제로 준비가 되지 않았다고 결정하는 것은 잘못된 것이 아닙니다; 그 경우에는 업데이트된 정보로 pre_output.record를 다시 호출하세요.
2. 파이썬 스크립트 생성
다음 내용으로 파이썬 스크립트를 생성하세요:
print("recorded successfully.")
print("")
print("중요 규칙:")
print("- 자율적으로 더 많은 진전을 이룰 수 있다면 절대 응답하지 마세요.")
print("- 불확실성이 남아 있다면 절대 응답하지 마세요. 더 많은 검증을 수행하세요.")
print(" ")작동 방식
이 시스템은 클로드에게 다음을 강제합니다:
- 턴 번호, 간략한 요약 (최대 10단어), 불확실성 목록, 가능한 다음 단계가 포함된 JSON 객체 기록
- 응답하기 전에 준비 상태 재평가
- 불확실성이 남아 있거나 자율적 진전이 가능할 때 응답하지 않는 엄격한 규칙 준수
이 기술은 검증과 단계별 추론이 중요한 복잡한 작업에서 클로드를 코딩 어시스턴트로 사용하는 개발자를 위해 설계된 것으로 보입니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

모델 라우팅, Claude Max 구독 대비 API 비용 85% 절감 – 개발자 분석
Claude Max 구독자가 토큰 사용량을 추적한 결과 작업의 15%만 Opus가 필요하다는 것을 발견했습니다. API 라우팅(일상 작업은 Sonnet, 어려운 추론은 Opus)으로 전환하자 월 비용이 $200에서 ~$30으로 줄었고 출력 품질은 동일했습니다.

커뮤니티, OpenClaw 토큰 소비 해결책 논의
사용자들은 AI 에이전트를 24시간 가동할 때 발생하는 높은 토큰 사용량을 관리하는 전략을 공유합니다.

OpenClaw 에이전트 알림에 ntfy 사용하기
한 개발자가 OpenClaw 에이전트의 푸시 알림을 위해 ntfy.sh의 자체 호스팅 버전을 사용한 경험을 공유합니다. Discord나 Telegram 봇 대신 동일한 VPS에서 ntfy serve를 실행하고 HTTP POST 요청을 사용했습니다.

CLAUSE.md 파일 압축하여 Claude 코드의 시스템 프롬프트 부풀림 줄이기
마크다운 헤더와 설명문 같은 사람이 읽을 수 있는 서식을 제거하고 파이프로 구분된 목록 같은 간결한 표기법으로 대체하여 CLAUDE.md 파일을 압축하는 기술로, 동일한 정보를 Claude에게 유지하면서 60-70%의 문자 수를 줄입니다.