토큰 낭비 없이 클로드 채팅 간 맥락 유지하는 2-프롬프트 시스템

한 Reddit 사용자가 프로젝트 중간에 클로드 채팅 길이 제한에 도달하는 문제를 해결하는 실용적인 시스템을 게시했습니다. 이 솔루션은 두 개의 프롬프트를 사용합니다. 하나는 이전 채팅에서 컨텍스트를 추출하고, 다른 하나는 새 채팅을 초기화하는 것입니다.
문제
긴 클로드 대화는 속도가 느려지고 길이 제한에 도달하거나 API 비용이 많이 듭니다. 일반적인 해결 방법(수동 요약, 전체 채팅 복사하여 붙여넣기, 새로 시작)은 중요한 결정을 잃거나 토큰을 낭비하거나 다시 설명해야 합니다.
시스템
프롬프트 1: 컨텍스트 추출 (이전 채팅에 붙여넣기)
클로드에게 전체 대화를 9개 섹션으로 구성된 구조화된 요약으로 압축하도록 지시합니다: 목표, 주요 컨텍스트, 결정 사항, 완료된 작업, 현재 상태, 다음 단계, 미해결 질문/장애물, 중요 데이터/자산, 스타일 및 선호도. 출력은 깨끗한 코드 블록 하나 안에 넣어야 합니다. 대상 길이는 300~600단어이며, 일반적인 내용보다 구체적인 내용을 보존합니다.
프롬프트 2: 채팅 초기화 (새 채팅에 붙여넣기)
추출된 컨텍스트 블록을 붙여넣고 새 채팅에 이를 진실의 원천으로 취급하도록 지시합니다. 클로드에게 이해를 확인하고, 누락된 부분을 표시하고, 다시 시작하지 않고 다음 단계부터 재개하도록 요청합니다.
정확한 프롬프트는 출처에 제공됩니다. 예를 들어, 추출 프롬프트의 출력 구조는 다음 헤더를 사용합니다:
- 목표
- 주요 컨텍스트
- 결정 사항 (이유 포함)
- 완료된 작업
- 현재 상태
- 다음 단계 (즉시 다음 단계는 →로 표시)
- 미해결 질문 / 장애물
- 중요 데이터 / 자산
- 스타일 및 선호도
초기화 프롬프트에는 다음이 포함됩니다: "컨텍스트를 확립된 것으로 취급하십시오. 다시 프레이밍하거나 다시 시작하지 마십시오. 나열된 모든 결정과 선호도를 유지하십시오." 또한 목표, 즉시 다음 조치 및 누락된 부분이 포함된 확인 답변을 요청합니다.
대상
장기 실행 프로젝트를 계속해야 하면서 컨텍스트를 잃거나 중복 설명에 토큰을 낭비하고 싶지 않은 클로드(API 또는 웹) 사용자.
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

Marmy: 원격으로 AI 코딩 에이전트를 관리하는 자체 호스팅 프레임워크
Marmy는 Claude Code로 구축된 오픈 소스 MIT 라이선스 프레임워크로, 개발자가 모바일 앱에서 AI 코딩 에이전트와 tmux 세션을 관리할 수 있게 해줍니다. 개발 머신용 Rust 에이전트와 원격 제어용 React Native 앱을 포함합니다.

OpenClaw .NET: 기존 플러그인을 위한 JSON-RPC 브리지가 포함된 NativeAOT 포트
OpenClaw .NET은 OpenClaw의 C# 포트로, ~23MB NativeAOT 바이너리로 컴파일되어 JIT 웜업과 Node 런타임 오버헤드를 제거하면서 내장된 JSON-RPC 브리지를 통해 기존 TypeScript/JavaScript 플러그인과의 호환성을 유지합니다.

매번 세션마다 Claude Code를 재교육하지 마세요: 지속적인 설정 사용하기
한 Reddit 사용자가 Claude Code의 영구 설정 파일을 작성하여 세션당 20분을 절약하고, 반복적인 조정을 없애고 완료 속도를 33% 향상시킨 방법을 설명합니다.

AI 에이전트를 위한 실시간 검색 데이터의 네 가지 ClawHub 기술
ClawHub의 네 가지 스킬은 AI 에이전트에게 구조화된 검색 기능을 제공합니다: Google(웹, 뉴스, 이미지, 지도), Amazon(12개 마켓플레이스에서의 제품 검색), Walmart(배송 필터가 포함된 제품 검색), YouTube(대본이 포함된 동영상 검색). 하나의 API 키로 clawhub install 명령어를 통해 설치할 수 있습니다.