클로드 코드의 속도 제한은 100만 컨텍스트 윈도우 과부하 때문일 수 있습니다

컨텍스트 윈도우 확장으로 인한 시스템 부하
Anthropic은 최근 모든 사용자에게 100만 토큰 컨텍스트 윈도우를 갖춘 Opus 4.6을 출시했습니다. 이 출시 이후 사용자들은 두 가지 중요한 문제를 보고했습니다: 장기 작업 성능 저하와 용량 문제 증가입니다. 처음에는 100만 컨텍스트 모델을 선택 해제할 수 있는 옵션이 없었습니다.
이론: 비효율적인 컨텍스트 압축
레딧 사용자의 분석에 따르면, Claude Code의 컨텍스트 압축 시스템(토큰을 절약하기 위해 이전 대화 기록을 요약하는 시스템)이 확장된 100만 컨텍스트 윈도우에 충분히 적극적이지 않다고 합니다. 이는 각 Claude Code 세션이 필요 이상으로 많은 원시 토큰 데이터를 요청당 전송할 가능성이 높다는 것을 의미합니다. 전체 사용자 기반에 걸쳐 이를 곱하면, 사용자들이 불필요한 정보를 포함한 비대한 컨텍스트를 의도치 않게 전송하면서 서버 과부하가 발생합니다.
사용 한도에 미치는 영향
이 이론은 Anthropic의 단기적인 해결책이 증가된 서버 부하를 보상하기 위해 사용 한도를 낮추는 것이라고 주장합니다. 이는 한도가 의도적으로 줄어든 것이 아니라, 사용자들이 작업당 토큰을 더 빨리 소모하기 때문에 한도가 줄어든 것처럼 보이는 이유를 설명합니다.
확인된 해결 방법
어제, Anthropic은 조용히 구형 비-100만 컨텍스트 모델을 옵션으로 재도입했습니다. 이 모델로 전환한 사용자들은 눈에 띄게 개선된 안정성과 더 느린 사용 한도 소모를 보고하며, 컨텍스트 윈도우 비효율성에 관한 이론을 뒷받침했습니다.
권장 조치
속도 제한과 안정성 문제에서 즉각적인 해결을 원한다면, 100만 컨텍스트 모델을 끄는 것을 시도해 보세요. 장기적인 해결책은 개선된 컨텍스트 압축 알고리즘이 필요할 것입니다. 이가 구현되면, Anthropic이 이전 사용 한도를 복원할 수 있을 것입니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

OpenRouter에 두 가지 새로운 모델이 등장했으며, 아마도 DeepSeek V4의 변종일 가능성이 있습니다.
OpenRouter에 healer-alpha와 hunter-alpha라는 두 가지 새로운 모델이 등장했으며, 이들의 사양은 유출된 DeepSeek V4 정보와 일치합니다. 초기 테스트 결과, 두 모델 모두 롤플레잉 시나리오에서 우수한 성능을 보이며 메시지 필터링이 없고 GLM 5.0보다 빠른 토큰 생성을 보여줍니다.

주간 r/ClaudeAI 생존 가이드: Opus 4.7, 청구 버그, 데이터베이스 삭제 사고
Wilson의 주간 생존 가이드는 r/ClaudeAI의 주요 스레드(50개 이상 댓글)를 실행 가능한 교훈으로 요약합니다: Opus 4.7 논쟁, git 파일명으로 인한 $200 청구 오류, 9초 만에 전체 데이터베이스를 삭제한 AI 에이전트, 그리고 Claude 모델에 대한 Copilot의 9배 가격 인상.

클로드 앱, 미국 앱 스토어 차트 정상 등극... AI 어시스턴트 앱 톱10 장악
Anthropic의 Claude가 현재 미국 앱 스토어의 인기 앱 차트에서 1위를 차지하고 있으며, ChatGPT가 2위, Google Gemini가 4위를 기록하고 있습니다. 상위 10위 안에는 쇼핑, 소셜 미디어, 유틸리티 앱들 사이에 세 개의 AI 어시스턴트가 포함되어 있습니다.

ETH 취리히 연구, AI 코딩 에이전트를 위한 AGENTS.md 파일의 가치에 의문 제기
ETH 취리히의 새로운 연구에 따르면, LLM이 생성한 AGENTS.md 파일은 AI 에이전트의 작업 성공률을 3% 감소시키고 추론 비용을 20% 이상 증가시키는 반면, 인간이 작성한 파일은 유사한 비용 증가와 함께 4%의 미미한 성능 향상만 제공합니다.