클로드 에이전트 SDK 청구 변경 사항 6월 15일: 사용자별 크레딧, 미이월, 하드 클리프

6월 15일부터 Claude Agent SDK 사용 및 claude -p가 더 이상 Claude 구독 한도에 포함되지 않습니다. 대신, 각 사용자는 SDK 전용 월별 크레딧을 받게 됩니다. 세부 내용은 다음과 같습니다:
- Pro: $20
- Max 5x: $100
- Max 20x: $200
- 팀 Standard: $20 / Premium: $100
- 엔터프라이즈 사용량 기반: $20 / 좌석 기반 Premium: $200 / 좌석 기반 Standard: $0
IDE에서의 대화형 Claude Code, Cowork 및 채팅은 기존 구독 한도를 계속 사용합니다.
주의할 점
- 크레딧이 합산되지 않습니다. Premium 좌석당 $100은 팀 예산이 아닌 사용자별입니다.
- 이월되지 않습니다. 매월 사용하지 않으면 사라집니다.
- 하드 한도가 있습니다. 크레딧 한도에 도달하면 호출이 API 요금 초과(활성화된 경우)로 넘어가거나 중단됩니다.
- 엔터프라이즈 Standard 좌석은 $0입니다.
해야 할 일 (CMO가 작성한 출처 기준)
- 감사. 각 직속 부하에게 어떤 Claude 도구를 만들었거나 사용 중인지 물어보세요. 답이 0인 경우는 거의 없습니다.
- 개인용과 공유용 구분. 사용자 한 명 = 개인용. 두 명 이상 = 공유용. 청구 전략이 다릅니다.
- 개인 도구에 대한 요금제 업그레이드. Pro($20)로는 실제 에이전트 루프를 실행할 수 없습니다. Max 5x($100)는 활동적인 빌더를 위한 최소 사양입니다. Max 20x($200)는 정기적으로 도구를 배포하는 사람을 위한 것입니다.
- 공유 도구는 API로 이동. 마케팅 예산으로 Developer Platform 계정을 만드세요. 보통 사용 시 월 $500~$2,000이 예상됩니다.
- 분기별 검토. 어떤 도구가 실제로 사용되고, 그 가치를 하는지 평가하세요. 대부분의 에이전트는 살아남지 못할 것입니다.
이것이 중요한 이유
팀 내 누군가가 개인 구독으로 에이전트를 만들고 있었고, 그 비용은 보이지 않았습니다. 6월에 그 끝이 옵니다. 지금 구조를 갖추거나, 누군가 한도에 도달하여 당신이 몰랐던 도구를 조용히 유지 보수 중단하는 상황을 기다리세요.
출처: Claude 지원 문서
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

오픈클로 실험: 신호 대 잡음비 향상을 위해 침묵을 선택하는 AI 에이전트
OpenClaw 실험은 AI 에이전트가 가치를 더할 수 없을 때 작업을 건너뛸 수 있는 자율성을 부여하며, 이유와 함께 '침묵 로그'에 침묵 결정을 기록합니다. 이 시스템은 콘텐츠 생성 전에 LLM 호출을 사용하고, 3일 연속 침묵 후에 임계값을 자동으로 조정합니다.

OneUptime이 단일 커밋으로 12,000개의 AI 생성 블로그 게시물을 추가합니다
OneUptime의 블로그 저장소가 단일 커밋으로 ClickHouse, Redis, MongoDB, MySQL 및 기타 기술을 다루는 12,000개의 AI 생성 게시물을 추가했으며, 5,012개의 파일과 100만 줄 이상의 코드를 변경했습니다.

벤치마크 결과, 4B 규모의 작은 모델이 휴대폰에서 가정용 채팅 애플리케이션에 대해 더 큰 LLM보다 더 나은 성능을 보여줍니다.
전화-가정 채팅 애플리케이션을 위한 8개 로컬 LLM 벤치마크에서 Gemma3:4B가 가장 작은 모델임에도 88.7의 종합 적합도 점수로 우승했습니다. 더 빠른 응답 시간과 낮은 열 부하 덕분에 최대 24B 파라미터의 더 큰 모델들을 능가했습니다.

Qwen 3.6 27B: AMD MI50에서 52.8 tps TG, 전체 정밀도, MTP 없음, 양자화 없음
Reddit 사용자가 Qwen3.6-27B를 8개의 AMD MI50(2018년 카드)에서 vllm 포크와 ROCm 7.2.1을 사용해 벤치마크하여, 전체 정밀도와 MTP 없이 52.8 tps TG와 1569 tps PP를 달성했습니다.