분석: 클로드 코드 사용자에 대한 Anthropic의 실제 컴퓨팅 비용은 보고된 5,000달러 수치보다 훨씬 낮습니다.

최근 포브스 기사는 Anthropic의 월 200달러 Claude Code Max 플랜이 컴퓨팅 비용으로 약 5,000달러를 소비할 수 있다고 주장하며, 회사가 추론에서 손해를 보고 있다고 시사했습니다. 이 분석은 그 수치가 왜 오해의 소지가 있는지 살펴봅니다.
API 가격 책정 대 실제 컴퓨팅 비용
5,000달러 수치는 Anthropic의 소매 API 가격 책정에서 비롯됩니다: Opus 4.6 기준 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러. 이러한 가격으로는, 고강도 사용자가 실제로 API에 상응하는 사용량으로 월 5,000달러를 누적할 수 있습니다.
그러나 API 가격 책정은 Anthropic이 그 토큰들을 제공하는 데 실제로 드는 비용을 반영하지 않습니다. 실제 추론 비용을 추정하려면 OpenRouter에서 유사 모델에 대한 경쟁적 가격 책정을 살펴보세요:
- Qwen 3.5 397B-A17B (Opus 4.6에 상응): 입력 토큰 100만 개당 0.39달러, 출력 토큰 100만 개당 2.34달러
- Kimi K2.5 1T 파라미터, 활성 32B: 입력 토큰 100만 개당 0.45달러, 출력 토큰 100만 개당 2.25달러
- DeepInfra 캐시 읽기 (Kimi K2.5 기준): 토큰 100만 개당 0.07달러 대 Anthropic의 토큰 100만 개당 0.50달러
실제 계산
이 OpenRouter 제공업체들은 막대한 손실을 보지 않고 마진을 남기며 사업을 운영하고 있습니다. 만약 그들이 Anthropic의 API 가격의 약 10% 수준으로 상응하는 모델을 제공할 수 있다면, 실제 컴퓨팅 비용은 그 범위에 있을 가능성이 높습니다.
따라서:
- API에 상응하는 토큰으로 5,000달러를 소비하는 고강도 사용자 ≈ 실제 컴퓨팅 비용 500달러
- 극단적인 파워 사용자에 대한 손실: 월 300달러 (4,800달러가 아님)
- 대부분의 사용자는 한계에 접근하지 않음: Anthropic에 따르면 가입자의 5% 미만이 주간 상한선의 영향을 받을 것
- 일반적인 Max 20x 플랜 사용량은 주간 토큰 예산의 약 50% 수준 ≈ Anthropic에 대해 손익분기점 또는 수익성 있음
실제로 누가 5,000달러 비용을 부담하나?
5,000달러 수치는 Cursor의 내부 분석에서 비롯됩니다. Cursor의 경우, 그들은 Opus 4.6 접근을 위해 Anthropic의 소매 API 가격(또는 그에 가까운 가격)을 지불하므로 그 수치는 대략 정확합니다.
개발자들은 더 저렴한 오픈 웨이트 대안들보다 현재 성능 우위와 브랜드 인지도 때문에 Cursor에서 Anthropic 모델을 원합니다.
더 넓은 함의
Anthropic은 전반적으로 훈련 비용, 연구원 급여, 컴퓨팅 약정 때문에 수익성이 없습니다 — 추론 때문이 아닙니다. 추론에 대한 사용자당, 토큰당 기준으로 보면, Anthropic은 평균 Claude Code 가입자에 대해 수익성이 있을 가능성이 높습니다.
"AI 추론은 돈 구덩이"라는 이야기는 경쟁을 억제하고 그들의 해자를 실제보다 더 깊어 보이게 만들어 프론티어 연구소들의 손을 들어주는 역할을 합니다.
📖 Read the full source: HN AI Agents
👀 See Also

MTP 멀티 토큰 예측: AMD Strix Halo & Radeon 9700 AI Pro에서의 2배 빠른 토큰 생성
MTP는 특히 코딩 에이전트에서 LLM 추론 속도를 최대 2배까지 가속화합니다. 영상은 MTP의 작동 방식과 AMD Strix Halo 및 듀얼 Radeon 9700에서 Qwen 3.6의 성능을 다룹니다.

Meta, 콘크리트 배합 설계를 위한 BOxCrete AI 모델 공개
메타가 미국산 재료를 사용해 지속 가능한 콘크리트 배합을 설계하는 오픈소스 AI 모델인 Bayesian Optimization for Concrete(BOxCrete)를 공개했습니다. 이 모델은 이전 버전 대비 향상된 노이즈 내성과 슬럼프 예측 능력을 갖추고 있습니다.

개발자가 Claude 금지와 MiMo 크레딧 문제로 Minimax 2.7로 전환했습니다
한 개발자가 Claude가 플랫폼에서 차단된 후 OpenClaw용 대체 AI 모델을 여러 개 테스트한 경험을 공유했습니다. 그들은 GLM 5.1과 5 Turbo가 에이전트 작업에 효과적이지 않다고 판단했고, MiMo V2 Pro의 크레딧 시스템은 비효율적이었으며, 결국 관대한 할당량과 자동화 작업 처리 능력으로 Minimax 2.7을 선택했습니다.

Qwen3.5-122B on Blackwell SM120: fp8 KV 캐시 손상 문제 및 성능 분석 결과
8x RTX PRO 6000 Blackwell 하드웨어에서 Qwen3.5-122B를 테스트한 결과, fp8_e4m3 KV 캐시가 오류 없이 조용히 손상된 출력을 생성하는 문제가 발견되어 bf16 KV 캐시를 사용해야 합니다. MTP 최적화는 단일 요청 속도를 2.75배 향상시켰지만, DeltaNet 제약으로 인해 다른 최적화는 차단되었습니다.