Claude Code Max 실제 컴퓨팅 비용: 5,000달러 vs 10%

최근 포브스 기사는 Anthropic의 월 200달러 Claude Code Max 플랜이 컴퓨팅 비용으로 약 5,000달러를 소비할 수 있다고 주장하며, 회사가 추론에서 손해를 보고 있다고 시사했습니다. 이 분석은 그 수치가 왜 오해의 소지가 있는지 살펴봅니다.

API 가격 책정 대 실제 컴퓨팅 비용

5,000달러 수치는 Anthropic의 소매 API 가격 책정에서 비롯됩니다: Opus 4.6 기준 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러. 이러한 가격으로는, 고강도 사용자가 실제로 API에 상응하는 사용량으로 월 5,000달러를 누적할 수 있습니다.

그러나 API 가격 책정은 Anthropic이 그 토큰들을 제공하는 데 실제로 드는 비용을 반영하지 않습니다. 실제 추론 비용을 추정하려면 OpenRouter에서 유사 모델에 대한 경쟁적 가격 책정을 살펴보세요:

Qwen 3.5 397B-A17B (Opus 4.6에 상응): 입력 토큰 100만 개당 0.39달러, 출력 토큰 100만 개당 2.34달러
Kimi K2.5 1T 파라미터, 활성 32B: 입력 토큰 100만 개당 0.45달러, 출력 토큰 100만 개당 2.25달러
DeepInfra 캐시 읽기 (Kimi K2.5 기준): 토큰 100만 개당 0.07달러 대 Anthropic의 토큰 100만 개당 0.50달러

실제 계산

이 OpenRouter 제공업체들은 막대한 손실을 보지 않고 마진을 남기며 사업을 운영하고 있습니다. 만약 그들이 Anthropic의 API 가격의 약 10% 수준으로 상응하는 모델을 제공할 수 있다면, 실제 컴퓨팅 비용은 그 범위에 있을 가능성이 높습니다.

따라서:

API에 상응하는 토큰으로 5,000달러를 소비하는 고강도 사용자 ≈ 실제 컴퓨팅 비용 500달러
극단적인 파워 사용자에 대한 손실: 월 300달러 (4,800달러가 아님)
대부분의 사용자는 한계에 접근하지 않음: Anthropic에 따르면 가입자의 5% 미만이 주간 상한선의 영향을 받을 것
일반적인 Max 20x 플랜 사용량은 주간 토큰 예산의 약 50% 수준 ≈ Anthropic에 대해 손익분기점 또는 수익성 있음

실제로 누가 5,000달러 비용을 부담하나?

5,000달러 수치는 Cursor의 내부 분석에서 비롯됩니다. Cursor의 경우, 그들은 Opus 4.6 접근을 위해 Anthropic의 소매 API 가격(또는 그에 가까운 가격)을 지불하므로 그 수치는 대략 정확합니다.

개발자들은 더 저렴한 오픈 웨이트 대안들보다 현재 성능 우위와 브랜드 인지도 때문에 Cursor에서 Anthropic 모델을 원합니다.

더 넓은 함의

Anthropic은 전반적으로 훈련 비용, 연구원 급여, 컴퓨팅 약정 때문에 수익성이 없습니다 — 추론 때문이 아닙니다. 추론에 대한 사용자당, 토큰당 기준으로 보면, Anthropic은 평균 Claude Code 가입자에 대해 수익성이 있을 가능성이 높습니다.

"AI 추론은 돈 구덩이"라는 이야기는 경쟁을 억제하고 그들의 해자를 실제보다 더 깊어 보이게 만들어 프론티어 연구소들의 손을 들어주는 역할을 합니다.

📖 Read the full source: HN AI Agents

분석: 클로드 코드 사용자에 대한 Anthropic의 실제 컴퓨팅 비용은 보고된 5,000달러 수치보다 훨씬 낮습니다.

API 가격 책정 대 실제 컴퓨팅 비용

실제 계산

실제로 누가 5,000달러 비용을 부담하나?

더 넓은 함의

👀 See Also

대서양, 반AI 폭력 증가와 정치적 반발 보도

유출된 클로드 코드로 드러난 KAIROS 시스템과 AI 에이전트의 검증 격차

장기 실행 AI 에이전트 팀의 실제 시간당 비용

구글, 국방부에 비밀 등급 없는 업무용 AI 에이전트 제공 예정