현재 LLM 비용 비교: Deepseek, Qwen, MiniMax 대 OpenAI

공급자별 가격 분석
최근 레딧 분석을 기반으로 한 주요 LLM 공급자 간 현재 비용 비교입니다. 모든 가격은 분석일 기준 100만 토큰당 USD로 표시됩니다.
- Deepseek-V3.2: $0.26 입력 / $0.38 출력. 이는 벤치마크가 GPT-5 급 성능을 제시하는 것으로 보이는 동안 GPT-4보다 약 10배 저렴합니다.
- Qwen3.5 시리즈: 27B 모델은 $0.26 입력 / $2.60 출력으로, 비용의 일부로 Claude에 필적하는 품질을 제공합니다. 이 시리즈는 0.8B부터 397TB 파라미터까지 유연성을 제공하며, 모든 변형이 262k 컨텍스트 창을 지원하고 1M+까지 확장 가능하며 내장 사고 모드를 갖추고 있습니다.
- MiniMax-M2.5: $0.27 입력 / $0.95 출력. SWE 벤치에서 검증된 80.2%로 코딩 워크플로에 탁월하여 에이전트 코딩 작업에 뛰어납니다.
- OpenAI GPT-4.1: $2.00 입력 / $8.00 출력. 확실히 능력은 있지만, 대안들이 비슷한 성능을 발휘할 때 대량 생산 사용 사례에 대한 가격 프리미엄은 정당화하기 어렵습니다.
주요 기술적 배경
이 분석은 다른 대부분의 벤치마크가 이 시점에서 최적화된 것으로 보일 때 가능한 경우 LMSYS ELO 점수를 포함합니다. 컨텍스트 창 용량은 점점 더 중요해지고 있으며, 대부분의 현재 모델이 표준으로 200k+ 토큰을 지원하여 장문 문서와 확장된 대화를 중심으로 애플리케이션을 구조화하는 방식을 근본적으로 변화시킵니다.
AI 코딩 에이전트를 사용하는 개발자들에게 이러한 가격 차이는 생산 배포 비용을 고려할 때 중요합니다. 데이터는 GPT-4와 같은 프리미엄 가격 모델에 대한 대안이 상당히 낮은 비용으로 비교 가능한 성능을 제공할 수 있음을 시사하며, 특히 대량 사용 사례에 해당합니다.
📖 전체 원문 읽기: r/LocalLLaMA
👀 See Also

최신 업데이트에서 하드코딩된 리눅스 경로로 인해 Windows에서 Claude VS Code 확장 프로그램 작동 중단
Anthropic의 최신 VS Code 확장 업데이트가 Linux 경로를 하드코딩하여 Windows에서 확장이 작동하지 않습니다. 이전 버전으로 다운그레이드하면 기능이 복원됩니다.

클로드 앱, 펜타곤 분쟁 이후 미국 앱스토어 2위로 랭크
Anthropic의 Claude 챗봇 앱이 애플 미국 앱스토어 무료 앱 순위에서 2위로 올라섰습니다. 2026년 1월 말에는 100위권 밖이었으나 2월 말까지 2위로 급상승했습니다. 이 급등세는 회사의 국방부와 AI 사용 제한에 관한 공개 협상 이후에 나타났습니다.

클로드, 이제 어도비 크리에이티브 클라우드, 블렌더, 에이블톤 등에 연결
Anthropic이 Claude가 Adobe Creative Cloud, Affinity, Blender, Ableton, Splice, Autodesk와 통합될 수 있는 커넥터를 출시하여 자연어로 앱 제어 및 데이터 검색을 가능하게 했습니다.

3월 16일 이후 전체 할당량이 남아있음에도 OpenAI Codex OAuth에서 429 오류 반환
OpenAI Codex OAuth가 3월 16일 이후로 지속적으로 429 "할당량을 초과했습니다" 오류를 반환하고 있으며, 대시보드에는 100% 할당량이 남아 있는 것으로 표시됩니다. 사용자들은 재인증, 토큰 취소, 완전한 재구성에도 불구하고 문제가 지속된다고 보고합니다.