Claude Opus 4.7 vs Kimi K2.6: Minetest 모드 + Google Sheets 통합 결과

테스트 내용은?

한 개발자가 Kimi K2.6과 Claude Opus 4.7을 두 부분으로 구성된 코딩 작업에서 비교했습니다: TypeScript 백엔드를 사용하여 Minetest/Luanti 현상금 보드 게임 모드를 구축한 다음, Composio를 통한 Google Sheets 로깅으로 확장하는 작업이었습니다. 두 모델 모두 동일한 프롬프트를 받았으며, 작동 결과, 코드 품질, 디버깅 어려움, 시간, 토큰 사용량 및 비용을 기준으로 측정되었습니다.

설정: Claude Opus 4.7은 Claude Code를 통해, Kimi K2.6은 OpenRouter의 OpenCode를 통해 사용되었습니다. 동일한 저장소, 동일한 성공 기준이 적용되었습니다.

테스트 1: 로컬 현상금 보드

Claude Opus 4.7은 Express/Zod/Vitest 백엔드, Lua 모드, /bounty 흐름, 보상 및 리더보드를 테스트 통과와 함께 구축했습니다.

비용: ~$3.59
시간: API 12분, 총 23분
코드: +1,688 / -0
출력: 54.8k 토큰
캐시 읽기: 2.8M 토큰

Kimi K2.6도 로컬 현상금 보드를 작동시켰습니다(백엔드 라우트, Lua 모드, 기본 게임 흐름). 하지만 코드는 더 지저분했습니다. 전역 설정에 secure.http_mods = bountykimi를 작성했지만, 다른 모드 이름으로 세계 수준 설정을 만들어 HTTP API가 실제 실행 중인 모드에 대해 활성화되지 않았습니다. 디버깅에 30분 이상이 소요되었습니다.

비용: ~$0.39
시간: ~9분 27초
코드 변경: +4,671 / -0 (Opus보다 2.7배 많음)
사용된 컨텍스트: 52,073 토큰
컨텍스트 창: 20%

결론: 두 모델 모두 테스트 1을 통과했지만 Opus의 출력이 더 깔끔하고 작았습니다.

테스트 2: Composio + Google Sheets

Claude Opus 4.7은 tsx watch 및 env 로딩에 대한 몇 번의 시행착오 끝에 Google Sheets 동기화를 작동시켰습니다. 백엔드가 현상금을 완료하고 Composio를 통해 Google Sheets에 추가할 수 있었습니다.

비용: $16.03 (고통스러움)
시간: API 28분, 총 1시간 17분
코드: +1,848 / -507
캐시 읽기: 22.3M 토큰
출력: 123.3k 토큰

Kimi K2.6은 실패했습니다. 개발 서버 문제, 테스트, 빌드 문제에 막혀 Composio 통합을 깨끗한 작동 상태로 연결하지 못했습니다. 약 25분과 135k+ 토큰 후 테스트가 중단되었습니다.

비용: ~$5.03
시간: ~25분
토큰: 135k+

주요 시사점

최고의 로컬 MVP: Opus(더 깔끔함), 하지만 Kimi가 훨씬 더 나은 가성비.
최고의 실제 통합: Opus가 큰 차이로 우세.
더 깔끔한 코드: Opus(동일 작업에 1.7k vs 4.7k 줄).
가장 저렴한 실험 모델: Kimi K2.6.
가장 고통스러운 비용: Opus(Google Sheets 동기화에 $16).

Kimi K2.6은 저렴한 로컬 코딩 작업에 흥미롭습니다. 작동하는 Lua + TypeScript 모드에 $0.39는 인상적입니다. 하지만 외부 도구, 설정 문제 및 실제 통합이 포함될 때는 Opus 4.7이 여전히 확실히 앞서 있습니다.

📖 전체 출처 읽기: r/LocalLLaMA

Kimi K2.6 대 Claude Opus 4.7: Minetest 모드 + Google Sheets 통합을 통한 실용적 코딩 대결

테스트 내용은?

테스트 1: 로컬 현상금 보드

테스트 2: Composio + Google Sheets

주요 시사점

👀 See Also

웹에서 Claude Code 부분 장애 보고

AMD 라이젠 AI NPU, 레모네이드 10.0 및 패스트플로우LM을 통해 리눅스 LLM 지원 획득

OpenClaw 개발자, Driftwatch V3 빌드 중 컨텍스트 압축 문제 보고

아마존 직원들, AI 사용 할당량 충족을 위해 빈일 만들기