OpenClaw 모델 성능 검토: Codex 5.3 선두, GLM 모델 실망

OpenClaw 모델 성능 순위
한 개발자가 여러 AI 모델을 OpenClaw로 테스트하고 상세한 성능 관찰 결과를 공유했습니다. 이 테스트는 Codex, Google, Sonnet, Gemini, DeepSeek, Z.ai의 GLM 모델을 포함하며, 벤치마크보다는 실제 사용 경험에 초점을 맞췄습니다.
최고 성능 모델
- Codex 5.3 - 9/10점. 개발자가 가장 선호하는 모델로, OpenClaw에 맞춰 미세 조정되어 채팅 에이전트 기능이 개선된 것으로 보입니다. 사용자 의도를 잘 이해하고, 원하는 출력을 일관되게 제공하며, 중단과 버그가 최소화되어 있습니다.
- Sonnet 4.6 - 8/10점. 속도와 문제 해결 능력으로 두 번째로 선호됩니다. Codex 5.3을 사용할 수 없을 때 충분한 경험을 제공하며, 일상 사용에 적합합니다.
- DeepSeek 3.2 Agent - 7/10점. OpenClaw에 맞춰 명확하게 커스터마이징되어 있으며, 네이티브 에이전트와 작업하는 느낌을 줍니다. 코딩 면에서는 Sonnet, Opus, Codex만큼 강력하지는 않지만, 일상 사용을 위한 확실한 대안입니다. 중국산 대체제로서 API 요금이 높을 수 있다는 점이 언급되었습니다.
중간 등급 모델
- Google 3.1 Pro (Low 및 High) - 6/10점. antigravity 인증으로 테스트되었습니다. OpenClaw 상호작용이 약하고 성능이 느리며, 지속적인 사용에는 매력적이지 않습니다. Sonnet과 Codex를 사용할 수 없을 때만 고려할 만합니다.
실망스러운 성능 모델
- GLM 4.7 - 5/10점. 저렴한 API 요금과 프로 계정에서 Codex 할당량의 3-4배를 제공하는 Sonnet 대안으로 홍보되었습니다. 그러나 지속적으로 멈추고, 응답이 늦으며, 메일 확인과 같은 간단한 작업에서도 출력 길이가 일관되지 않습니다. 새 세션에서 5개의 이메일을 확인하는 데만 100만 토큰을 소모했습니다.
- GLM 5 - 5/10점. 벤치마크는 Opus 및 Codex 5.3과 경쟁한다고 주장하지만, OpenClaw 경험은 그렇지 않습니다. 동일한 작업에 2-3배 더 많은 토큰을 사용하고, 응답이 늦으며, 코딩 답변은 Sonnet 4.5 수준을 제공합니다. OpenClaw에 특화된 최적화가 필요합니다. 주요 장점은 가격입니다.
- Gemini 3 Flash - 4/10점. 매우 간단한 작업에만 적합하며, 본격적인 사용에는 권장되지 않습니다.
개발자는 OpenClaw가 최적화되지 않았거나 모델 품질 문제로 인해 경험에서 명백한 차이가 있어 적절한 모델 선택이 어렵다고 언급했습니다. Codex 외 다양화를 원했음에도 GLM 모델에 실망을 표현하며, 향후 개선을 희망했습니다.
📖 Read the full source: r/openclaw
👀 See Also

Flue: 자율 코딩 에이전트 구축을 위한 TypeScript 프레임워크
Flue는 자율 에이전트 구축을 위한 프로그래머블 하네스를 제공하는 TypeScript 프레임워크로, 스킬, 세션, 샌드박스 셸 실행 및 내장 가상 샌드박스를 갖추고 있습니다. Dosu, Greptile, CodeRabbit, Devin, Claude Code 같은 도구를 사용자 정의 에이전트 로직으로 대체할 수 있습니다.

OpenJet v0.4: llama.cpp 백엔드를 사용한 제로 설정 로컬 코딩 에이전트
OpenJet v0.4는 로컬 LLM을 위한 오픈소스 터미널 코딩 에이전트로, 하드웨어를 자동 감지하고 llama.cpp를 구성하며 API 키 없이 Claude Code 스타일의 워크플로를 제공합니다.

영국 자체 LLM 추론: Relax.ai, 공개 문서 출시
Relax.ai가 영국 자체 LLM 추론을 위한 문서를 공개했으며, /docs/getting-started/introduction으로 리디렉션됩니다. 이 서비스는 Hacker News에 104포인트로 공유되었습니다.

RCFlow: Claude Code, Codex 및 OpenCode를 위한 멀티 세션 관리 기능이 있는 오픈소스 오케스트레이터
RCFlow는 AI 코딩 에이전트(Claude Code, Codex, OpenCode)를 위한 AGPL v3 오케스트레이터로, 워크트리 지원, 작업 계획, 아티팩트 추적, 실시간 텔레메트리 기능을 갖추고 여러 머신에서 병렬 세션을 관리할 수 있는 통합 UI를 제공합니다.