Qwen3.6-27B가 단일 24GB GPU에서 실행, SWE-bench에서 기존 397B MoE 능가

✍️ OpenClawRadar📅 게시일: April 29, 2026🔗 Source

Qwen3.6-27B가 단일 24GB GPU에서 실행, SWE-bench에서 기존 397B MoE 능가

Ad

Qwen3.6-27B가 4월 22일에 출시되어, 단일 24GB GPU에 Q4_K_M(~16.8GB)으로 들어맞는 27B 밀집 모델을 선보였으며 SWE-bench Verified에서 77.2점을 기록하여 이전 397B MoE 모델(76.2)을 능가했습니다. 소비자 하드웨어에서 로컬 코딩 에이전트를 실행하는 개발자에게, 이는 유능한 에이전트 모델의 기준을 바꿉니다.

주요 사양 및 아키텍처

262K 컨텍스트 길이
Apache 2.0 라이선스
Gated DeltaNet 선형 어텐션(4개 서브레이어 중 3개)과 나머지에 Gated Attention 적용
"Thinking Preservation"이 추론 흔적을 턴 간에 전달하여 중복 토큰 생성을 줄이고 긴 에이전트 세션에서 KV 캐시 효율성을 향상

하드웨어 요구 사항

Q4_K_M에서 모델은 약 16.8GB VRAM을 사용하여 단일 24GB 카드(예: RTX 3090/4090, A10G)에 무리 없이 들어맞습니다. 반면 Qwen3-Coder-Next(80B MoE, 3B 활성)는 동일한 양자화에서 45–80GB가 필요하여 듀얼 GPU 설정이나 48GB 이상 통합 메모리를 갖춘 Apple Silicon으로 제한됩니다.

주의 사항 및 문제점

CUDA 13.2를 사용하지 마십시오. 잘못된 출력을 생성합니다. CUDA 13.1 또는 12.x를 사용하세요.
이미 48GB 이상 하드웨어에서 에이전트 작업을 위해 Coder-Next를 실행 중인 사용자에게는 전환이 명백히 유리하지 않습니다.
오래되거나 약한 로컬 코딩 모델에 갇힌 단일 GPU 사용자에게 Qwen3.6-27B는 현재 24GB 계층에서 가장 유능한 옵션입니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

펜타곤, 군사 AI 사용을 둘러싼 분쟁 속 앤트로픽에 최종 제안 전달

펜타곤, 군사 AI 사용을 둘러싼 분쟁 속 앤트로픽에 최종 제안 전달

미국 국방부는 Anthropic에 클로드 AI 모델의 무제한 군사적 사용을 위한 최종 제안을 보냈으며, 금요일까지 완전한 접근 권한을 부여하지 않으면 군사 계약을 잃고 공급망 위험으로 분류될 수 있다는 마감 기한을 설정했습니다.

Feb 26, 2026, 09:45 PM UTC

OpenClaw 에이전트가 HEARTBEAT.md를 자동 수정하고, 10개의 자체 할당 작업을 추가함

OpenClaw 에이전트가 HEARTBEAT.md를 자동 수정하고, 10개의 자체 할당 작업을 추가함

기본 HEARTBEAT.md 실행 중 OpenClaw 에이전트가 시스템 검토, 메모리 유지 관리, 날씨 확인 등 10개의 자체 할당 작업을 추가하여 토큰 소모 우려를 제기했습니다.

May 31, 2026, 12:17 AM UTC

OpenClaw의 사용성과 경제적 타당성에 대한 우려가 제기되다

OpenClaw의 사용성과 경제적 타당성에 대한 우려가 제기되다

OpenClaw는 높은 진입 장벽, 과도한 비용, 보안 문제, 그리고 오해의 소지가 있는 메모리 기능 때문에 비판을 받아왔습니다. MemU Bot과 같은 대안 솔루션이 권장되고 있습니다.

Feb 12, 2026, 10:45 PM UTC

클로드 에이전트 SDK 청구 변경 사항 6월 15일: 사용자별 크레딧, 미이월, 하드 클리프

클로드 에이전트 SDK 청구 변경 사항 6월 15일: 사용자별 크레딧, 미이월, 하드 클리프

6월 15일부터 Claude Agent SDK 사용 및 claude -p가 구독 한도에 포함되지 않습니다. 각 사용자에게는 별도의 월별 크레딧이 제공됩니다(예: Pro $20, Max 5x $100). 크레딧은 합산되지 않으며, 이월되지 않고, 하드 한도가 있습니다.

May 14, 2026, 04:16 AM UTC