Mac Mini 로컬 LLM 벤치마크: OpenClaw vs LM Studio, 초당 34토큰

한 레딧 사용자가 32GB RAM을 탑재한 Mac Mini에서 로컬 대규모 언어 모델을 실행한 구체적인 성능 벤치마크를 공유했습니다. 이 게시물은 이 하드웨어 구성에 대한 구체적인 성능 데이터가 부족한 점을 다루고 있습니다.

기술 설정 상세 정보

사용자는 다음과 같은 구성과 결과를 보고했습니다:

소프트웨어 버전: OpenClaw 2026.3.8, LM Studio 0.4.6+1
모델: Unsloth gpt-oss-20b-Q4_K_S.gguf
컨텍스트 크기: 26035
성능 지표: 첫 프롬프트 이후 초당 34토큰, 초기 토큰까지 0.7초

모델 구성

사용자는 다음 모델 설정을 지정했습니다(모두 기본값):

GPU 오프로드 = 18
CPU 스레드 풀 크기 = 7
최대 동시 실행 수 = 4
전문가 수 = 4
플래시 어텐션 = 켜짐

Q4_K_S 양자화는 이 모델이 200억 개의 매개변수를 가진 모델의 4비트 양자화 버전임을 나타내며, 이는 합리적인 성능을 유지하면서 메모리 요구 사항을 줄입니다. Mac Mini의 32GB RAM은 주어진 컨텍스트 길이로 이 모델 크기에 충분합니다. 초당 34토큰의 처리량은 Apple Silicon 하드웨어에서 유사한 로컬 LLM 설정을 고려하는 개발자들에게 실용적인 벤치마크입니다.

📖 Read the full source: r/openclaw

Mac Mini에서 OpenClaw와 LM Studio를 사용한 로컬 LLM 성능 벤치마크

기술 설정 상세 정보

모델 구성

👀 See Also

토큰 강화기는 AI 에이전트를 위한 웹페이지 토큰 사용량을 줄여줍니다.

비트코인 MCP 서버: AI 코딩 에이전트를 위한 43가지 도구

Claude-Code v2.1.76은 MCP(Multi-Context Prompting) 유도 기능 추가, 작업 트리 최적화, 그리고 수많은 버그 수정을 포함합니다.

Clawpage: OpenClaw 대화를 정적 웹사이트로 변환하는 도구