Qwen3.5-122B-A10B-MINT-MLX는 64GB RAM이 탑재된 M5 Pro에서 원활하게 실행됩니다.

✍️ OpenClawRadar📅 게시일: April 20, 2026🔗 Source
Qwen3.5-122B-A10B-MINT-MLX는 64GB RAM이 탑재된 M5 Pro에서 원활하게 실행됩니다.
Ad

애플 실리콘에서의 로컬 LLM 성능

레딧 사용자가 M5 Pro(64GB RAM)에서 Qwen3.5-122B-A10B-MINT-MLX 모델을 로컬로 실행한 경험을 공유했습니다. 이 설정은 적절한 구성으로 대규모 언어 모델이 소비자용 하드웨어에서 효과적으로 실행될 수 있음을 보여줍니다.

구성 세부사항

사용자는 VRAM 할당을 위한 특정 터미널 명령어를 사용하여 원활한 성능을 달성했습니다:

sysctl iogpu.unified_memory_limit_percentage
sudo sysctl iogpu.wired_limit_mb=61440

LM Studio에서 컨텍스트 창을 16384 토큰으로 설정했습니다. 이 구성으로 시스템은 Safari(여러 탭), 메시지, 활동 모니터를 동시에 실행하면서도 안정적인 성능을 유지했습니다.

성능 벤치마크

Qwen3.5-122B-A10B-MINT-MLX 모델의 성능은 다음과 같습니다:

  • 첫 토큰까지의 시간: 0.86초
  • 토큰 생성 속도: 39.58 토큰/초

사용자는 이 모델이 "여러 수수께끼를 정확히 풀고 약간의 바이브 코딩을 수행했다"고 언급하며, 3비트 MINT 양자화에 대한 불만은 없었습니다. 유일한 문제는 컨텍스트 창이 가득 차 VRAM 사용량이 59GB에 가까워졌을 때 시스템이 멈춘 경우였습니다.

다른 모델과의 비교

사용자는 "Qwen3.5 40B Claude 4.6 Opus Deckard Heretic Uncensored Thinking Mxfp8" 모델도 테스트했는데, 122B 모델보다 정확도는 높지만 속도는 훨씬 느렸습니다:

  • 토큰 생성 속도: 6.93 토큰/초
  • 생성 속도는 느렸지만 프롬프트 처리 속도는 여전히 빨랐습니다

이는 개발자가 로컬 LLM 구성을 선택할 때 모델 크기, 양자화, 추론 속도 사이에서 고려해야 하는 절충점을 보여줍니다.

📖 전체 원문 읽기: r/LocalLLaMA

Ad

👀 See Also

OpenClaw 에이전트의 지출 패턴과 지출 한도 부재
News

OpenClaw 에이전트의 지출 패턴과 지출 한도 부재

한 개발자가 두 달 동안 OpenClaw 에이전트 지출을 추적한 결과, 대부분의 에이전트가 제한 없이 방치될 경우 API 및 서비스 요금으로 월 평균 40~80달러를 소비하며, 주말과 야간에 급증하는 패턴을 발견했습니다. 기본 동작은 무제한이며, 내장된 지출 한도는 없습니다.

OpenClawRadar
Analytics API에서 Claude for Word 애드인 증거 발견
News

Analytics API에서 Claude for Word 애드인 증거 발견

Anthropic의 분석 API가 기존 Excel 및 PowerPoint 추가 기능과 함께 Claude for Word에 대한 메트릭을 반환하고 있어, Word 통합이 개발 중임을 시사합니다. API는 Word에 대한 사용량이 0으로 표시되어 아직 공개적으로 이용 가능하지 않음을 보여줍니다.

OpenClawRadar
KV 캐시 아키텍처 진화: GPT-2부터 맘바까지
News

KV 캐시 아키텍처 진화: GPT-2부터 맘바까지

KV 캐시 메모리 비용 분석에 따르면 GPT-2는 토큰당 300 KiB를 사용했고, Llama 3는 그룹화된 쿼리 어텐션으로 128 KiB/token으로 줄였으며, DeepSeek V3는 멀티헤드 잠재 어텐션으로 68.6 KiB/token을 달성했습니다. Mamba/SSM은 고정 크기 은닉 상태로 KV 캐시를 완전히 제거합니다.

OpenClawRadar
OpenClaw 2026.4.29 버전 손상 – 2026.2.6으로 다운그레이드
News

OpenClaw 2026.4.29 버전 손상 – 2026.2.6으로 다운그레이드

OpenClaw 버전 2026.4.29는 무작위 오류, 느린 CLI, 이중 응답 등의 문제가 있습니다. 2026.2.6으로 다운그레이드하여 해결하세요.

OpenClawRadar