번개 MLX: 애플 실리콘 에이전트 사용을 위한 초고속 로컬 AI 엔진, Qwen 35B-A3B에서 220 tok/s 구현

✍️ OpenClawRadar📅 게시일: May 8, 2026🔗 Source

번개 MLX: 애플 실리콘 에이전트 사용을 위한 초고속 로컬 AI 엔진, Qwen 35B-A3B에서 220 tok/s 구현

Ad

Lightning MLX라는 Apple Silicon용 새로운 오픈소스 추론 엔진이 에이전틱 워크플로(코딩 에이전트, 도구 호출, 짧은 응답 작업)에 특화된 가장 빠른 로컬 AI 엔진이라고 주장합니다. 이 프로젝트는 GitHub samuelfaj/lightning-mlx에서 확인할 수 있습니다.

벤치마크 결과

개발자는 128GB RAM의 MacBook Max M5에서 테스트하여 다음과 같은 토큰 생성 속도를 보고했습니다:

Qwen3.6-27B: 40.67 tok/s
Qwen3.6-35B-A3B: 220.86 tok/s

이 결과는 엔진이 토큰당 일부 파라미터만 활성화하는 Qwen3.6-35B-A3B 모델의 mixture-of-expert 아키텍처에 특히 효율적임을 시사합니다.

주요 기능

짧은 응답 에이전틱 사용 사례 — 코드 생성, 도구 호출, 빠른 추론 루프에 최적화
MTPLX(커스텀 샘플링 기본값)라는 사전 설정 구성 포함; 개발자는 이러한 기본값이 프로덕션에 적합한지에 대한 피드백을 구하고 있습니다
GitHub에서 MIT 라이선스(추정)로 오픈소스 제공

피드백 요청

개발자는 커뮤니티에 다음을 적극적으로 요청하고 있습니다:

로컬 코딩 에이전트를 위한 더 나은 벤치마크 설계
MTPLX 사전 설정 기본값에 대한 의견
다른 Apple Silicon 구성(예: M1, M2, M3, M4, 다양한 RAM 크기)에서의 테스트 결과

대상 사용자

에이전틱 코딩 워크플로를 위해 Apple Silicon에서 로컬 LLM을 실행하며 최대 추론 속도가 필요한 개발자.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

동일 코드베이스에서 세 가지 AI 도구를 비교하는 헤드투헤드 코드 리뷰 실험

동일 코드베이스에서 세 가지 AI 도구를 비교하는 헤드투헤드 코드 리뷰 실험

동일한 코드 리뷰 작업에 대해 Codex, Claude Code, 그리고 Sextant가 적용된 Claude Code를 비교하는 비디오 실험이 진행되었습니다. Codex는 발견 사항을 검증하고 어떤 보고서가 더 가치 있는지 판단하는 역할을 맡았습니다. 이 실험은 워크플로우와 구조가 AI가 무엇을 인지하고 우선순위를 매기는지에 어떻게 영향을 미치는지에 초점을 맞추고 있습니다.

Apr 4, 2026, 04:45 PM UTC

Knowledge Raven: Claude Code로 구축된 모델 불가지론적 지식 베이스 플랫폼

Knowledge Raven: Claude Code로 구축된 모델 불가지론적 지식 베이스 플랫폼

Knowledge Raven은 MCP 호환 LLM(Claude, GPT 등)이 회사 문서를 검색하고 소스 인용과 함께 특정 섹션을 검색할 수 있도록 하는 지식 베이스 플랫폼입니다. 이 플랫폼은 AI 어시스턴트를 위한 구조화된 권한 인식 메모리 역할을 합니다.

Apr 15, 2026, 05:45 PM UTC

스마트 픽셀 시계를 사용한 Claude AI 완료 알림

스마트 픽셀 시계를 사용한 Claude AI 완료 알림

레딧 사용자가 ULANZI TC001 스마트 픽셀 시계에 커스텀 펌웨어와 HTTP 엔드포인트를 사용하여 Claude AI 완료 알림을 표시하는 방법을 공유합니다.

Mar 28, 2026, 06:45 AM UTC

SubQ: 1,200만 토큰 컨텍스트 윈도우를 가진 서브-쿼드라틱 LLM

SubQ: 1,200만 토큰 컨텍스트 윈도우를 가진 서브-쿼드라틱 LLM

SubQ는 완전 준2차 희소 주의 LLM으로, 12M 토큰 컨텍스트 윈도우를 150 tokens/s로 제공하며 SWE-Bench Verified 81.8%, RULER @ 128K 95.0%를 기록합니다. 트랜스포머 대비 주의 계산량을 약 1000배 줄입니다.

May 6, 2026, 12:18 AM UTC