스케일스: 올라마 지원 데스크톱 AI 에이전트, 300MB 유휴 RAM

Skales는 Windows용 .exe 설치 프로그램과 macOS용 .dmg를 갖춘 네이티브 Electron 앱으로 구축된 데스크톱 AI 에이전트입니다. 창립자는 2년간의 LLM 경험을 가진 디자이너로, 로컬 AI 설정을 위한 Docker와 터미널 명령어로 어려움을 겪은 후 가족과 같은 비기술 사용자도 접근할 수 있는 것을 만들기 위해 개발했습니다.
주요 기능
- 완전한 로컬 추론을 위한 Ollama 또는 OpenRouter, OpenAI, Claude, Gemini, Grok, Mistral, DeepSeek를 포함한 모든 클라우드 제공업체와 함께 작동 (BYOK)
- 이중 시간적 메모리를 갖춘 ReAct 자동 조종
- Playwright를 통한 브라우저 자동화
- 네이티브 통합: Gmail, Telegram, WhatsApp, Discord, Google Calendar
- 다른 모델들이 주제를 토론하는 다중 에이전트 그룹 채팅
- 최소화 시 화면에 상주하며 창 전환 없이 작업을 할당할 수 있는 데스크톱 버디 (Clippy와 유사)
- 보안을 위한 내장 킬스위치 및 웹사이트/검색 블랙리스트
- 약 300MB 유휴 RAM 사용량
- 모든 데이터는 로컬에 ~/.skales-data에 저장
기술적 세부사항
이 앱은 Electron + Next.js + Node.js로 구축되었습니다. BSL-1.1 라이선스 하에 소스 이용 가능하며, 개인 사용은 무료입니다. 창립자는 "대기업이 포크하여 상업적으로 재판매하는 것을 원하지 않았다"고 언급했습니다. GitHub 저장소는 github.com/skalesapp/skales에 있습니다.
창립자는 60세 이상의 어머니가 즉시 실행할 수 있었고, 6살 아이가 내장 코딩 기능을 사용하여 레트로 게임(슈퍼 마리오 한 레벨)을 만들었다고 보고했습니다.
📖 전체 출처 읽기: r/LocalLLaMA
👀 See Also

antrez의 DS4: Mac Metal 및 DGX에서 1M 컨텍스트로 DeepSeek V4 Flash 실행하기
Redis 창시자 Salvatore Sanfilippo가 Mac Metal 하드웨어와 DGX에서 1M 컨텍스트 윈도우로 DeepSeek V4 Flash를 실행하고, 에이전트 코딩 도구를 위한 OpenAI/Anthropic 엔드포인트를 제공하는 프로젝트 DS4를 출시했습니다.

Atlas 추론 엔진 오픈소스화: 순수 Rust + CUDA, DGX Spark에서 초당 100+ 토큰
Atlas가 이제 오픈소스가 되었습니다 — 단일 DGX Spark에서 Qwen3.5-35B (NVFP4)에 대해 최대 130 tok/s를 달성하는 Rust + CUDA 추론 엔진으로, Python 런타임이 없고 콜드 스타트가 2분 미만입니다.

에이전트 기반 텍스트-투-SQL 작업에서 소형 로컬 및 오픈라우터 모델의 벤치마크 결과
한 개발자가 영어 쿼리를 SQL로 변환하는 디버깅 라운드를 포함한 맞춤형 에이전트 기반 텍스트-투-SQL 벤치마크를 사용하여 여러 소형 로컬 및 OpenRouter 모델을 테스트했습니다. 이 벤치마크는 25개의 질문을 포함하며 5분 이내에 실행되며, kimi-k2.5 및 Qwen 3.5 변형과 같은 최고 성능 모델을 보여줍니다.

센티넬: 클로드 코드 구독자를 위한 자체 호스팅 에이전트 플랫폼
Sentinel은 API 오버헤드 없이 기존 Claude Code OAuth 토큰에서 직접 실행되는 무료 오픈소스 에이전트 플랫폼입니다. 내장된 VNC를 통한 실시간 브라우저 자동화 기능을 갖춘 깔끔한 운영자 UI를 제공하며, Git 게이팅, 세션 추적 로그, 구조화된 계층적 메모리 등의 기능을 포함합니다.