Apfel: Ferramenta CLI Gratuita para Acessar o LLM Local da Apple no macOS

O que o Apfel faz
Apfel é uma ferramenta gratuita que dá acesso direto ao LLM que a Apple inclui no macOS 26 (Tahoe) em Macs com Apple Silicon. Normalmente, a Apple restringe esse modelo ao Siri e recursos do sistema, mas o Apfel o expõe através de três interfaces: uma ferramenta de linha de comando UNIX, um servidor HTTP compatível com OpenAI e um chat interativo.
Detalhes técnicos
A ferramenta é construída em Swift 6.3 e envolve o framework FoundationModels da Apple, especificamente a API LanguageModelSession. Toda a inferência roda no Neural Engine e GPU - sem chamadas de rede, sem nuvem e nada sai da sua máquina.
Especificações principais da fonte:
- Versão: v0.6.13
- Requisitos: macOS 26+ (Tahoe), Apple Silicon, Apple Intelligence habilitado
- Janela de contexto: 4.096 tokens (entrada e saída combinados)
- Licença: MIT
- Instalação:
brew install Arthur-Ficial/tap/apfel
Três modos de uso
1. Ferramenta CLI
Ferramenta UNIX amigável a pipes com suporte a stdin/stdout, saída JSON, anexos de arquivo e códigos de saída apropriados:
$ apfel "Qual é a capital da Áustria?"
A capital da Áustria é Viena.
$ apfel -o json "Traduza para alemão: olá" | jq .content
"Hallo"
2. Servidor compatível com OpenAI
Substituto direto em localhost:11434 que funciona com qualquer SDK da OpenAI:
$ apfel --serve
Servidor rodando em http://127.0.0.1:11434
qualquer cliente OpenAI funciona
$ curl localhost:11434/v1/chat/completions
Suporta streaming (SSE), chamada de ferramentas, CORS, formatos de resposta, temperatura, max_tokens e parâmetros de seed.
3. Chat interativo
Conversas de múltiplas interações com gerenciamento automático de contexto e cinco estratégias de corte:
$ apfel --chat -s "Você é um assistente de programação"
Chat iniciado. Digite /quit para sair.
> Como eu reverso uma lista em Python?O que o Apfel adiciona sobre a API bruta da Apple
- Códigos de saída apropriados para scripts de shell
- Formato de saída JSON
- Suporte a anexos de arquivo
- Cinco estratégias de corte de contexto para a janela de 4.096 tokens
- Contagem real de tokens via SDK
- Conversão de esquemas de ferramentas OpenAI para o formato nativo Transcript.ToolDefinition da Apple
Ferramentas poderosas incluídas
A pasta demo/ inclui vários scripts de shell:
cmd: Conversão de linguagem natural para comandos de shelloneliner: Gera cadeias de pipes a partir de inglês simplesmac-narrator: Narra a atividade do sistema como um documentário da naturezaexplain: Explica comandos, mensagens de erro ou trechos de códigowtd: Orientação instantânea de projeto para qualquer base de códigogitsum: Resume commits recentes do git
Para quem é isso
Desenvolvedores que querem experimentar com o LLM local da Apple sem escrever aplicações Swift ou pagar por chamadas de API na nuvem.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Kanwas: Quadro de contexto compartilhado de código aberto para equipes e agentes de IA
Kanwas é um espaço de trabalho multiplayer de código aberto onde equipes e agentes de IA compartilham documentos, evidências e decisões em um canvas com streaming ao vivo de chamadas de ferramentas. Auto-hospedado via Docker, é baseado em git com Yjs e BlockNote.

SDK de Código Aberto para Trabalho de Conhecimento em IA
O kw-sdk da ClioAI oferece uma estrutura estruturada para agentes de IA que realizam trabalho de conhecimento, implementando um loop de autoverificação com briefing de tarefas, criação de rubricas e verificação.

Scalpel v2.0: Scanner de Base de Código e Orquestrador de Agentes de IA
Scalpel v2.0 é uma ferramenta de código aberto que analisa bases de código em 12 dimensões e monta equipes personalizadas de agentes de IA. Inclui um scanner puro em bash que funciona sem tokens de IA e é compatível com Claude Code, Codex, Gemini, Cursor, Windsurf, Aider e OpenCode.

Homebutler: Habilidade OpenClaw para Gerenciamento de Homelab via Telegram
Homebutler é um binário único em Go (~13MB, sem dependências) que funciona como uma habilidade do OpenClaw para gerenciar homelabs a partir do chat do Telegram. Ele monitora servidores, reinicia contêineres Docker, liga máquinas, escaneia redes e alerta sobre picos de recursos sem sessões SSH ou logins em painéis.