Apfel: Kostenloses CLI-Tool für den Zugriff auf Apples On-Device-LLM unter macOS

Was Apfel macht
Apfel ist ein kostenloses Tool, das Ihnen direkten Zugriff auf das LLM bietet, das Apple mit macOS 26 (Tahoe) auf Apple Silicon Macs ausliefert. Apple beschränkt dieses Modell normalerweise auf Siri und Systemfunktionen, aber Apfel macht es über drei Schnittstellen verfügbar: ein UNIX-Kommandozeilen-Tool, einen OpenAI-kompatiblen HTTP-Server und einen interaktiven Chat.
Technische Details
Das Tool ist in Swift 6.3 entwickelt und umschließt Apples FoundationModels-Framework, insbesondere die LanguageModelSession-API. Alle Inferenzen laufen auf der Neural Engine und GPU – keine Netzwerkaufrufe, keine Cloud, und nichts verlässt Ihren Rechner.
Wichtige Spezifikationen aus der Quelle:
- Version: v0.6.13
- Anforderungen: macOS 26+ (Tahoe), Apple Silicon, Apple Intelligence aktiviert
- Kontextfenster: 4.096 Token (Eingabe und Ausgabe kombiniert)
- Lizenz: MIT
- Installation:
brew install Arthur-Ficial/tap/apfel
Drei Nutzungsmodi
1. CLI-Tool
Pipe-freundliches UNIX-Tool mit stdin/stdout-Unterstützung, JSON-Ausgabe, Dateianhängen und korrekten Exit-Codes:
$ apfel "Was ist die Hauptstadt von Österreich?"
Die Hauptstadt von Österreich ist Wien.
$ apfel -o json "Übersetze ins Deutsche: hello" | jq .content
"Hallo"
2. OpenAI-kompatibler Server
Drop-in-Ersatz unter localhost:11434, der mit jedem OpenAI-SDK funktioniert:
$ apfel --serve
Server läuft auf http://127.0.0.1:11434
jeder OpenAI-Client funktioniert
$ curl localhost:11434/v1/chat/completions
Unterstützt Streaming (SSE), Tool Calling, CORS, Antwortformate, Temperatur, max_tokens und Seed-Parameter.
3. Interaktiver Chat
Mehrfachunterhaltungen mit automatischem Kontextmanagement und fünf Trimming-Strategien:
$ apfel --chat -s "Sie sind ein Programmierassistent"
Chat gestartet. Geben Sie /quit ein, um zu beenden.
> Wie drehe ich eine Liste in Python um?Was Apfel gegenüber Apples Roh-API hinzufügt
- Korrekte Exit-Codes für Shell-Skripting
- JSON-Ausgabeformat
- Unterstützung für Dateianhänge
- Fünf Kontext-Trimming-Strategien für das 4.096-Token-Fenster
- Echte Token-Zählung über das SDK
- Konvertierung von OpenAI-Tool-Schemas in Apples natives Transcript.ToolDefinition-Format
Enthaltene Power-Tools
Der demo/-Ordner enthält mehrere Shell-Skripte:
cmd: Umwandlung von natürlicher Sprache in Shell-Befehleoneliner: Erzeugt Pipe-Ketten aus einfachem Englischmac-narrator: Erzählt Systemaktivitäten wie eine Naturdokumentationexplain: Erklärt Befehle, Fehlermeldungen oder Code-Schnipselwtd: Sofortige Projektorientierung für jede Codebasisgitsum: Fasst kürzliche Git-Commits zusammen
Für wen dies gedacht ist
Entwickler, die mit Apples On-Device-LLM experimentieren möchten, ohne Swift-Anwendungen zu schreiben oder für Cloud-API-Aufrufe zu bezahlen.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Claude AIs UltraThink-Funktion kehrt zurück mit praktischen Nutzungshinweisen
Claude AI hat die UltraThink-Funktion nach Nutzerfeedback wieder eingeführt. Mittlerer Aufwand ist jetzt die Standardeinstellung für Opus 4.6 (Max/Team), wobei Hoher Aufwand dauerhaft über /model verfügbar ist und UltraThink als einmalige Überschreibung für hohen Aufwand dient.

ClamBot: KI-Agent führt LLM-generierten Code in WASM-Sandbox für Sicherheit aus
ClamBot ist ein KI-Agenten-Framework, das allen von LLM generierten Code in einer WebAssembly-Sandbox mit QuickJS in Wasmtime ausführt, wodurch exec()- oder Subprozess-Aufrufe überflüssig werden. Es umfasst eine Genehmigungsschleuse für Tool-Aufrufe, persistentes Script-Caching als 'Clams' und unterstützt mehrere LLM-Anbieter.

Open-Source JARVIS Desktop-Assistent, in 2 Tagen mit Claude Code erstellt
Ein Entwickler hat in 1-2 Tagen einen macOS-Desktop-KI-Assistenten namens JARVIS gebaut, wobei Claude Code als primäres Entwicklungswerkzeug diente. Die Anwendung verfügt über eine holografische Benutzeroberfläche, 18 native Tools zur Systemsteuerung, eine Sprachschnittstelle und Integrationen mit Gmail, Google Kalender, Notion, GitHub und Obsidian.

Kopflose OpenClaw-Einrichtung mit Discord über Docker-Skripte
Ein GitHub-Repository bietet Skripte, um OpenClaw mit Discord in einem headless Docker-Container auszuführen und dabei die TUI/WebUI zu umgehen. Es enthält ein Verwaltungsskript mit Befehlen wie claw init, start und stop sowie vorkonfigurierte Unterstützung für die OpenAI Responses API, Chromium und verschiedene Tools.