Apfel : Outil CLI gratuit pour accéder au LLM sur appareil d'Apple sur macOS

Ce que fait Apfel
Apfel est un outil gratuit qui vous donne un accès direct au LLM qu'Apple livre avec macOS 26 (Tahoe) sur les Mac à puce Apple Silicon. Apple restreint normalement ce modèle à Siri et aux fonctionnalités système, mais Apfel l'expose via trois interfaces : un outil en ligne de commande UNIX, un serveur HTTP compatible OpenAI et un chat interactif.
Détails techniques
L'outil est construit en Swift 6.3 et encapsule le framework FoundationModels d'Apple, spécifiquement l'API LanguageModelSession. Toute l'inférence s'exécute sur le Neural Engine et le GPU - pas d'appels réseau, pas de cloud, et rien ne quitte votre machine.
Spécifications clés de la source :
- Version : v0.6.13
- Prérequis : macOS 26+ (Tahoe), Apple Silicon, Apple Intelligence activé
- Fenêtre de contexte : 4 096 tokens (entrée et sortie combinées)
- Licence : MIT
- Installation :
brew install Arthur-Ficial/tap/apfel
Trois modes d'utilisation
1. Outil CLI
Outil UNIX compatible avec les pipes, supportant stdin/stdout, sortie JSON, pièces jointes et codes de sortie appropriés :
$ apfel "Quelle est la capitale de l'Autriche ?"
La capitale de l'Autriche est Vienne.
$ apfel -o json "Traduis en allemand : bonjour" | jq .content
"Hallo"
2. Serveur compatible OpenAI
Remplacement direct sur localhost:11434 qui fonctionne avec n'importe quel SDK OpenAI :
$ apfel --serve
Serveur en cours d'exécution sur http://127.0.0.1:11434
tout client OpenAI fonctionne
$ curl localhost:11434/v1/chat/completions
Prend en charge le streaming (SSE), l'appel d'outils, CORS, les formats de réponse, la température, max_tokens et les paramètres de seed.
3. Chat interactif
Conversations multi-tours avec gestion automatique du contexte et cinq stratégies de réduction :
$ apfel --chat -s "Vous êtes un assistant de codage"
Chat démarré. Tapez /quit pour quitter.
> Comment inverser une liste en Python ?Ce qu'Apfel ajoute par rapport à l'API brute d'Apple
- Codes de sortie appropriés pour le scripting shell
- Format de sortie JSON
- Support des pièces jointes
- Cinq stratégies de réduction de contexte pour la fenêtre de 4 096 tokens
- Comptage réel des tokens via le SDK
- Conversion des schémas d'outils OpenAI au format natif Transcript.ToolDefinition d'Apple
Outils puissants inclus
Le dossier demo/ comprend plusieurs scripts shell :
cmd: Conversion du langage naturel en commande shelloneliner: Génère des chaînes de pipes à partir de l'anglais simplemac-narrator: Narre l'activité système comme un documentaire natureexplain: Explique les commandes, messages d'erreur ou extraits de codewtd: Orientation instantanée de projet pour n'importe quelle base de codegitsum: Résume les commits git récents
À qui cela s'adresse
Développeurs qui souhaitent expérimenter avec le LLM sur appareil d'Apple sans écrire d'applications Swift ou payer pour des appels d'API cloud.
📖 Lire la source complète : HN AI Agents
👀 See Also

Le Chef de Produit Partage Plus de 70 Compétences Claude pour Automatiser les Flux de Travail de Gestion de Produit
Un chef de produit avec 20 ans d'expérience a créé plus de 70 compétences Claude qui automatisent des tâches courantes de gestion de produit, incluant la génération de PRD, l'analyse d'entretiens utilisateurs, le profilage concurrentiel et la construction de feuilles de route. Les compétences sont disponibles sous forme de fichiers .md téléchargeables pour Claude Code.

Rivet Actors ajoute le stockage SQLite : une base de données par agent, locataire ou document
Rivet Actors prend désormais en charge le stockage SQLite où chaque acteur obtient sa propre base de données SQLite, permettant des millions de bases de données indépendantes pour les agents IA, les SaaS multi-locataires, les documents collaboratifs ou l'isolation par utilisateur.

Surveillance du quota de code Claude dans la barre système Windows
Une application de la zone de notification Windows qui surveille l'utilisation de Claude Code avec une icône codée par couleur, actualise automatiquement les données de quota toutes les 5 minutes via l'API OAuth d'Anthropic, et fournit des tableaux de bord détaillés montrant les tendances d'utilisation horaires, quotidiennes, hebdomadaires et mensuelles.

Comparaison des agents IA locaux et cloud : OpenClaw et Twin.so
OpenClaw est un agent d'IA local open-source qui s'exécute sur votre machine avec un contrôle total des données, tandis que Twin.so est une plateforme cloud avec plus de 200 000 agents créés par la communauté pour une automatisation 24h/24 et 7j/7.