PocketBot : Un pilote automatique IA local pour iOS utilisant les intentions d'application et l'inférence sur appareil

PocketBot est un agent pilote automatique iOS qui fonctionne entièrement sur l'appareil, utilisant les frameworks natifs d'iOS pour créer des automatisations pilotées par événements sans envoyer de données vers des serveurs cloud. Les développeurs l'ont construit en quatre semaines avec l'aide de la fenêtre de contexte de 1 million de tokens de Claude Opus 4.6.
Architecture et détails techniques
Le système adopte une approche axée sur la confidentialité avec ces composants clés :
- Inférence 100 % locale : Exécute un modèle Llama 3B quantifié nativement sur le Neural Engine de l'iPhone via Metal
- Orchestration native : Utilise les frameworks AppIntents et CoreLocation d'Apple au lieu du scraping d'écran
- Moteur piloté par événements : Ne se réveille en arrière-plan que lorsque le système d'exploitation déclenche des événements (localisation, heure, batterie)
- Confidentialité avant tout : Les invites, les données et les automatisations ne touchent jamais les serveurs cloud
Fonctionnalités actuelles
Trois exemples fonctionnels de la version bêta :
- Le sauveur de batterie : "Si ma batterie tombe en dessous de 5 %, assombris l'écran et envoie un SMS à mon partenaire avec ma position en direct."
- Le briefing matinal : "À 7h, scanne mon calendrier/rappel/emails, vérifie la météo et envoie-moi une seule notification de résumé."
- Les astuces Monzo/FinTech : "Si je marche près d'un McDonald's, transfère 10 livres sterling vers mon pot d'épargne."
Contexte de développement et défis
Les développeurs ont créé PocketBot parce qu'ils voulaient un "Pilote, pas une barre de recherche" — un véritable agent plutôt qu'un simple wrapper de chatbot. Ils ont spécifiquement évité de lutter contre le système d'exploitation en concevant autour des API iOS natives.
Les limitations actuelles incluent la lutte contre les limites de mémoire des puces de série A pendant le raisonnement sur l'appareil. La version bêta est limitée à 1 000 testeurs pour surveiller l'impact sur la batterie sur différents modèles d'iPhone, avec un intérêt particulier pour les tests sur iPhone 15 Pro ou des appareils plus récents pour voir si iOS tue le processus de l'application.
📖 Read the full source: r/ClaudeAI
👀 See Also

L'utilisateur de Claude Code crée la commande /discuss pour des conversations en lecture seule.
Un utilisateur de Claude Code a créé une compétence personnalisée de 25 lignes appelée /discuss qui permet des conversations en lecture seule sans modifications de fichiers. La commande permet l'exploration de code, la recherche et la discussion tout en empêchant les modifications, en utilisant le drapeau --dangerously-skip-permissions avec des mesures de sécurité intégrées.

Réduction de la latence des agents multi-modaux en omettant l'historique des captures d'écran
Un développeur a constaté que l'omission des captures d'écran précédentes des requêtes d'agents multimodaux et le remplacement des données d'image en base64 par des chaînes "[image omise]" réduisent considérablement la latence tout en maintenant les performances. L'expérience a été menée avec Claude et documentée sur GitHub.

mentionné.to vs outils de surveillance plus larges : une comparaison des flux de travail centrés sur Reddit
mentioned.to est un outil de surveillance spécialement conçu pour les flux de travail Reddit, se concentrant sur le suivi des publications pertinentes, la mise en avant des opportunités de réponse, l'analyse du contenu performant et la rédaction de réponses, plutôt que sur une surveillance générale de la marque sur plusieurs canaux.

cq : Un système de partage de connaissances local-first pour agents d'IA de codage
cq de Mozilla.ai est un outil open-source qui permet aux agents d'IA de codage de partager des 'unités de connaissance' sur les pièges courants via un stockage SQLite local, avec un partage d'équipe optionnel via une API Docker. Il s'installe comme plugin Claude Code ou serveur MCP OpenCode.