PocketBot: Ein lokaler KI-Autopilot für iOS mit App-Intents und On-Device-Inferenz

PocketBot ist ein iOS-Autopilot-Agent, der vollständig auf dem Gerät läuft und native iOS-Frameworks nutzt, um ereignisgesteuerte Automatisierungen zu erstellen, ohne Daten an Cloud-Server zu senden. Die Entwickler haben es über vier Wochen mit Hilfe von Claude Opus 4.6 und dessen 1M-Kontextfenster aufgebaut.
Architektur und technische Details
Das System verfolgt einen datenschutzorientierten Ansatz mit diesen Schlüsselkomponenten:
- 100 % lokale Inferenz: Führt ein quantisiertes 3B-Llama-Modell nativ auf dem Neural Engine des iPhones über Metal aus
- Native Orchestrierung: Nutzt Apples AppIntents- und CoreLocation-Frameworks anstelle von Screen-Scraping
- Ereignisgesteuerte Engine: Wird nur im Hintergrund aktiviert, wenn das Betriebssystem Systemtrigger (Standort, Zeit, Akku) auslöst
- Datenschutzorientiert: Prompts, Daten und Automatisierungen gelangen niemals auf Cloud-Server
Aktuelle Fähigkeiten
Drei funktionierende Beispiele aus der Beta:
- Der Akku-Retter: "Wenn mein Akku unter 5 % fällt, dimme den Bildschirm und schicke meinem Partner meinen Live-Standort."
- Morgendliches Briefing: "Um 7 Uhr morgens durchsuche meinen Kalender/Erinnerungen/E-Mails, prüfe das Wetter und sende mir eine einzelne Zusammenfassungsbenachrichtigung."
- Monzo/FinTech-Hacks: "Wenn ich in die Nähe eines McDonald's gehe, überweise ich £10 auf mein Sparkonto."
Entwicklungskontext und Herausforderungen
Die Entwickler haben PocketBot gebaut, weil sie einen "Fahrer, keine Suchleiste" wollten – einen echten Agenten statt nur einer weiteren Chatbot-Hülle. Sie haben speziell vermieden, gegen das Betriebssystem anzukämpfen, indem sie die Architektur um native iOS-APIs herum aufgebaut haben.
Aktuelle Einschränkungen umfassen den Kampf mit den Speichergrenzen der A-Serie-Chips während der lokalen Schlussfolgerung. Die Beta ist auf 1.000 Tester beschränkt, um die Akkuauswirkungen auf verschiedenen iPhone-Modellen zu überwachen, mit besonderem Interesse an Tests auf iPhone 15 Pro oder neueren Geräten, um zu sehen, ob iOS den App-Prozess beendet.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch
Forscher entwickelt Wahrheitsprüfungs-Funktion für Claude Code, findet Hallucinationen in eigener Dokumentation
Ein Forscher entwickelte eine Claude Code-Fähigkeit namens /veracity-tweaked-555, die Dokumente in atomare Behauptungen zerlegt und jede über Websuche verifiziert, wobei 16 parallele Agenten über 4 Wellen hinweg eingesetzt werden. Bei einer Selbstprüfung erzielte die Fähigkeit 62/100 Punkte aufgrund von erfundenen Statistiken und übertriebenen Behauptungen in ihrer eigenen Dokumentation.

Start Engine MCP Server bietet eine 39-Tool-Pipeline für die Geschäftsvalidierung.
Launch Engine ist ein MCP-Server, der Claude eine strukturierte Pipeline mit 39 miteinander verbundenen SOP-Tools bietet, die in 5 Ebenen organisiert sind, um Geschäftsideen von der Konzeption bis zur validierten Umsatzgenerierung zu führen. Das System umfasst spezialisierte Subagenten, Voraussetzungsprüfungen sowie Tools für Batch-Auswertungen und schnelles Testen.

Google Research stellt TurboQuant zur Komprimierung von KI-Modellen vor
Google Research hat TurboQuant eingeführt, einen Komprimierungsalgorithmus, der die Größe von KI-Modellen ohne Genauigkeitsverlust reduziert. Er behebt den Speichermehraufwand bei der Vektorquantisierung und verbessert die Leistung des Key-Value-Caches.

Claude Desktop Feature-Anfrage: Sitzungsstart-Hook für automatische Initialisierung
Ein Entwickler, der persistente Kontextsysteme für Claude Desktop erstellt, identifiziert eine Lücke: Das Feld für Benutzereinstellungen injiziert Anweisungen nur, wenn der Benutzer die erste Nachricht sendet, was manuelle Auslöser für die Initialisierung erfordert. Sie schlagen vor, ein Feld für die Ausführung "Bei Sitzungsstart" hinzuzufügen, das automatisch ausgeführt wird, wenn eine neue Konversation beginnt.