Claude Code KI-Agent steuert physisches iPhone über Barrierefreiheits-APIs

✍️ OpenClawRadar📅 Veröffentlicht: 26. Februar 2026🔗 Source
Claude Code KI-Agent steuert physisches iPhone über Barrierefreiheits-APIs
Ad

Ein KI-Agent steuert ein physisches iPhone, um Inhalte auf Reddit zu schreiben und zu posten, ohne dass ein Mensch tippen muss. Die Demonstration verwendet Claude Code (den KI-Agenten von Anthropic), der innerhalb von Blitz läuft, einer Mac-App, die KI-Agenten mit physischen iPhones verbindet.

Technische Umsetzung

Blitz bietet über WebDriverAgent Zugriff auf ein echtes iPhone, wobei die Navigation vollständig über Barrierefreiheits-APIs erfolgt. Der Entwickler stieß auf eine spezifische technische Einschränkung: Normale Tap-Befehle funktionieren auf physischen Geräten nicht und geben einen 404-Fehler "unknown command" zurück.

Der gefundene Workaround: Ein Null-Abstand-Swipe (gleiche Start- UND Endkoordinaten) wird als Tap registriert. Jeder Tastendruck in der Demonstration verwendet diesen Hack.

Ad

Schritt-für-Schritt-Prozess

  • Rufte describe_screen auf, um die Koordinaten des Reddit-Icons auf dem Startbildschirm zu finden (scan_ui ist nur für Simulatoren, daher wurde stattdessen der Barrierefreiheitsbaum verwendet)
  • Null-Abstand-swipete das Icon, um Reddit zu öffnen
  • Tappte die Suchschaltfläche, sah r/ClaudeAI in den letzten Suchen, tappte darauf
  • Drückte Erstellen, tappte das Titelfeld, tippte den Titel
  • Tappte das Post-Textfeld und begann zu schreiben

Jede Aktion folgt dem Muster: describe_screen → Koordinaten parsen → swipe(x, y, x, y). Der Agent bedient das Telefon "blind" und liest die Welt durch einen Barrierefreiheits-JSON-Baum.

Der Entwickler erwähnt, dass er auch in r/vibecoding über dieselbe Sitzung gepostet hat, wo er Feedback zu seiner anfänglichen Titelwahl erhielt.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

OpenClaw-Agent im Aivilization-Persistent-World-Simulator getestet
Anwendungsfälle

OpenClaw-Agent im Aivilization-Persistent-World-Simulator getestet

Ein Entwickler experimentierte, indem er seinen OpenClaw-Agenten in Aivilization einführte, eine Open-World-Simulation, in der KI-Agenten als Bewohner existieren. Anstatt über Terminal-Workflows zu agieren, wurde der Agent zu einem Charakter, der zur Schule ging, Bücher las, Landwirtschaft betrieb, Arbeit fand, Geld verdiente und mit anderen Agenten interagierte.

OpenClawRadar
Entwickler baut Paartherapie-App mit Claude und teilt Einblicke in Prompt Engineering
Anwendungsfälle

Entwickler baut Paartherapie-App mit Claude und teilt Einblicke in Prompt Engineering

Ein Entwickler hat TherapAI erstellt, eine progressive Web-App für Paare, bei der jeder Partner einen privaten KI-Begleiter erhält, der von Claude Sonnet angetrieben wird. Der Entwickler teilt fünf spezifische Prompt-Engineering-Techniken, die Claude menschlicher und weniger wie ein Chatbot wirken lassen.

OpenClawRadar
Nicht-Programmierer baut lokalen Video-Downloader mit Claude AI in einem Abend
Anwendungsfälle

Nicht-Programmierer baut lokalen Video-Downloader mit Claude AI in einem Abend

Ein Nutzer ohne Programmierkenntnisse nutzte Claude AI, um AZ Downloader zu erstellen, einen lokalen Video-Downloader, der auf 14/16 Plattformen funktioniert, darunter YouTube, TikTok, Instagram und Reddit. Das Tool wurde in einem Abend entwickelt und ist jetzt auf GitHub verfügbar.

OpenClawRadar
Nicht-Entwickler baut Healthcare-SaaS in 3 Wochen mit Claude und Gemini: Erkenntnisse
Anwendungsfälle

Nicht-Entwickler baut Healthcare-SaaS in 3 Wochen mit Claude und Gemini: Erkenntnisse

Ein Vertriebsmitarbeiter für medizinische Geräte ohne Programmierkenntnisse baute FastCredentials.com, eine Plattform für die Nachweisführung im Gesundheitswesen, in drei Wochen mithilfe von KI-Codierungsassistenten. Das Projekt verwendete Python/Django, Gunicorn, Nginx, Stripe, WeasyPrint, SQLite und die Claude-API für automatisierten Bloginhalt.

OpenClawRadar