Coasty KI-Agent löst CAPTCHA-Herausforderungen bis Level 6 ohne Training

Coastys Computer Using Agent bewältigt echte Desktop-Herausforderungen
Coastys Computer Using Agent (CUA) hat gezeigt, dass er CAPTCHA-Herausforderungen bis Level 6 lösen kann, ohne speziell für "Ich bin kein Roboter"-Tests trainiert worden zu sein. Der Agent erreichte 82 % auf dem OSWorld-Benchmark, was Spitzenleistung für Computer-Nutzungs-Agenten in realen Desktop-Umgebungen darstellt.
Der Agent bewältigt verschiedene Web-Interface-Herausforderungen, die typischerweise andere Agenten zum Scheitern bringen, darunter:
- CAPTCHA-Herausforderungen bis Level 6
- Browser-Popups
- Cookie-Banner
Laut der Quelle haben die Entwickler den CUA nicht speziell zum Lösen von "Ich bin kein Roboter"-Herausforderungen trainiert und merken an, dass "die Ironie uns nicht entgeht". Die Leistung des Agenten deutet darauf hin, dass er allgemeine Computer-Interaktionsfähigkeiten entwickelt hat, anstatt spezialisierte Lösungen für einzelne Herausforderungstypen.
Ein Wiedergabelink ist für Interessierte verfügbar, die den Agenten in Aktion sehen möchten: https://coasty.ai/share/1cd404ae-3fcb-4d7f-b9d4-dac7aa26fc6d
📖 Read the full source: HN AI Agents
👀 Siehe auch

Claudes Analyse der Minimax-Debatte und die Marktlücke von Anthropic
Claude argumentiert, dass MiniMax Trainingsdaten legal erworben hat, indem es Millionen von API-Aufrufen bezahlt hat, und identifiziert eine Lücke in Anthropics Produktpalette für einen günstigen, persistenten Orchestrator.

Ubers KI-Entwicklung steht trotz 3,4 Mrd. Dollar Investitionen vor Budgetbeschränkungen
Ubers KI-Initiativen stoßen laut ihrem CTO auf Budgetbeschränkungen, obwohl das Unternehmen 3,4 Milliarden Dollar für diese Bemühungen bereitgestellt hat. Der Artikel erörtert die Herausforderungen bei der Skalierung der KI-Entwicklung innerhalb finanzieller Grenzen.

„AI-Washing“: Britische Firmen bezeichnen sich trotz schwacher Verbindungen als KI-Unternehmen um
PR-Führungskräfte berichten, dass britische Unternehmen sie zwingen, gewöhnliche Automatisierung als KI zu bewerben. 50 % der KI-bezogenen Pressemitteilungen werden unter Druck versandt. Beispiele sind AllBirds‘ Wende zu KI-GPUs und eine Immobilienfirma, die einen Handscanner als KI-Tool bezeichnet.

Claude Code v2.1.160: Sicherheitsabfragen für Shell-Konfiguration, Dateischutz durch acceptEdits und Dutzende von Fehlerbehebungen
Anthropic hat Claude Code v2.1.160 veröffentlicht, das Sicherheitsabfragen vor dem Schreiben in Shell-Startup-Dateien und Build-Tool-Konfigurationen im acceptEdits-Modus hinzufügt, die Windows-Zwischenablage verbessert und Verluste des Sitzungsverlaufs behebt.