Агент Coasty AI решает задачи CAPTCHA до 6 уровня без обучения

Агент Coasty по использованию компьютера справляется с реальными задачами на рабочем столе
Агент Coasty по использованию компьютера (CUA) продемонстрировал способность решать задачи CAPTCHA до 6-го уровня без специального обучения для тестов 'Я не робот'. Агент достиг 82% в тесте OSWorld, что представляет собой передовые показатели для агентов, использующих компьютер в реальных условиях рабочего стола.
Агент справляется с различными задачами веб-интерфейса, которые обычно сбивают других агентов, включая:
- Задачи CAPTCHA до 6-го уровня
- Всплывающие окна браузера
- Баннеры с согласием на использование файлов cookie
Согласно источнику, разработчики не учили CUA специально решать задачи 'Я не робот', отмечая, что 'ирония не ускользнула от нас'. Производительность агента предполагает, что он развил общие способности взаимодействия с компьютером, а не специализированные решения для отдельных типов задач.
Ссылка на повтор доступна для тех, кто хочет увидеть агента в действии: https://coasty.ai/share/1cd404ae-3fcb-4d7f-b9d4-dac7aa26fc6d
📖 Read the full source: HN AI Agents
👀 Смотрите также

ИИ-подсчет углеводов провалил воспроизводимость: 27 тысяч запросов показали разброс в 429 г на одном фото
Исследование 26 904 AI-запросов к 4 моделям показало, что Gemini 2.5 Pro варьирует оценку углеводов для одного фото паэльи от 55 г до 484 г — потенциальное колебание инсулина на 42,9 ЕД. У Claude медианное отклонение составило всего 2,4%.

Uber сжигает бюджет на ИИ 2026 года за 4 месяца на Claude Code — $500–2 тыс. на инженера в месяц
Uber потратил весь свой AI-бюджет на 2026 год уже к апрелю на Claude Code и Cursor. Ежемесячные затраты на API достигли $500–$2000 на одного инженера. 95% инженеров используют AI-инструменты ежемесячно; 70% всего закоммиченного кода создано с помощью AI.

Женщина из Теннесси заключена в тюрьму на шесть месяцев из-за ошибки распознавания лиц с использованием ИИ.
Анджела Липпс, 50-летняя бабушка из Теннесси, провела почти шесть месяцев в тюрьме после того, как полиция Фарго использовала программное обеспечение для распознавания лиц, чтобы ошибочно идентифицировать её как подозреваемую в деле о мошенничестве с банком в Северной Дакоте. Она была освобождена в канун Рождества после того, как банковские записи доказали, что в момент совершения преступлений она находилась в 1200 милях от места событий.

Anthropic меняет условия подписки, пользователи OpenClaw теперь оплачивают использование агентов отдельно.
Anthropic ограничила подписки Claude Max только собственными платформами, такими как Claude.ai и Claude Code, а использование через сторонние агенты теперь оплачивается как «Дополнительное использование» по токенам. У пользователей есть четыре варианта: остаться на Max и платить дополнительно, перейти на API Anthropic, сменить провайдера или использовать интеллектуальную маршрутизацию с Manifest.