SWE-rebench-V2: крупнейший открытый датасет для обучения кодовых агентов

Детали релиза SWE-rebench-V2

Команда R&D Nebius под руководством Ибрагима опубликовала SWE-rebench-V2, который они описывают как "в настоящее время самый большой открытый набор данных в мире для обучения кодирующих агентов". Набор данных является многоязычным и исполняемым, специально разработанным для крупномасштабного обучения с подкреплением.

Ключевые технические особенности

Команда создала автоматизированный конвейер для извлечения RL-сред в масштабе. Этот релиз включает:

Полный набор данных SWE-rebench-V2
Подробный технический отчет
Статья и набор данных доступны по адресу: https://huggingface.co/papers/2602.23866

Сообщество и поддержка

Команда поддерживает активную поддержку в Discord как для набора данных, так и для их SWE-rebench Leaderboard по адресу: https://discord.gg/wXYmWpMu. Они отмечают, что сообщество LocalLLaMA предоставило "самую ценную обратную связь" для их работы с SWE-rebench Leaderboard и подтверждают, что продолжают работу над таблицей лидеров с планами "сделать её ещё круче".

Для исследовательского сотрудничества или вопросов, с Ибрагимом можно связаться через личные сообщения на Reddit или Twitter (X) по адресу: https://x.com/ibragim_bad.

📖 Read the full source: r/LocalLLaMA

SWE-rebench-V2 выпущен: Крупнейший открытый мультиязычный набор данных для обучения кодовых агентов

Детали релиза SWE-rebench-V2

Ключевые технические особенности

Сообщество и поддержка

👀 Смотрите также

Стартап-бухгалтер: Бесплатный навык Claude для отслеживания малого бизнеса

Щит: Открытый плагин безопасности для Claude Code с унифицированным сканированием

Переработанная реализация кода Claude с открытым исходным кодом, адаптированная для совместимости с локальными моделями.

OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude