SWE-rebench-V2 выпущен: Крупнейший открытый мультиязычный набор данных для обучения кодовых агентов

✍️ OpenClawRadar📅 Опубликовано: 7 марта 2026 г.🔗 Source
SWE-rebench-V2 выпущен: Крупнейший открытый мультиязычный набор данных для обучения кодовых агентов
Ad

Детали релиза SWE-rebench-V2

Команда R&D Nebius под руководством Ибрагима опубликовала SWE-rebench-V2, который они описывают как "в настоящее время самый большой открытый набор данных в мире для обучения кодирующих агентов". Набор данных является многоязычным и исполняемым, специально разработанным для крупномасштабного обучения с подкреплением.

Ключевые технические особенности

Команда создала автоматизированный конвейер для извлечения RL-сред в масштабе. Этот релиз включает:

  • Полный набор данных SWE-rebench-V2
  • Подробный технический отчет
  • Статья и набор данных доступны по адресу: https://huggingface.co/papers/2602.23866
Ad

Сообщество и поддержка

Команда поддерживает активную поддержку в Discord как для набора данных, так и для их SWE-rebench Leaderboard по адресу: https://discord.gg/wXYmWpMu. Они отмечают, что сообщество LocalLLaMA предоставило "самую ценную обратную связь" для их работы с SWE-rebench Leaderboard и подтверждают, что продолжают работу над таблицей лидеров с планами "сделать её ещё круче".

Для исследовательского сотрудничества или вопросов, с Ибрагимом можно связаться через личные сообщения на Reddit или Twitter (X) по адресу: https://x.com/ibragim_bad.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Стартап-бухгалтер: Бесплатный навык Claude для отслеживания малого бизнеса
Инструменты

Стартап-бухгалтер: Бесплатный навык Claude для отслеживания малого бизнеса

Startup Bookkeeper — это открытый навык для Claude AI, который помогает основателям стартапов отслеживать расходы, классифицируя транзакции по описаниям на простом английском языке, обрабатывая фотографии чеков с помощью OCR и создавая дашборды или отчёты о прибылях и убытках.

OpenClawRadar
Щит: Открытый плагин безопасности для Claude Code с унифицированным сканированием
Инструменты

Щит: Открытый плагин безопасности для Claude Code с унифицированным сканированием

Shield — это плагин безопасности с открытым исходным кодом для Claude Code, который координирует работу нескольких инструментов безопасности через единую команду /shield:shield, автоматически определяет ваш стек технологий, запускает установленные инструменты и генерирует объединённые отчёты с оценками риска и предложениями по исправлению кода.

OpenClawRadar
Переработанная реализация кода Claude с открытым исходным кодом, адаптированная для совместимости с локальными моделями.
Инструменты

Переработанная реализация кода Claude с открытым исходным кодом, адаптированная для совместимости с локальными моделями.

Разработчик исправил реализацию открытого кода Claude Code для работы с Ollama и локальными моделями, удалив жёсткие зависимости от клиента Anthropic. Теперь CLI автоматически определяет провайдеров по именам моделей и переменным окружения.

OpenClawRadar
OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude
Инструменты

OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude

OpenHelm — это бесплатное локальное приложение для macOS, которое автоматизирует повторяющиеся задачи кодирования в Claude, запуская задания по расписанию, автоматически повторяя неудачные попытки и разбивая работу на части, чтобы избежать ограничений сессий. Оно использует вашу существующую подписку Claude для вызовов LLM.

OpenClawRadar