SWE-rebench-V2 выпущен: Крупнейший открытый мультиязычный набор данных для обучения кодовых агентов

Детали релиза SWE-rebench-V2
Команда R&D Nebius под руководством Ибрагима опубликовала SWE-rebench-V2, который они описывают как "в настоящее время самый большой открытый набор данных в мире для обучения кодирующих агентов". Набор данных является многоязычным и исполняемым, специально разработанным для крупномасштабного обучения с подкреплением.
Ключевые технические особенности
Команда создала автоматизированный конвейер для извлечения RL-сред в масштабе. Этот релиз включает:
- Полный набор данных SWE-rebench-V2
- Подробный технический отчет
- Статья и набор данных доступны по адресу: https://huggingface.co/papers/2602.23866
Сообщество и поддержка
Команда поддерживает активную поддержку в Discord как для набора данных, так и для их SWE-rebench Leaderboard по адресу: https://discord.gg/wXYmWpMu. Они отмечают, что сообщество LocalLLaMA предоставило "самую ценную обратную связь" для их работы с SWE-rebench Leaderboard и подтверждают, что продолжают работу над таблицей лидеров с планами "сделать её ещё круче".
Для исследовательского сотрудничества или вопросов, с Ибрагимом можно связаться через личные сообщения на Reddit или Twitter (X) по адресу: https://x.com/ibragim_bad.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Стартап-бухгалтер: Бесплатный навык Claude для отслеживания малого бизнеса
Startup Bookkeeper — это открытый навык для Claude AI, который помогает основателям стартапов отслеживать расходы, классифицируя транзакции по описаниям на простом английском языке, обрабатывая фотографии чеков с помощью OCR и создавая дашборды или отчёты о прибылях и убытках.

Щит: Открытый плагин безопасности для Claude Code с унифицированным сканированием
Shield — это плагин безопасности с открытым исходным кодом для Claude Code, который координирует работу нескольких инструментов безопасности через единую команду /shield:shield, автоматически определяет ваш стек технологий, запускает установленные инструменты и генерирует объединённые отчёты с оценками риска и предложениями по исправлению кода.

Переработанная реализация кода Claude с открытым исходным кодом, адаптированная для совместимости с локальными моделями.
Разработчик исправил реализацию открытого кода Claude Code для работы с Ollama и локальными моделями, удалив жёсткие зависимости от клиента Anthropic. Теперь CLI автоматически определяет провайдеров по именам моделей и переменным окружения.

OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude
OpenHelm — это бесплатное локальное приложение для macOS, которое автоматизирует повторяющиеся задачи кодирования в Claude, запуская задания по расписанию, автоматически повторяя неудачные попытки и разбивая работу на части, чтобы избежать ограничений сессий. Оно использует вашу существующую подписку Claude для вызовов LLM.