SWE-rebench-V2 publié : le plus grand ensemble de données multilingues ouvert pour l'entraînement d'agents de code

Détails de la publication de SWE-rebench-V2
L'équipe de R&D de Nebius, dirigée par Ibragim, a publié SWE-rebench-V2, qu'ils décrivent comme "actuellement le plus grand ensemble de données ouvert au monde pour l'entraînement d'agents de codage". L'ensemble de données est multilingue et exécutable, conçu spécifiquement pour l'entraînement à grande échelle en apprentissage par renforcement.
Caractéristiques techniques clés
L'équipe a construit un pipeline automatisé pour extraire des environnements d'apprentissage par renforcement à grande échelle. Cette publication comprend :
- L'ensemble complet de données SWE-rebench-V2
- Un rapport technique détaillé
- L'article et l'ensemble de données disponibles à : https://huggingface.co/papers/2602.23866
Communauté et support
L'équipe maintient un support Discord actif pour l'ensemble de données et leur classement SWE-rebench à : https://discord.gg/wXYmWpMu. Ils notent que la communauté LocalLLaMA a fourni "les retours les plus précieux" pour leur travail avec le classement SWE-rebench et confirment qu'ils continuent à travailler sur le classement avec des plans pour "le rendre encore plus cool".
Pour des collaborations de recherche ou des questions, Ibragim peut être contacté par message privé sur Reddit ou Twitter (X) à : https://x.com/ibragim_bad.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Le serveur LocalSynapse MCP ajoute la prise en charge de macOS et des améliorations de la recherche
LocalSynapse, un serveur MCP hors ligne pour rechercher dans des documents locaux, prend désormais en charge macOS et inclut des corrections pour les requêtes de recherche à plusieurs mots. Le développeur a mis en œuvre des améliorations basées sur les retours, notamment un boost de clic ajusté à la position et une décroissance temporelle comme promotion.

MonClaw : Une Implémentation Minimale d'OpenClaw Utilisant le SDK OpenCode
Une alternative légère à OpenClaw construite sur le SDK OpenCode, avec prise en charge de Telegram et WhatsApp.

Cadre d'Équipe de Recherche en Boîte pour Claude Code Utilisant une Architecture Multi-Agents
Un développeur a créé un cadre de recherche multi-agents pour Claude Code qui utilise Opus 4.6 pour coordonner des agents spécialisés via un plugin appelé research-clab. Le cadre se déploie via un processus guidé de questions-réponses et comprend 11 compétences, des définitions d'agents et des répertoires structurés pour gérer des projets de recherche complexes.

Mozilla Thunderbolt : Client IA d'entreprise open source pour infrastructure auto-hébergée
Mozilla a annoncé Thunderbolt, un client IA open-source sous licence MPL 2.0 conçu pour permettre aux organisations de déployer une infrastructure IA auto-hébergée avec choix de modèles, intégration de données d'entreprise et applications natives multiplateformes.