SWE-rebench-V2リリース:コードエージェントトレーニング向け最大規模のオープン多言語データセット

SWE-rebench-V2リリース詳細
NebiusのR&Dチーム(Ibragimが率いる)は、SWE-rebench-V2を公開しました。彼らはこれを「現在、コーディングエージェントのトレーニング用として世界最大のオープンデータセット」と説明しています。このデータセットは多言語で実行可能であり、大規模な強化学習トレーニングに特化して設計されています。
主な技術的特徴
チームは、大規模なRL環境の抽出を自動化するパイプラインを構築しました。このリリースには以下が含まれます:
- 完全なSWE-rebench-V2データセット
- 詳細な技術レポート
- 論文とデータセットはこちらで入手可能:https://huggingface.co/papers/2602.23866
コミュニティとサポート
チームは、データセットとSWE-rebenchリーダーボードの両方に対して、アクティブなDiscordサポートを維持しています:https://discord.gg/wXYmWpMu。彼らは、LocalLLaMAコミュニティがSWE-rebenchリーダーボードに関する彼らの作業に対して「最も貴重なフィードバック」を提供したと述べており、リーダーボードの作業を継続し、「さらにクールにする」計画があることを確認しています。
研究協力や質問については、IbragimにRedditまたはTwitter(X)のDMで連絡できます:https://x.com/ibragim_bad。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

YouTubeトランスクリプトMCPがClaudeの研究ワークフローを改善
YouTubeトランスクリプトMCPにより、ClaudeはYouTubeリンクからタイムスタンプ付きの完全なトランスクリプトを取得できるようになり、手動でのタブ切り替えやコピー&ペーストが不要になります。ユーザーは、Claudeが実際のトランスクリプトを持っている場合とユーザーの要約だけの場合とでは、回答の質が大幅に向上すると報告しています。

Apfel: macOSでAppleのオンデバイスLLMにアクセスする無料CLIツール
Apfel v0.6.13は、Appleの組み込みLLMをCLIツール、OpenAI互換サーバー、インタラクティブチャットとして公開するSwift 6.3バイナリです。Apple Silicon搭載MacのmacOS 26+に同梱される4,096トークンモデルを使用し、APIキーやコストなしで100%オンデバイスで動作します。

Claude向けの法的MCPサーバーが400万件以上の米国裁判所判例にアクセスを提供
Claude Codeで構築された無料のオープンソースMCPサーバーは、Claude AIに400万件以上の実在する米国裁判所の判例へのアクセスを提供し、判例法検索、引用追跡、Bluebook解析、Clio実務管理、PACER連邦書類へのアクセスなど18のツールを備え、幻覚(hallucination)なしで利用できます。

SendToAI VS Code拡張機能、プロジェクトバンドリングでClaudeの20ファイル制限を解決
SendToAIは、VS Codeの無料拡張機能で、プロジェクト全体を単一のクリップボード貼り付けにまとめ、Claudeの20ファイルアップロード制限を回避します。視覚的なファイル選択、トークンカウント、コスト見積もり、セッション間で持続するプロジェクトノートが含まれています。