コードセットは、Git履歴からリポジトリ固有のコンテキストを活用して、コーディングエージェントを強化します。

✍️ OpenClawRadar📅 公開日: April 17, 2026🔗 Source

コードセットは、Git履歴からリポジトリ固有のコンテキストを活用して、コーディングエージェントを強化します。

Ad

Codesetの機能

Codesetは、git履歴に対してパイプラインを実行し、リポジトリ内に直接配置されるファイルを生成します。これらのファイルには、ファイルごとの過去のバグと根本原因、既知の落とし穴、共同変更の関係性、テストチェックリストが含まれます。コーディングエージェントは、通常のコンテキストウィンドウの一部としてこれらのファイルを読み取ります。RAGやクエリ時のベクトルデータベース、ランタイムインフラストラクチャは不要で、リポジトリ内の他のファイルと同様にエージェントが取得する静的ファイルのみです。

ベンチマーク結果

チームは2つのベンチマークでCodesetをテストしました：

codeset-gym-python（150タスク、Claude評価と同じサブセット）：60.7% → 66%（+5.3パーセンテージポイント）
SWE-Bench Pro（400のランダムサンプリングタスク）：56.5% → 58.5%（+2パーセンテージポイント）

これにより、両方のベンチマークで一貫した改善が示され、codeset-gymに比べてSWE-Bench Proでは改善幅が小さくなりました。codeset-gymベンチマークは公開されており、方法論の検証に利用できる完全なタスクリストと検証ツールが利用可能です。

価格と利用可能性

Codesetはリポジトリごとに5ドルの1回限りの支払いです。無料トライアルにはコードCODESETLAUNCHをご利用ください。完全な評価成果物はhttps://github.com/codeset-ai/codeset-release-evalsで利用可能です。

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

RAGとAIエージェント開発のための3つのリポジトリ

RAGとAIエージェント開発のための3つのリポジトリ

Redditの投稿では、RAGとAIエージェントを構築する開発者向けに3つのリポジトリが紹介されています：エージェントメモリ用のmemvid、RAGパイプライン用のllama_index、コーディングアシスタント用のContinueです。著者は、純粋なRAGは知識検索に最適であり、メモリシステムはエージェントに適しており、実際のツールではハイブリッドアプローチが一般的であると指摘しています。

Apr 17, 2026, 04:45 PM UTC

コンテキストモードMCPサーバーがClaudeのコードコンテキスト使用量を98％削減

コンテキストモードMCPサーバーがClaudeのコードコンテキスト使用量を98％削減

コンテキストモードは、Claude Codeのコンテキスト消費量を315KBから5.4KBに削減するMCPサーバーです。ツール出力をサンドボックス化することで実現し、10の言語ランタイムをサポートし、全文検索機能を備えたナレッジベースを含みます。

Feb 28, 2026, 05:45 PM UTC

AIコーディングエージェントのための再帰的自己改善フレームワーク（Claude Code使用）

AIコーディングエージェントのための再帰的自己改善フレームワーク（Claude Code使用）

オープンソースのフレームワークにより、AIコーディングエージェントがClaude Codeを使用して再帰的に自己改善できるようになります。このシステムはエージェントの実行トレースを分析し、失敗パターンを特定して修正を実装し、1回のテストサイクルで25%の性能向上を達成しました。

Mar 28, 2026, 05:45 PM UTC

「簡潔さ」がClaude Code圧縮ベンチマークで原始人プラグインを破る

「簡潔さ」がClaude Code圧縮ベンチマークで原始人プラグインを破る

24のプロンプトを使ったベンチマークで、Claude Codeの「caveman」圧縮プラグインが、「簡潔に」と前置きするのとほぼ同じトークン数と品質を生み出すことが示された。しかし、プラグインの一貫した出力形状と安全ルールによるエスケープ機能は、構造的な利点を提供する。

Apr 30, 2026, 04:16 AM UTC