コードセットは、Git履歴からリポジトリ固有のコンテキストを活用して、コーディングエージェントを強化します。

Codesetの機能
Codesetは、git履歴に対してパイプラインを実行し、リポジトリ内に直接配置されるファイルを生成します。これらのファイルには、ファイルごとの過去のバグと根本原因、既知の落とし穴、共同変更の関係性、テストチェックリストが含まれます。コーディングエージェントは、通常のコンテキストウィンドウの一部としてこれらのファイルを読み取ります。RAGやクエリ時のベクトルデータベース、ランタイムインフラストラクチャは不要で、リポジトリ内の他のファイルと同様にエージェントが取得する静的ファイルのみです。
ベンチマーク結果
チームは2つのベンチマークでCodesetをテストしました:
- codeset-gym-python(150タスク、Claude評価と同じサブセット):60.7% → 66%(+5.3パーセンテージポイント)
- SWE-Bench Pro(400のランダムサンプリングタスク):56.5% → 58.5%(+2パーセンテージポイント)
これにより、両方のベンチマークで一貫した改善が示され、codeset-gymに比べてSWE-Bench Proでは改善幅が小さくなりました。codeset-gymベンチマークは公開されており、方法論の検証に利用できる完全なタスクリストと検証ツールが利用可能です。
価格と利用可能性
Codesetはリポジトリごとに5ドルの1回限りの支払いです。無料トライアルにはコードCODESETLAUNCHをご利用ください。完全な評価成果物はhttps://github.com/codeset-ai/codeset-release-evalsで利用可能です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

GANスキル for Claude コード:アイデアを洗練する敵対的AIツール
Claude Codeのスキルである/ganは、敵対的AIの役割を用いて、識別器と生成器の交互のフェーズを通じてアイデアを批評・改善します。強度モード、多言語出力、強制役割選択などの機能は、自己反復を通じて開発されました。

CostClaw: OpenClawエージェント向け無料ローカルコスト追跡ダッシュボード
CostClawは、OpenClawのネイティブフックを介してすべてのLLM呼び出しをキャプチャし、モデルの内訳、セッションごとのコスト、時間ごとの支出チャートを表示するダッシュボードを提供する無料のローカルプラグインです。開発者は、ハートビートエージェントが24時間365日、3分ごとにClaude Sonnetを実行し、月額60ドルのコストがかかっていたことを発見しました。Haikuに切り替えることで、請求額を約65%削減しました。

DocMason:複雑なオフィスファイル向けローカルエージェント知識ベース
DocMasonは、PPTX、DOCX、Excel、PDFなどの複雑なオフィス文書からローカルナレッジベースを構築するリポジトリネイティブなエージェントアプリです。CodexまたはClaude Code内で完全に動作し、文書構造を維持しながら、出典を追跡可能な回答を提供します。

iknowkungfu スキルは、OpenClawの使用状況を分析して、不足しているスキルを推奨します
iknowkungfuは、エージェントのワークスペース、メモリファイル、会話ログをスキャンし、実際の使用パターンに基づいて不足しているスキルを特定する新しいOpenClawスキルです。ワークフローに紐づいた信頼スコアと理由付きで具体的な推奨を提供します。