カーパシーの自律研究プロジェクト:AIエージェントが夜通しLLM学習実験を実行

カーパシーの自動研究プロジェクトの概要
アンドレイ・カーパシーは、「AI研究者イン・ザ・ループ」の概念を示す「autoresearch」という小さなリポジトリを公開しました。このシステムは、AIエージェントを使用して、一晩中単一のGPUでLLM学習実験を自律的に実行します。
仕組み
エージェントは次のワークフローに従います:
train.pyファイルを継続的に編集する- 5分間のナノチャット学習実験を実行する
- 検証ビット・パー・バイト(
val_bpb)メトリックが改善したかどうかを確認する - このサイクルを睡眠中に繰り返す
セットアップと構成
このプロジェクトは非常に最小限のセットアップです:
- ハードウェア: 1つのGPU
- ファイル: 1つのメインファイル
- メトリック: 1つの主要メトリック(
val_bpb)
人間はprogram.mdに研究組織のプロンプトを書き、エージェントがコードの反復を処理します。
実験のスループット
実験ごとに固定の5分の予算で、システムは1時間あたり約12回の実験を実行できます。
このアプローチは、AIエージェントがパラメータ空間と学習構成を自律的に探索できる自動化された研究の実用的な実装を示しており、言語モデルを扱う開発者の実験サイクルを加速させる可能性があります。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

Claude CodeがNVIDIA NIMゲートウェイ経由で240以上のモデルをサポート — エージェンティックコーディング向けNemotron-3 120Bを含む
Claude Code は、/model コマンドでセッション中に 240 以上の NVIDIA NIM モデルに切り替え可能。Nemotron-3 Super 120B 思考型バリアントは、複数ファイルのリファクタリングやエージェントタスクで強力な結果を示している。

SuperContext:AIコーディングエージェントのための永続メモリフレームワーク
SuperContextは、大規模な指示文書の代わりに構造化されたターゲットファイルを通じて、ClaudeなどのAIコーディングツールに永続的なメモリを提供するオープンソースフレームワークです。手動セットアップなしで約10分でシステムを構築する実行可能なプロンプトが含まれています。

Freddy MCPサーバーがヘッドレスサインインでウェアラブルをAIエージェントに接続
Freddyは、ウェアラブル(Polar、Oura、Withings、Suunto、Intervals.icu、Hevy、およびベータ版のWHOOP、Strava、Dexcom)をClaude Code、ChatGPT、Notion AIなどのAIクライアントにOAuth経由で接続する個人用MCPサーバーです。新しいヘッドレスサインインにより、自律エージェントのスケジュールワークフローが可能になりました。

Codiff v0.1.0: LLM生成コードレビュー用のローカル差分ビューア
Codiff v0.1.0は、ローカルのGit差分をレビューするための高速でミニマルなデスクトップアプリです。LLMウォークスルーモードと、Markdownとしてコピー可能なインラインコメントを備えています。