カーパシーの自律研究プロジェクト:AIエージェントが夜通しLLM学習実験を実行

✍️ OpenClawRadar📅 公開日: March 9, 2026🔗 Source
カーパシーの自律研究プロジェクト:AIエージェントが夜通しLLM学習実験を実行
Ad

カーパシーの自動研究プロジェクトの概要

アンドレイ・カーパシーは、「AI研究者イン・ザ・ループ」の概念を示す「autoresearch」という小さなリポジトリを公開しました。このシステムは、AIエージェントを使用して、一晩中単一のGPUでLLM学習実験を自律的に実行します。

仕組み

エージェントは次のワークフローに従います:

  • train.pyファイルを継続的に編集する
  • 5分間のナノチャット学習実験を実行する
  • 検証ビット・パー・バイト(val_bpb)メトリックが改善したかどうかを確認する
  • このサイクルを睡眠中に繰り返す

セットアップと構成

このプロジェクトは非常に最小限のセットアップです:

  • ハードウェア: 1つのGPU
  • ファイル: 1つのメインファイル
  • メトリック: 1つの主要メトリック(val_bpb

人間はprogram.mdに研究組織のプロンプトを書き、エージェントがコードの反復を処理します。

実験のスループット

実験ごとに固定の5分の予算で、システムは1時間あたり約12回の実験を実行できます。

このアプローチは、AIエージェントがパラメータ空間と学習構成を自律的に探索できる自動化された研究の実用的な実装を示しており、言語モデルを扱う開発者の実験サイクルを加速させる可能性があります。

📖 完全なソースを読む: r/LocalLLaMA

Ad

👀 See Also

Claude CodeがNVIDIA NIMゲートウェイ経由で240以上のモデルをサポート — エージェンティックコーディング向けNemotron-3 120Bを含む
Tools

Claude CodeがNVIDIA NIMゲートウェイ経由で240以上のモデルをサポート — エージェンティックコーディング向けNemotron-3 120Bを含む

Claude Code は、/model コマンドでセッション中に 240 以上の NVIDIA NIM モデルに切り替え可能。Nemotron-3 Super 120B 思考型バリアントは、複数ファイルのリファクタリングやエージェントタスクで強力な結果を示している。

OpenClawRadar
SuperContext:AIコーディングエージェントのための永続メモリフレームワーク
Tools

SuperContext:AIコーディングエージェントのための永続メモリフレームワーク

SuperContextは、大規模な指示文書の代わりに構造化されたターゲットファイルを通じて、ClaudeなどのAIコーディングツールに永続的なメモリを提供するオープンソースフレームワークです。手動セットアップなしで約10分でシステムを構築する実行可能なプロンプトが含まれています。

OpenClawRadar
Freddy MCPサーバーがヘッドレスサインインでウェアラブルをAIエージェントに接続
Tools

Freddy MCPサーバーがヘッドレスサインインでウェアラブルをAIエージェントに接続

Freddyは、ウェアラブル(Polar、Oura、Withings、Suunto、Intervals.icu、Hevy、およびベータ版のWHOOP、Strava、Dexcom)をClaude Code、ChatGPT、Notion AIなどのAIクライアントにOAuth経由で接続する個人用MCPサーバーです。新しいヘッドレスサインインにより、自律エージェントのスケジュールワークフローが可能になりました。

OpenClawRadar
Codiff v0.1.0: LLM生成コードレビュー用のローカル差分ビューア
Tools

Codiff v0.1.0: LLM生成コードレビュー用のローカル差分ビューア

Codiff v0.1.0は、ローカルのGit差分をレビューするための高速でミニマルなデスクトップアプリです。LLMウォークスルーモードと、Markdownとしてコピー可能なインラインコメントを備えています。

OpenClawRadar