Cull: AI画像パイプラインのためのオープンソースデータセットキュレーションエンジン

✍️ OpenClawRadar📅 公開日: May 10, 2026🔗 Source
Cull: AI画像パイプラインのためのオープンソースデータセットキュレーションエンジン
Ad

Cullは、AI画像データセットのための機械キュレーションエンジンで、u/Compunerd3によって構築・保守されています。スクレイピング、分類、キャプション付与、仕分けのパイプライン全体を自動化し、LoRAやファインチューン学習にすぐに使えるSDプロンプト付きのトリアージ済み画像フォルダを出力します。

エンドツーエンドパイプライン

  • スクレイピング: Civitai(.comおよび.red)、X/Twitter、Reddit、Discord、およびgallery-dlがサポートするあらゆるURL(Pixiv、DeviantArt、booru系、ArtStation、Tumblr、FurAffinity/e621、Imgur、Flickr、その他約340サイト)に対応。
  • キュー: 各画像とソース側のプロンプトがローカルキューに投入されます。ソースごとに重複排除を行い、データベースは使用しません。
  • 分類: 複数のLM Studioインスタンス(ローカル)またはGroq(クラウド)を介してビジョン言語モデルを使用——OpenAI互換のエンドポイントなら何でも可。厳格な17フィールドのJSONスキーマにより構造化出力を保証。
  • 仕分け: 保持する画像はカテゴリフォルダに、.txtプロンプトファイルと.vision.json監査レコードとともに格納されます。品質とトピック関連性の2つのスコアゲートがあり、UIで調整可能。
  • ダッシュボード: Flask + Alpine.jsのUIで、開始/停止、ソースのオン/オフ、ギャラリー、プロンプトエディタ、ZIPエクスポート、ソースごとの統計を提供。

ユースケース

作者はCullを300画像のLoRAと10万画像のファインチューンデータセットに使用しました。トピック(例:「女性インフルエンサー」や{artist} style art)を設定し、AUTO_CAPTION_ENABLEDをオンにすれば、あとは待つだけです。プロンプトがないアーカイブの場合は、LOCAL_IMPORT_DIRをJPEGフォルダに指定し、プロンプト要件をオフにして、自動キャプションをオンにすれば、各画像にSDプロンプト、booruタグ、または自然言語キャプションが付与されます。

Ad

技術詳細

  • ビジョンワーカーのプラグイン化: BaseVisionWorkerをサブクラス化して登録。2つのLM Studioエンドポイントが並行して動作;キープアライブワーカーが15秒ごとにpingを送信してアイドルアンロードを防止;オプションのアイドルアンローダーでVRAMを解放。
  • AIアシスタント統合: .claude/skills/にClaude Codeスキルバンドル(cull-helper、lmstudio-vision、metadata-schema)と3つのサブエージェントを同梱——Claude Code、Cursor、Aider、Codexで動作。
  • セルフアップデーター: ダッシュボードにトースト通知が表示され、Updateをクリックするとorigin/mainからプルして再起動。
  • スタック: Python 3.10+、Flask、Alpine.js、Pillow、Playwright(Xスクレイパー)、gallery-dl。シングルマシン、Redis不要、DB不要、Docker不要。
  • ライセンス: MIT。

ロードマップ

計画中:さらなるビジョンワーカーバックエンド、改善された再キューUI、小型ヘッドレスCLI、動画のスクレイピングと分類。

リポジトリ: https://github.com/tlennon-ie/cull | スクリーンショット: https://imgur.com/a/kSvsAW9

📖 全文ソース: r/LocalLLaMA

Ad

👀 See Also

効率的なワークフロー:実行前の計画立案(Claude Code活用)
Tools

効率的なワークフロー:実行前の計画立案(Claude Code活用)

ボリス・タネは、構造化された計画優先アプローチでClaude Codeを活用し、詳細な調査と計画に焦点を当てることで、アーキテクチャの決定に対するコントロールを維持しています。

OpenClawRadar
Kanwas: チームとAIエージェントのためのオープンソース共有コンテキストボード
Tools

Kanwas: チームとAIエージェントのためのオープンソース共有コンテキストボード

Kanwasは、チームとAIエージェントがドキュメント、証拠、決定をライブストリーミングツールコールとともにキャンバス上で共有するオープンソースのマルチプレイヤーワークスペースです。Docker経由でセルフホストでき、YjsとBlockNoteを使用したGitバックアップが可能です。

OpenClawRadar
ローカルLLMエージェントとComfyUIの統合による自然言語バッチ画像生成
Tools

ローカルLLMエージェントとComfyUIの統合による自然言語バッチ画像生成

開発者がローカルのOpenClawエージェントをComfyUIに接続し、自然言語によるバッチ画像生成ワークフローを可能にした方法を共有しています。この統合では、英語のリクエストをComfyUIのワークフローJSONにマッピングし、API通信を処理するカスタムエージェントスキルを使用しています。

OpenClawRadar
オープンソースのClaudeプラグインが、ライブプレビュー付きのインタラクティブなビジュアルチューナーを生成します
Tools

オープンソースのClaudeプラグインが、ライブプレビュー付きのインタラクティブなビジュアルチューナーを生成します

開発者が、Claude CodeでCSS値を微調整するためのスライダーとFigmaスタイルの無限キャンバスを備えた単一HTMLページを生成するオープンソースプラグインを構築しました。このプラグインはソースファイルを読み取り、インタラクティブなキャンバス上で要素を再現し、ライブプレビュー付きで精密な調整を行うコントロールを提供します。

OpenClawRadar