Cull: AI画像パイプラインのためのオープンソースデータセットキュレーションエンジン

Cullは、AI画像データセットのための機械キュレーションエンジンで、u/Compunerd3によって構築・保守されています。スクレイピング、分類、キャプション付与、仕分けのパイプライン全体を自動化し、LoRAやファインチューン学習にすぐに使えるSDプロンプト付きのトリアージ済み画像フォルダを出力します。
エンドツーエンドパイプライン
- スクレイピング: Civitai(.comおよび.red)、X/Twitter、Reddit、Discord、およびgallery-dlがサポートするあらゆるURL(Pixiv、DeviantArt、booru系、ArtStation、Tumblr、FurAffinity/e621、Imgur、Flickr、その他約340サイト)に対応。
- キュー: 各画像とソース側のプロンプトがローカルキューに投入されます。ソースごとに重複排除を行い、データベースは使用しません。
- 分類: 複数のLM Studioインスタンス(ローカル)またはGroq(クラウド)を介してビジョン言語モデルを使用——OpenAI互換のエンドポイントなら何でも可。厳格な17フィールドのJSONスキーマにより構造化出力を保証。
- 仕分け: 保持する画像はカテゴリフォルダに、.txtプロンプトファイルと.vision.json監査レコードとともに格納されます。品質とトピック関連性の2つのスコアゲートがあり、UIで調整可能。
- ダッシュボード: Flask + Alpine.jsのUIで、開始/停止、ソースのオン/オフ、ギャラリー、プロンプトエディタ、ZIPエクスポート、ソースごとの統計を提供。
ユースケース
作者はCullを300画像のLoRAと10万画像のファインチューンデータセットに使用しました。トピック(例:「女性インフルエンサー」や{artist} style art)を設定し、AUTO_CAPTION_ENABLEDをオンにすれば、あとは待つだけです。プロンプトがないアーカイブの場合は、LOCAL_IMPORT_DIRをJPEGフォルダに指定し、プロンプト要件をオフにして、自動キャプションをオンにすれば、各画像にSDプロンプト、booruタグ、または自然言語キャプションが付与されます。
技術詳細
- ビジョンワーカーのプラグイン化:
BaseVisionWorkerをサブクラス化して登録。2つのLM Studioエンドポイントが並行して動作;キープアライブワーカーが15秒ごとにpingを送信してアイドルアンロードを防止;オプションのアイドルアンローダーでVRAMを解放。 - AIアシスタント統合:
.claude/skills/にClaude Codeスキルバンドル(cull-helper、lmstudio-vision、metadata-schema)と3つのサブエージェントを同梱——Claude Code、Cursor、Aider、Codexで動作。 - セルフアップデーター: ダッシュボードにトースト通知が表示され、Updateをクリックするとorigin/mainからプルして再起動。
- スタック: Python 3.10+、Flask、Alpine.js、Pillow、Playwright(Xスクレイパー)、gallery-dl。シングルマシン、Redis不要、DB不要、Docker不要。
- ライセンス: MIT。
ロードマップ
計画中:さらなるビジョンワーカーバックエンド、改善された再キューUI、小型ヘッドレスCLI、動画のスクレイピングと分類。
リポジトリ: https://github.com/tlennon-ie/cull | スクリーンショット: https://imgur.com/a/kSvsAW9
📖 全文ソース: r/LocalLLaMA
👀 See Also

効率的なワークフロー:実行前の計画立案(Claude Code活用)
ボリス・タネは、構造化された計画優先アプローチでClaude Codeを活用し、詳細な調査と計画に焦点を当てることで、アーキテクチャの決定に対するコントロールを維持しています。

Kanwas: チームとAIエージェントのためのオープンソース共有コンテキストボード
Kanwasは、チームとAIエージェントがドキュメント、証拠、決定をライブストリーミングツールコールとともにキャンバス上で共有するオープンソースのマルチプレイヤーワークスペースです。Docker経由でセルフホストでき、YjsとBlockNoteを使用したGitバックアップが可能です。

ローカルLLMエージェントとComfyUIの統合による自然言語バッチ画像生成
開発者がローカルのOpenClawエージェントをComfyUIに接続し、自然言語によるバッチ画像生成ワークフローを可能にした方法を共有しています。この統合では、英語のリクエストをComfyUIのワークフローJSONにマッピングし、API通信を処理するカスタムエージェントスキルを使用しています。

オープンソースのClaudeプラグインが、ライブプレビュー付きのインタラクティブなビジュアルチューナーを生成します
開発者が、Claude CodeでCSS値を微調整するためのスライダーとFigmaスタイルの無限キャンバスを備えた単一HTMLページを生成するオープンソースプラグインを構築しました。このプラグインはソースファイルを読み取り、インタラクティブなキャンバス上で要素を再現し、ライブプレビュー付きで精密な調整を行うコントロールを提供します。