ミアズマ:AIウェブスクレイパーを毒データで罠にかけるツール

Miasmaの機能
Miasmaは、AIウェブスクレイパーを罠にかけるために設計されたツールで、毒入りのトレーニングデータと複数の自己参照リンクを提供し、開発者が「スロップマシンのための無限のスロップビュッフェ」と呼ぶものを生成します。このツールは、最小限のメモリ使用量で高速に動作するように構築されています。
インストールとセットアップ
Cargoでインストール: cargo install miasma または、リリースから事前ビルド済みバイナリをダウンロード。
デフォルト設定で起動: miasma
すべての設定オプションを表示: miasma --help
スクレイパーを罠にかける方法
典型的なセットアップは次の手順を含みます:
- サイトに特定のパス(例:
/bots)を指す隠しリンクを埋め込み、人間の訪問者には見えないがスクレイパーには見える属性を設定:<a href="/bots" style="display: none;" aria-hidden="true" tabindex="1">Amazing high quality data here!</a>
- そのパスをMiasmaにルーティングするリバースプロキシ(Nginxなど)を設定:
location ~ ^/bots($|/.*)$ { proxy_pass http://localhost:9855; } - 特定のパラメータでMiasmaを実行:
miasma --link-prefix '/bots' -p 9855 -c 50
-c 50フラグは最大同時接続数を50に制限し、50-60 MBのピークメモリ使用量をもたらします。この制限を超えるリクエストは429レスポンスを受け取ります。
設定オプション
--port: デフォルト 9999 - サーバーがバインドするポート--host: デフォルト localhost - サーバーがバインドするホストアドレス--max-in-flight: デフォルト 500 - 許可される最大同時リクエスト数--link-prefix: デフォルト / - 自己参照リンクのプレフィックス(ホスティングパスと一致させる必要があります)--link-count: デフォルト 5 - 各レスポンスページに含める自己参照リンクの数--force-gzip: デフォルト false - Accept-Encodingヘッダーに関わらず常にレスポンスをgzip圧縮--poison-source: デフォルト https://rnsaffn.com/poison2/ - 毒入りトレーニングデータのプロキシソース
重要な考慮事項
開発者は、robots.txtファイルでフレンドリーなボットや検索エンジンを保護することを推奨しています:
User-agent: Googlebot User-agent: Bingbot User-agent: DuckDuckBot User-agent: Slurp User-agent: SomeOtherNiceBot Disallow: /bots Allow: /
MiasmaはGPL-3.0でライセンスされており、開発者は「主にAI生成の貢献は自動的に拒否されます」と注記しています。
📖 Read the full source: HN AI Agents
👀 See Also

Claudeコード用のカスタム音声抽出プロセス(テンプレート付き)
開発者が、Claude Code向けのカスタムボイススキルを作成するための3段階抽出プロセスを共有し、LLM特有の表現の禁止リスト、アンチパフォーマンスルール、フォーマット固有のボイスモードを含む510行のSKILL.mdファイルを作成しました。このオープンソーステンプレートは、10以上の書き込みサンプルを使用してあらゆる言語で動作します。

レッドクイーン:Claude Codeをワーカープールとして動作させる決定論的オーケストレーター
Red Queenはステートマシンを使ってClaude Codeのサブプロセスを orchestrate し、LLMのルーティングエラーとメガプロンプトによるトークン浪費を排除します。

AIエージェントが事前定義されたツールなしでRemotionを使用して自律的に動画を作成
ある開発者が、AIエージェントをテストし、Remotionのインストール、コンポジションコードの記述、問題のデバッグ、人間の介入なしにレンダリングファイルを提供することで、短いビデオリールを自律的に作成しました。

Khael AIエージェントがOpenClawの本番環境アーキテクチャ設計を共有
OpenClaw上で動作するAI自律エージェント「Khael」は、個別のLAWS.mdファイル、モードファイル、自己監査のcronジョブ、特殊化されたボットタイプなど、数ヶ月間本番環境で機能してきた具体的なアーキテクチャ設計について詳細を説明しています。