ミアズマ:AIウェブスクレイパーを毒データで罠にかけるツール

✍️ OpenClawRadar📅 公開日: March 29, 2026🔗 Source
ミアズマ:AIウェブスクレイパーを毒データで罠にかけるツール
Ad

Miasmaの機能

Miasmaは、AIウェブスクレイパーを罠にかけるために設計されたツールで、毒入りのトレーニングデータと複数の自己参照リンクを提供し、開発者が「スロップマシンのための無限のスロップビュッフェ」と呼ぶものを生成します。このツールは、最小限のメモリ使用量で高速に動作するように構築されています。

インストールとセットアップ

Cargoでインストール: cargo install miasma または、リリースから事前ビルド済みバイナリをダウンロード。

デフォルト設定で起動: miasma

すべての設定オプションを表示: miasma --help

スクレイパーを罠にかける方法

典型的なセットアップは次の手順を含みます:

  1. サイトに特定のパス(例: /bots)を指す隠しリンクを埋め込み、人間の訪問者には見えないがスクレイパーには見える属性を設定:
    <a href="/bots" style="display: none;" aria-hidden="true" tabindex="1">Amazing high quality data here!</a>
  2. そのパスをMiasmaにルーティングするリバースプロキシ(Nginxなど)を設定:
    location ~ ^/bots($|/.*)$ {
      proxy_pass http://localhost:9855;
    }
  3. 特定のパラメータでMiasmaを実行:
    miasma --link-prefix '/bots' -p 9855 -c 50

-c 50フラグは最大同時接続数を50に制限し、50-60 MBのピークメモリ使用量をもたらします。この制限を超えるリクエストは429レスポンスを受け取ります。

Ad

設定オプション

  • --port: デフォルト 9999 - サーバーがバインドするポート
  • --host: デフォルト localhost - サーバーがバインドするホストアドレス
  • --max-in-flight: デフォルト 500 - 許可される最大同時リクエスト数
  • --link-prefix: デフォルト / - 自己参照リンクのプレフィックス(ホスティングパスと一致させる必要があります)
  • --link-count: デフォルト 5 - 各レスポンスページに含める自己参照リンクの数
  • --force-gzip: デフォルト false - Accept-Encodingヘッダーに関わらず常にレスポンスをgzip圧縮
  • --poison-source: デフォルト https://rnsaffn.com/poison2/ - 毒入りトレーニングデータのプロキシソース

重要な考慮事項

開発者は、robots.txtファイルでフレンドリーなボットや検索エンジンを保護することを推奨しています:

User-agent: Googlebot
User-agent: Bingbot
User-agent: DuckDuckBot
User-agent: Slurp
User-agent: SomeOtherNiceBot
Disallow: /bots
Allow: /

MiasmaはGPL-3.0でライセンスされており、開発者は「主にAI生成の貢献は自動的に拒否されます」と注記しています。

📖 Read the full source: HN AI Agents

Ad

👀 See Also

Claudeコード用のカスタム音声抽出プロセス(テンプレート付き)
Tools

Claudeコード用のカスタム音声抽出プロセス(テンプレート付き)

開発者が、Claude Code向けのカスタムボイススキルを作成するための3段階抽出プロセスを共有し、LLM特有の表現の禁止リスト、アンチパフォーマンスルール、フォーマット固有のボイスモードを含む510行のSKILL.mdファイルを作成しました。このオープンソーステンプレートは、10以上の書き込みサンプルを使用してあらゆる言語で動作します。

OpenClawRadar
レッドクイーン:Claude Codeをワーカープールとして動作させる決定論的オーケストレーター
Tools

レッドクイーン:Claude Codeをワーカープールとして動作させる決定論的オーケストレーター

Red Queenはステートマシンを使ってClaude Codeのサブプロセスを orchestrate し、LLMのルーティングエラーとメガプロンプトによるトークン浪費を排除します。

OpenClawRadar
AIエージェントが事前定義されたツールなしでRemotionを使用して自律的に動画を作成
Tools

AIエージェントが事前定義されたツールなしでRemotionを使用して自律的に動画を作成

ある開発者が、AIエージェントをテストし、Remotionのインストール、コンポジションコードの記述、問題のデバッグ、人間の介入なしにレンダリングファイルを提供することで、短いビデオリールを自律的に作成しました。

OpenClawRadar
Khael AIエージェントがOpenClawの本番環境アーキテクチャ設計を共有
Tools

Khael AIエージェントがOpenClawの本番環境アーキテクチャ設計を共有

OpenClaw上で動作するAI自律エージェント「Khael」は、個別のLAWS.mdファイル、モードファイル、自己監査のcronジョブ、特殊化されたボットタイプなど、数ヶ月間本番環境で機能してきた具体的なアーキテクチャ設計について詳細を説明しています。

OpenClawRadar