Miasma: Una herramienta para atrapar rastreadores web de IA con datos envenenados

✍️ OpenClawRadar📅 Publicado: 29 de marzo de 2026🔗 Source
Miasma: Una herramienta para atrapar rastreadores web de IA con datos envenenados
Ad

Qué hace Miasma

Miasma es una herramienta diseñada para atrapar a los rastreadores web de IA sirviéndoles datos de entrenamiento envenenados junto con múltiples enlaces autorreferenciales, creando lo que los desarrolladores llaman un "bufet interminable de basura para las máquinas de basura". La herramienta está construida para ser rápida con una huella de memoria mínima.

Instalación y configuración

Instala con Cargo: cargo install miasma o descarga binarios precompilados desde las versiones.

Inicia con configuración predeterminada: miasma

Ver todas las opciones de configuración: miasma --help

Cómo atrapar rastreadores

La configuración típica implica:

  1. Incrustar enlaces ocultos en tu sitio que apunten a una ruta específica (por ejemplo, /bots) con atributos que los hagan invisibles para los visitantes humanos pero visibles para los rastreadores:
    <a href="/bots" style="display: none;" aria-hidden="true" tabindex="1">¡Datos de alta calidad increíbles aquí!</a>
  2. Configurar un proxy inverso (como Nginx) para enrutar esa ruta a Miasma:
    location ~ ^/bots($|/.*)$ {
      proxy_pass http://localhost:9855;
    }
  3. Ejecutar Miasma con parámetros específicos:
    miasma --link-prefix '/bots' -p 9855 -c 50

La bandera -c 50 limita las conexiones máximas en curso a 50, lo que resulta en un uso máximo de memoria de 50-60 MB. Las solicitudes que excedan este límite reciben una respuesta 429.

Ad

Opciones de configuración

  • --port: Predeterminado 9999 - El puerto al que debe vincularse el servidor
  • --host: Predeterminado localhost - La dirección de host a la que debe vincularse el servidor
  • --max-in-flight: Predeterminado 500 - Número máximo de solicitudes en curso permitidas
  • --link-prefix: Predeterminado / - Prefijo para enlaces autodirigidos (debe coincidir con la ruta de alojamiento)
  • --link-count: Predeterminado 5 - Número de enlaces autodirigidos para incluir en cada página de respuesta
  • --force-gzip: Predeterminado false - Siempre comprimir respuestas con gzip independientemente del encabezado Accept-Encoding
  • --poison-source: Predeterminado https://rnsaffn.com/poison2/ - Fuente proxy para datos de entrenamiento envenenados

Consideraciones importantes

Los desarrolladores recomiendan proteger los bots amigables y los motores de búsqueda en tu archivo robots.txt:

User-agent: Googlebot
User-agent: Bingbot
User-agent: DuckDuckBot
User-agent: Slurp
User-agent: SomeOtherNiceBot
Disallow: /bots
Allow: /

Miasma está licenciado bajo GPL-3.0 y los desarrolladores señalan que "las contribuciones generadas principalmente por IA serán automáticamente rechazadas".

📖 Leer la fuente completa: HN AI Agents

Ad

👀 Ver también

Tabla de clasificación de modelos votada por la comunidad para OpenClaw lanzada.
Herramientas

Tabla de clasificación de modelos votada por la comunidad para OpenClaw lanzada.

Un nuevo ranking votado por la comunidad para modelos compatibles con OpenClaw ya está disponible, con Opus 4.5 actualmente a la cabeza.

OpenClawRadar
Manifest Agrega Soporte para Planes de Tokens MiniMax con el Modelo M2.7
Herramientas

Manifest Agrega Soporte para Planes de Tokens MiniMax con el Modelo M2.7

Manifest, una capa de enrutamiento de código abierto para OpenClaw, ahora admite planes de tokens MiniMax a partir de $10/mes. El nuevo modelo MiniMax M2.7 está específicamente entrenado para flujos de trabajo de OpenClaw y obtiene puntuaciones de 62.7 en MM-ClawBench y 56.2 en SWE-Bench Pro.

OpenClawRadar
Piloto: Una Herramienta de Automatización de Navegador Construida Completamente con Código Claude
Herramientas

Piloto: Una Herramienta de Automatización de Navegador Construida Completamente con Código Claude

Una persona sin conocimientos de desarrollo utilizó Claude Code para crear Pilot, una herramienta de automatización de Chrome que permite a la IA controlar navegadores mediante la navegación del árbol de accesibilidad. La herramienta asigna números a los elementos clicables para que Claude pueda emitir comandos como 'clic 5' en lugar de adivinar posiciones en pantalla.

OpenClawRadar
Contador de Tokens de Claude Actualizado con Función de Comparación de Modelos
Herramientas

Contador de Tokens de Claude Actualizado con Función de Comparación de Modelos

La herramienta Contador de Tokens de Claude de Simon Willison ahora permite comparar recuentos de tokens entre diferentes modelos de Claude. La actualización revela que Opus 4.7 utiliza entre 1.0 y 1.35 veces más tokens que Opus 4.6 debido a un tokenizador actualizado, lo que podría aumentar los costos en aproximadamente un 40% a pesar de mantener el mismo precio.

OpenClawRadar