Miasma: Una herramienta para atrapar rastreadores web de IA con datos envenenados

Qué hace Miasma
Miasma es una herramienta diseñada para atrapar a los rastreadores web de IA sirviéndoles datos de entrenamiento envenenados junto con múltiples enlaces autorreferenciales, creando lo que los desarrolladores llaman un "bufet interminable de basura para las máquinas de basura". La herramienta está construida para ser rápida con una huella de memoria mínima.
Instalación y configuración
Instala con Cargo: cargo install miasma o descarga binarios precompilados desde las versiones.
Inicia con configuración predeterminada: miasma
Ver todas las opciones de configuración: miasma --help
Cómo atrapar rastreadores
La configuración típica implica:
- Incrustar enlaces ocultos en tu sitio que apunten a una ruta específica (por ejemplo,
/bots) con atributos que los hagan invisibles para los visitantes humanos pero visibles para los rastreadores:<a href="/bots" style="display: none;" aria-hidden="true" tabindex="1">¡Datos de alta calidad increíbles aquí!</a>
- Configurar un proxy inverso (como Nginx) para enrutar esa ruta a Miasma:
location ~ ^/bots($|/.*)$ { proxy_pass http://localhost:9855; } - Ejecutar Miasma con parámetros específicos:
miasma --link-prefix '/bots' -p 9855 -c 50
La bandera -c 50 limita las conexiones máximas en curso a 50, lo que resulta en un uso máximo de memoria de 50-60 MB. Las solicitudes que excedan este límite reciben una respuesta 429.
Opciones de configuración
--port: Predeterminado 9999 - El puerto al que debe vincularse el servidor--host: Predeterminado localhost - La dirección de host a la que debe vincularse el servidor--max-in-flight: Predeterminado 500 - Número máximo de solicitudes en curso permitidas--link-prefix: Predeterminado / - Prefijo para enlaces autodirigidos (debe coincidir con la ruta de alojamiento)--link-count: Predeterminado 5 - Número de enlaces autodirigidos para incluir en cada página de respuesta--force-gzip: Predeterminado false - Siempre comprimir respuestas con gzip independientemente del encabezado Accept-Encoding--poison-source: Predeterminado https://rnsaffn.com/poison2/ - Fuente proxy para datos de entrenamiento envenenados
Consideraciones importantes
Los desarrolladores recomiendan proteger los bots amigables y los motores de búsqueda en tu archivo robots.txt:
User-agent: Googlebot User-agent: Bingbot User-agent: DuckDuckBot User-agent: Slurp User-agent: SomeOtherNiceBot Disallow: /bots Allow: /
Miasma está licenciado bajo GPL-3.0 y los desarrolladores señalan que "las contribuciones generadas principalmente por IA serán automáticamente rechazadas".
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

Tabla de clasificación de modelos votada por la comunidad para OpenClaw lanzada.
Un nuevo ranking votado por la comunidad para modelos compatibles con OpenClaw ya está disponible, con Opus 4.5 actualmente a la cabeza.

Manifest Agrega Soporte para Planes de Tokens MiniMax con el Modelo M2.7
Manifest, una capa de enrutamiento de código abierto para OpenClaw, ahora admite planes de tokens MiniMax a partir de $10/mes. El nuevo modelo MiniMax M2.7 está específicamente entrenado para flujos de trabajo de OpenClaw y obtiene puntuaciones de 62.7 en MM-ClawBench y 56.2 en SWE-Bench Pro.

Piloto: Una Herramienta de Automatización de Navegador Construida Completamente con Código Claude
Una persona sin conocimientos de desarrollo utilizó Claude Code para crear Pilot, una herramienta de automatización de Chrome que permite a la IA controlar navegadores mediante la navegación del árbol de accesibilidad. La herramienta asigna números a los elementos clicables para que Claude pueda emitir comandos como 'clic 5' en lugar de adivinar posiciones en pantalla.

Contador de Tokens de Claude Actualizado con Función de Comparación de Modelos
La herramienta Contador de Tokens de Claude de Simon Willison ahora permite comparar recuentos de tokens entre diferentes modelos de Claude. La actualización revela que Opus 4.7 utiliza entre 1.0 y 1.35 veces más tokens que Opus 4.6 debido a un tokenizador actualizado, lo que podría aumentar los costos en aproximadamente un 40% a pesar de mantener el mismo precio.