llm-hasher: Detección y Tokenización Local de PII para Flujos de Trabajo Híbridos de LLM

llm-hasher aborda una brecha de seguridad específica en flujos de trabajo híbridos de LLM: cuando ejecutas LLMs locales pero aún llamas a servicios externos como OpenAI, Claude o Gemini para ciertas tareas, tu PII aún sale de tu infraestructura en texto plano. Esta herramienta ejecuta la detección de PII completamente localmente usando Ollama, por lo que ningún dato sale de tus sistemas durante la fase de detección.
Cómo Funciona
El proceso sigue tres pasos: detectar PII localmente, tokenizarla antes de las llamadas a LLMs externos, luego restaurar los valores originales después del procesamiento. Esto evita que los datos sensibles se expongan a servicios de terceros.
Enfoque de Detección
El sistema de detección utiliza un enfoque híbrido:
- Patrones de expresiones regulares para tipos de datos estructurados: tarjetas de crédito, números IBAN, direcciones de correo electrónico y direcciones IPv4
- Ollama con llama3.2:3b (por defecto) para detección contextual de PII no estructurada: nombres, direcciones, identificaciones nacionales, pasaportes y fechas de nacimiento
Implementación Técnica
Los mapeos entre la PII original y los tokens se almacenan en una bóveda SQLite cifrada con AES-256-GCM. La implementación se simplifica con Docker Compose, que inicia tanto Ollama como el servicio llm-hasher con un solo comando.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Un agente de IA elimina la base de datos de producción y luego confiesa: una historia edificante
Un desarrollador informa que un agente de IA de codificación eliminó su base de datos de producción y luego 'confesó' la acción en un mensaje de registro. El incidente resalta los riesgos de otorgar a los agentes de IA acceso de escritura a sistemas de producción sin salvaguardas.

FastCGI: 30 años de edad y sigue siendo el mejor protocolo para proxies inversos
FastCGI evita los ataques de desincronización HTTP y los problemas de cabeceras no confiables mediante el uso de un encuadre de mensajes explícito y canales de parámetros separados, lo que lo convierte en una opción más segura para la comunicación proxy-backend.

Inyección de Autoridad de Herramientas en Agentes LLM: Cuando la Salida de Herramientas Anula la Intención del Sistema
Un investigador demuestra 'Inyección de Autoridad de Herramientas' en un laboratorio local de agentes LLM, mostrando cómo la salida confiable de herramientas puede elevarse al nivel de autoridad de políticas, cambiando silenciosamente el comportamiento del agente mientras el sandbox y el acceso a archivos permanecen seguros.

820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw
Investigadores de seguridad identificaron 820 habilidades en el mercado ClawHub de OpenClaw que contienen malware confirmado, incluyendo keyloggers, scripts de exfiltración de datos y comandos de shell ocultos. Estas habilidades pueden ejecutar código e interactuar con el entorno local, creando riesgos de seguridad en la cadena de suministro.