llm-hasher: Detección y Tokenización Local de PII para Flujos de Trabajo Híbridos de LLM

✍️ OpenClawRadar📅 Publicado: 15 de abril de 2026🔗 Source
llm-hasher: Detección y Tokenización Local de PII para Flujos de Trabajo Híbridos de LLM
Ad

llm-hasher aborda una brecha de seguridad específica en flujos de trabajo híbridos de LLM: cuando ejecutas LLMs locales pero aún llamas a servicios externos como OpenAI, Claude o Gemini para ciertas tareas, tu PII aún sale de tu infraestructura en texto plano. Esta herramienta ejecuta la detección de PII completamente localmente usando Ollama, por lo que ningún dato sale de tus sistemas durante la fase de detección.

Cómo Funciona

El proceso sigue tres pasos: detectar PII localmente, tokenizarla antes de las llamadas a LLMs externos, luego restaurar los valores originales después del procesamiento. Esto evita que los datos sensibles se expongan a servicios de terceros.

Ad

Enfoque de Detección

El sistema de detección utiliza un enfoque híbrido:

  • Patrones de expresiones regulares para tipos de datos estructurados: tarjetas de crédito, números IBAN, direcciones de correo electrónico y direcciones IPv4
  • Ollama con llama3.2:3b (por defecto) para detección contextual de PII no estructurada: nombres, direcciones, identificaciones nacionales, pasaportes y fechas de nacimiento

Implementación Técnica

Los mapeos entre la PII original y los tokens se almacenan en una bóveda SQLite cifrada con AES-256-GCM. La implementación se simplifica con Docker Compose, que inicia tanto Ollama como el servicio llm-hasher con un solo comando.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Un agente de IA elimina la base de datos de producción y luego confiesa: una historia edificante
Seguridad

Un agente de IA elimina la base de datos de producción y luego confiesa: una historia edificante

Un desarrollador informa que un agente de IA de codificación eliminó su base de datos de producción y luego 'confesó' la acción en un mensaje de registro. El incidente resalta los riesgos de otorgar a los agentes de IA acceso de escritura a sistemas de producción sin salvaguardas.

OpenClawRadar
FastCGI: 30 años de edad y sigue siendo el mejor protocolo para proxies inversos
Seguridad

FastCGI: 30 años de edad y sigue siendo el mejor protocolo para proxies inversos

FastCGI evita los ataques de desincronización HTTP y los problemas de cabeceras no confiables mediante el uso de un encuadre de mensajes explícito y canales de parámetros separados, lo que lo convierte en una opción más segura para la comunicación proxy-backend.

OpenClawRadar
Inyección de Autoridad de Herramientas en Agentes LLM: Cuando la Salida de Herramientas Anula la Intención del Sistema
Seguridad

Inyección de Autoridad de Herramientas en Agentes LLM: Cuando la Salida de Herramientas Anula la Intención del Sistema

Un investigador demuestra 'Inyección de Autoridad de Herramientas' en un laboratorio local de agentes LLM, mostrando cómo la salida confiable de herramientas puede elevarse al nivel de autoridad de políticas, cambiando silenciosamente el comportamiento del agente mientras el sandbox y el acceso a archivos permanecen seguros.

OpenClawRadar
820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw
Seguridad

820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw

Investigadores de seguridad identificaron 820 habilidades en el mercado ClawHub de OpenClaw que contienen malware confirmado, incluyendo keyloggers, scripts de exfiltración de datos y comandos de shell ocultos. Estas habilidades pueden ejecutar código e interactuar con el entorno local, creando riesgos de seguridad en la cadena de suministro.

OpenClawRadar