llm-hasher: Detecção e Tokenização Local de PII para Fluxos de Trabalho Híbridos de LLM

✍️ OpenClawRadar📅 Publicado: April 15, 2026🔗 Source

O llm-hasher aborda uma lacuna de segurança específica em fluxos de trabalho híbridos de LLM: quando você executa LLMs locais, mas ainda chama serviços externos como OpenAI, Claude ou Gemini para certas tarefas, suas PII ainda saem de sua infraestrutura em texto simples. Esta ferramenta executa a detecção de PII inteiramente localmente usando Ollama, portanto, nenhum dado sai de seus sistemas durante a fase de detecção.

Como Funciona

O processo segue três etapas: detectar PII localmente, tokenizá-la antes das chamadas de LLM externo e, em seguida, restaurar os valores originais após o processamento. Isso evita que dados sensíveis sejam expostos a serviços de terceiros.

Abordagem de Detecção

O sistema de detecção usa uma abordagem híbrida:

Padrões regex para tipos de dados estruturados: cartões de crédito, números IBAN, endereços de e-mail e endereços IPv4
Ollama com llama3.2:3b (por padrão) para detecção contextual de PII não estruturada: nomes, endereços, IDs nacionais, passaportes e datas de nascimento

Implementação Técnica

Os mapeamentos entre PII originais e tokens são armazenados em um cofre SQLite criptografado com AES-256-GCM. A implantação é simplificada com Docker Compose, que inicia tanto o Ollama quanto o serviço llm-hasher com um único comando.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

Security

Ataque de cadeia de suprimentos usa código Unicode invisível para evitar detecção

Pesquisadores descobriram 151 pacotes maliciosos enviados para o GitHub entre 3 e 9 de março usando caracteres Unicode invisíveis para ocultar código malicioso. O ataque tem como alvo repositórios GitHub, NPM e Open VSX com pacotes que parecem legítimos, mas contêm cargas maliciosas ocultas.

Mar 15, 2026, 06:45 PM UTC

OpenClawRadar

Security

Alerta de Golpe: Falso Airdrop do GitHub Mira Usuários do Token CLAW

Um golpe de phishing está circulando, alegando oferecer airdrops do token $CLAW por contribuições no GitHub. O golpe usa um link de compartilhamento do Google que redireciona para um site suspeito .xyz e pede que os usuários conectem suas carteiras, o que pode levar ao esvaziamento das mesmas.

Mar 18, 2026, 06:45 PM UTC

OpenClawRadar

Security

Desungado: Um Scanner de Malware Avançado e Dirigido pela Comunidade para Arquivos SKILL.md do ClawHub

Declawed é uma ferramenta de segurança para escanear arquivos SKILL.md no ClawHub, detectando injeção de prompt, conteúdo malicioso e roubadores de informações, utilizando conjuntos de regras orientados pela comunidade.

Feb 13, 2026, 12:45 AM UTC

OpenClawRadar

Security

Análise de Segurança da Extração de Componentes do OpenClaw para Agentes de IA Personalizados

Um desenvolvedor analisou o código-fonte do OpenClaw para determinar quais componentes podem ser extraídos com segurança para uso em agentes de IA personalizados, classificando cada um usando a estrutura Lethal Quartet. A análise revela riscos significativos de segurança em componentes como Semantic Snapshots e BrowserClaw.

Mar 14, 2026, 08:45 PM UTC

OpenClawRadar