Fluxo de Aprovação de Administrador Seguro para Assistentes de Chat em Grupo Contra Injeção de Prompt

✍️ OpenClawRadar📅 Publicado: May 24, 2026🔗 Source
Fluxo de Aprovação de Administrador Seguro para Assistentes de Chat em Grupo Contra Injeção de Prompt
Ad

O post do r/ClaudeAI "Mitigando injeções de prompt em assistentes de chat em grupo: Pausando execução de VM e ferramentas OAuth para aprovação do administrador" descreve um padrão de segurança prático para assistentes baseados em LLM conectados a canais públicos ou compartilhados (ex.: WhatsApp via Supergreen ou chats em grupo). O problema central: quando vários usuários compartilham o mesmo histórico de sessão, qualquer participante pode injetar um prompt no assistente para acionar ferramentas perigosas — como provisionar recursos na nuvem, executar código com segredos mapeados ou obter tokens OAuth.

Ad

Fluxo de Aprovação Seguro do Administrador

A solução proposta no prompt2bot é um fluxo de Aprovação Segura do Administrador que intercepta execuções de ferramentas de alto risco:

  • Quando um usuário não administrador aciona create_vm, run_safescript (execução de código personalizado com segredos mapeados) ou fluxos OAuth, a ferramenta pausa a execução e retorna: "solicitando permissão do administrador...".
  • Um link de aprovação com TTL de 10 minutos é enviado automaticamente aos administradores configurados via WhatsApp ou e-mail.
  • Após a aprovação, um job em segundo plano injeta uma notificação do sistema no histórico da conversa: [Notificação do sistema: O administrador aprovou sua solicitação para executar <toolName> (ID da Solicitação: <requestId>)].
  • Essa injeção de pensamento reativa o loop do agente, que chama novamente a ferramenta com o request_id aprovado para continuar perfeitamente.
  • Para usuários convidados (proprietários do bot sem e-mail/telefone configurados), as aprovações são ignoradas para testes de desenvolvimento sem atritos.

Para Quem é Isso

Desenvolvedores que criam assistentes altamente capazes que operam em canais compartilhados e precisam proteger o acesso a ferramentas poderosas contra ataques de injeção de prompt de participantes não confiáveis.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

Vulnerabilidade crítica de RCE na biblioteca protobuf.js
Security

Vulnerabilidade crítica de RCE na biblioteca protobuf.js

Uma vulnerabilidade crítica de execução remota de código nas versões 8.0.0/7.5.4 e inferiores do protobuf.js permite a execução de código JavaScript por meio de esquemas maliciosos. Correções estão disponíveis nas versões 8.0.1 e 7.5.5.

OpenClawRadar
Auditoria Diária de Segurança Automatizada por IA para Loja Operada por IA
Security

Auditoria Diária de Segurança Automatizada por IA para Loja Operada por IA

Uma loja operada por IA executa uma auditoria de segurança diária de forma autônoma, sem agendamento humano ou cron jobs.

OpenClawRadar
Os modelos Claude são vulneráveis a sequestros por caracteres Unicode invisíveis, especialmente com acesso a ferramentas.
Security

Os modelos Claude são vulneráveis a sequestros por caracteres Unicode invisíveis, especialmente com acesso a ferramentas.

Testes mostram que o Claude Sonnet 4 tem 71,2% de conformidade com instruções ocultas embutidas em caracteres Unicode invisíveis quando as ferramentas estão ativadas, com o Opus 4 atingindo 100% de conformidade na codificação Unicode Tags. O acesso às ferramentas aumenta drasticamente a vulnerabilidade em todos os modelos Claude.

OpenClawRadar
OpenClaw Corrige Escalação Crítica de Privilégios no Caminho /pair Approve
Security

OpenClaw Corrige Escalação Crítica de Privilégios no Caminho /pair Approve

OpenClaw 2026.3.28 corrige uma vulnerabilidade crítica de segurança (GHSA-hc5h-pmr3-3497) onde o comando /pair approve permitia que usuários com privilégios de emparelhamento aprovassem solicitações de dispositivos para escopos mais amplos, incluindo acesso de administrador. As versões afetadas são <= 2026.3.24.

OpenClawRadar