Clawvisor: Autorização Baseada em Propósito para Agentes IA

Clawvisor é uma camada de autorização que fica entre seu agente OpenClaw e as APIs que ele chama, abordando preocupações de segurança quando os agentes precisam acessar dados sensíveis como Gmail ou Calendário. Em vez de entregar credenciais diretamente, ele implementa autorização baseada em propósito: o agente declara o que pretende fazer, você aprova esse propósito específico e um guardião de IA verifica cada solicitação subsequente em relação a ele.

Como Funciona

O fluxo de trabalho segue estas etapas:

Na configuração, você registra aplicativos para seu agente acessar e gera um token para seu agente
Você instrui seu agente a fazer algo (por exemplo, verificar minha agenda e e-mail e me enviar um resumo)
Seu agente registra uma "tarefa" no Clawvisor, com um propósito específico e escopos necessários
Você revisa a tarefa no painel do Clawvisor e aprova se corresponder às suas expectativas
Seu agente começa a executar a tarefa solicitando dados através do Clawvisor
O Clawvisor inspeciona cada solicitação e garante que esteja alinhada com a tarefa aprovada

Recursos de Segurança

O modelo do guardião é projetado para ser resistente a injeção de prompt e desvio de contexto. Mesmo que uma instrução maliciosa convença seu agente a fazer uma solicitação, o Clawvisor a avalia em relação ao seu propósito aprovado original e a bloqueia. O trabalho do guardião permanece estritamente focado em verificar o alinhamento, evitando os riscos de desvio que afetam agentes de IA mais amplos.

Detalhes Técnicos

O modelo do guardião é configurável, com o criador usando Haiku
Adiciona apenas alguns centavos por dia aos custos da conta Claude
Integração com Telegram para aprovar tarefas em movimento
Mostra avaliação de risco com base na amplitude da permissão e coerência da tarefa
Realiza encadeamento de contexto para passar fatos entre chamadas de API para detectar desvio da tarefa
Suporta tarefas permanentes para operações regulares sem aprovação constante
Oferece interfaces TUI e web

Começando

A instalação requer alguns comandos:

git clone https://github.com/clawvisor/clawvisor
cd clawvisor
make setup
make run

Em seguida, faça seu agente OpenClaw instalar a habilidade ClawHub:

clawhub install clawvisor

O Clawvisor é auto-hospedado e de código aberto, atualmente em desenvolvimento inicial, mas já sendo usado pelo criador para tarefas sensíveis. A ferramenta aborda a questão fundamental de confiança ao dar aos agentes de IA acesso a dados pessoais, garantindo que as credenciais nunca saiam da camada de autorização e que cada ação seja verificada em relação a propósitos aprovados pelo usuário.

📖 Read the full source: r/openclaw