Validação do padrão de habilidades de autoevolução: resultados do experimento de 5 rodadas

✍️ OpenClawRadar📅 Publicado: March 8, 2026🔗 Source

Configuração do experimento e resultados

Um desenvolvedor conduziu um experimento de 5 rodadas para validar o padrão de design Self-Evolving Skill para Claude Code, que foi compartilhado anteriormente. O experimento utilizou um banco de dados MySQL com 29 tabelas e 590MB de dados de um sistema de gerenciamento de edifícios inteligentes.

As rodadas seguiram esta progressão: exploração de estrutura → consultas de dados → descoberta de regras → investigação complexa → verificação repetida.

Principais descobertas

Taxa de rejeição do Five-Gate: 63,6% — a maioria das interações não produziu mudança no conhecimento
Convergência incremental: +75 → +46 → +12 → +21 → +1
Auto-correção do Gate 2: O padrão detectou e corrigiu 2 regras errôneas que a Skill havia escrito em rodadas anteriores
Rodada 5: Zero etapas de exploração, reutilização direta de template
Precisão: 100% — nenhum conhecimento incorreto sobreviveu ao processo

Uma descoberta inesperada foi que as armadilhas de uso de ferramentas foram capturadas como um subproduto de alto valor — problemas que o desenvolvedor não projetou, mas que o Five Gates detectou mesmo assim.

O desenvolvedor tem um segundo experimento em andamento em um banco de dados maior de cobrança de telecomunicações. Dados completos com snapshots diferenciáveis por rodada estão disponíveis no GitHub.

📖 Leia a fonte completa: r/ClaudeAI

👀 See Also

Tools

Análise de Custo do Primeiro Dia de Fable 5 no Claude Code — $210 equivalente em API, $0 Pago

Um desenvolvedor mudou para o claude-fable-5 no Claude Code e mediu o uso de tokens em 742 respostas. Custo equivalente à API: US$ 210,15. Valor real pago: US$ 0 durante a janela do plano até 22 de junho.

Jun 11, 2026, 12:20 PM UTC

OpenClawRadar

Tools

Sobreposição em Tempo Real para Monitorar Limites de Uso de Código Claude

A sobreposição de desktop de código aberto exibe os limites de uso do Claude Code em tempo real, eliminando a necessidade de digitar repetidamente '/usage'.

Feb 13, 2026, 10:45 AM UTC

OpenClawRadar

Tools

ClamBot: Agente de IA Executa Código Gerado por LLM em Sandbox WASM para Segurança

ClamBot é um framework de agente de IA que executa todo o código gerado por LLM em uma sandbox WebAssembly usando QuickJS no Wasmtime, eliminando a necessidade de chamadas exec() ou subprocess. Ele inclui um portão de aprovação para chamadas de ferramentas, cache persistente de scripts como 'clams' e suporta múltiplos provedores de LLM.

Apr 13, 2026, 12:45 PM UTC

OpenClawRadar

Tools

Claude Code Skill refatora componentes React usando princípios de 'Não Me Faça Pensar'

Uma nova habilidade do Claude Code refatora automaticamente componentes React para usabilidade com base nos princípios de Steve Krug — elimina "happy talk", destaca CTAs primárias, corrige estados vazios/de erro e ajusta rótulos.

May 6, 2026, 08:22 PM UTC

OpenClawRadar