Codev: Fluxo de trabalho de agente de IA para 106 PRs em 14 dias

Codev é um sistema de coordenação de agentes de IA de código aberto que impõe um fluxo de trabalho de desenvolvimento estruturado. O projeto demonstra como levar a IA do protótipo para o trabalho de produção com práticas específicas extraídas do tratamento de 106 pull requests em 14 dias.
Seis práticas fundamentais
- Especificações e planos são código-fonte: Especificações e planos residem no git junto com o código-fonte, não no histórico de chat. Um novo agente lê arch.md para ter a visão geral, depois sua especificação específica. Isso garante que você sempre saiba por que algo foi construído.
- Três modelos revisam cada fase: Claude, Gemini e Codex capturam bugs quase totalmente diferentes. Nenhum modelo único encontrou mais de 55% dos problemas. Nos testes, 20 bugs foram capturados antes do lançamento: Claude Code encontrou 5 bugs, enquanto Gemini e Codex capturaram outros 15, incluindo um problema de segurança grave que Claude perdeu.
- Imponha o processo, não apenas sugira: Uma máquina de estado força Especificação → Plano → Implementação → Revisão → PR. A IA não pode pular etapas, e os testes devem passar antes de avançar. O sistema fornece trilhos porque as IAs não seguem o plano por conta própria.
- Anote, não edite: A maior parte do trabalho envolve escrever especificações e revisões que orientam o código, em vez de mexer em arquivos em um chat aberto.
- Agentes coordenam agentes: Um agente arquiteto gera agentes construtores em worktrees git isolados. Você direciona o arquiteto; ele direciona os construtores. Eles se comunicam de forma assíncrona.
- Gerencie todo o ciclo de vida: A maioria das ferramentas de IA ajuda a escrever código mais rápido (cerca de 30% do trabalho). Os outros 70% envolvem planejamento, revisão, integração, scripts de implantação e gerenciamento de staging vs produção. Codev faz a IA executar todo o pipeline, da especificação ao PR e além.
Resultados e custos
O sistema permitiu que um engenheiro produzisse o que uma equipe de 3-4 normalmente faria. A qualidade do código mediu 1,2 pontos melhor em uma escala de 10 pontos em comparação com o uso apenas do Claude Code. A abordagem leva mais tempo e usa mais tokens, mas os custos permanecem razoáveis, aproximadamente US$ 1,60 por PR.
De acordo com o desenvolvedor, a imposição do protocolo é o divisor de águas: "Eu descobria que a IA simplesmente não seguia especificações ou planos." A coordenação de agentes também se mostrou eficaz, com o agente arquiteto gerenciando vários agentes construtores corrigindo diferentes bugs simultaneamente.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Usando o kit de ferramentas Obliteratus para remover pesos de recusa de modelos de IA
Um usuário do Reddit utilizou o kit de ferramentas Obliteratus para remover cirurgicamente pesos específicos responsáveis pelo comportamento de recusa em modelos de IA, demonstrando no modelo Qwen 1.5B da Alibaba que é possível revelar as origens do treinamento sem retreinamento.

Ferramenta de código aberto permite que o Claude controle o Unreal Engine diretamente
soft-ue-cli é uma ferramenta Python com um plugin C++ que permite ao Claude Code e Claude Desktop executar comandos no Unreal Engine sem interação com o editor, oferecendo mais de 60 operações incluindo edição de blueprints, spawn de atores e análise de desempenho.

Framework de código aberto para memória persistente de agentes de IA com armazenamento local e recuperação baseada em grafos
Um desenvolvedor está construindo um framework de código aberto para memória persistente de agentes de IA que armazena dados localmente como arquivos Markdown, usa wiki-links como arestas de grafo e implementa Git para controle de versão. O sistema apresenta recuperação de quatro sinais e esquecimento consciente do grafo baseado na ciência cognitiva ACT-R.

certctl: Plataforma de ciclo de vida de certificados auto-hospedada com 78 endpoints de API para automação de agentes de IA
certctl é uma plataforma de ciclo de vida de certificados auto-hospedada desenvolvida com Go e TypeScript que expõe 78 endpoints de API REST para gerenciamento de certificados. A plataforma é independente de emissor e de destino, com um servidor MCP planejado para expor toda a funcionalidade como ferramentas nativas MCP.