Bernstein: Um orquestrador semelhante ao Kubernetes para agentes de codificação de IA com verificação e políticas de modelo

Bernstein é um orquestrador para agentes de codificação de IA que o criador descreve como "Kubernetes para agentes de codificação". Diferente de ferramentas mais simples que geram agentes em worktrees paralelas, Bernstein aborda o que o desenvolvedor chama de "os outros 95%" do problema.
Principais Recursos
O sistema inclui vários componentes críticos:
- Verificação: Um componente "zelador" verifica independentemente as saídas dos agentes após cada tarefa. Ele executa testes, verifica diferenças e analisa a saída porque "os agentes mentem" - eles podem afirmar que os testes passam quando não passam ou dizer que cometeram arquivos quando não o fizeram.
- Motor de Política de Modelo: Fornece listas de permissão/negação por provedor, restrições de residência de dados, roteamento preferencial e tetos de custo. O criador compara isso a "políticas de rede do K8s, mas para provedores de LLM".
- Agendamento Determinístico: Usa Python puro para agendamento em vez de LLMs, criando fluxo de controle determinístico com zero tokens de LLM gastos em coordenação. Um bandit epsilon-greedy aprende o roteamento ao longo do tempo.
- Design Agnostico de Agentes: Inclui 13 adaptadores para Claude Code, Codex, Gemini CLI, Cursor, Qwen, Aider, Amp, Roo Code, Goose, Kilo, Kiro, OpenCode e agentes genéricos. Claude Code tem a integração mais profunda.
- Recursos de Escala: Com mais de 500K linhas e ~5000 testes, Bernstein inclui disjuntores, detecção de anomalias de custo, detecção de loops, detecção de deadlocks, varredura de PII, logs de auditoria encadeados por HMAC, permissões progressivas e quarentena para saídas suspeitas.
- Auto-Desenvolvimento: Pode se desenvolver usando
bernstein --evolve.
Detalhes Técnicos
O criador observa que gerar agentes em worktrees é "o hello world deste espaço" e que a maioria dos frameworks multiagente usa um LLM para agendar outros LLMs, o que é "lento, caro e não determinístico". A abordagem do Bernstein usa Python puro para fluxo de controle determinístico.
O projeto foi testado em escala com mais de 500K linhas de código e aproximadamente 5000 testes. O desenvolvedor construiu recursos como disjuntores e detecção de anomalias porque "as coisas quebraram e essas foram as correções".
O criador é um desenvolvedor solo de Israel que menciona "construindo sob foguetes (literalmente)" e que o projeto superou suas capacidades, buscando contribuidores.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Otimizador Gratuito de Sessão Claude: Estimador de Tokens, Compressor de Prompts e Planejador de Sessões
Um desenvolvedor criou uma ferramenta gratuita e sem necessidade de cadastro para ajudar a gerenciar os limites de uso do Claude com três funcionalidades: um estimador de tokens para visualizar o consumo de prompts, um compressor de prompts que reduz prompts em 40-60% removendo frases desnecessárias, e um planejador de sessões que agrupa tarefas para minimizar o recarregamento de contexto.

Servidor MCP não oficial do Anel Ultrahuman para integração de agentes de IA
Um servidor MCP desenvolvido pela comunidade encapsula a API Parceira Ultrahuman, permitindo que agentes de codificação de IA acessem diretamente métricas do anel e CGM, como sono, HRV, glicose e pontuações de recuperação, por meio de chamadas de dados estruturadas.

Como os assistentes de IA buscam páginas da web: análise de logs do Nginx do ChatGPT, Claude, Gemini e outros
Um desenvolvedor testou cinco assistentes de IA principais, solicitando que acessassem URLs únicas e monitorando os logs do Nginx, revelando padrões de recuperação distintos: ChatGPT, Claude e Perplexity usam agentes de usuário dedicados, enquanto o Gemini respondeu a partir de seu próprio índice sem buscar a página.

DeepClaude substitui o backend Anthropic do Claude Code pelo DeepSeek V4 Pro com custo 17 vezes menor
Um script que reescreve as variáveis de ambiente do Claude Code para rotear todas as chamadas do loop do agente através do DeepSeek V4 Pro, OpenRouter ou Fireworks AI — mesma experiência de usuário, $0,87/M tokens de saída vs $15/M.