Nanocode: Treinando agentes de codificação semelhantes ao Claude com JAX em TPUs

✍️ OpenClawRadar📅 Publicado: April 15, 2026🔗 Source
Nanocode: Treinando agentes de codificação semelhantes ao Claude com JAX em TPUs
Ad

Nanocode é uma biblioteca que demonstra como treinar seu próprio modelo Claude Code de ponta a ponta usando Constitutional AI, seguindo a abordagem da Anthropic. Escrito inteiramente em JAX e otimizado para TPUs, ele adapta a infraestrutura do projeto nanochat de Karpathy.

Configuração e Custos de Treinamento

O modelo nanocode-d24 (1,3B de parâmetros) pode ser reproduzido em aproximadamente 9 horas em uma TPU v6e-8 a um custo de US$ 200. O modelo menor nanocode-d20 (477M de parâmetros) treina em cerca de 1,5 horas por US$ 34. O projeto recomenda usar o programa TRC do Google para acesso gratuito a TPUs preemptíveis por um mês, ou os créditos de US$ 300 do Google Cloud para novas contas.

Implementação Técnica

O processo de treinamento inclui:

  • Escrever um arquivo SOUL.md para definir o alinhamento do modelo
  • Definir uma interface agentica para interação com o mundo
  • Gerar dados sintéticos
  • Usar otimização de preferência para alinhar o modelo com o SOUL
Ad

Diferenças de Tokenização e Pré-treinamento

Embora o processo de pré-treinamento e treinamento do tokenizador seja semelhante ao nanochat, o nanocode inclui dados adicionais de codificação do The Stack-V2 em uma proporção de 1:5 tanto nas misturas de pré-treinamento quanto do tokenizador. Isso resulta em um desempenho de codificação mais forte, mas reduz a eficiência de tokenização de texto geral.

A comparação do tokenizador mostra que o nanocode alcança -50,9% melhor tokenização para código em comparação com o nanochat, enquanto o nanochat tem desempenho melhor em texto coreano (+7,9% para nanocode em notícias, -27,6% em coreano).

Comandos e Configuração

export NANOCODE_BASE_DIR="$HOME/.cache/nanocode"
export MODEL_TAG=d24
python -m data.pretrain -d fineweb-edu -n 300
python -m data.pretrain -d the-stack-v2-dedup -n 60
python -m scripts.tok_train --max-chars=2000000000
python -m scripts.tok_eval

Os modelos são treinados com uma proporção param:dados de 8, seguindo a análise da lei de escala do nanochat. Embora otimizado para TPUs, o nanocode também deve funcionar em GPUs NVIDIA prontas para uso.

📖 Read the full source: HN AI Agents

Ad

👀 See Also

Clawpage: Uma Ferramenta que Converte Conversas do OpenClaw em Sites Estáticos
Tools

Clawpage: Uma Ferramenta que Converte Conversas do OpenClaw em Sites Estáticos

Um desenvolvedor criou o Clawpage, uma habilidade que transforma o histórico de sessões do OpenClaw em páginas web estáticas para preservar conversas valiosas, incluindo o vai e vem, a pesquisa e o processo de depuração. A ferramenta está disponível no GitHub.

OpenClawRadar
A arquitetura de modelo duplo reduz o consumo de tokens pela metade em conversas longas.
Tools

A arquitetura de modelo duplo reduz o consumo de tokens pela metade em conversas longas.

Um desenvolvedor criou um sistema de modelo duplo onde um pequeno modelo 'subconsciente' comprime o histórico da conversa em segundo plano, permitindo que o modelo principal trabalhe com um contexto curado de ~35K em vez de 120K tokens de histórico bruto. Essa arquitetura reduz o consumo de tokens aproximadamente pela metade para trabalhos de projeto sustentados.

OpenClawRadar
O Repositório de Habilidades Awesome OpenClaw Oferece Mais de 5.400 Habilidades Filtradas
Tools

O Repositório de Habilidades Awesome OpenClaw Oferece Mais de 5.400 Habilidades Filtradas

Um repositório GitHub chamado awesome-openclaw-skills oferece mais de 1.715 habilidades prontas para produção que agentes de IA podem instalar com um único comando CLI, filtradas do Registro Oficial de Habilidades do OpenClaw.

OpenClawRadar
Merlin: Deduplicação de contexto LLM local-first – meça até 71% de sobreposição de chunks, gratuito e open-core
Tools

Merlin: Deduplicação de contexto LLM local-first – meça até 71% de sobreposição de chunks, gratuito e open-core

Merlin é uma ferramenta de deduplicação de contexto local-first que mediu 22-71% de sobreposição de chunks em 22 milhões de passagens de sessões reais de agente/RAG. Funciona como proxy HTTP (Ollama/vLLM/SGLang/llama.cpp), servidor MCP (Claude/Cursor/OpenClaw) ou CLI standalone. Open-core MIT com limites de uso diário.

OpenClawRadar