Нанокод: обучение кодирующих агентов, подобных Claude, с использованием JAX на TPU

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source

Nanocode — это библиотека, которая демонстрирует, как обучить собственную модель Claude Code сквозным образом с использованием Constitutional AI, следуя подходу Anthropic. Написана полностью на JAX и оптимизирована для TPU, адаптирует инфраструктуру из проекта nanochat от Карпати.

Настройка обучения и затраты

Модель nanocode-d24 (1,3 млрд параметров) можно воспроизвести примерно за 9 часов на TPU v6e-8 стоимостью $200. Меньшая модель nanocode-d20 (477 млн параметров) обучается около 1,5 часов за $34. Проект рекомендует использовать программу Google TRC для бесплатного доступа к прерываемым TPU на месяц или кредиты Google Cloud в размере $300 для новых аккаунтов.

Техническая реализация

Процесс обучения включает:

Написание файла SOUL.md для определения согласованности модели
Определение агентского интерфейса для взаимодействия с миром
Генерацию синтетических данных
Использование оптимизации предпочтений для согласования модели с SOUL

Различия в токенизации и предварительном обучении

Хотя процесс предварительного обучения и обучения токенизатора похож на nanochat, nanocode включает дополнительные данные по программированию из The Stack-V2 в соотношении 1:5 как в предварительном обучении, так и в смесях токенизатора. Это приводит к более высокой производительности в кодировании, но снижает эффективность токенизации общего текста.

Сравнение токенизаторов показывает, что nanocode достигает на -50,9% лучшей токенизации для кода по сравнению с nanochat, в то время как nanochat работает лучше с корейским текстом (+7,9% для nanocode на новостях, -27,6% на корейском).

Команды и настройка

export NANOCODE_BASE_DIR="$HOME/.cache/nanocode"
export MODEL_TAG=d24
python -m data.pretrain -d fineweb-edu -n 300
python -m data.pretrain -d the-stack-v2-dedup -n 60
python -m scripts.tok_train --max-chars=2000000000
python -m scripts.tok_eval

Модели обучаются с соотношением параметров:данных 8, следуя анализу закона масштабирования nanochat. Хотя оптимизированы для TPU, nanocode также должен работать на GPU NVIDIA из коробки.

📖 Read the full source: HN AI Agents

👀 Смотрите также

Инструменты

Панель управления кода Клода отслеживает более 19 миллионов AI-сгенерированных коммитов на GitHub

Разработчик создал дашборд, отслеживающий более 19 миллионов коммитов, сгенерированных Claude Code в публичных репозиториях GitHub, где TypeScript (35,3%), Python (19,2%) и JavaScript (10,3%) являются самыми популярными языками. Система использует Next.js с Recharts и PostgreSQL, а также ETL-пайплайн, который обходит ограничения по частоте запросов API GitHub.

24 мар. 2026 г., 15:45 UTC

OpenClawRadar

Инструменты

Построение кодирующего агента для контекста в 8 тыс. токенов: разделение планировщика/исполнителя, бюджетирование токенов и параллельное выполнение

Подробный разбор создания CLI-агента для написания кода, рассчитанного на лимит в 8 тысяч токенов, с архитектурой planner/executor, строгим распределением токенов и параллельным выполнением задач.

28 апр. 2026 г., 14:20 UTC

OpenClawRadar

Инструменты

Три репозитория для разработки RAG и AI-агентов

В посте на Reddit выделены три репозитория для разработчиков, работающих с RAG и AI-агентами: memvid для памяти агентов, llama_index для RAG-пайплайнов и Continue для ассистентов программирования. Автор отмечает, что чистый RAG лучше всего подходит для извлечения знаний, в то время как системы памяти лучше для агентов, а гибридные подходы часто используются в реальных инструментах.

17 апр. 2026 г., 16:45 UTC

OpenClawRadar

Инструменты

GuppyLM: 9-миллионная языковая модель, созданная с нуля для образовательных целей

GuppyLM — это языковая модель с примерно 9 миллионами параметров, обученная с нуля на 60 тысячах синтетических диалогов, использующая стандартную архитектуру трансформера с 6 слоями, 384 скрытыми измерениями и 6 головами внимания. Она обучается примерно за 5 минут на бесплатном GPU T4 в Colab и говорит с рыбьей личностью, сосредоточенной на воде, еде и жизни в аквариуме.

16 апр. 2026 г., 12:15 UTC

OpenClawRadar