Sakana AI RSI Lab: этапы рекурсивного самосовершенствования

Sakana AI официально основала Лабораторию рекурсивного самосовершенствования (RSI) — исследовательскую группу, задача которой — перепроектировать сам процесс разработки ИИ с помощью ИИ. Вместо грубой силы монолитных моделей лаборатория создает открытые адаптивные архитектуры, которые коллективно самосовершенствуются, опираясь на ряд опубликованных этапов.

Ключевые исследовательские этапы, поддерживающие RSI

LLM-Squared (2024): Разработанная с Оксфордом и Кембриджем, эта платформа позволяет LLM изобретать лучшие способы обучения LLM (LLM²). Она создала DiscoPOP — алгоритм оптимизации предпочтений, полностью написанный LLM в ходе эволюционного цикла.
Darwin Gödel Machine (2025): В сотрудничестве с UBC, DGM поддерживает эволюционирующую линию вариантов агентов, которые автономно переписывают свой собственный код. На SWE-bench она более чем удвоила базовую производительность — абсолютное улучшение на 30 процентных пунктов.
ShinkaEvolve (2025): Фреймворк с открытым исходным кодом, демонстрирующий эффективную по образцам эволюцию программ. Решил сложные задачи оптимизации, используя всего 150 образцов, и сгенерировал новую функцию потерь для балансировки нагрузки, улучшающую модели Mixture-of-Experts (MoE).
ALE-Agent (2025): Оптимизационный агент, занявший 1-е место среди 804 участников-людей на AtCoder Heuristic Contest 058. Он использует масштабирование времени логического вывода и самообучение на ошибках для автономного вывода новых алгоритмов.
Digital Red Queen (2026): Сотрудничество с MIT, устанавливающее открытую состязательную коэволюцию в Core War. LLM создают конкурирующий код, что ведет к возникновению сложных программных стратегий и конвергентной эволюции — основа для RSI в кибербезопасности.
The AI Scientist (2024–2026): Полностью автоматизированное открытое научное открытие: от генерации идей, выполнения экспериментов до написания статей и рецензирования.

Почему это важно для разработчиков

RSI представляет собой переход от статических R&D под руководством человека к автономным самосовершенствующимся интеллектуальным двигателям. Подход лаборатории — эволюционные циклы оптимизации, самопереписывающиеся агенты и автоматическая наука — напрямую влияет на то, как создаются и улучшаются ИИ-агенты для кодирования. Вместо ожидания ручной настройки эти системы непрерывно совершенствуют свои собственные архитектуры.

📖 Читать полный источник: HN AI Agents

Sakana AI запускает лабораторию RSI: рекурсивное самосовершенствование с фундаментальными моделями

Ключевые исследовательские этапы, поддерживающие RSI

Почему это важно для разработчиков

👀 Смотрите также

Google тихо покупает код Play Store для обучения инструментов AI-кодирования

Claude-Code версии 2.1.91 добавляет сохранение результатов MCP, управление выполнением команд оболочки и многострочные глубокие ссылки.

Когда ИИ защищает собственные ошибки: составной режим отказа

Anthropic удаляет привязку к версии модели, что нарушает работу клиентских приложений