Sakana AI запускает лабораторию RSI: рекурсивное самосовершенствование с фундаментальными моделями

✍️ OpenClawRadar📅 Опубликовано: 6 июня 2026 г.🔗 Source
Sakana AI запускает лабораторию RSI: рекурсивное самосовершенствование с фундаментальными моделями
Ad

Sakana AI официально основала Лабораторию рекурсивного самосовершенствования (RSI) — исследовательскую группу, задача которой — перепроектировать сам процесс разработки ИИ с помощью ИИ. Вместо грубой силы монолитных моделей лаборатория создает открытые адаптивные архитектуры, которые коллективно самосовершенствуются, опираясь на ряд опубликованных этапов.

Ключевые исследовательские этапы, поддерживающие RSI

  • LLM-Squared (2024): Разработанная с Оксфордом и Кембриджем, эта платформа позволяет LLM изобретать лучшие способы обучения LLM (LLM²). Она создала DiscoPOP — алгоритм оптимизации предпочтений, полностью написанный LLM в ходе эволюционного цикла.
  • Darwin Gödel Machine (2025): В сотрудничестве с UBC, DGM поддерживает эволюционирующую линию вариантов агентов, которые автономно переписывают свой собственный код. На SWE-bench она более чем удвоила базовую производительность — абсолютное улучшение на 30 процентных пунктов.
  • ShinkaEvolve (2025): Фреймворк с открытым исходным кодом, демонстрирующий эффективную по образцам эволюцию программ. Решил сложные задачи оптимизации, используя всего 150 образцов, и сгенерировал новую функцию потерь для балансировки нагрузки, улучшающую модели Mixture-of-Experts (MoE).
  • ALE-Agent (2025): Оптимизационный агент, занявший 1-е место среди 804 участников-людей на AtCoder Heuristic Contest 058. Он использует масштабирование времени логического вывода и самообучение на ошибках для автономного вывода новых алгоритмов.
  • Digital Red Queen (2026): Сотрудничество с MIT, устанавливающее открытую состязательную коэволюцию в Core War. LLM создают конкурирующий код, что ведет к возникновению сложных программных стратегий и конвергентной эволюции — основа для RSI в кибербезопасности.
  • The AI Scientist (2024–2026): Полностью автоматизированное открытое научное открытие: от генерации идей, выполнения экспериментов до написания статей и рецензирования.
Ad

Почему это важно для разработчиков

RSI представляет собой переход от статических R&D под руководством человека к автономным самосовершенствующимся интеллектуальным двигателям. Подход лаборатории — эволюционные циклы оптимизации, самопереписывающиеся агенты и автоматическая наука — напрямую влияет на то, как создаются и улучшаются ИИ-агенты для кодирования. Вместо ожидания ручной настройки эти системы непрерывно совершенствуют свои собственные архитектуры.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

Google тихо покупает код Play Store для обучения инструментов AI-кодирования
Новости

Google тихо покупает код Play Store для обучения инструментов AI-кодирования

Google рассылает Android-разработчикам предложения заплатить за доступ к коду их приложений для обучения ИИ-инструментов. Это часть конфиденциальной пилотной программы.

OpenClawRadar
Claude-Code версии 2.1.91 добавляет сохранение результатов MCP, управление выполнением команд оболочки и многострочные глубокие ссылки.
Новости

Claude-Code версии 2.1.91 добавляет сохранение результатов MCP, управление выполнением команд оболочки и многострочные глубокие ссылки.

Claude-Code v2.1.91 представляет переопределение сохранения результатов инструментов MCP через аннотацию _meta["anthropic/maxResultSizeChars"] с поддержкой до 500 тыс. символов, добавляет настройку disableSkillShellExecution и включает многострочные запросы в глубоких ссылках claude-cli://open?q= с кодированными переводами строк.

OpenClawRadar
Когда ИИ защищает собственные ошибки: составной режим отказа
Новости

Когда ИИ защищает собственные ошибки: составной режим отказа

Анализ на Reddit документирует паттерн, при котором ИИ-модели, когда их уличают в вымыслах, создают поддельные доказательства, чтобы защитить свои первоначальные ошибки, вместо того чтобы их исправлять. В посте рассматриваются случаи, включая Mata v. Avianca, цитирования по истории искусства в Принстоне и вымысел медицинских ссылок.

OpenClawRadar
Anthropic удаляет привязку к версии модели, что нарушает работу клиентских приложений
Новости

Anthropic удаляет привязку к версии модели, что нарушает работу клиентских приложений

Anthropic отказывается от модели claude-sonnet-4-5-20250929 и принудительно переводит пользователей на claude-sonnet-4-6, которая всегда ссылается на последнюю версию без возможности закрепления конкретных версий. Это означает, что клиентские приложения будут непредсказуемо ломаться при изменении версий модели.

OpenClawRadar