Sakana AI Lança o Laboratório RSI: Autoaperfeiçoamento Recursivo com Modelos de Base

✍️ OpenClawRadar📅 Publicado: June 6, 2026🔗 Source
Sakana AI Lança o Laboratório RSI: Autoaperfeiçoamento Recursivo com Modelos de Base
Ad

A Sakana AI estabeleceu formalmente seu Laboratório de Melhoria Recursiva (RSI Lab), um grupo de pesquisa dedicado a redesenhar o próprio processo de desenvolvimento de IA usando IA. Em vez de forçar modelos monolíticos, o laboratório constrói arquiteturas abertas e adaptativas que se auto-aprimoram coletivamente — baseando-se em uma linhagem de marcos publicados.

Principais Marcos de Pesquisa que Sustentam o RSI

  • LLM-Squared (2024): Desenvolvido com Oxford e Cambridge, este framework permite que LLMs inventem melhores maneiras de treinar LLMs (LLM²). Produziu DiscoPOP, um algoritmo de otimização de preferência descoberto e escrito inteiramente por um LLM por meio de um loop evolutivo geracional.
  • Darwin Gödel Machine (2025): Em colaboração com a UBC, a DGM mantém uma linhagem evolutiva de variantes de agentes que reescrevem autonomamente seu próprio código. No SWE-bench, mais que dobrou o desempenho base — uma melhoria absoluta de 30 pontos percentuais.
  • ShinkaEvolve (2025): Framework de código aberto demonstrando evolução de programas com amostras eficientes. Resolveu problemas complexos de otimização usando apenas 150 amostras e gerou uma nova função de perda de balanceamento de carga que melhora modelos Mixture-of-Experts (MoE).
  • ALE-Agent (2025): Agente de otimização que garantiu o 1º lugar entre 804 participantes humanos no AtCoder Heuristic Contest 058. Ele aproveita escalonamento massivo em tempo de inferência e auto-aprendizagem a partir de falhas de tentativa e erro para derivar autonomamente algoritmos inovadores.
  • Digital Red Queen (2026): Colaboração com o MIT estabelecendo coevolução adversária de código aberto no Core War. LLMs criam códigos concorrentes, gerando estratégias emergentes de software complexas e evolução convergente — fundamental para o RSI em segurança cibernética.
  • The AI Scientist (2024–2026): Descoberta científica totalmente automatizada e de código aberto, desde geração de ideias, execução de experimentos, escrita completa de artigos até revisão por pares.
Ad

Por Que Isso é Importante para Desenvolvedores

O RSI representa uma mudança de P&D estática e liderada por humanos para motores de inteligência autônomos e auto-aprimoráveis. A abordagem do laboratório — loops de otimização evolutivos, agentes auto-reescritores e ciência automatizada — impacta diretamente como agentes de codificação de IA são construídos e melhorados. Em vez de esperar por ajustes manuais, esses sistemas refinam continuamente suas próprias arquiteturas.

📖 Leia a fonte original: HN AI Agents

Ad

👀 See Also

O Ruído da Codificação por Vibração: Como a IA Genérica Está Suprimindo Comunidades de Desenvolvedores
News

O Ruído da Codificação por Vibração: Como a IA Genérica Está Suprimindo Comunidades de Desenvolvedores

rmoff reclama sobre o fluxo constante de conteúdo de baixa qualidade gerado por IA em comunidades de desenvolvedores, desde repositórios inúteis no GitHub até postagens de blog escritas por IA, e por que isso está afastando a participação orgânica.

OpenClawRadar
API Paga do DeepSeek Usa Prompts para Treinamento — O que os Usuários do OpenClaw Precisam Saber
News

API Paga do DeepSeek Usa Prompts para Treinamento — O que os Usuários do OpenClaw Precisam Saber

A API oficial do DeepSeek registra prompts para treinamento, mesmo em planos pagos. O Gemini só registra no AI Studio gratuito. O OpenClaw agora usa o DeepSeek V4 Flash como padrão — cuidado ao processar dados pessoais.

OpenClawRadar
Claude Skills vs. MCP: Uma Questão Prática de Limites para Desenvolvedores
News

Claude Skills vs. MCP: Uma Questão Prática de Limites para Desenvolvedores

Um desenvolvedor questiona onde o valor do MCP se torna decisivo versus as Habilidades do Claude após o lançamento das Habilidades ter tornado o raciocínio sobre integração de ferramentas mais difícil, observando que instruções bem estruturadas muitas vezes podem ser suficientes sem limites de protocolo.

OpenClawRadar
Usuários relatam que Claude Opus 4.7 regride em raciocínio e conversação
News

Usuários relatam que Claude Opus 4.7 regride em raciocínio e conversação

O Opus 4.7 introduz um novo tokenizador que custa 30-50% mais, apresenta metanarrativa, instabilidade de posição e planejamento sem execução — tornando-o pior para colaboração técnica do que o 4.6.

OpenClawRadar