Sakana AI Lança o Laboratório RSI: Autoaperfeiçoamento Recursivo com Modelos de Base

A Sakana AI estabeleceu formalmente seu Laboratório de Melhoria Recursiva (RSI Lab), um grupo de pesquisa dedicado a redesenhar o próprio processo de desenvolvimento de IA usando IA. Em vez de forçar modelos monolíticos, o laboratório constrói arquiteturas abertas e adaptativas que se auto-aprimoram coletivamente — baseando-se em uma linhagem de marcos publicados.
Principais Marcos de Pesquisa que Sustentam o RSI
- LLM-Squared (2024): Desenvolvido com Oxford e Cambridge, este framework permite que LLMs inventem melhores maneiras de treinar LLMs (LLM²). Produziu DiscoPOP, um algoritmo de otimização de preferência descoberto e escrito inteiramente por um LLM por meio de um loop evolutivo geracional.
- Darwin Gödel Machine (2025): Em colaboração com a UBC, a DGM mantém uma linhagem evolutiva de variantes de agentes que reescrevem autonomamente seu próprio código. No SWE-bench, mais que dobrou o desempenho base — uma melhoria absoluta de 30 pontos percentuais.
- ShinkaEvolve (2025): Framework de código aberto demonstrando evolução de programas com amostras eficientes. Resolveu problemas complexos de otimização usando apenas 150 amostras e gerou uma nova função de perda de balanceamento de carga que melhora modelos Mixture-of-Experts (MoE).
- ALE-Agent (2025): Agente de otimização que garantiu o 1º lugar entre 804 participantes humanos no AtCoder Heuristic Contest 058. Ele aproveita escalonamento massivo em tempo de inferência e auto-aprendizagem a partir de falhas de tentativa e erro para derivar autonomamente algoritmos inovadores.
- Digital Red Queen (2026): Colaboração com o MIT estabelecendo coevolução adversária de código aberto no Core War. LLMs criam códigos concorrentes, gerando estratégias emergentes de software complexas e evolução convergente — fundamental para o RSI em segurança cibernética.
- The AI Scientist (2024–2026): Descoberta científica totalmente automatizada e de código aberto, desde geração de ideias, execução de experimentos, escrita completa de artigos até revisão por pares.
Por Que Isso é Importante para Desenvolvedores
O RSI representa uma mudança de P&D estática e liderada por humanos para motores de inteligência autônomos e auto-aprimoráveis. A abordagem do laboratório — loops de otimização evolutivos, agentes auto-reescritores e ciência automatizada — impacta diretamente como agentes de codificação de IA são construídos e melhorados. Em vez de esperar por ajustes manuais, esses sistemas refinam continuamente suas próprias arquiteturas.
📖 Leia a fonte original: HN AI Agents
👀 See Also

O Ruído da Codificação por Vibração: Como a IA Genérica Está Suprimindo Comunidades de Desenvolvedores
rmoff reclama sobre o fluxo constante de conteúdo de baixa qualidade gerado por IA em comunidades de desenvolvedores, desde repositórios inúteis no GitHub até postagens de blog escritas por IA, e por que isso está afastando a participação orgânica.

API Paga do DeepSeek Usa Prompts para Treinamento — O que os Usuários do OpenClaw Precisam Saber
A API oficial do DeepSeek registra prompts para treinamento, mesmo em planos pagos. O Gemini só registra no AI Studio gratuito. O OpenClaw agora usa o DeepSeek V4 Flash como padrão — cuidado ao processar dados pessoais.

Claude Skills vs. MCP: Uma Questão Prática de Limites para Desenvolvedores
Um desenvolvedor questiona onde o valor do MCP se torna decisivo versus as Habilidades do Claude após o lançamento das Habilidades ter tornado o raciocínio sobre integração de ferramentas mais difícil, observando que instruções bem estruturadas muitas vezes podem ser suficientes sem limites de protocolo.

Usuários relatam que Claude Opus 4.7 regride em raciocínio e conversação
O Opus 4.7 introduz um novo tokenizador que custa 30-50% mais, apresenta metanarrativa, instabilidade de posição e planejamento sem execução — tornando-o pior para colaboração técnica do que o 4.6.