Sakana AI eröffnet RSI-Labor: Rekursive Selbstverbesserung mit Foundation-Modellen

✍️ OpenClawRadar📅 Veröffentlicht: 6. Juni 2026🔗 Source
Sakana AI eröffnet RSI-Labor: Rekursive Selbstverbesserung mit Foundation-Modellen
Ad

Sakana AI hat offiziell sein Recursive Self-Improvement (RSI) Lab eingerichtet, eine dedizierte Forschungsgruppe, die den KI-Entwicklungsprozess selbst mit KI neu gestalten soll. Anstatt monolithische Modelle mit roher Gewalt zu trainieren, baut das Labor offene, adaptive Architekturen, die sich gemeinsam selbst verbessern – basierend auf einer Reihe veröffentlichter Meilensteine.

Wichtige Forschungsmeilensteine für RSI

  • LLM-Squared (2024): Entwickelt mit Oxford und Cambridge, ermöglicht dieses Framework LLMs, bessere Methoden zum Trainieren von LLMs zu erfinden (LLM²). Es entstand DiscoPOP, ein Präferenzoptimierungsalgorithmus, der vollständig von einem LLM durch einen generationellen Evolutionszyklus entdeckt und geschrieben wurde.
  • Darwin Gödel Machine (2025): In Zusammenarbeit mit der UBC unterhält DGM eine sich entwickelnde Abstammungslinie von Agentenvarianten, die ihre eigene Codebasis autonom umschreiben. Auf SWE-bench verdoppelte es die Basisleistung – eine absolute Verbesserung um 30 Prozentpunkte.
  • ShinkaEvolve (2025): Open-Source-Framework, das mustereffiziente Programmevolution demonstriert. Löste komplexe Optimierungsprobleme mit nur 150 Stichproben und generierte eine neuartige Loss-Funktion für Lastausgleich, die Mixture-of-Experts (MoE)-Modelle verbessert.
  • ALE-Agent (2025): Optimierungsagent, der im AtCoder Heuristic Contest 058 den 1. Platz unter 804 menschlichen Teilnehmern belegte. Er nutzt massives Inference-Time-Scaling und selbstständiges Lernen aus Trial-and-Error-Fehlern, um autonom neuartige Algorithmen abzuleiten.
  • Digital Red Queen (2026): Zusammenarbeit mit MIT zur Etablierung offener, adversarischer Koevolution in Core War. LLMs verfassen konkurrierenden Code, was zu emergenten komplexen Softwarestrategien und konvergenter Evolution führt – grundlegend für die Cybersicherheits-RSI.
  • The AI Scientist (2024–2026): Vollautomatisierte, offene wissenschaftliche Entdeckung, von der Ideenfindung über die Experimentdurchführung bis zum vollständigen Schreiben von Papieren und Peer-Review.
Ad

Warum dies für Entwickler wichtig ist

RSI steht für einen Wandel von statischer, menschengeführter F&E hin zu autonomen, sich selbst verbessernden Intelligenzmaschinen. Der Ansatz des Labors – evolutionäre Optimierungsschleifen, sich selbst umschreibende Agenten und automatisierte Wissenschaft – wirkt sich direkt darauf aus, wie KI-Codierungsagenten gebaut und verbessert werden. Anstatt auf manuelle Optimierung zu warten, verfeinern diese Systeme kontinuierlich ihre eigenen Architekturen.

📖 Lesen Sie die vollständige Quelle: HN AI Agents

Ad

👀 Siehe auch

Claude Code v2.1.133: Worktree.baseRef-Rücknahme, Sandbox-Pfade, Proxy-Fix für MCP OAuth
Nachrichten

Claude Code v2.1.133: Worktree.baseRef-Rücknahme, Sandbox-Pfade, Proxy-Fix für MCP OAuth

Anthropic veröffentlicht v2.1.133 des Claude Code CLI mit einer neuen worktree.baseRef-Einstellung, die standardmäßig fresh (Branch von origin/default) verwendet, sandbox.bwrapPath und sandbox.socatPath für benutzerdefinierte bubblewrap/socat-Binärdateien, einen Proxy/mTLS-Fix für den MCP-OAuth-Ablauf und mehrere Fehlerbehebungen.

OpenClawRadar
Die Analyse von 100 Millionen Tokens im Claude Code zeigt eine Nutzungsrate der Eingabe von 99,4 %.
Nachrichten

Die Analyse von 100 Millionen Tokens im Claude Code zeigt eine Nutzungsrate der Eingabe von 99,4 %.

Eine Analyse von 1.289 Anfragen über längere Codingsitzungen zeigt, dass Claude Code 100,3 Mio. Eingabe-Tokens (99,4 %) gegenüber nur 616.000 Ausgabe-Tokens (0,6 %) verwendete, wobei 84,2 Mio. Tokens aufgrund wiederholter Kontextwiedergabe zwischengespeichert wurden.

OpenClawRadar
Claude Code System Prompts v2.1.53-2.1.55: Speicherauswahl hinzugefügt, Befehlsausführung entfernt
Nachrichten

Claude Code System Prompts v2.1.53-2.1.55: Speicherauswahl hinzugefügt, Befehlsausführung entfernt

Claude Code Systemprompt-Versionen 2.1.53 bis 2.1.55 fügen Speicherauswahlanweisungen hinzu (156 Token), entfernen den Befehlausführungsspezialisten (109 Token) und strukturieren Prompts in etwa 70 atomare Dateien um. Hintergrundagenten benachrichtigen jetzt automatisch bei Abschluss, anstatt Ausgabedateipfade bereitzustellen.

OpenClawRadar
Codestrap-Gründer kritisieren KI-Codierungsmetriken und warnen vor Qualitätsproblemen
Nachrichten

Codestrap-Gründer kritisieren KI-Codierungsmetriken und warnen vor Qualitätsproblemen

Die Gründer von Codestrap argumentieren, dass KI-Codierungswerkzeuge falsch bewertet werden, etwa anhand von Metriken wie Codezeilen und Pull-Requests, während Qualitätsmetriken Probleme aufzeigen – wie eine 3,7-mal größere Codebasis, die bei einer SQLite-zu-Rust-Umschreibung 2.000-mal schlechter abschneidet.

OpenClawRadar