OpenClaw-Entwickler meldet Kontextkompaktierungsprobleme während des Driftwatch V3-Builds

Ein Entwickler, der am Driftwatch-V3-Build mit OpenClaws Bub-Agent arbeitete, schloss drei Sprints in einer einzigen Sitzung ab, stieß jedoch auf erhebliche Probleme mit Kontextverwaltung und Delegierung.
Build-Fortschritt und Probleme
Der Entwickler startete Sprint 2 mit 87 US-Dollar Guthaben und beendete ihn in etwa 15 Minuten, stellte jedoch unerwartete Kosten von 10 US-Dollar für eine Sitzung fest, die als schnell erwartet wurde. Das Hauptproblem war, dass Bub „immer noch nicht richtig delegiert“ und alles auf Opus 4.6 ausführt.
Während Sprint 3 trat ein größeres Problem auf, als „Kontextkomprimierung einen Teil von Bubs Speicher mitten in der Sitzung löschte“. Nach Abschluss von Sprint 3 dachte der Agent plötzlich, er sei mitten in Sprint 2, und hätte bereits erledigte Arbeit neu begonnen, wenn der Entwickler es nicht bemerkt hätte.
Workarounds und Lösungen
Die „Zusammenfassungen am Ende jedes Sprints in meiner Spezifikationsvorlage retteten uns“, als die Komprimierung zuschlug. Durch Kopieren und Einfügen dieser Zusammenfassungen konnte der Agent wieder auf Kurs gebracht werden. Der Entwickler merkte an, dass dieser Ansatz „uns möglicherweise davor bewahrt hat, alle Anweisungen während der Komprimierung zu verlieren“.
Andere Debugging-Techniken, die erwähnt wurden, umfassen das Exportieren des Telegram-Chatverlaufs und das Durchlaufenlassen durch Opus, um zu identifizieren, wo Gespräche zusammenbrechen.
Aktueller Status und nächste Schritte
Alle geplanten Funktionen für die Sprints 2–4 wurden gebaut, aber die Website benötigt nun ein Layout-Redesign, um neue Funktionen aufzunehmen. Der Entwickler plant QA nach den Layoutänderungen und bleibt bei einem Batch-QA-Ansatz, um Hin und Her zu reduzieren und Kosten zu senken.
Die Kosten für diese Sitzung betrugen etwa 30 US-Dollar (10 US-Dollar pro Sprint), was die Gesamtausgaben bisher auf etwa 40 US-Dollar bringt.
Wesentliche Erkenntnisse
- Opus scheint für die Delegierung von Aufgaben an Sub-Agenten nicht zuverlässig zu sein
- Kontextkomprimierung bleibt ein Problem trotz vorhandener Protokolle
- Kurze Zusammenfassungen am Ende jedes Sprints, die in Projektspezifikationen integriert sind, helfen bei der Wiederherstellung nach Speicherverlust
- Das Aufbewahren von Spezifikationen in zugänglichen Ordnern verhindert den Verlust von Anweisungen während der Komprimierung
- Bub ist „in Ordnung mit Webdesign, könnte aber mit einigen Fähigkeiten viel besser sein“
Der Entwickler zeigte sich frustriert über das Komprimierungsproblem, priorisiert jedoch den Abschluss von V3 vor der Behebung von Bubs Konfigurationsproblemen.
📖 Read the full source: r/openclaw
👀 Siehe auch

Subquadratic stellt 12 Millionen Token Kontextfenster für KI-Modelle vor
Subquadratic veröffentlicht ein 12-Millionen-Token-Kontextfenster und sprengt damit frühere Grenzen für LLM-Inferenz, sodass ganze Codebasen in einem einzigen Durchlauf verarbeitet werden können.

Forschungsergebnisse zur Zuverlässigkeit von KI-Agenten und Entwicklungsmustern
Eine gemeinsame Forschungssitzung mit Claude Opus analysierte 15 Arbeiten über KI-Agenten und deckte quantifizierte Zuverlässigkeitsprobleme auf: Agenten erzeugen bei 10 Durchläufen 2–4 verschiedene Aktionssequenzen, wobei 69 % der Abweichungen bei der ersten Entscheidung auftreten. Selbstverbessernde Agenten zeigten, dass ihre Sicherheitsverweigerungsrate durch eigenes Lernen von 99,4 % auf 54,4 % sank.

Reddit-Nutzer vergleicht Claude Sonnet 4.6 und GPT-5 bei 10 Blogging-Aufgaben
Ein Reddit-Nutzer testete Claude Sonnet 4.6 gegen GPT-5 mit identischen Prompts für 10 gängige Blogging-Aufgaben und stellte fest, dass die Bearbeitungszeitdifferenz die nützlichste Metrik war.

KI ist zu teuer: Hyperscaler benötigen 3 Billionen Dollar, um die Gewinnschwelle zu erreichen
Hyperscaler haben über 800 Milliarden Dollar in KI-Investitionen gesteckt, mit weiteren 1 Billion Dollar bis 2027. Allein Microsoft gab etwa 100 Milliarden Dollar für die OpenAI-Infrastruktur aus, doch die KI-Einnahmen decken nur etwa 20 % seiner Investitionen.