Die OpenClaw-Fähigkeit reduziert die Zugänglichkeitsbaum-Tokens von 600.000 auf 1.300 für werbelastige Websites.

Token-Reduzierung für moderne Webaufgaben
Ein Entwickler auf r/openclaw teilte Benchmark-Daten, die signifikante Token-Schwankungen im standardmäßigen Barrierefreiheitsbaum von OpenClaw auf verschiedenen Websites zeigen. Die Daten offenbaren, dass werbelastige Seiten enorme Token-Zahlen generieren, während einfachere Seiten handhabbar bleiben.
Benchmark-Daten aus der Quelle
- slickdeals: 24.567 Elemente → ~598K Token
- ycombinator: 681 Elemente → ~16K Token
- httpbin: 34 Elemente → ~1,5K Token
Der Entwickler merkte an, dass "werbelastige Seiten brutal sind" und 600K Token benötigt werden, nur um Seiten voller Tracking-Pixel und Werbe-Iframes zu beobachten.
ML-basierte Beschneidungslösung
Um dies zu adressieren, bauten sie eine OpenClaw-Fähigkeit, die maschinelles Lernen-basiertes Element-Ranking nutzt, um den Barrierefreiheitsbaum zu beschneiden, bevor er an das LLM gesendet wird. Der Ansatz behält nur die Top ~50 aktionsfähigen Elemente (konfigurierbar) bei, was slickdeals von ~598K Token auf ~1,3K Token reduziert.
Verfügbare Ressourcen
Die Fähigkeit ist verfügbar als:
- OpenClaw Skill: https://clawhub.ai/rcholic/predicate-snapshot
- GitHub-Repository: https://github.com/PredicateSystems/openclaw-predicate-skill
Der Entwickler sucht Feedback zu alternativen Ansätzen für das Beschneiden von Barrierefreiheitsbäumen für OpenClaw.
📖 Read the full source: r/openclaw
👀 Siehe auch

120 Prompt Patterns getestet: 8, die bei Claude Code tatsächlich funktionieren
Ein 3-monatiger empirischer Test von 120 Prompt-Mustern für Claude Code ergibt 8 umsetzbare Befehle und 5 Validierungs-Prompts. Schlüsselmuster: L99 (reduziert Absicherungen), /ghost (entfernt KI-Stimme), OODA (strukturierte Argumentation), ULTRATHINK (tiefgehendes Denken), HARDMODE (Einschränkungs-Debugging).

Die Dual-Modell-Architektur reduziert den Token-Verbrauch für lange Gespräche um die Hälfte.
Ein Entwickler hat ein Dual-Modell-System aufgebaut, bei dem ein kleines 'Unterbewusstseins'-Modell im Hintergrund den Gesprächsverlauf komprimiert. Dadurch kann das Hauptmodell mit einem kuratierten Kontext von etwa 35K Token arbeiten, anstatt mit 120K Token des rohen Verlaufs. Diese Architektur reduziert den Token-Verbrauch bei längerfristigen Projektarbeiten ungefähr um die Hälfte.

Unterstudie: Ein lehrbarer Desktop-Agent, der Aufgaben durch Vorführung lernt
Understudy ist eine lokal-first Desktop-Agenten-Laufzeitumgebung, die GUI-Apps, Browser, Shell-Tools, Dateien und Messaging in einer Sitzung bedienen kann. Sie demonstrieren eine Aufgabe einmal, sie zeichnet Bildschirmvideo und semantische Ereignisse auf, extrahiert die Absicht statt Koordinaten und verwandelt sie in eine wiederverwendbare Fähigkeit.

Microsoft DebugMCP VS Code Extension verleiht KI-Agenten Debugging-Fähigkeiten
Microsoft DebugMCP ist eine VS Code-Erweiterung, die den vollständigen VS Code-Debugger über das Model Context Protocol (MCP) für KI-Coding-Agenten verfügbar macht, sodass sie Haltepunkte setzen, Code schrittweise durchlaufen, Variablen inspizieren und Ausdrücke auswerten können.