Libretto: Deterministische Browser-Automatisierungserzeugung für KI-Codierungsagenten

✍️ OpenClawRadar📅 Veröffentlicht: 18. April 2026🔗 Source
Libretto: Deterministische Browser-Automatisierungserzeugung für KI-Codierungsagenten
Ad

Libretto ist ein Toolkit zum Erstellen robuster Web-Integrationen, das Ihrem Coding-Agenten einen Live-Browser und eine token-effiziente CLI bietet. Es wechselt von Laufzeit-KI-Agenten, die als Blackboxen arbeiten, zu "Entwicklungszeit-KI", bei der Skripte im Voraus als echter Code generiert werden, den Sie lesen, ändern, versionieren und debuggen können.

Wichtige Funktionen und Ansatz

Libretto verfolgt einen hybriden Ansatz, der Playwright-UI-Automatisierung mit direkten Netzwerk-/API-Anfragen innerhalb der Browser-Sitzung kombiniert, um bessere Zuverlässigkeit und Umgehung von Bot-Erkennung zu erreichen. Dies behebt Einschränkungen von Laufzeit-KI-Tools, die auf benutzerdefiniertes DOM-Parsing angewiesen sind, was bei älteren oder komplexen Websites wie Gesundheitssystemen unzuverlässig sein kann.

Das Tool wurde nach einem Jahr der Wartung von Browser-Automatisierungen für EHR- und Zahlungsportal-Integrationen in einem Gesundheits-Startup entwickelt, wo das Debuggen fehlgeschlagener Automatisierungen zeitaufwändig war. Es behebt vier Hauptprobleme mit Laufzeit-KI-Tools:

  • Abhängigkeit von benutzerdefiniertem DOM-Parsing, das bei komplexen Websites unzuverlässig ist
  • Hohe Kosten aufgrund vieler KI-Aufrufe und Unfähigkeit, Aktionen zuverlässig zu cachen
  • Fehlende Interpretierbarkeit zur Laufzeit
  • Begrenzte Hilfe bei der Generierung neuer Automatisierungen oder beim Debuggen von Fehlern
Ad

Praktische Verwendung

Die Installation erfolgt über npm: npm install libretto. Die Erstinstallation erfordert: npx libretto setup, was den Skill installiert, Chromium herunterlädt und das Standard-Snapshot-Modell festlegt. Sie können die Arbeitsbereichsbereitschaft mit npx libretto status überprüfen und das Snapshot-Analysemodell manuell mit npx libretto ai configure <openai | anthropic | gemini | vertex> ändern.

Libretto ist als Skill über Ihren Coding-Agenten nutzbar, mit Beispielaufforderungen wie:

  • Einmalige Skriptgenerierung: "Verwenden Sie den Libretto-Skill. Gehen Sie auf LinkedIn und scrapen Sie die ersten 10 Beiträge nach Inhalt, wer sie gepostet hat, die Anzahl der Reaktionen, die ersten 25 Kommentare und die ersten 25 Reposts."
  • Interaktive Skripterstellung: "Ich zeige Ihnen einen Workflow im eclinicalworks EHR, um die primäre Versicherungs-ID eines Patienten zu erhalten. Verwenden Sie den Libretto-Skill, um daraus ein Playwright-Skript zu machen, das Patientennamen und Geburtsdatum als Eingabe nimmt, um die Versicherungs-ID zurückzugeben."
  • Browser-Automatisierung in Netzwerkanfragen umwandeln: "Wir haben ein Browser-Skript unter ./integration.ts, das automatisiert auf Hacker News geht und die ersten 10 Beiträge abruft. Konvertieren Sie es stattdessen in direkte Netzwerkskripte."
  • Defekte Integrationen reparieren: "Wir haben ein Browser-Skript unter ./integration.ts, das auf Availity gehen und eine Berechtigungsprüfung für einen Patienten durchführen soll. Aber ich erhalte einen fehlerhaften Selektor-Fehler, wenn ich es ausführe. Reparieren Sie es."

Die CLI kann auch direkt mit Befehlen wie npx libretto open <url> verwendet werden, um Sitzungen zu starten. Alle Befehle akzeptieren --session <name>, um bestimmte Sitzungen anzusprechen.

Zusätzliche Funktionen umfassen das Aufzeichnen manueller Benutzeraktionen, um Agenten bei der Generierung und Aktualisierung von Skripten zu helfen, schrittweises Debugging, optionalen Nur-Lese-Modus, um zu verhindern, dass Agenten versehentlich Daten übermitteln oder ändern, und das Generieren von Code, der bestehenden Abstraktionen und Konventionen in Ihrem Coding-Repository folgt.

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch

PixelCheck: Ein npm-Paket, das KI-Agenten die visuelle Überprüfung von Webseiten ermöglicht
Werkzeuge

PixelCheck: Ein npm-Paket, das KI-Agenten die visuelle Überprüfung von Webseiten ermöglicht

PixelCheck ist ein npm-Paket, das KI-Agenten ermöglicht, Webseiten visuell zu öffnen, zu interagieren und zu bewerten – keine manuellen Screenshot-Feedback-Schleifen mehr.

OpenClawRadar
Hawkeye-Update fügt Schwarm-Orchestrierung, Remote-Aufgaben und lokale Modellunterstützung hinzu
Werkzeuge

Hawkeye-Update fügt Schwarm-Orchestrierung, Remote-Aufgaben und lokale Modellunterstützung hinzu

Hawkeye v1.0+ unterstützt jetzt Multi-Agenten-Schwarm-Orchestrierung, Remote-Aufgabenwarteschlangen und verbesserte Ollama/LM Studio-Integration. Der lokale First-AI-Agent-Flugschreiber hilft Entwicklern, nachzuvollziehen, was passiert, wenn Agenten in Repositories arbeiten.

OpenClawRadar
Claude-Code-Plugin für Reddit-Geschäftsrecherche
Werkzeuge

Claude-Code-Plugin für Reddit-Geschäftsrecherche

Ein Claude Code-Plugin automatisiert die Reddit-Recherche für Unternehmen, indem es relevante Beiträge sucht, Threads analysiert und strukturierte Markdown-Berichte mit Erkenntnissen und Quellenlinks erstellt. Keine API-Schlüssel erforderlich – Installation über GitHub und Ausführung mit einem einzigen Befehl.

OpenClawRadar
OpenClaw vs Hermes: Nach über 100 Deployments den richtigen selbstgehosteten KI-Agenten wählen
Werkzeuge

OpenClaw vs Hermes: Nach über 100 Deployments den richtigen selbstgehosteten KI-Agenten wählen

Nachdem er über 100 KI-Agenten für Kunden bereitgestellt hat, teilt ein Reddit-Nutzer hart erarbeitete Lektionen: OpenClaw (149K Sterne) ist das zuverlässige Arbeitstier für einzelne/kleine Flotten; Hermes glänzt bei der Multi-Agenten-Orchestrierung, hat aber eine kleinere Community.

OpenClawRadar