Libretto : Génération Déterministe d'Automatisation de Navigateur pour les Agents d'IA de Programmation

✍️ OpenClawRadar📅 Publié: April 18, 2026🔗 Source
Libretto : Génération Déterministe d'Automatisation de Navigateur pour les Agents d'IA de Programmation
Ad

Libretto est une boîte à outils pour créer des intégrations web robustes qui donne à votre agent de codage un navigateur en direct et un CLI économe en tokens. Il passe d'agents d'IA en temps d'exécution qui fonctionnent comme des boîtes noires à une "IA en temps de développement" où les scripts sont générés à l'avance sous forme de code réel que vous pouvez lire, modifier, versionner et déboguer.

Fonctionnalités clés et approche

Libretto adopte une approche hybride combinant l'automatisation d'interface utilisateur Playwright avec des requêtes réseau/API directes au sein de la session du navigateur pour une meilleure fiabilité et une évasion de la détection des bots. Cela répond aux limitations des outils d'IA en temps d'exécution qui reposent sur l'analyse DOM personnalisée, ce qui peut être peu fiable sur des sites web anciens ou complexes comme les systèmes de santé.

L'outil a été construit après un an de maintenance d'automatisations de navigateur pour les intégrations de portails EHR et payeurs dans une startup de santé, où le débogage des automatisations échouées prenait beaucoup de temps. Il aborde quatre problèmes principaux des outils d'IA en temps d'exécution :

  • Dépendance à l'analyse DOM personnalisée qui est peu fiable sur les sites web complexes
  • Coûts élevés dus à de nombreux appels d'IA et incapacité à mettre en cache les actions de manière fiable
  • Manque d'interprétabilité en temps d'exécution
  • Aide limitée pour générer de nouvelles automatisations ou déboguer les échecs
Ad

Utilisation pratique

L'installation se fait via npm : npm install libretto. La configuration initiale nécessite : npx libretto setup qui installe la compétence, télécharge Chromium et épingle le modèle de capture par défaut. Vous pouvez vérifier la préparation de l'espace de travail avec npx libretto status et modifier manuellement le modèle d'analyse de capture avec npx libretto ai configure <openai | anthropic | gemini | vertex>.

Libretto est conçu pour être utilisé comme une compétence via votre agent de codage avec des invites d'exemple incluant :

  • Génération de script en une seule fois : "Utilisez la compétence Libretto. Allez sur LinkedIn et scrapez les 10 premiers posts pour le contenu, qui l'a posté, le nombre de réactions, les 25 premiers commentaires et les 25 premiers reposts."
  • Construction interactive de script : "Je vais vous montrer un workflow dans l'EHR eclinicalworks pour obtenir l'ID d'assurance primaire d'un patient. Utilisez la compétence libretto pour le transformer en un script playwright qui prend le nom et la date de naissance du patient en entrée pour récupérer l'ID d'assurance."
  • Convertir l'automatisation du navigateur en requêtes réseau : "Nous avons un script de navigateur à ./integration.ts qui automatise l'accès à Hacker News et récupère les 10 premiers posts. Convertissez-le en scripts réseau directs à la place."
  • Réparer les intégrations cassées : "Nous avons un script de navigateur à ./integration.ts qui est censé aller sur Availity et effectuer une vérification d'éligibilité pour un patient. Mais j'obtiens une erreur de sélecteur cassé quand je l'exécute. Réparez-le."

Le CLI peut également être utilisé directement avec des commandes comme npx libretto open <url> pour lancer des sessions. Toutes les commandes acceptent --session <name> pour cibler des sessions spécifiques.

Les fonctionnalités supplémentaires incluent l'enregistrement des actions manuelles de l'utilisateur pour aider les agents à générer et mettre à jour les scripts, le débogage pas à pas, le mode lecture seule optionnel pour empêcher les agents de soumettre ou modifier accidentellement des données, et la génération de code qui suit les abstractions et conventions existantes dans votre référentiel de codage.

📖 Read the full source: HN AI Agents

Ad

👀 See Also

SecureContext : Un Plugin MCP pour la Mémoire Persistante et la Réduction de Jetons dans Claude Code
Tools

SecureContext : Un Plugin MCP pour la Mémoire Persistante et la Réduction de Jetons dans Claude Code

SecureContext est un plugin MCP open source qui offre une persistance de style MemGPT entre les sessions Claude Code, réduit les jetons d'entrée d'environ 87 % grâce à un rappel de contexte ciblé, et isole les identifiants via un bac à sable de sécurité.

OpenClawRadar
re_gent : Git pour les agents de codage IA – Contrôle de version pour l'activité des agents
Tools

re_gent : Git pour les agents de codage IA – Contrôle de version pour l'activité des agents

re_gent est un outil open-source qui fournit un contrôle de version pour les sessions d'agents IA, enregistrant chaque appel d'outil, stockant les prompts et les différences de fichiers, et permettant des commandes comme `rgt log`, `rgt blame` et `rgt rewind` (bientôt disponible).

OpenClawRadar
TechDebtMCP v2.0.0 : Serveur MCP pour l'analyse de la dette technique dans 14 langues
Tools

TechDebtMCP v2.0.0 : Serveur MCP pour l'analyse de la dette technique dans 14 langues

TechDebtMCP v2.0.0 est un serveur MCP qui connecte Claude aux bases de code pour trouver, mesurer et hiérarchiser la dette technique dans 14 langages de programmation, notamment JS/TS, Python, Java, Swift, Kotlin, Go, Rust, C/C++, C#, Ruby et PHP.

OpenClawRadar
Deblank : Outil pour Supprimer le Formatage du Code afin de Réduire les Tokens des LLM
Tools

Deblank : Outil pour Supprimer le Formatage du Code afin de Réduire les Tokens des LLM

Deblank est un outil open-source qui supprime la mise en forme du code (indentation, espaces, sauts de ligne) avant de l'envoyer aux LLM, réduisant les tokens d'environ 30 % pour Java/C++ et d'environ 9 % pour Python, avec une latence d'environ 76 ms. Il prend en charge Python, Java, C/C++, C#, JS/TS et Go.

OpenClawRadar