Libretto : Génération Déterministe d'Automatisation de Navigateur pour IA de Codage

Libretto est une boîte à outils pour créer des intégrations web robustes qui donne à votre agent de codage un navigateur en direct et un CLI économe en tokens. Il passe d'agents d'IA en temps d'exécution qui fonctionnent comme des boîtes noires à une "IA en temps de développement" où les scripts sont générés à l'avance sous forme de code réel que vous pouvez lire, modifier, versionner et déboguer.

Fonctionnalités clés et approche

Libretto adopte une approche hybride combinant l'automatisation d'interface utilisateur Playwright avec des requêtes réseau/API directes au sein de la session du navigateur pour une meilleure fiabilité et une évasion de la détection des bots. Cela répond aux limitations des outils d'IA en temps d'exécution qui reposent sur l'analyse DOM personnalisée, ce qui peut être peu fiable sur des sites web anciens ou complexes comme les systèmes de santé.

L'outil a été construit après un an de maintenance d'automatisations de navigateur pour les intégrations de portails EHR et payeurs dans une startup de santé, où le débogage des automatisations échouées prenait beaucoup de temps. Il aborde quatre problèmes principaux des outils d'IA en temps d'exécution :

Dépendance à l'analyse DOM personnalisée qui est peu fiable sur les sites web complexes
Coûts élevés dus à de nombreux appels d'IA et incapacité à mettre en cache les actions de manière fiable
Manque d'interprétabilité en temps d'exécution
Aide limitée pour générer de nouvelles automatisations ou déboguer les échecs

Utilisation pratique

L'installation se fait via npm : npm install libretto. La configuration initiale nécessite : npx libretto setup qui installe la compétence, télécharge Chromium et épingle le modèle de capture par défaut. Vous pouvez vérifier la préparation de l'espace de travail avec npx libretto status et modifier manuellement le modèle d'analyse de capture avec npx libretto ai configure <openai | anthropic | gemini | vertex>.

Libretto est conçu pour être utilisé comme une compétence via votre agent de codage avec des invites d'exemple incluant :

Génération de script en une seule fois : "Utilisez la compétence Libretto. Allez sur LinkedIn et scrapez les 10 premiers posts pour le contenu, qui l'a posté, le nombre de réactions, les 25 premiers commentaires et les 25 premiers reposts."
Construction interactive de script : "Je vais vous montrer un workflow dans l'EHR eclinicalworks pour obtenir l'ID d'assurance primaire d'un patient. Utilisez la compétence libretto pour le transformer en un script playwright qui prend le nom et la date de naissance du patient en entrée pour récupérer l'ID d'assurance."
Convertir l'automatisation du navigateur en requêtes réseau : "Nous avons un script de navigateur à ./integration.ts qui automatise l'accès à Hacker News et récupère les 10 premiers posts. Convertissez-le en scripts réseau directs à la place."
Réparer les intégrations cassées : "Nous avons un script de navigateur à ./integration.ts qui est censé aller sur Availity et effectuer une vérification d'éligibilité pour un patient. Mais j'obtiens une erreur de sélecteur cassé quand je l'exécute. Réparez-le."

Le CLI peut également être utilisé directement avec des commandes comme npx libretto open <url> pour lancer des sessions. Toutes les commandes acceptent --session <name> pour cibler des sessions spécifiques.

Les fonctionnalités supplémentaires incluent l'enregistrement des actions manuelles de l'utilisateur pour aider les agents à générer et mettre à jour les scripts, le débogage pas à pas, le mode lecture seule optionnel pour empêcher les agents de soumettre ou modifier accidentellement des données, et la génération de code qui suit les abstractions et conventions existantes dans votre référentiel de codage.

📖 Read the full source: HN AI Agents

Libretto : Génération Déterministe d'Automatisation de Navigateur pour les Agents d'IA de Programmation

Fonctionnalités clés et approche

Utilisation pratique

👀 See Also

Agint : Un outil CLI en Rust qui détecte les contradictions dans les fichiers d'instructions des agents IA

Claude Code à l'échelle : Comment la recherche agentique évite les modes de défaillance du RAG dans les grandes bases de code

Packs de contexte IA open source pour les questions juridiques, de conformité et financières

Le modèle Distilled Qwen 3.5 27B démontre de solides performances avec l'agent de codage Cursor AI.