ProofShot : CLI pour Agents IA pour Vérifier le Code UI avec Enregistrement Navigateur

Ce que fait ProofShot
ProofShot est un outil CLI qui donne aux agents d'IA de codage des capacités de vérification visuelle. Il permet aux agents de voir à quoi ressemble réellement l'interface utilisateur qu'ils construisent dans le navigateur, de détecter les problèmes de mise en page et de capturer les erreurs de la console.
Comment cela fonctionne
L'outil fonctionne via trois commandes principales :
proofshot start --run "npm run dev" --port 3000- Lance votre serveur de développement, ouvre Chromium sans interface et commence l'enregistrement vidéo- Votre agent d'IA exécute ensuite des actions comme
proofshot exec navigate "http://localhost:3000"etproofshot exec screenshot "homepage"pour naviguer, cliquer, remplir des formulaires et prendre des captures d'écran proofshot stop- Collecte les erreurs, arrête l'enregistrement, supprime les temps morts et génère les artefacts de preuve
Sortie et fonctionnalités
ProofShot génère un fichier HTML autonome contenant :
- La lecture vidéo de la session du navigateur synchronisée avec une chronologie des actions
- Les captures d'écran prises pendant la session
- Les étiquettes d'éléments pour chaque action
- Les erreurs de la console du navigateur capturées pendant la session
- Les journaux du serveur analysés avec correspondance de motifs pour JavaScript, Python, Go, Rust et d'autres langages
- Des artefacts prêts pour les PR incluant SUMMARY.md et une sortie formatée pour les pull requests
- Une comparaison visuelle des différences par rapport aux références
Détails techniques
L'outil est :
- Basé sur agent-browser de Vercel Labs (décrit comme "bien meilleur et plus rapide que Playwright MCP")
- Pas un framework de test - l'agent ne décide pas de réussite/échec, il fournit simplement des preuves
- Agnostique aux agents - fonctionne avec Claude Code, Cursor, Codex, Gemini CLI, Windsurf et tout agent compatible MCP
- Conditionné en tant que compétence pour que les agents d'IA sachent exactement comment il fonctionne
- Open source avec licence MIT
Installation et configuration
$ npm install -g proofshot
$ proofshot install
L'outil supprime automatiquement les temps morts des enregistrements, donc vous ne voyez que ce que l'agent a réellement fait, pas les périodes d'attente inactives.
📖 Read the full source: HN LLM Tools
👀 See Also

Agent Swarm : Cadre d'Orchestration Multi-Agents pour Assistants de Codage IA
Agent Swarm est un framework open-source qui permet à des équipes d'agents d'IA de codage de se coordonner de manière autonome. Un agent principal reçoit des tâches depuis Slack, GitHub ou email, les décompose et les délègue à des agents travailleurs isolés dans Docker.

GSD-Lite : Une machine à états pour le code Claude qui impose le TDD et empêche le contournement des tests
GSD-Lite est un serveur MCP open-source qui ajoute une machine de workflow à 12 états à Claude Code, imposant le développement piloté par les tests avec des invites anti-rationalisation spécifiques et des contextes d'agents distincts pour l'exécution, la revue et le débogage.

ATLAS : Un Cadre d'Apprentissage Adaptatif en Temps de Test Surpasse Claude Sonnet sur les Benchmarks de Codage avec un GPU à 500 $
ATLAS atteint 74,6 % de réussite pass@1-v(k=3) sur LiveCodeBench avec un modèle figé de 14B sur un seul GPU grand public, surpassant les 71,4 % de Claude 4.5 Sonnet à une fraction du coût grâce à une génération pilotée par contraintes et un raffinement itératif auto-vérifié.

Scrapling intégré comme colonne vertébrale de scraping d'OpenClaw
Scrapling, une bibliothèque open-source qui apprend la structure des pages et s'adapte aux changements, a été intégrée à OpenClaw en tant que moteur de scraping principal. Elle est 774 fois plus rapide que BeautifulSoup avec Lxml et prend en charge plusieurs types de sélecteurs avec des sessions asynchrones.