ProofShot CLI verleiht KI-Codierungsagenten Browser-Verifizierungsfunktionen

ProofShot: Browser-Verifizierung für KI-Coding-Agents
ProofShot ist ein Open-Source, Agent-agnostisches CLI, das KI-Coding-Agents die Fähigkeit gibt, UI-Funktionen, die sie erstellen, zu verifizieren, indem es Browser-Sitzungen aufzeichnet, Screenshots erfasst und Fehler sammelt. Es löst das Problem, dass Agenten Code schreiben, aber nicht sehen können, wie er tatsächlich im Browser aussieht oder Layoutprobleme und Konsolenfehler erkennen können.
So funktioniert es
Das Tool folgt einem dreistufigen Workflow: Start, Test, Stopp. Der KI-Agent steuert den Browser mit agent-browser-Befehlen, während ProofShot die Sitzung aufzeichnet.
Grundlegende Verwendung:
proofshot start --run "npm run dev" --port 3000
# agent navigiert, klickt, macht Screenshots
proofshot stop
Detailliertes Workflow-Beispiel:
# 1. Start — Browser öffnen, Aufnahme beginnen, Server-Logs erfassen
proofshot start --run "npm run dev" --port 3000 --description "Login-Formular-Verifizierung"
2. Test — der KI-Agent steuert den Browser
agent-browser snapshot -i # Interaktive Elemente anzeigen
agent-browser open http://localhost:3000/login # Navigieren
agent-browser fill @e2 "[email protected]" # Formular ausfüllen
agent-browser click @e5 # Absenden klicken
agent-browser screenshot ./proofshot-artifacts/step-login.png # Beweise erfassen
3. Stopp — Video + Screenshots + Fehler in Proof-Artefakte bündeln
proofshot stop
Hauptfunktionen
- Funktioniert mit jedem KI-Coding-Agenten, der Shell-Befehle ausführen kann (Claude Code, Cursor, Codex, Gemini CLI, Windsurf, GitHub Copilot, usw.)
- Als Skill verpackt, damit KI-Agenten verstehen, wie man es verwendet
- Basiert auf agent-browser von Vercel Labs (beschrieben als "weit besser und schneller als Playwright MCP")
- Kein Test-Framework — entscheidet nicht über Bestehen/Scheitern, liefert nur Beweise
- Erstellt eigenständige HTML-Dateien mit Video, Screenshots und Logs
- Kann Artefakte mit
proofshot prals Inline-Kommentare in GitHub-PRs hochladen
Installation und Einrichtung
npm install -g proofshot
proofshot install
Der erste Befehl installiert das CLI und agent-browser (mit headless Chromium). Der zweite erkennt Ihre KI-Coding-Tools und installiert den ProofShot-Skill auf Benutzerebene — funktioniert automatisch in allen Projekten.
Ausgabe-Artefakte
Jede Sitzung erzeugt einen zeitgestempelten Ordner in ./proofshot-artifacts/ mit:
session.webm— Videoaufnahme der gesamten Sitzungviewer.html— Eigenständiger interaktiver Viewer mit Scrub-Bar, Timeline und Console/Server-Log-TabsSUMMARY.md— Markdown-Bericht mit Fehlern, Screenshots und Videostep-*.png— Screenshots, die zu Schlüsselmomenten erfasst wurdensession-log.json— Aktions-Timeline mit Zeitstempeln und Elementdatenserver.log— Dev-Server stdout/stderr (bei Verwendung von--run)console-output.log— Browser-Konsolenausgabe
Verfügbare Befehle
proofshot install— KI-Coding-Tools erkennen und ProofShot-Skill installierenproofshot start— Verifizierungssitzung mit Browser, Aufnahme, Fehlererfassung startenproofshot stop— Aufnahme stoppen, Fehler sammeln, Proof-Artefakte generierenproofshot exec— Pass-Through-Befehl
Das Tool ist komplett kostenlos und Open-Source, ohne Vendor-Lock-in oder Cloud-Abhängigkeit. Es ist für Entwickler konzipiert, die KI-Agenten verwenden, um UI-Funktionen zu erstellen und die Ergebnisse überprüfen möchten, ohne jedes Mal manuell den Browser zu öffnen.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Entwickler misst Frustration mit 'F-Bombs pro tausend Prompts'-Metrik über 44.212 Claude Code-Logs
Ein Entwickler hat über 5 Monate hinweg 'fpk' (F-Bomben pro tausend Prompts) in 44.212 Claude-Code-Prompts gemessen. Die Frustration sank zwischen Claude Opus 4-5 und 4-7 um das 3,4-fache. Das meiste Fluchen bezog sich auf die Umgebungstools, nicht auf das Modell.

Open-Source-Claude-Code-Fähigkeit diagnostiziert Hindernisse bei der KI-Einführung
Eine MIT-lizenzierte Claude Code-Fähigkeit analysiert, wo Unternehmen bei der KI-Einführung stecken bleiben – bei Tools, Kultur oder Messung – und erstellt 90-Tage-Pläne mit benannten Verantwortlichen. Basierend auf Interviews mit über 100 Gründern und Vorstandsmitgliedern.

Tether: Ein MCP-Server zum Austausch von Kontext zwischen KI-Modellen über SQLite
Tether ist ein Open-Source-Tool, das JSON-Daten auf 28-Byte inhaltsadressierte Handles reduziert, wodurch mehrere KI-Modelle Kontext über eine gemeinsame SQLite-Datenbank teilen können. Es fungiert als MCP-Server und ermöglicht die direkte Kommunikation zwischen Modellen wie Claude und MiniMax ohne Kopieren und Einfügen.

TestThread: Open-Source-Testframework für KI-Agenten
TestThread ist ein Open-Source-Testframework für KI-Agenten, das Tests gegen Live-Endpunkte ausführt, Pass/Fail-Ergebnisse mit KI-Diagnose liefert und Funktionen wie semantisches Matching, PII-Erkennung und CI/CD-Integration umfasst.