ProofShot: CLI für KI-Agenten zur Überprüfung von UI-Code mit Browser-Aufzeichnung

Was ProofShot macht
ProofShot ist ein CLI-Tool, das KI-Codierungsagenten visuelle Verifizierungsfähigkeiten bietet. Es ermöglicht Agenten zu sehen, wie die von ihnen erstellte Benutzeroberfläche tatsächlich im Browser aussieht, Layoutprobleme zu erkennen und Konsolenfehler zu erfassen.
Wie es funktioniert
Das Tool arbeitet mit drei Hauptbefehlen:
proofshot start --run "npm run dev" --port 3000- Startet Ihren Entwicklungsserver, öffnet headless Chromium und beginnt mit der Videoaufzeichnung- Ihr KI-Agent führt dann Aktionen wie
proofshot exec navigate "http://localhost:3000"undproofshot exec screenshot "homepage"aus, um zu navigieren, zu klicken, Formulare auszufüllen und Screenshots zu erstellen proofshot stop- Sammelt Fehler, stoppt die Aufzeichnung, schneidet Leerlaufzeiten heraus und erzeugt Beweisartefakte
Ausgabe und Funktionen
ProofShot erzeugt eine eigenständige HTML-Datei, die enthält:
- Video-Wiedergabe der Browsersitzung synchronisiert mit einer Aktionszeitleiste
- Während der Sitzung erstellte Screenshots
- Elementbeschriftungen für jede Aktion
- Während der Sitzung erfasste Browser-Konsolenfehler
- Serverscans mit Mustererkennung für JavaScript, Python, Go, Rust und andere Sprachen
- PR-fertige Artefakte einschließlich SUMMARY.md und formatierten Ausgaben für Pull Requests
- Visuellen Vergleich mit Baselines
Technische Details
Das Tool ist:
- Auf agent-browser von Vercel Labs aufgebaut (beschrieben als "weitaus besser und schneller als Playwright MCP")
- Kein Testframework - der Agent entscheidet nicht über Bestehen/Nichtbestehen, sondern liefert nur Beweise
- Agentenunabhängig - funktioniert mit Claude Code, Cursor, Codex, Gemini CLI, Windsurf und jedem MCP-kompatiblen Agenten
- Als Skill verpackt, damit KI-Agenten genau wissen, wie es funktioniert
- Open Source mit MIT-Lizenz
Installation und Einrichtung
$ npm install -g proofshot
$ proofshot install
Das Tool schneidet automatisch Leerlaufzeiten aus Aufzeichnungen heraus, sodass Sie nur sehen, was der Agent tatsächlich getan hat, nicht inaktive Wartezeiten.
📖 Read the full source: HN LLM Tools
👀 Siehe auch

KANBAII: Ein visuelles Kanban-Board, entwickelt mit Claude Code für KI-unterstützte Entwicklung
Ein Entwickler hat KANBAII, ein lokales Kanban-Board-Tool, komplett mit Claude Code über zwei Monate hinweg erstellt. Es bietet visuelles Aufgabenmanagement, KI-Planung und parallele Ausführungsmodi für Claude-Code-Workflows.

Wie Clawdbot 6 KI-Agenten mit einer produktionsstabilen Work Queue koordiniert
Das Team von Clawdbot entwickelte ein Arbeitssystem zur Koordination von 6 KI-Agenten (Design, Code, Marketing, Betrieb) für ihren KI-gesteuerten Shop. Das System umfasst atomare Aufgabenübernahme, einen Zustandsautomaten, Wiederholungslogik mit Backoff, Aufgabenketten, Heartbeat-Überwachung und einen Daemon-Orchestrator.

TestThread: Open-Source-Testframework für KI-Agenten
TestThread ist ein Open-Source-Testframework für KI-Agenten, das Tests gegen Live-Endpunkte ausführt, Pass/Fail-Ergebnisse mit KI-Diagnose liefert und Funktionen wie semantisches Matching, PII-Erkennung und CI/CD-Integration umfasst.

Claude Code als Compiler: Eine praktische Neuausrichtung für die KI-Entwicklung
Ein Reddit-Beitrag argumentiert, dass Claude Code wie ein Compiler funktioniert, der Englisch in funktionierende Software übersetzt, und zieht Parallelen zu historischen Durchbrüchen in der Informatik wie Grace Hoppers A-0 und FORTRAN. Der Autor beschreibt, wie aus einer 3-Absätze-langen englischen Beschreibung 400 Zeilen Code über 6 Dateien generiert wurden, wobei in 25 Minuten zwei Probleme entdeckt wurden.