ProofShot: CLI für KI-Agenten zur Überprüfung von UI-Code mit Browser-Aufzeichnung

✍️ OpenClawRadar📅 Veröffentlicht: 24. März 2026🔗 Source
ProofShot: CLI für KI-Agenten zur Überprüfung von UI-Code mit Browser-Aufzeichnung
Ad

Was ProofShot macht

ProofShot ist ein CLI-Tool, das KI-Codierungsagenten visuelle Verifizierungsfähigkeiten bietet. Es ermöglicht Agenten zu sehen, wie die von ihnen erstellte Benutzeroberfläche tatsächlich im Browser aussieht, Layoutprobleme zu erkennen und Konsolenfehler zu erfassen.

Wie es funktioniert

Das Tool arbeitet mit drei Hauptbefehlen:

  • proofshot start --run "npm run dev" --port 3000 - Startet Ihren Entwicklungsserver, öffnet headless Chromium und beginnt mit der Videoaufzeichnung
  • Ihr KI-Agent führt dann Aktionen wie proofshot exec navigate "http://localhost:3000" und proofshot exec screenshot "homepage" aus, um zu navigieren, zu klicken, Formulare auszufüllen und Screenshots zu erstellen
  • proofshot stop - Sammelt Fehler, stoppt die Aufzeichnung, schneidet Leerlaufzeiten heraus und erzeugt Beweisartefakte

Ausgabe und Funktionen

ProofShot erzeugt eine eigenständige HTML-Datei, die enthält:

  • Video-Wiedergabe der Browsersitzung synchronisiert mit einer Aktionszeitleiste
  • Während der Sitzung erstellte Screenshots
  • Elementbeschriftungen für jede Aktion
  • Während der Sitzung erfasste Browser-Konsolenfehler
  • Serverscans mit Mustererkennung für JavaScript, Python, Go, Rust und andere Sprachen
  • PR-fertige Artefakte einschließlich SUMMARY.md und formatierten Ausgaben für Pull Requests
  • Visuellen Vergleich mit Baselines
Ad

Technische Details

Das Tool ist:

  • Auf agent-browser von Vercel Labs aufgebaut (beschrieben als "weitaus besser und schneller als Playwright MCP")
  • Kein Testframework - der Agent entscheidet nicht über Bestehen/Nichtbestehen, sondern liefert nur Beweise
  • Agentenunabhängig - funktioniert mit Claude Code, Cursor, Codex, Gemini CLI, Windsurf und jedem MCP-kompatiblen Agenten
  • Als Skill verpackt, damit KI-Agenten genau wissen, wie es funktioniert
  • Open Source mit MIT-Lizenz

Installation und Einrichtung

$ npm install -g proofshot

$ proofshot install

Das Tool schneidet automatisch Leerlaufzeiten aus Aufzeichnungen heraus, sodass Sie nur sehen, was der Agent tatsächlich getan hat, nicht inaktive Wartezeiten.

📖 Read the full source: HN LLM Tools

Ad

👀 Siehe auch

KANBAII: Ein visuelles Kanban-Board, entwickelt mit Claude Code für KI-unterstützte Entwicklung
Werkzeuge

KANBAII: Ein visuelles Kanban-Board, entwickelt mit Claude Code für KI-unterstützte Entwicklung

Ein Entwickler hat KANBAII, ein lokales Kanban-Board-Tool, komplett mit Claude Code über zwei Monate hinweg erstellt. Es bietet visuelles Aufgabenmanagement, KI-Planung und parallele Ausführungsmodi für Claude-Code-Workflows.

OpenClawRadar
Wie Clawdbot 6 KI-Agenten mit einer produktionsstabilen Work Queue koordiniert
Werkzeuge

Wie Clawdbot 6 KI-Agenten mit einer produktionsstabilen Work Queue koordiniert

Das Team von Clawdbot entwickelte ein Arbeitssystem zur Koordination von 6 KI-Agenten (Design, Code, Marketing, Betrieb) für ihren KI-gesteuerten Shop. Das System umfasst atomare Aufgabenübernahme, einen Zustandsautomaten, Wiederholungslogik mit Backoff, Aufgabenketten, Heartbeat-Überwachung und einen Daemon-Orchestrator.

OpenClawRadar
TestThread: Open-Source-Testframework für KI-Agenten
Werkzeuge

TestThread: Open-Source-Testframework für KI-Agenten

TestThread ist ein Open-Source-Testframework für KI-Agenten, das Tests gegen Live-Endpunkte ausführt, Pass/Fail-Ergebnisse mit KI-Diagnose liefert und Funktionen wie semantisches Matching, PII-Erkennung und CI/CD-Integration umfasst.

OpenClawRadar
Claude Code als Compiler: Eine praktische Neuausrichtung für die KI-Entwicklung
Werkzeuge

Claude Code als Compiler: Eine praktische Neuausrichtung für die KI-Entwicklung

Ein Reddit-Beitrag argumentiert, dass Claude Code wie ein Compiler funktioniert, der Englisch in funktionierende Software übersetzt, und zieht Parallelen zu historischen Durchbrüchen in der Informatik wie Grace Hoppers A-0 und FORTRAN. Der Autor beschreibt, wie aus einer 3-Absätze-langen englischen Beschreibung 400 Zeilen Code über 6 Dateien generiert wurden, wobei in 25 Minuten zwei Probleme entdeckt wurden.

OpenClawRadar