PixelCheck: Ein npm-Paket, das KI-Agenten die visuelle Überprüfung von Webseiten ermöglicht

PixelCheck ist ein npm-Paket, das KI-Agenten die visuelle Überprüfung der von ihnen erstellten Webseiten ermöglicht. Statt dass Sie manuell jeden Button, jeden Flow, jedes Gebietsschema und jedes Gerät prüfen, kann der Agent selbstständig Seiten öffnen, Buttons klicken, Formulare ausfüllen, strukturierte Daten extrahieren und die Benutzeroberfläche bewerten.
Warum es das gibt
Der Autor, kein Programmierer, nutzt Claude, um Frontend-Code zu schreiben, stieß jedoch auf ein Hindernis: Claude ist blind. Jeder Login-Flow, jede japanische Übersetzung oder jedes arabische RTL-Layout erforderte manuelle Browser-Prüfungen. Er erstellte Screenshots, fügte sie ein und beschrieb, was falsch war – Stunden pro Woche. PixelCheck wurde entwickelt, um diese Schleife zu beseitigen.
Hauptfunktionen
- Seiten öffnen und mit ihnen durch natürliche Sprachbefehle interagieren
- Buttons klicken und Formulare ausfüllen
- Strukturierte Daten von jeder Seite extrahieren
- Eine Benutzeroberfläche bewerten wie ein echter Mensch
- Zwei Versionen einer Seite vergleichen
- Eine App durchgehen als verschiedene Benutzer-Personas: Hausfrau aus Tokio auf MacBook, Unternehmer aus Lagos auf Tecno, 72-jähriger US-Rentner auf iPad, arabischer Geschäftsmann mit RTL, Student aus Shanghai auf Xiaomi
Technische Details
- Läuft lokal – kein SaaS in der Schleife
- Der Autor hat null Code geschrieben; jedes Zeichen wurde von Claude Code generiert
- Die gesamte Logik wurde in einfachem Englisch an Claude Code beschrieben, das sie in auslieferungsfähige Software umwandelte
Für wen es gedacht ist
Entwickler, die KI-Coding-Agenten für Frontend-Arbeiten nutzen und eine automatisierte visuelle Verifizierung ohne manuelle Screenshots wünschen.
Ausprobieren
Jetzt auf npm verfügbar. Der Autor stellt es als Beweis zur Verfügung, dass Produktinstinkte über Claude Code in Software umgesetzt werden können, ohne eine einzige Zeile Code zu tippen.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

Interfaze: Neue Modellarchitektur übertrifft Gemini-3-Flash und GPT-5.4-Mini bei deterministischen Aufgaben
Interfaze, eine neue Modellarchitektur, die DNN/CNNs mit Transformatoren kombiniert, übertrifft Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini und Grok-4.3 in 9 Benchmarks, darunter OCR, Bildverarbeitung, Spracherkennung und strukturierte Ausgaben.

SwiftUI-Agentenfähigkeiten: Verbesserung der View-Entwicklung mit KI
Das SwiftUI Agent Skill ist ein Open-Source-Tool, das KI nutzt, um die Entwicklung von SwiftUI-Views durch die Einbettung von Best Practices und Optimierungen zu verbessern.

Überwachen Sie Ihre Claude AI-Nutzung mit einem neuen Linux-Taskleisten-Widget.
Ein neues Linux-Taskleisten-Widget hilft Benutzern, ihre Nutzung des Claude AI-Abonnements in Echtzeit zu verfolgen, mit farbcodiertem Feedback und einfacher Installation.

Claude Plugins: Computer Vision, Multi-Agent Council und Self-Debugging Workflow
Drei Claude-Plugins wurden veröffentlicht: Computer Vision v1.7.0 für die Automatisierung von Windows-Apps, The Council v3.1.0 für konsultative Mehr-Agenten-Beratung und Upwork Scraper v0.2.0 für die Analyse des Arbeitsmarktes. Eine Demonstration zeigte, wie Claude diese Plugins nutzte, um seinen eigenen Solitaire-Automatisierungsfehler zu diagnostizieren und zu beheben.