WebMCP-Browser-APIs könnten den Bedarf an Web-Scraping für KI-Agenten verringern.

Was WebMCP für die Webautomatisierung ändert
Google hat kürzlich WebMCP veröffentlicht, zwei neue Browser-APIs, die es Websites ermöglichen, Tools zu registrieren, die KI-Agenten direkt aufrufen können. Anstatt DOM-Elemente zu scrapen oder Anti-Bot-Systeme zu umgehen, können Websites ihre Funktionalität über standardisierte Schnittstellen bereitstellen.
Wie es technisch funktioniert
Websites registrieren Tools mit navigator.modelContext.registerTool() mit einem Namen, einer Beschreibung, einem Eingabeschema und einer Ausführungsfunktion. Die Quelle liefert dieses Beispiel:
navigator.modelContext.registerTool({
name: "search_flights",
description: "Verfügbare Flüge suchen",
inputSchema: { /* JSON Schema */ },
execute: async (input) => {
return await internalFlightAPI(input);
}
});Dieser Ansatz eliminiert CSS-Selektor-Ketten, Wiederholungslogik, Headless-Browser-Sitzungsverwaltung und DOM-Scraping für jede Website, die WebMCP implementiert.
Aktueller Implementierungsstatus
Die Spezifikation befindet sich noch in einem frühen Stadium – der W3C-Entwurf enthält wörtliche "TODO: fill this out"-Kommentare in Methodendefinitionen. Sie ist derzeit nur in Chrome 146 als frühe Vorschau verfügbar. Der Autor hat sich für die frühe Vorschau angemeldet, um zu testen, wie viel seines bestehenden Scraping-Codes ersetzt werden kann.
Praktische Auswirkungen für Entwickler
Für Entwickler, die bereits MCP-Server aufbauen, ist das mentale Modell identisch: Tools + Schemata + Ausführung. Der Schritt von der Bereitstellung lokaler Ressourcen als MCP-Tools zur Bereitstellung von Websites als MCP-Tools ist klein – gleiche Architektur, anderer Transport.
Große Websites mit bestehenden internen APIs (wie Booking, Amazon, Fluggesellschaften) werden wahrscheinlich zuerst übernehmen, da sie ihre APIs mit minimalen Änderungen über WebMCP bereitstellen können. Scraper werden nicht vollständig verschwinden – Websites ohne WebMCP-Implementierung erfordern weiterhin traditionelle Ansätze.
Der Autor schlägt einen gestaffelten Ansatz vor: Agenten versuchen zuerst WebMCP, greifen bei Nichtverfügbarkeit auf DOM-Automatisierung zurück und dann als letzten Ausweg auf Roh-Scraping – unter Verwendung der besten verfügbaren Methode pro Website.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

srclight: Vollständig lokaler Code-Indexierungs-MCP-Server mit Ollama-Embeddings
srclight ist ein MCP-Server für tiefgehende Code-Indizierung, der zu 100 % lokal ohne API-Schlüssel oder Cloud-Aufrufe läuft. Er verwendet tree-sitter AST-Parsing für 11 Sprachen, SQLite FTS5 für die Schlüsselwortsuche, Ollama für Embeddings und GPU-beschleunigte Kosinus-Ähnlichkeit über cupy.

OpenClaw PARA-Fähigkeit organisiert Dateien automatisch nach Tiago Fortes Methode
Ein Entwickler hat eine OpenClaw-Fähigkeit erstellt, die die PARA-Methode (Projekte, Bereiche, Ressourcen, Archive) für die automatische Dateiorganisation durchsetzt und Dateien aus einem unordentlichen Stammverzeichnis in strukturierte Ordner verschiebt.

Vektoris Speicherarchitektur: Prinzipien aus Claudes geleaktem System
Vektori implementiert einen dreischichtigen hierarchischen Satzgraphen für KI-Erinnerung, inspiriert von durchgesickerten Prinzipien aus Claudes Architektur. Das System verwendet strenge Qualitätsfilter, skeptisches Abrufen mit einer Mindestpunktzahl von 0,3 und bewahrt Korrekturverläufe über Sitzungen hinweg.

Codev: KI-Agenten-Workflow für 106 PRs in 14 Tagen
Codev ist ein Open-Source-System, das mehrere KI-Agenten durch einen strengen Spec→Plan→Implement→Review→PR-Workflow koordiniert, dabei 20 Fehler vor dem Ausliefern findet und Code produziert, der auf einer 10-Punkte-Skala 1,2 Punkte besser bewertet wird.