PageAgent: Browser-AI-Agent, der innerhalb von Webseiten mit Ollama-Unterstützung läuft

Was PageAgent macht
PageAgent ist ein Browser-KI-Agenten-Framework, das als JavaScript-Bibliothek innerhalb der Webseiten selbst läuft, im Gegensatz zu den meisten Frameworks wie Playwright oder Selenium, die den Browser von außen steuern.
Wichtige technische Details
Der Agent liest den Live-DOM als Text, wodurch Screenshots oder Vision-Modelle überflüssig werden, was ihn schneller und token-effizienter macht.
Es funktioniert mit jedem OpenAI-kompatiblen Endpunkt, einschließlich Ollama. In Kombination mit einem lokalen Modell bleibt alles auf Ihrem Rechner – ohne Backend oder Cloud. LLM-Aufrufe gehen direkt vom Browser zu localhost.
Code-Beispiel
const agent = new PageAgent({
model: 'qwen3.5:27b',
baseURL: 'http://localhost:11434/v1',
})
await agent.execute('Fill the expense report for last Friday')Zusätzliche Funktionen
- Human-in-the-loop-Panel, das Ihnen erlaubt, den Denkprozess des Agenten zu verfolgen und ihn jederzeit zu stoppen oder zu korrigieren
- Optionale Browser-Erweiterung für Multi-Tab-Aufgaben
- MIT-lizenziert
Das Projekt ist auf GitHub unter alibaba/page-agent verfügbar.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Code-Entscheidungen: Open-Source-Claude-Plugin erfasst technische Entscheidungen
Code Decisions ist ein Open-Source-Claude-Code-Plugin, das technische Entscheidungen aus Gesprächen erfasst und sie anzeigt, wenn betroffene Dateien bearbeitet werden. Es schreibt Entscheidungen als Markdown-Dateien in .claude/decisions/ mit einem affects-Feld, das auf die verwalteten Dateien verweist.

Testen von MiniMax M2.7 über API in drei realen ML- und Coding-Workflows
Ein Entwickler testet MiniMax M2.7 gegen Claude Opus 4.7 in drei realen Aufgaben: Refactoring eines PyTorch-Projekts, Erstellen von Obsidian-Notizen und mehr. Hauptergebnisse und Einrichtung enthalten.

Holaboss AI Runtime wechselt zu TypeScript, implementiert persistente MCP-Ports
Die Holaboss AI-Laufzeitumgebung für lokale Agenten wurde überarbeitet, um ausschließlich TypeScript zu verwenden, wodurch Python-Abhängigkeiten entfallen und die Bündelgröße reduziert wird. Sie speichert nun MCP-Server-Ports in SQLite mit UNIQUE(port)-Einschränkungen, um Konflikte bei Neustarts zu verhindern.

Benchmark-Ergebnisse: Wann Claude Opus mit Codex gegenüber reinem Opus für Code-Generierung verwenden
Ein kontrollierter Benchmark testete den 'Planen mit Opus, Ausführen mit Codex'-Ansatz an drei realen Programmieraufgaben. Die Ergebnisse zeigen einen Kostenschwellenwert bei etwa 600 Codezeilen, mit spezifischen Empfehlungen basierend auf der Projektgröße.