PageAgent : Agent IA de navigateur qui s'exécute dans les pages web avec prise en charge d'Ollama

Ce que fait PageAgent
PageAgent est un framework d'agent d'IA pour navigateur qui s'exécute comme une bibliothèque JavaScript à l'intérieur des pages web elles-mêmes, contrairement à la plupart des frameworks comme Playwright ou Selenium qui contrôlent le navigateur depuis l'extérieur.
Détails techniques clés
L'agent lit le DOM en direct sous forme de texte, éliminant le besoin de captures d'écran ou de modèles de vision, ce qui le rend plus rapide et plus économe en tokens.
Il fonctionne avec n'importe quel point de terminaison compatible OpenAI, y compris Ollama. Lorsqu'il est associé à un modèle local, tout reste sur votre machine sans nécessiter de backend ou de cloud—les appels LLM vont directement du navigateur à localhost.
Exemple de code
const agent = new PageAgent({
model: 'qwen3.5:27b',
baseURL: 'http://localhost:11434/v1',
})
await agent.execute('Remplir le rapport de dépenses pour vendredi dernier')Fonctionnalités supplémentaires
- Panneau humain dans la boucle qui vous permet de voir l'agent réfléchir et de l'arrêter/le corriger à tout moment
- Extension de navigateur optionnelle pour les tâches multi-onglets
- Sous licence MIT
Le projet est disponible sur GitHub à alibaba/page-agent.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Les artefacts HTML remplacent Google Docs pour la documentation technique, mais manquent de commentaires
Les artefacts HTML générés par Claude remplacent Google Docs pour le contenu technique long comme les comptes rendus de sprint et les notes d'architecture, mais la nature du iframe sandboxé empêche les commentaires en ligne et les fonctionnalités de révision.

Stage CLI : Modifications générées par l'IA locale révisées sous forme de chapitres logiques
Stage CLI regroupe votre diff local en chapitres logiques (via n'importe quel agent d'IA) et ouvre une interface navigateur pour une révision étape par étape. Installez-le avec 'npm install -g stagereview' et ajoutez la compétence via 'npx skills add ReviewStage/stage-cli'.

Phaselock : Un système de contrôle d'agent IA inspiré des techniques parentales
Phaselock est une compétence d'agent open-source qui implémente quatre mécanismes de contrôle pour les agents d'IA de codage : des portes explicites avant l'action, un retour immédiat sur les erreurs, des choix contraints et l'application mécanique de règles. Il fonctionne avec Claude Code, Cursor, Windsurf et tout outil prenant en charge les hooks.

Torrix : Observabilité LLM auto-hébergée sans Postgres ni Redis
Torrix est un outil d'observabilité pour LLM auto-hébergé qui fonctionne comme un unique conteneur Docker soutenu par SQLite. Installation avec docker compose up ; journalisation des appels LLM via proxy HTTP ou SDK — tokens, coût, latence, traces complètes, masquage des PII, prévision des coûts.