PageAgent: Agente de IA para Navegador que Se Ejecuta Dentro de Páginas Web con Soporte para Ollama

✍️ OpenClawRadar📅 Publicado: 28 de febrero de 2026🔗 Source

Qué hace PageAgent

PageAgent es un framework de agente de IA para navegadores que se ejecuta como una biblioteca de JavaScript dentro de las propias páginas web, a diferencia de la mayoría de frameworks como Playwright o Selenium que controlan el navegador desde fuera.

Detalles técnicos clave

El agente lee el DOM en vivo como texto, eliminando la necesidad de capturas de pantalla o modelos de visión, lo que lo hace más rápido y eficiente en tokens.

Funciona con cualquier endpoint compatible con OpenAI, incluido Ollama. Cuando se combina con un modelo local, todo permanece en tu máquina sin necesidad de backend o nube: las llamadas LLM van directamente desde el navegador a localhost.

Ejemplo de código

const agent = new PageAgent({ 
  model: 'qwen3.5:27b', 
  baseURL: 'http://localhost:11434/v1', 
})
await agent.execute('Fill the expense report for last Friday')

Características adicionales

Panel de humano en el bucle que te permite ver al agente pensando y detenerlo/corregirlo en cualquier momento
Extensión opcional del navegador para tareas de múltiples pestañas
Licencia MIT

El proyecto está disponible en GitHub en alibaba/page-agent.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Herramientas

El Complemento de Programación en Pareja Agrega Contexto de Pantalla en Vivo, Voz y Audio a Claude Code

Un desarrollador ha creado un complemento llamado Pair Programmer que le da a Claude Code percepción del escritorio en tiempo real capturando transmisiones de pantalla, micrófono y audio del sistema. La arquitectura utiliza agentes especializados que se ejecutan en paralelo para diferentes tipos de entrada, con la indexación actualmente manejada por modelos en la nube pero diseñada para ser independiente del modelo.

16 abr 2026, 17:45 UTC

OpenClawRadar

Herramientas

Galadriel: Arnés de caché cálido de código abierto para agentes persistentes de Claude

Galadriel es un arnés de almacenamiento en caché apilado de 3 niveles para Claude que reduce los costos en un 87% y la latencia a menos de 3s para indicaciones de 100K tokens. Integra MemPalace para memoria vectorial persistente.

29 abr 2026, 12:17 UTC

OpenClawRadar

Herramientas

Argus: Una aplicación de GitHub que revisa archivos CLAUDE.md y publica puntuaciones en las PRs

Argus es una aplicación de GitHub creada con Claude Code que revisa archivos CLAUDE.md y publica una puntuación en cada solicitud de extracción. Después de probar en múltiples repositorios, los fallos más comunes son la falta de límites de alcance explícitos y rutas de escalación.

18 abr 2026, 22:45 UTC

OpenClawRadar

Herramientas

La Habilidad OpenClaw Reduce la Transferencia de Agentes al Permitir la Autoejecución

Una nueva habilidad para los agentes de OpenClaw aborda el problema común en el que los agentes identifican el siguiente paso pero se detienen en 'esto es lo que hay que hacer a continuación', requiriendo una transferencia humana. La habilidad permite a los agentes realizar ciertas acciones por sí mismos, como registrarse, publicar, responder y firmar.

18 abr 2026, 19:45 UTC

OpenClawRadar