Automatización del Navegador con Costo Cero de Tokens

Qué hacen los Subrutinas de IA

Los Subrutinas de IA graban tareas del navegador una vez y las guardan como herramientas invocables que se reproducen a costo cero de tokens, sin retraso de inferencia de LLM y con 100% de determinismo. El script generado se ejecuta dentro de la página web misma, no a través de un proxy, un trabajador sin cabeza o una solución fuera de proceso.

Decisión arquitectónica clave

El script se ejecuta dentro del contexto de ejecución de la página web, lo que significa que toda la autenticación, tokens CSRF, sesiones TLS y encabezados firmados se agregan a las solicitudes automáticamente. No se requiere instalación de certificados, modificación de huella digital TLS o mantenimiento de una pila de autenticación separada.

Mecanismo de grabación

Durante la grabación, la extensión intercepta las solicitudes de red usando dos capas:

Parche de fetch/XHR del MUNDO-PRINCIPAL instalado antes de que se ejecute cualquier script de página
API webRequest de Chrome como respaldo correlacionado para rutas CORS y de service-worker

Se capturan los cuerpos de las solicitudes, incluidos FormData, Blob y bytes sin procesar, no solo JSON.

Procesamiento de captura de red

El sistema puntúa y recorta aproximadamente 300 solicitudes a unas 5 basándose en múltiples señales:

Origen de primera parte vs. de terceros (+20 / −15)
Hosts de telemetría conocidos (Sentry, Segment, Hotjar, RUM): −80
Correlación temporal con eventos DOM (+28 dentro de 800ms, +16 dentro de 2.5s)
Método y forma de carga útil (POST/PUT/PATCH/DELETE mutantes: +35; GET: +5; con cuerpo de solicitud: +8)
Calidad de respuesta (2xx: +12; 4xx+: −25; cuerpo no vacío: +4)
Identificadores de operación volátiles (−18) para queryId de GraphQL, doc_id, operationHash

Los IDs de operación volátiles de GraphQL activan un respaldo solo de DOM antes de que fallen silenciosamente en la próxima ejecución.

Estructura del código generado

El código generado combina llamadas de red con acciones DOM (clic, escribir, encontrar) en la misma función a través de un espacio de nombres auxiliar rtrvr.*. Las cinco principales solicitudes clasificadas más las interacciones DOM se renderizan en un contexto de 12,000 caracteres para el generador.

Patrón de uso

Dirige un agente de IA a una hoja de cálculo de 500 filas, y con solo una llamada LLM, se asignan parámetros y se inician 500 Subrutinas.

Casos de uso clave

Graba el envío de un DM de Instagram, luego ten una rutina reutilizable para enviar DMs a costo cero de tokens
Crea una rutina para obtener los últimos productos en un catálogo de sitio, llámala para obtener miles de productos a través de consultas GraphQL directas
Configura una rutina para completar formularios EHR basados en parámetros, con la IA infiriendo parámetros del contexto de la página actual
Reutiliza rutinas diariamente para sincronizar mensajes salientes en LinkedIn/Slack/Gmail a un CRM usando un servidor MCP

Por qué esto importa

El problema fundamental con los agentes de navegador para tareas repetitivas es que pasar por el bucle de inferencia es innecesario. Grabar una vez y hacer que el LLM genere un script que aproveche todos los métodos de interacción posibles (llamadas API directas, interacciones DOM, herramientas/APIs/servidores MCP de terceros) proporciona automatización determinista y rentable.

📖 Read the full source: HN LLM Tools

Subrutinas de IA: Automatización Determinista del Navegador con Costo Cero de Tokens

Qué hacen los Subrutinas de IA

Decisión arquitectónica clave

Mecanismo de grabación

Procesamiento de captura de red

Estructura del código generado

Patrón de uso

Casos de uso clave

Por qué esto importa

👀 Ver también

Auto-co: Un Script de Bash de 50 Líneas Que Convierte Código de Claude en Compañías de IA Autónomas

Agoragentic: mercado de agentes instalable con pip para comprar y vender capacidades

Google PM publica como código abierto un agente de memoria siempre activo con almacenamiento SQLite, sin base de datos vectorial.

Corrección de la inflación de contexto en la memoria automática de Claude Code con un esquema de nombres y script de auditoría