PageAgent: Ollama 지원으로 웹 페이지 내에서 실행되는 브라우저 AI 에이전트

PageAgent의 기능
PageAgent는 Playwright나 Selenium처럼 브라우저 외부에서 제어하는 대부분의 프레임워크와 달리, 웹 페이지 자체 내에서 JavaScript 라이브러리로 실행되는 브라우저 AI 에이전트 프레임워크입니다.
주요 기술적 특징
에이전트는 라이브 DOM을 텍스트로 읽어들여 스크린샷이나 비전 모델이 필요 없어 더 빠르고 토큰 효율적입니다.
Ollama를 포함한 모든 OpenAI 호환 엔드포인트와 작동합니다. 로컬 모델과 함께 사용하면 백엔드나 클라우드 없이 모든 것이 사용자의 기기에 유지되며, LLM 호출이 브라우저에서 localhost로 직접 전송됩니다.
코드 예시
const agent = new PageAgent({
model: 'qwen3.5:27b',
baseURL: 'http://localhost:11434/v1',
})
await agent.execute('지난 금요일 지출 보고서 작성하기')추가 기능
- 에이전트의 사고 과정을 확인하고 언제든지 중단하거나 수정할 수 있는 인간 개입 패널
- 다중 탭 작업을 위한 선택적 브라우저 확장 프로그램
- MIT 라이선스
프로젝트는 GitHub의 alibaba/page-agent에서 확인할 수 있습니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

스케일스: 도커 없이 올라마에 연결하는 데스크톱 AI 에이전트
Skales는 Docker 설정 없이도 로컬에서 Ollama에 연결하는 데스크톱 AI 에이전트입니다. Gmail IMAP를 통한 이메일 관리, 브라우저 자동화, Groq를 통한 Whisper 음성 채팅과 같은 기능을 제공합니다.

M1 Ultra에서 1M 토큰 컨텍스트로 Nemotron 3 Super 120B 벤치마킹하기
한 사용자가 M1 Ultra에서 llama.cpp를 사용하여 Q4_K_M 양자화 모델로 Nemotron 3 Super 120B를 테스트했으며, 약 90GB의 VRAM을 소비하는 100만 토큰 컨텍스트 창을 달성했습니다. 성능 벤치마크는 512 프롬프트 처리 시 255 t/s에서 10만 토큰 컨텍스트 시 22.37 t/s까지의 토큰 생성 속도를 보여줍니다.

자동 최적화: 자율 성능 최적화를 위한 Claude 코드 플러그인
한 개발자가 코드 성능을 최적화하기 위해 프로파일링 → 계획 → 벤치마크 루프를 자율적으로 실행하는 Claude Code 플러그인인 auto-optimize를 구축했습니다. 한 테스트에서 약 3시간 만에 모든 벤치마크 시나리오에서 27% 더 빠른 해시 테이블을 달성했습니다.

전체 디스크 암호화 및 모니터링을 포함한 OpenClaw를 위한 원-커맨드 Docker 설정
전체 디스크 암호화 가이드, PID 1로서의 Tini, 내장 모니터링 도구, 그리고 호스트에 일반 파일로 저장된 데이터를 제공하는 OpenClaw용 Docker 설정입니다. 배포에는 git clone과 ./shell 두 가지 명령어만 필요합니다.