PocketBot: Un piloto automático de IA local para iOS que utiliza App Intents e inferencia en el dispositivo

PocketBot es un agente piloto automático para iOS que funciona completamente en el dispositivo, utilizando frameworks nativos de iOS para crear automatizaciones basadas en eventos sin enviar datos a servidores en la nube. Los desarrolladores lo construyeron en cuatro semanas con ayuda de la ventana de contexto de 1M de Claude Opus 4.6.
Arquitectura y Detalles Técnicos
El sistema utiliza un enfoque centrado en la privacidad con estos componentes clave:
- Inferencia 100% Local: Ejecuta un modelo Llama 3B cuantizado de forma nativa en el Neural Engine del iPhone mediante Metal
- Orquestación Nativa: Utiliza los frameworks AppIntents y CoreLocation de Apple en lugar de captura de pantalla
- Motor Basado en Eventos: Solo se activa en segundo plano cuando el sistema operativo dispara desencadenadores del sistema (ubicación, hora, batería)
- Privacidad Primero: Las indicaciones, datos y automatizaciones nunca llegan a servidores en la nube
Capacidades Actuales
Tres ejemplos funcionales de la beta:
- El Salvador de Batería: "Si mi batería cae por debajo del 5%, atenúa la pantalla y envía un mensaje a mi pareja con mi ubicación en vivo."
- Resumen Matutino: "A las 7 AM, escanea mi calendario/recordatorios/correos, revisa el clima y envíame una única notificación de resumen."
- Trucos de Monzo/FinTech: "Si camino cerca de un McDonald's, transfiere £10 a mi bote de ahorros."
Contexto de Desarrollo y Desafíos
Los desarrolladores construyeron PocketBot porque querían un "Conductor, no una Barra de Búsqueda"—un agente real en lugar de solo otro envoltorio de chatbot. Específicamente evitaron luchar contra el sistema operativo al diseñar alrededor de las APIs nativas de iOS.
Las limitaciones actuales incluyen lidiar con los límites de memoria de los chips de la serie A durante el razonamiento en el dispositivo. La beta está limitada a 1,000 probadores para monitorear el impacto en la batería en diferentes modelos de iPhone, con especial interés en probar en iPhone 15 Pro o dispositivos más nuevos para ver si iOS termina el proceso de la aplicación.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Canal de Traducción de Libros Local Utiliza Qwen 32B y Mistral 24B con RAG Contextual
Un desarrollador construyó una canalización completamente automatizada de traducción de libros de PDF a ePub utilizando ocho scripts de Python, Marker para extracción de PDF, Qwen 32B para traducción con un glosario global y Mistral 24B para edición de estilo.

VibeAround: Daemon Local Conecta Agentes de Programación a Telegram y Discord
VibeAround es un demonio local que conecta agentes de codificación como Claude Code, Gemini CLI y Codex a plataformas de mensajería instantánea como Telegram y Discord. La herramienta incluye transferencia de sesión con códigos de recuperación para continuar conversaciones entre dispositivos.

OpenRoom: Una Interfaz Gráfica de Escritorio Basada en Web para Visualizar las Habilidades de los Agentes de IA
OpenRoom es un entorno de escritorio basado en web donde operan agentes de IA, con actualizaciones en tiempo real del estado del sistema como diarios y archivos durante las interacciones de chat, además de un modo de transmisión en vivo para la interacción de múltiples bots.

AiPayGen: Un Mercado de Agentes de IA con Integración MCP para Claude Code
AiPayGen es un mercado con 142 agentes de IA en 27 categorías que incluyen finanzas, legal, salud, DevOps, seguridad y marketing. Funciona como un servidor MCP para uso directo en Claude Code, permitiendo a los usuarios navegar, invocar y gestionar agentes mediante comandos específicos.