Application Mobile Hors Réseau Ajoute l'Utilisation d'Outils IA sur l'Appareil avec une Amélioration de Vitesse de 3x

Off Grid, une application mobile d'IA sur périphérique, a été mise à jour pour ajouter des capacités d'utilisation d'outils et des améliorations significatives des performances. L'application permet désormais aux modèles d'IA d'appeler des outils hors ligne sans nécessiter de clés API, de serveurs ou de fonctions cloud.
Fonctionnalités clés et performances
La mise à jour introduit des boucles d'outils automatiques pour la recherche web, la calculatrice, les fonctions date/heure et l'accès aux informations du périphérique. Selon le développeur, cela comble l'écart entre « jouet local » et « assistant utile » en permettant aux modèles de 3B paramètres de raisonner, d'appeler des outils et de synthétiser des résultats directement sur votre téléphone.
Les améliorations de performances proviennent d'options de cache KV configurables. Les utilisateurs peuvent désormais choisir entre trois types de cache KV :
f16q8_0q4_0
Avec le cache q4_0, les modèles qui généraient auparavant 10 tokens/seconde atteignent désormais 30 tokens/seconde. L'application inclut une fonction d'incitation aux performances qui suggère des paramètres plus rapides après la première génération.
Support des modèles et disponibilité sur les plateformes
Off Grid prend en charge les modèles au format GGUF, notamment :
- Qwen 3
- Llama 3.2
- Gemma 3
- Phi-4
- Autres modèles compatibles GGUF
L'application est désormais disponible sur les deux principales boutiques d'applications sans exigence de sideloading. Elle peut être installée directement depuis l'App Store et Google Play.
Fonctionnalités principales et philosophie
Ce qui n'a pas changé dans cette mise à jour :
- Sous licence MIT et entièrement open source
- Aucune donnée ne quitte le périphérique (pas d'analytique, de télémétrie ou de données d'utilisation anonymes)
- Capacités hors ligne incluant la génération de texte (15-30 tokens/seconde), la génération d'images (5-10 secondes sur NPU), la vision par IA, la transcription vocale et l'analyse de documents
Le développeur déclare que le projet est motivé par la conviction que « le téléphone dans votre poche devrait être l'ordinateur le plus privé que vous possédez — pas le plus surveillé. »
📖 Lire la source complète : HN AI Agents
👀 See Also

Traduire en fr : Détails visuels du flux de travail de Claude Code, hiérarchie de la mémoire et système de compétences
Un utilisateur de Reddit a partagé un diagramme visuel montrant comment Claude Code organise la mémoire via des fichiers CLAUDE.md en couches et implémente des compétences réutilisables via des fichiers SKILL.md. La boucle de flux de travail suggère d'utiliser le mode Plan avec acceptation automatique et des commits fréquents.

Comment Clawdbot coordonne 6 agents IA avec une file d'attente de production stable
L'équipe de Clawdbot a construit un système de file d'attente de travail pour coordonner 6 agents IA (design, code, marketing, opérations) pour leur boutique gérée par IA. Le système comprend la réclamation atomique de tâches, une machine à états, une logique de nouvelle tentative avec backoff, des chaînes de tâches, un suivi de pulsation cardiaque et un orchestrateur démon.

SoulPrint : Outil Local pour Rechercher l'Historique de Claude et ChatGPT Simultanément
SoulPrint est un outil Python open-source qui importe les exportations de conversations de Claude (.json) et ChatGPT (.zip) dans une archive SQLite locale, permettant une recherche en texte intégral sur les deux fournisseurs simultanément avec un classement BM25 et des extraits surlignés.

Heartbeat-gateway : Remplacement piloté par événements pour le sondage cron dans OpenClaw
Heartbeat-gateway est un outil Python open-source qui remplace la vérification périodique basée sur cron par des événements déclenchés par webhook pour OpenClaw, réduisant les coûts d'API d'environ 86 $/mois à environ 4,50 $/mois et améliorant la latence de jusqu'à 30 minutes à moins de 2 secondes.