オフグリッドモバイルアプリ、オンデバイスAIツールを追加し3倍の速度向上を実現

オンデバイスAIモバイルアプリ「Off Grid」がアップデートされ、ツール使用機能と大幅なパフォーマンス向上が追加されました。このアプリは現在、APIキー、サーバー、またはクラウド機能を必要とせずに、AIモデルがオフラインでツールを呼び出せるようになりました。
主な機能とパフォーマンス
このアップデートでは、ウェブ検索、電卓、日付/時刻機能、デバイス情報アクセスのための自動ツールループが導入されています。開発者によると、これにより30億パラメータのモデルがスマートフォン上で直接推論、ツール呼び出し、結果の統合を行えるようになり、「ローカル玩具」と「有用なアシスタント」のギャップが埋められるとのことです。
パフォーマンス向上は設定可能なKVキャッシュオプションによるものです。ユーザーは現在、3つのKVキャッシュタイプから選択できます:
f16q8_0q4_0
q4_0キャッシュを使用すると、以前は10トークン/秒を生成していたモデルが、現在は30トークン/秒に達します。このアプリには、最初の生成後に高速な設定を提案するパフォーマンスナッジ機能が含まれています。
モデルサポートとプラットフォーム対応状況
Off GridはGGUF形式のモデルをサポートしており、以下を含みます:
- Qwen 3
- Llama 3.2
- Gemma 3
- Phi-4
- その他のGGUF互換モデル
このアプリは現在、サイドロード要件なしで両方の主要アプリストアで利用可能です。App StoreとGoogle Playから直接インストールできます。
コア機能と哲学
このアップデートで変わらなかった点:
- MITライセンスで完全オープンソース
- デバイスからデータが一切流出しない(分析、テレメトリ、匿名使用データなし)
- テキスト生成(15-30トークン/秒)、画像生成(NPUで5-10秒)、視覚AI、音声文字起こし、文書分析を含むオフライン機能
開発者は、このプロジェクトは「あなたのポケットにあるスマートフォンは、最も監視されるコンピューターではなく、最もプライベートなコンピューターであるべきだ」という信念に動機づけられていると述べています。
📖 完全なソースを読む: HN AI Agents
👀 See Also

Skir: 型安全なデータ交換のためのProtocol Buffersの現代的代替手段
Skirは、データ型、定数、APIを定義する宣言型言語であり、単一の.skirファイルからTypeScript、Python、Java、C++、Kotlin、Dart向けの慣用的で型安全なコードを生成します。組み込みのスキーマ進化安全性、gRPCに類似したRPCサポート、JSONまたはバイナリ形式へのシリアル化機能を備えています。

トークンを無駄にせずClaudeのチャット間でコンテキストを引き継ぐ2プロンプトシステム
開発者が、Claudeの会話全体を構造化されたコンテキストブロックに圧縮し、新しいチャットに読み込んで、決定事項、作業内容、次のステップを保持する2つのプロンプトを共有しています。

antirezのDS4:Mac MetalとDGXでDeepSeek V4 Flashを100万コンテクストで実行
Redisの作者Salvatore Sanfilippoが、Mac MetalハードウェアとDGX上で1MコンテキストウィンドウのDeepSeek V4 Flashを実行するプロジェクトDS4を公開しました。エージェンティックコーディングツール向けのOpenAI/Anthropicエンドポイントも備えています。

Claude Codeを使って放置していた個人プロジェクトを復活させる方法:実践ガイド
Matthew Brunelle氏が、Claude Code(Opus 4.6使用)を用いて、YouTube MusicからOpenSubsonic APIへのシャムプロジェクトを復活させた方法を、セットアップ手順、プロンプト、ワークフローのヒントとともに紹介しています。