SpruceChatは、llama.cppを介してMiyooハンドヘルド端末上で0.5B LLMをオンデバイスで動作させます。

概要
SpruceChatは、llama.cppを使用してQwen2.5-0.5B言語モデルを完全にオンデバイスで複数の携帯型ゲーム機上で動作させるプロジェクトです。初期設定後はクラウド接続やWiFiを必要としません。
主な詳細
モデルは初回起動後にRAMに常駐し、生成時にはトークンが一つずつストリーミングされます。Miyoo A30、Miyoo Flip、Trimui Brick、Trimui Smart Proで動作します。
Miyoo A30(Cortex-A7クアッドコアプロセッサ搭載)でのパフォーマンス:
- モデルロード:初回起動時約60秒
- 生成速度:約1-2トークン/秒
- プロンプト評価:約3トークン/秒
開発者は「高速ではないが、ストリーミングされるため思考過程を観察できる」と述べており、64ビットデバイスの方が速いと指摘しています。
このAIは「トウヒの木のような性格:忍耐強く、急がず、全てのものに静かに驚嘆する」と表現されています。
デバイスがWiFiに接続されている場合、ブラウザからllama-serverにアクセスして、スマートフォンやノートパソコンの実キーボードでチャットすることも可能です。
リポジトリはhttps://github.com/RED-BASE/SpruceChatにあります。このプロジェクトはClaudeの助けを借りて構築され、デバイスサポート拡大に取り組む共同作業者も既に参加しています。初回リリースではarmhfとaarch64バイナリの両方が提供され、モデルも同梱されています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

htmLLM-124M v2 リリース:特化型HTML/Bootstrapオートコンプリートモデル
LH-Tech-AIは、HTML/Bootstrapのオートコンプリートに特化した124Mパラメータモデル「htmLLM-124M v2」をリリースしました。このモデルは0.91の検証損失を達成し、単一のT4 GPUで約8時間のトレーニングを要します。

「簡潔さ」がClaude Code圧縮ベンチマークで原始人プラグインを破る
24のプロンプトを使ったベンチマークで、Claude Codeの「caveman」圧縮プラグインが、「簡潔に」と前置きするのとほぼ同じトークン数と品質を生み出すことが示された。しかし、プラグインの一貫した出力形状と安全ルールによるエスケープ機能は、構造的な利点を提供する。

tmux-claude: Tmuxペイン間でのClaudeコードインスタンスの監視
tmux-claudeは、tmuxセッション内のClaude Codeインスタンスにライブ監視機能を追加するツールです。API呼び出しなしでローカルセッションファイルを読み取り、ステータスバー、インタラクティブダッシュボード、強化されたウィンドウ選択機能、デスクトップ通知を提供します。

OpenClaw開発者、900回のユーザートライアル後にキラー用途を模索中
OpenClawの開発者は、ユーザーがTelegramインターフェース、カレンダー連携、自動化ワークフローなどの機能を試すものの、大半は長期的にツールを使い続けないと報告しています。課題は、実験的なものではなく、必須となる日常使用のワークフローを見つけることです。