AI終末ツールボックス v0.932は、AndroidローカルAI向けにベンチマーキング、データセット作成、エージェントワークスペースを追加しました。

AI Doomsday Toolbox v0.932の新機能
AI Doomsday Toolbox v0.932は、Androidアプリケーションの大幅なアップデートであり、オンデバイスAIを扱う開発者のための実用的な機能がいくつか追加されました。
このリリースの主な機能
- ローカルLLMのベンチマーク: ユーザーはデバイスのベンチマークを実行し、異なるスレッド数を比較することで、最適なモデル構成を推測ではなく決定できます。
- データセット作成ツール: TXTまたはPDFファイルをインポートし、チャンクに分割、クリーンアップ、質問/回答ペアの生成、評価を行い、最終的なデータセットをAlpaca JSON形式でエクスポートできます。パイプラインで使用されるプロンプトはカスタマイズ可能です。
- Termux/prootワークフロー: Termuxを通じたprootディストロの使用に対するサポートが向上し、SSHセットアップのヘルプ、事前定義されたツールのインストールフロー、互換性のあるツールのためのアプリ内WebViewアクセス、アプリ内からのファイル管理が含まれます。
- AIエージェントワークスペース: Termuxとローカルバックエンドを中心に構築されたエージェント指向の環境で、カスタムツール、カスタムエージェント、プロジェクト指向のワークフローをサポートします。これにより、LLMがツールを使用し、コマンドを実行できるようになります。
- 字幕焼き込み: Whisperで字幕を生成し、フォント、色、位置の制御を備えてビデオに焼き込みます。
- 要約ワークフローの変更: 要約機能がOllamaおよびllama.cpp互換バックエンドでより適切に動作するようになりました。
- 組み込みのOllamaおよびllamaツール: モデルとModelfileのための組み込みOllamaマネージャー、および長時間の呼び出しを接続を切らずに実行できる(Web UIでは発生する)llama-serverスタイルのバックエンド用のネイティブチャットインターフェースが含まれます。
- ペットシステム: アプリのTama側では、記憶、冒険、農場管理、インタラクションを中心としたゲームプレイが提供されています。
維持された既存機能
このアップデートでは、Androidデバイス間での分散推論、メディアやドキュメントのワークフローベースの処理、オフライン知識ツール、ローカル画像生成、ローカルAI用の古いスマートフォンの再利用というコンセプトなど、以前の機能が維持されています。
インストールオプション
Google Playベータ版が利用可能になり、App Bundleパッケージングによりインストールサイズが小さくなっています。ベータ版は異なるデバイスでのテストに役立ちます。GitHubリポジトリは直接ダウンロード用に引き続き利用可能です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Savecraft MCPサーバーはClaudeに正確なマジック:ザ・ギャザリングデータを提供します
Savecraftは、MTG ArenaのPlayer.logをローカルで解析し、ゲーム状態を同期し、実際のMagic: The Gatheringデータに基づいて構築された12の専門家向け参照モジュールにClaudeがアクセスできるようにするオープンソースのMCPサーバーです。このツールは、実際のArenaデータ、17Landsからのドラフト推奨、完全なScryfallデータベースへのアクセスを提供することで、Claudeがカード名やルールを幻覚的に生成するのを防ぎます。

Claudeカウンター:AndroidアプリでClaudeの使用制限をリアルタイム通知で追跡
開発者がClaude Counterという無料のAndroidアプリを構築しました。このアプリはClaudeのAPIをポーリングして、ライブセッションと週間使用制限を表示します。アプリはプログレスバーを表示し、残りパーセンテージを含むリッチな通知を提供し、制限がリセットされるとアラートを送信します。

デュアルDGXスパークス vs Mac Studio M3 Ultra:Qwen3.5 397Bをローカルで実行する実用的比較
開発者が、1万ドルのMac Studio M3 Ultra 512GBと1万ドルのデュアルDGX SparkセットアップでQwen3.5 397Bをローカル実行した比較を行いました。Mac Studioは800GB/sの帯域幅で30-40トークン/秒を達成しましたがプリフィルは低速で、Sparkは計算が高速で27-28トークン/秒を達成しましたがセットアップが複雑でした。

NemoClawをローカルvLLMで実行する:セットアップメモとエージェントエンジニアリングの観察
開発者が、WSL2上でvLLMを使用してローカルのNemotron 9B v2モデルでNVIDIAのNemoClaw(サンドボックス化されたAIエージェントプラットフォーム)を実行した経験を記録しました。主な発見には、推論ルーティングの詳細、パーサーの互換性の問題、およびエージェントエンジニアリングのギャップに関する観察が含まれます。