TextGen (text-generation-webui)、ポータブルビルドでネイティブデスクトップアプリに
TextGen(旧称text-generation-webui、別名oobabooga)がネイティブデスクトップアプリ版をリリースしました。2022年12月から開発が進められてきたこのプロジェクトは、現在ポータブルビルドを提供しています。ダウンロードして解凍し、textgenをダブルクリックするだけです。インストールは不要で、ファイルはすべて展開フォルダ内に収まります。すべてのチャット履歴と設定は、バンドルされたuser_dataフォルダに保存されます。
主な機能
- プライバシー:外部へのリクエストは一切送信しません。LM Studioとは異なり、OS、CPU、アプリバージョン、バックエンドの選択などを送信することはありません。
- ik_llama.cppビルド:LM StudioやOllamaが使用する標準のllama.cppよりも高精度なIQ4_KSやIQ5_KSなどのカスタム量子化タイプを搭載しています。
- 組み込みWeb検索:
ddgsPythonライブラリを使用します。ツールコーリングモード(web_searchツールでQwen 3.6やGemma 4に対応)と、検索結果をテキスト添付として取得するチェックボックスモードの2つがあります。 - ツールコーリング:単一ファイルの.pyツール(簡単なカスタム関数)、HTTP MCPサーバー、stdio MCPサーバーをサポート。ツールコールの実行前に承認/拒否の確認を求めるオプションもあります。ガイドはこちら。
- カスタムキャラクター:指示追随型の会話に加えて、カジュアルなチャット用のキャラクターを作成できます。
- API互換性:OpenAIおよびAnthropicの仕様に準拠したAPI。Claude Codeでも使用可能:
ANTHROPIC_BASE_URL=http://127.0.0.1:5000 claude。 - PDF抽出:PyMuPDFを使用して正確なテキスト抽出を実現。
- Webページ取得:
trafilaturaを使用してナビゲーションや余計な部分を除去し、エージェントループでのトークン消費を節約。 - Jinja2テンプレート:PythonのJinja2でチャットテンプレートをレンダリングし、llama.cppのC++による再実装でのクラッシュを回避。
利用可能なビルド
CUDA、Vulkan、CPUのみ、Mac(Apple SiliconおよびIntel)、ROCm。すべてポータブルです。
ライセンス:AGPLv3。ソース:https://github.com/oobabooga/textgen
📖 全文はこちら: r/LocalLLaMA
👀 See Also
Claude Code vs Codex:36ファイル対28ファイル、2.50ドル対2.04ドル、無限ループを捕捉——実世界比較
ある開発者がClaude CodeとCodex(Cursor)で同じ2つのタスク(PRトリアージボットとリアルタイムコードレビューUI)を実行。結果:36ファイル対28ファイル、コスト$2.50対$2.04、Claudeの方がTypeScriptエラーが少なく、Codexでは無限Reactループが発生。

オリー・ルーメン:Claude Code用オープンソースローカルセマンティック検索プラグイン
Ory Lumenは、Claude Codeのパフォーマンス問題を解決するためのプラグインです。Ollamaのコード埋め込みモデルとSQLite-vecのセマンティック検索を使用してコードベースをインデックス化し、大規模なコードベースでのClaude Codeの性能問題に対処します。このツールは無料でローカルのみ動作し、再現可能な結果を得るためのSWEスタイルのベンチマークテストハーネスを含んでいます。

ClawBridge – ホームアシスタントエンティティをOpenClawに安全に公開
ClawBridgeは、Home AssistantエンティティをOpenClawにシームレスに公開する方法を導入し、安全性を確保しながら自動化を強化します。その特徴と利点をご覧ください。

Docent: Claude Codeで構築された論文分析AIアシスタント
開発者が、Claude Codeを使用してアップロードされた論文を読み、提示し、質問に答え、理解度を評価するAIアシスタント「Docent」を作成しました。このプロジェクトはMITライセンスの下でGitHubで公開されており、Vercelでデモが利用可能です。