NLAがGemma 3の内部活性化を任意のトークンに対して可読テキストに変換

✍️ OpenClawRadar📅 公開日: May 8, 2026🔗 Source

NLAがGemma 3の内部活性化を任意のトークンに対して可読テキストに変換

Ad

Anthropicは、LLMの内部活性化を任意のトークンに対して人間が読めるテキストに変換する新しい手法「Natural Language Autoencoders（NLA）」を発表しました。彼らはGemma 3 27b Instruct用の2つのモデル重みセットをリリースしています：

Auto Verbalizer（AV）：対象モデルの活性化を、特定のトークンを生成する際のモデルの「思考」を自然言語で説明するLLM。重みはkitft/nla-gemma3-27b-L41-avで入手可能。
Activation Reconstructor（AR）：AVのテキスト出力から活性化を再構築し、オートエンコーダーが忠実であることを検証する補助モデル。重みはkitft/nla-gemma3-27b-L41-arにあります。

Neuronpediaでは、neuronpedia.org/gemma-3-27b-it/nlaでインタラクティブデモを公開しています。Gemma 3に質問し、応答内の任意のトークンをクリックして「説明」を押すと、そのトークンに対するモデルの内部推論が平文で表示されます。

これはアテンションや顕著性マップとは異なり、隠れ状態ベクトルを直接デコードします。AVモデルはLLMと並行して実行でき、トークンごとの説明を生成します。一方、ARモデルはAV出力が有効な再構成であることを保証します。両モデルはオープンウェイトで公開されています。

対象者：メカニスティック・インタプリタビリティに取り組む研究者やエンジニア、あるいはエージェントのモデルが特定のトークンを選ぶ理由に興味がある開発者。

📖 全文はこちら： r/LocalLLaMA

Ad

👀 See Also

オープンソースのソロRPGエンジンは、解析、ナレーション、ディレクションの役割を三つのClaudeインスタンスで分担しています。

オープンソースのソロRPGエンジンは、解析、ナレーション、ディレクションの役割を三つのClaudeインスタンスで分担しています。

EdgeTalesは、ダイスメカニクスで結果を決定し、Claude AIが雰囲気のある文章を生成するオープンソースのテキストベースソロRPGエンジンです。このシステムは、3つのClaudeインスタンスをパイプラインで使用します。Brain（Haiku）は入力をJSONに解析し、Narrator（Sonnet）は文章を書き、Director（Haiku）は非同期でシーン分析を行います。

Mar 1, 2026, 04:45 PM UTC

原始人：原始人スタイルの話し方でトークンを75％削減するClaudeコードスキル

原始人：原始人スタイルの話し方でトークンを75％削減するClaudeコードスキル

CavemanはClaude Codeのスキルで、Claudeが原始人のような簡潔な話し方をするようにし、完全な技術的正確性を保ちながらトークン使用量を約75%削減します。npxまたはClaudeプラグインマーケットプレイスからインストールできます。

Apr 15, 2026, 01:06 PM UTC

5つの無料Claudeデスクトップ拡張機能がリリースされました：Inspector Lite、Graph Lite、Bible Code、Word Graph、そしてFun Packです。

5つの無料Claudeデスクトップ拡張機能がリリースされました：Inspector Lite、Graph Lite、Bible Code、Word Graph、そしてFun Packです。

開発者が5つのローカルClaude Desktop拡張機能をオープンソース化しました：意味的コード検索のInspector Lite、個人知識グラフのGraph Lite、娯楽機能のFun Pack、聖書研究のWord Graph、パターン検出のBible Codeです。すべてローカルで動作し、外部依存関係や追加のAPIキーは不要です。

Apr 18, 2026, 09:45 AM UTC

Quiver: Claudeコードスキルの管理と同期のためのGUI

Quiver: Claudeコードスキルの管理と同期のためのGUI

Quiverは、Claude Codeスキルを管理するための無料のオープンソースGUIツールで、ウェブインターフェースを提供します。これにより、ユーザーはローカルのスキルやマーケットプレイスのプラグインを閲覧し、SKILL.mdファイルを編集し、Gitで同期し、ターミナルを使用せずにスキルをインストールできます。

Apr 15, 2026, 08:45 AM UTC