Talkie:基于1931年前文本训练的13B大型语言模型,采用Claude作为强化学习训练的评判者

✍️ OpenClawRadar📅 公開日: April 28, 2026🔗 Source
Talkie:基于1931年前文本训练的13B大型语言模型,采用Claude作为强化学习训练的评判者
Ad

Alec Radford(GPT、CLIP、Whisper)、Nick Levine、David Duvenaudを含む研究チームが、Talkieを公開しました。これは130億パラメータの言語モデルで、1931年より前に公開されたテキストのみで学習されています。モデルの知識の基準日は1930年12月31日で、インターネット、Wikipedia、第二次世界大戦の内容は一切含まれていません。

なぜ重要なのか

現在のLLM(GPT、Claude、Gemini、Llama)はすべて現代のWebからの学習データを共有しており、記憶と真の推論を分離することが困難です。Talkieはその系列を断ち切ります。学習分布が根本的に異なるため、研究者は能力が記憶から生じるのか、一般化から生じるのかをテストできます。チームが指摘するように:「言語モデルの能力が記憶と一般化のどちらから生じるかは重要な問題です。ビンテージ言語モデルは独自の一般化テストを可能にします。」

学習におけるClaudeの役割

Claude Sonnet 4.6は、Talkieの強化学習パイプライン(オンラインDPO)の評価者として機能しました。さらに、Claude Opus 4.4が合成マルチターン会話を生成し、最終的な微調整段階で使用されました。チームは皮肉や汚染リスクを認識しており、将来のバージョンで排除するよう取り組んでいると述べています。

Ad

主な機能

  • Talkieは、学習データに現代のコードが一切ないにもかかわらず、わずか数件のコンテキスト内例からPythonコードの書き方を学習できます。19世紀の数学テキストから推論しており、検索によるものではありません。
  • 長期的予測向けに設計:モデルは凍結された1930年の視点から未来をどの程度「予測」できるか?
  • 「発明」の研究に使用可能:知識の基準日以降のアイデアを生み出せるか?
  • アーキテクチャ駆動の能力とWebデータから吸収された能力を分離するのに役立つ。

アクセスとライセンス

TalkieとそのバリアントはApache 2.0ライセンスで提供され、Hugging Face上でオープンウェイトです。提供されたリンクからライブチャットが可能です。チームは今年後半にGPT-3規模のビンテージモデルを計画しています。

研究用途

  • 長期的予測:歴史的観点から将来の展開を予測。
  • 発明:訓練基準日以降のアイデアを生成。
  • LLMのアイデンティティ:モデルをそれ自体たらしめるものは何か——アーキテクチャとデータ分布の影響を分離。

📖 出典全文: r/ClaudeAI

Ad

👀 See Also

OpenClaw Codex OAuthが有効なアカウントにもかかわらず課金エラーを返しています
News

OpenClaw Codex OAuthが有効なアカウントにもかかわらず課金エラーを返しています

OpenClaw Codex OAuthが、請求情報が確認済みで有効であり、execコマンドが正常に動作しているにもかかわらず、「アカウントがアクティブではありません。請求情報を確認してください」という429エラーを返しています。この問題は複数のOpenClawバージョンで発生しています。

OpenClawRadar
Anthropic、メッセージング統合向けにClaude Code Channelsをローンチ
News

Anthropic、メッセージング統合向けにClaude Code Channelsをローンチ

AnthropicはClaude Code Channelsをリリースしました。これにより、開発者はTelegramやDiscordからClaude CodeセッションにDMを送信でき、ファイル編集、テスト実行、git操作を含むフルツールアクセスが可能になります。この機能は有料のAnthropicプランが必要で、OpenClawの20以上と比べて2つのプラットフォームをサポートしています。

OpenClawRadar
フォーブス:AIによる解雇の代償がやってくる — CTOは二重の負担を強いられる
News

フォーブス:AIによる解雇の代償がやってくる — CTOは二重の負担を強いられる

Forbesは、AI主導の解雇のコストは企業に二度の打撃を与えると論じている。一度目は退職金と士気の低下、二度目は期待された効率性の向上が実現せず、再雇用が必要になることだ。

OpenClawRadar
開発者は、その失敗モードのためにQwen3.5-27Bをプロプライエタリモデルよりも好む
News

開発者は、その失敗モードのためにQwen3.5-27Bをプロプライエタリモデルよりも好む

r/LocalLLaMAの開発者が、問題のあるタスクを諦めるため、無制限のPerlやNodeJSスクリプトのような潜在的に危険なコードを生成するGemini 3.1 ProやGPT-5.3 CodexよりもQwen3.5-27Bを好んでいると報告しています。

OpenClawRadar