Talkie: Um LLM de 13B Treinado Exclusivamente em Textos Anteriores a 1931, Usando Claude como Juiz no Treinamento RL

✍️ OpenClawRadar📅 Publicado: April 28, 2026🔗 Source
Talkie: Um LLM de 13B Treinado Exclusivamente em Textos Anteriores a 1931, Usando Claude como Juiz no Treinamento RL
Ad

Uma equipe de pesquisadores, incluindo Alec Radford (GPT, CLIP, Whisper), Nick Levine e David Duvenaud, acaba de lançar o Talkie, um modelo de linguagem de 13 bilhões de parâmetros treinado exclusivamente em textos publicados antes de 1931. O corte de conhecimento do modelo é 31 de dezembro de 1930 — sem internet, sem Wikipédia, sem conteúdo da Segunda Guerra Mundial.

Por que isso importa

Os LLMs atuais (GPT, Claude, Gemini, Llama) compartilham dados de treinamento da web moderna, dificultando separar memorização de raciocínio genuíno. O Talkie quebra essa linhagem: sua distribuição de treinamento é fundamentalmente diferente, permitindo que pesquisadores testem se as capacidades surgem de memorização ou generalização. Como a equipe observa: "É uma questão importante saber o quanto das capacidades dos LLMs vêm de memorização versus generalização. Os LLMs vintage permitem testes de generalização únicos."

O papel do Claude no treinamento

O Claude Sonnet 4.6 serviu como juiz no pipeline de aprendizado por reforço do Talkie (DPO online). Além disso, o Claude Opus 4.4 gerou conversas sintéticas de múltiplas rodadas usadas na etapa final de ajuste fino. A equipe reconhece a ironia e o risco de contaminação, destacando que estão trabalhando para eliminar isso em versões futuras.

Ad

Principais capacidades

  • O Talkie pode aprender a escrever código Python a partir de apenas alguns exemplos no contexto — apesar de ter zero código moderno em seus dados de treinamento. Ele está raciocinando a partir de textos de matemática do século XIX, não de recuperação.
  • Projetado para previsões de longo prazo: quão bem um modelo consegue "prever" o futuro a partir de sua perspectiva congelada de 1930?
  • Pode ser usado para estudar "invenção" — se consegue desenvolver ideias posteriores ao seu corte de conhecimento.
  • Ajuda a isolar quais capacidades são impulsionadas pela arquitetura vs. absorvidas de dados da web.

Acesso e licenciamento

Tanto o Talkie quanto sua variante são licenciados sob Apache 2.0 e têm pesos abertos no Hugging Face. Você pode conversar com ele ao vivo no link fornecido. A equipe planeja um modelo vintage na escala do GPT-3 ainda este ano.

Para que está sendo usado

  • Previsões de longo prazo: prever desenvolvimentos futuros a partir de um ponto de vista histórico.
  • Invenção: gerar ideias posteriores ao seu corte de treinamento.
  • Identidade de LLMs: o que torna um modelo ele mesmo — isolando efeitos de arquitetura vs. distribuição de dados.

📖 Leia a fonte original: r/ClaudeAI

Ad

👀 See Also

Experiência do desenvolvedor com a Claude AI: De parceiro de reflexão à terceirização cognitiva
News

Experiência do desenvolvedor com a Claude AI: De parceiro de reflexão à terceirização cognitiva

Um desenvolvedor compartilha uma experiência de 8 meses usando o Claude AI diariamente, observando uma mudança de usá-lo para refinar pensamentos existentes para terceirizar completamente o pensamento inicial. O post descreve duas abordagens cognitivas distintas: IA como parceira de pensamento versus IA como geradora de primeira passagem.

OpenClawRadar
Arquitetura de Memória Inspirada na Neurociência para Agentes de IA Validada pelo Auto-sonho do Claude
News

Arquitetura de Memória Inspirada na Neurociência para Agentes de IA Validada pelo Auto-sonho do Claude

Uma arquitetura de memória inspirada na neurociência para agentes de IA, desenvolvida por um programador, com consolidação em ciclos de sono e três agentes especializados, alinha-se de perto com o recurso Auto-dream do Claude, recentemente lançado, que realiza passagens reflexivas sobre arquivos de memória.

OpenClawRadar
Novos Créditos de Assinatura Claude da Anthropic: SDK de Agente e claude -p Ganham Pool Separado com Limite a Partir de 15 de Junho
News

Novos Créditos de Assinatura Claude da Anthropic: SDK de Agente e claude -p Ganham Pool Separado com Limite a Partir de 15 de Junho

A partir de 15 de junho, assinantes do Claude recebem um crédito mensal separado para uso do Agent SDK e claude -p: US$ 200/mês para Max 20x, US$ 100 para Max 5x, US$ 20 para Pro. O uso é interrompido quando o crédito acaba, a menos que a cobrança extra seja ativada. O uso interativo do Claude Code e do chat permanece no pool da assinatura.

OpenClawRadar
Lançamento do Claude Code v2.1.117: Divisão de Subagentes, Melhorias em Plugins e Correções de Desempenho
News

Lançamento do Claude Code v2.1.117: Divisão de Subagentes, Melhorias em Plugins e Correções de Desempenho

O Claude Code v2.1.117 permite subagentes bifurcados em builds externos via CLAUDE_CODE_FORK_SUBAGENT=1, melhora o gerenciamento de dependências de plugins e corrige os cálculos da janela de contexto do Opus 4.7. A versão inclui inicialização mais rápida com conexões MCP simultâneas e substitui as ferramentas Glob/Grep por bfs/ugrep embutidos no macOS/Linux.

OpenClawRadar