Máquina de Fluxo de Estado: Arquitetura Não-Transformer Mantém 62% de Precisão em Sequências Longas, Enquanto Transformers Caem para 2%

Um desenvolvedor construiu a Máquina de Fluxo de Estado (SFM), uma arquitetura não-transformadora projetada para tarefas que exigem rastreamento de estado em sequências longas. O modelo roda em um único NPU Huawei Ascend 910 ProA e aborda as limitações dos transformadores em simular processos passo a passo quando as sequências excedem os comprimentos de treinamento.
Detalhes da Arquitetura
Em vez de cabeças de atenção, a SFM usa um banco de slots de memória explícitos (vetores pequenos de tamanho fixo). A cada token, um mecanismo de portão decide quais slots atualizar e como. O modelo lê dos slots, calcula uma atualização e grava de volta, funcionando como um pequeno arquivo de registros diferenciável. Essa abordagem está relacionada ao DeltaNet, Atenção Linear e modelos de espaço de estado (Mamba, RWKV), mas é mais explícita — os slots são diretamente endereçáveis e atualizados por meio de portões aprendidos, em vez de serem um estado recorrente implícito.
Configuração do Benchmark
O benchmark sintético de rastreamento de estado de programa envolve sequências como x = 42; x += 17; x -= 8; x *= 2; ... onde o modelo deve prever o valor final de x (inteiro 0–100, enquadrado como classificação de 101 classes).
- Dados de treinamento: 10.000 programas com 10–27 operações, dificuldade alta (todas as operações: adicionar, subtrair, multiplicar, divisão inteira, módulo, definir), seed 42
- Validação: 1.000 programas, mesma distribuição
- Avaliação: teste em 1× (dentro da distribuição), 2×, 4×, 8×, 16× e 32× o comprimento do programa de treinamento
Resultados
Precisão de Correspondência Exata:
- 1× (10 ops): State Slots 99,9%, Transformer-Fair 100,0%, Transformer-Large 100,0%
- 2× (20 ops): State Slots 92,9%, Transformer-Fair 99,0%, Transformer-Large 99,5%
- 4× (40 ops): State Slots 62,0%, Transformer-Fair 1,9%, Transformer-Large 3,1%
- 8× (80 ops): State Slots 35,3%, Transformer-Fair 1,3%, Transformer-Large 1,0%
- 16× (160 ops): State Slots 5,1%, Transformer-Fair 0,9%, Transformer-Large 0,7%
- 32× (320 ops): State Slots 5,0%, Transformer-Fair 1,0%, Transformer-Large 0,8%
Razão de generalização (retenção de precisão):
- State Slots: 4×/1× = 0,62×, 8×/1× = 0,35×
- Transformer-Fair: 4×/1× = 0,02×, 8×/1× = 0,01×
- Transformer-Large: 4×/1× = 0,03×, 8×/1× = 0,01×
Erro Absoluto Médio em comprimentos de extrapolação (escala 0–100):
- 4×: State Slots 14,03, Transformer-Fair 40,33, Transformer-Large 36,76
- 8×: State Slots 26,73, Transformer-Fair 41,71, Transformer-Large 41,19
Os transformadores estão essencialmente adivinhando aleatoriamente em 4× e além (EAM ~40 em uma escala 0–100 está próximo do erro esperado de um palpite aleatório uniforme), enquanto o State Slots continua fazendo previsões significativas.
Parâmetros do Modelo
State Slots usa 961K parâmetros, comparado com Transformer-Fair (443K) e Transformer-Large (2,2M).
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Gemma 4 31B supera modelos maiores no FoodTruck Bench
Gemma 4 31B ficou em 3º lugar no benchmark FoodTruck Bench, superando GLM 5, Qwen 3.5 397B e todos os modelos Claude Sonnet. O modelo parece lidar melhor com tarefas de longo prazo e segue seus próprios conselhos de planejamento.

Claude Code adiciona entrada de voz com funcionalidade de pressionar para falar
O Claude Code está lançando o modo de voz para aproximadamente 5% dos usuários inicialmente, com ativação push-to-talk ao segurar a barra de espaço. Os tokens de transcrição de voz não contam contra os limites de taxa e o recurso está incluído sem custo adicional.

A empresa de IA da Medvi, avaliada em US$ 1,8 bilhão, enfrenta questionamentos sobre questões legais e éticas
Gary Marcus critica a história viral da Medvi, uma suposta empresa de IA de US$ 1,8 bilhão construída por uma pessoa em dois meses, destacando ações coletivas por violações de spam e questões sobre relatórios de receita e conformidade.

Meta rastreia interações dos funcionários com computadores para treinamento de agentes de IA
A Meta está instalando software de rastreamento nos computadores dos funcionários nos EUA para capturar movimentos do mouse, cliques e teclas digitadas para treinar modelos de IA que podem realizar tarefas de trabalho de forma autônoma. A ferramenta funciona em aplicativos e sites relacionados ao trabalho e tira capturas de tela ocasionais para contexto.