Apple constrói nova arquitetura de IA sobre os modelos fundacionais Google Gemini

A Apple anunciou hoje uma grande reformulação de sua plataforma Apple Intelligence, construída sobre modelos de base codesenvolvidos com o Google usando tecnologias da família Gemini. A nova arquitetura, revelada na WWDC 2026, foi projetada para funcionar tanto no dispositivo quanto em servidores por meio da infraestrutura Private Cloud Compute da Apple.
Detalhes Principais
- Modelos de Base da Apple: Codesenvolvidos com o Google, esses modelos alimentam o novo Apple Intelligence. A Apple descreve a colaboração como "profunda."
- Suporte multimodal: Os modelos agora lidam com compreensão e geração de imagens, incluindo criação de imagens realistas, edição avançada de fotos e resposta visual a perguntas.
- Variante de maior potência: Alguns dispositivos receberão uma versão com capacidades adicionais: geração de fala, precisão melhorada de ditado e compreensão de linguagem natural mais forte. A Apple não especificou quais dispositivos.
- Orquestrador do sistema: Um novo componente fica no centro da arquitetura, coordenando recursos de forma segura entre plataformas. Ele adapta as respostas com base no aplicativo ativo e na tarefa atual do usuário, permitindo "inteligência verdadeiramente em todo o sistema."
- Privacidade: A Apple reitera que os dados do usuário são usados apenas para executar a solicitação imediata e não são acessíveis à Apple ou a terceiros. Especialistas externos podem verificar as garantias de privacidade a qualquer momento.
A Apple enquadrou o anúncio como um contraste aos concorrentes que "correm para frente" sem se importar com os usuários, e enfatizou seu compromisso com o processamento no dispositivo e o Private Cloud Compute.
Para desenvolvedores que usam agentes de codificação de IA, isso significa que futuros SDKs e ferramentas da Apple podem expor esses modelos por meio de APIs do Private Cloud Compute, permitindo fluxos de trabalho agentivos com garantias de privacidade. O padrão de orquestrador pode servir como referência para construir sistemas de roteamento de tarefas entre modelos no dispositivo e na nuvem.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Dois funcionários do Ministério do Interior da África do Sul suspensos por alucinações de IA em documento de política
Dois funcionários foram suspensos após alucinações de IA serem encontradas na lista de referências de um documento revisado sobre cidadania, imigração e proteção de refugiados. O departamento implementará verificações de IA e revisará todos os documentos políticos desde novembro de 2022.

Explorando o Flash da Etapa 3.5: Modelo de Código Aberto para Raciocínio Profundo Rápido
O Step 3.5 Flash é um modelo de base de código aberto projetado para raciocínio profundo rápido e eficiente, utilizando uma arquitetura esparsa de Mistura de Especialistas.

Agentes de codificação de IA podem fragmentar o fluxo de trabalho e drenar a atenção, alerta desenvolvedor
Um desenvolvedor web com 12 anos de experiência relata que usar Claude Code diariamente leva a micro interrupções, perda de foco e exaustão mental — sem ganhos mensuráveis de produtividade.

Previsão Multi-Token MTP: Geração de Tokens 2x Mais Rápida no AMD Strix Halo & Radeon 9700 AI Pro
MTP acelera a inferência de LLMs em até 2x, especialmente para agentes de codificação. O vídeo aborda a mecânica do MTP e o desempenho no Qwen 3.6 com AMD Strix Halo e Dual Radeon 9700.