O WWDC26 ontem confirmou a nova arquitetura do Apple Intelligence: Siri reescrita sobre Foundation Models co-desenvolvidos com o Google usando tecnologias Gemini como base, rodando localmente no dispositivo ou via Private Cloud Compute sem enviar dados ao Google. O macOS 27 (Golden Gate) descontinua suporte a Macs Intel — apenas Apple Silicon em diante. iOS 27 chega até o iPhone 11, com 70% mais rapidez no carregamento de fotos e 80% em AirDrop. O Core AI Framework é a novidade mais direta para devs: a Apple expõe os mesmos Foundation Models do sistema para apps de terceiros via API. Tim Cook confirmou WWDC26 como seu último keynote como CEO; John Ternus assume em 1º de setembro.
NEWS DROP
09 de junho de 2026
8 itens
Terça-feira, 9 de junho.
O WWDC26 aconteceu ontem, e a Apple entregou mais em um keynote do que nos últimos três anos combinados. O headline técnico é a arquitetura da nova Siri: Foundation Models co-desenvolvidos com o Google, usando tecnologias Gemini como base, rodando localmente no dispositivo ou via Private Cloud Compute. A Apple foi explícita — a colaboração foi no nível de treinamento dos modelos, não de infraestrutura; dados de usuário não passam pelos servidores do Google. O macOS 27, batizado Golden Gate, descontinua suporte a Macs Intel: todos os modelos com processador Intel ficam na versão anterior. iOS 27 vai na direção oposta em compatibilidade — chega até o iPhone 11 — e traz ganhos de performance mensuráveis: 70% mais rápido no carregamento de fotos, 80% em transferências AirDrop. Para desenvolvedores, o item mais relevante é o Core AI Framework, que expõe os mesmos Foundation Models que alimentam o sistema internamente via API para apps de terceiros. Tim Cook usou o keynote para confirmar sua última aparição como CEO antes da transição para Executive Chairman em 1º de setembro, com John Ternus — o engenheiro por trás do M-series e do Vision Pro — assumindo o posto.
Supply chain attack em andamento: o Miasma worm infectou pelo menos 73 repositórios Microsoft no GitHub, inserindo um credential stealer em ferramentas de desenvolvimento populares como Claude Code, Gemini CLI e extensões do VS Code. O malware rouba passwords e credenciais quando devs abrem as ferramentas comprometidas nos seus ambientes de AI coding. A Microsoft desativou os repositórios e notificou "um pequeno número de clientes" sem divulgar o volume total de downloads comprometidos. É o segundo incidente conhecido em semanas; pesquisadores indicam possível re-comprometimento do projeto Durable Task, sugerindo que a resposta ao primeiro breach pode não ter sido completa.
A Xiaomi open-sourceu o MiMo-v2.5-Pro-UltraSpeed: 1 trilhão de parâmetros a mais de 1.000 tokens por segundo num único nó de 8 GPUs commodity. O resultado vem de três decisões simultâneas de design — quantização FP4 seletiva nos Expert do MoE preservando precisão nos componentes críticos; DFlash, um decodificador especulativo de predição paralela em bloco com 6.3 tokens aceitos por round em coding; e TileRT, um motor de execução com kernels persistentes e warp specialization. A capacidade do modelo permanece equivalente ao original. Para loops de decisão em tempo real — trading, detecção de fraude, diagnóstico médico — isso muda o que é viável em hardware padrão.
A xAI está se tornando outra coisa. Martin Alderson publicou ontem uma análise com 550+ pontos no HN: a empresa formalizou contratos de aluguel de GPUs com a Anthropic ($1.25 bilhão/mês, 220 mil GPUs) e com o Google ($920 milhões/mês, 110 mil GPUs) — receita combinada de ~$25 bilhões por ano apenas desses dois acordos. Os contratos permitem recuperar todo o capex em 18 meses com margem significativa. A xAI continua desenvolvendo o Grok, mas a atividade econômica dominante é hoje alugar infraestrutura para competidores diretos. O argumento é direto: isso é mais parecido com um REIT ou operadora de co-location do que com um laboratório de frontier AI.
Quatro itens mais curtos para fechar. O OpenCV 5 foi lançado com o maior salto de capacidades em anos: suporte ONNX subiu de ~22% para mais de 80%, modelos como Qwen 2.5, Gemma 3 e PaliGemma rodam nativamente sem runtimes externos, e a inferência está 4-36% mais rápida. O Cognition AI lançou o FrontierCode, benchmark que pergunta "esse código seria mergeado por um maintainer de produção?" — o melhor modelo atual, Claude Opus 4.8, acerta apenas 13.4% nas 50 tarefas mais difíceis. O pgEdge publicou um deep dive sobre query hints no Postgres 19: 20 anos após Robert Haas propor o mecanismo pela primeira vez, o Postgres 19 chega com `pg_plan_advice` e `pg_stash_advice` — conselhos que constrangem o espaço de busca do otimizador com degradação graciosa quando o conselho é ruim. E o Akita On Rails publicou ontem um post sobre TUIs em Rust com Ratatui, com a observação que ficou: com LLM escrevendo a maior parte do Rust, o custo do borrow checker some — e escrever utilitários pequenos em Rust passa a competir economicamente com Python e Go.
Oito itens. Boa terça.
O Miasma worm infectou pelo menos 73 repositórios Microsoft no GitHub, inserindo um credential stealer em ferramentas populares de AI coding — incluindo Claude Code, Gemini CLI e extensões do VS Code. O malware rouba passwords e credenciais sensíveis quando devs abrem as ferramentas comprometidas. A Microsoft desativou os repositórios e notificou "um pequeno número de clientes" sem divulgar o volume total de downloads afetados. É o segundo incidente conhecido em semanas, com pesquisadores apontando possível re-comprometimento do projeto Durable Task — sugerindo que a resposta ao primeiro breach pode não ter eliminado completamente o vetor.
A análise de Martin Alderson documenta a transformação da xAI: contratos de aluguel de GPUs com a Anthropic ($1.25B/mês, 220 mil GPUs) e com o Google ($920M/mês, 110 mil GPUs) geram receita combinada de ~$25 bilhões por ano — suficiente para recuperar todo o capex em 18 meses com margem significativa. A xAI continua desenvolvendo o Grok, mas a atividade econômica dominante hoje é alugar infraestrutura para competidores diretos. O argumento central: isso é mais próximo de um REIT de data center ou operadora de co-location do que de um laboratório de frontier AI — e tem implicações diretas para a valuation da SpaceX no seu IPO.
A Xiaomi open-sourceu o MiMo-v2.5-Pro-UltraSpeed, conseguindo 1.000+ tokens/segundo com um modelo de 1 trilhão de parâmetros num único nó de 8 GPUs padrão. O sistema combina quantização FP4 seletiva nos Expert do MoE, DFlash (decodificação especulativa com predição paralela em bloco, ~6.3 tokens aceitos por round em coding) e TileRT (kernels persistentes com warp specialization). A capacidade do modelo permanece equivalente ao MiMo-V2.5-Pro original — apenas a velocidade muda, a ~3x o custo de inferência. Checkpoint FP4 disponível no HuggingFace. Para aplicações com decisão em tempo real como trading, detecção de fraude e diagnóstico médico, muda o que é viável em hardware commodity.
O OpenCV 5 chegou com o maior salto de capacidades desde a versão 3. O novo DNN engine graph-based elevou o suporte a operadores ONNX de ~22% para mais de 80%, com formas dinâmicas e fusão inteligente de operadores. Modelos como Qwen 2.5, Gemma 3 e PaliGemma rodam nativamente via tokenizers e KV-cache built-in, sem runtimes externos. Inferência 4-36% mais rápida versus versão 4.x em benchmarks que vão de YOLOv8 a OWLv2; suporte nativo a FP16, BF16 e inteiros de 64 bits. A API C legada foi depreciada, mas três engines coexistem por uma API unificada (ENGINE_AUTO por padrão) para migração gradual sem reescrever código.
O Cognition AI lançou o FrontierCode, benchmark que avalia se o código gerado por IA passaria no code review de um maintainer de projeto real — não apenas se compila e passa nos testes. As 50 tarefas mais difíceis (Diamond) foram criadas por mais de 20 maintainers de projetos como Celery, Budibase e Mattermost, com 40+ horas de trabalho por tarefa. Resultado: Claude Opus 4.8 lidera com 13.4% no Diamond e 34.3% no Main; GPT-5.5 marca 6.3%; Gemini 3.1 Pro, 4.7%. É o primeiro benchmark que separa sistematicamente 'código que funciona' de 'código que seria aceito em produção por um maintainer experiente'.
O Postgres 19 introduz `pg_plan_advice` e `pg_stash_advice`, 20 anos após Robert Haas propor hints pela primeira vez e encontrar resistência da comunidade. A implementação escolhida não substitui o planner: os 'conselhos' constrangem o espaço de busca do otimizador, e conselho ruim degrada graciosamente — o planner marca os nós afetados como `Disabled` e recai para alternativas em vez de produzir um plano catastrófico. O `pg_stash_advice` persiste os conselhos na shared memory por query ID, aplicando automaticamente entre sessões sem modificar o SQL da aplicação.
Fabio Akita publicou ontem um post prático sobre construção de TUIs em Rust com Ratatui e ratatui-bubbletea — uma biblioteca de componentes e theming inspirada no Charm's Bubble Tea do Go. O ponto central: com um LLM escrevendo a maior parte do Rust, o custo de lidar com o borrow checker some, tornando Rust competitivo com Python e Go para utilitários pequenos. Os projetos resultantes incluem ai-usagebar (monitor de limites de API de LLMs), clock-tui com tarefas e calendário, e um módulo GTK para o GNOME Geary que evita manter um fork.
NEWSLETTER
Receba os próximos drops direto no e-mail
Sem frequência forçada. Só quando tiver algo que vale o clique.