← News

NEWS DROP

09 de junho de 2026

8 itens

Terça-feira, 9 de junho.

O WWDC26 aconteceu ontem, e a Apple entregou mais em um keynote do que nos últimos três anos combinados. O headline técnico é a arquitetura da nova Siri: Foundation Models co-desenvolvidos com o Google, usando tecnologias Gemini como base, rodando localmente no dispositivo ou via Private Cloud Compute. A Apple foi explícita — a colaboração foi no nível de treinamento dos modelos, não de infraestrutura; dados de usuário não passam pelos servidores do Google. O macOS 27, batizado Golden Gate, descontinua suporte a Macs Intel: todos os modelos com processador Intel ficam na versão anterior. iOS 27 vai na direção oposta em compatibilidade — chega até o iPhone 11 — e traz ganhos de performance mensuráveis: 70% mais rápido no carregamento de fotos, 80% em transferências AirDrop. Para desenvolvedores, o item mais relevante é o Core AI Framework, que expõe os mesmos Foundation Models que alimentam o sistema internamente via API para apps de terceiros. Tim Cook usou o keynote para confirmar sua última aparição como CEO antes da transição para Executive Chairman em 1º de setembro, com John Ternus — o engenheiro por trás do M-series e do Vision Pro — assumindo o posto.

Supply chain attack em andamento: o Miasma worm infectou pelo menos 73 repositórios Microsoft no GitHub, inserindo um credential stealer em ferramentas de desenvolvimento populares como Claude Code, Gemini CLI e extensões do VS Code. O malware rouba passwords e credenciais quando devs abrem as ferramentas comprometidas nos seus ambientes de AI coding. A Microsoft desativou os repositórios e notificou "um pequeno número de clientes" sem divulgar o volume total de downloads comprometidos. É o segundo incidente conhecido em semanas; pesquisadores indicam possível re-comprometimento do projeto Durable Task, sugerindo que a resposta ao primeiro breach pode não ter sido completa.

A Xiaomi open-sourceu o MiMo-v2.5-Pro-UltraSpeed: 1 trilhão de parâmetros a mais de 1.000 tokens por segundo num único nó de 8 GPUs commodity. O resultado vem de três decisões simultâneas de design — quantização FP4 seletiva nos Expert do MoE preservando precisão nos componentes críticos; DFlash, um decodificador especulativo de predição paralela em bloco com 6.3 tokens aceitos por round em coding; e TileRT, um motor de execução com kernels persistentes e warp specialization. A capacidade do modelo permanece equivalente ao original. Para loops de decisão em tempo real — trading, detecção de fraude, diagnóstico médico — isso muda o que é viável em hardware padrão.

A xAI está se tornando outra coisa. Martin Alderson publicou ontem uma análise com 550+ pontos no HN: a empresa formalizou contratos de aluguel de GPUs com a Anthropic ($1.25 bilhão/mês, 220 mil GPUs) e com o Google ($920 milhões/mês, 110 mil GPUs) — receita combinada de ~$25 bilhões por ano apenas desses dois acordos. Os contratos permitem recuperar todo o capex em 18 meses com margem significativa. A xAI continua desenvolvendo o Grok, mas a atividade econômica dominante é hoje alugar infraestrutura para competidores diretos. O argumento é direto: isso é mais parecido com um REIT ou operadora de co-location do que com um laboratório de frontier AI.

Quatro itens mais curtos para fechar. O OpenCV 5 foi lançado com o maior salto de capacidades em anos: suporte ONNX subiu de ~22% para mais de 80%, modelos como Qwen 2.5, Gemma 3 e PaliGemma rodam nativamente sem runtimes externos, e a inferência está 4-36% mais rápida. O Cognition AI lançou o FrontierCode, benchmark que pergunta "esse código seria mergeado por um maintainer de produção?" — o melhor modelo atual, Claude Opus 4.8, acerta apenas 13.4% nas 50 tarefas mais difíceis. O pgEdge publicou um deep dive sobre query hints no Postgres 19: 20 anos após Robert Haas propor o mecanismo pela primeira vez, o Postgres 19 chega com `pg_plan_advice` e `pg_stash_advice` — conselhos que constrangem o espaço de busca do otimizador com degradação graciosa quando o conselho é ruim. E o Akita On Rails publicou ontem um post sobre TUIs em Rust com Ratatui, com a observação que ficou: com LLM escrevendo a maior parte do Rust, o custo do borrow checker some — e escrever utilitários pequenos em Rust passa a competir economicamente com Python e Go.

Oito itens. Boa terça.

01
WWDC26: Siri reescrita sobre Foundation Models co-desenvolvidos com Google, macOS Golden Gate abandona Macs Intel e Tim Cook despede-se como CEO
TechCrunch / Apple#Apple#WWDC26#AI#macOS

O WWDC26 ontem confirmou a nova arquitetura do Apple Intelligence: Siri reescrita sobre Foundation Models co-desenvolvidos com o Google usando tecnologias Gemini como base, rodando localmente no dispositivo ou via Private Cloud Compute sem enviar dados ao Google. O macOS 27 (Golden Gate) descontinua suporte a Macs Intel — apenas Apple Silicon em diante. iOS 27 chega até o iPhone 11, com 70% mais rapidez no carregamento de fotos e 80% em AirDrop. O Core AI Framework é a novidade mais direta para devs: a Apple expõe os mesmos Foundation Models do sistema para apps de terceiros via API. Tim Cook confirmou WWDC26 como seu último keynote como CEO; John Ternus assume em 1º de setembro.

Ler na fonte →
02
Miasma worm infecta 73 repositórios Microsoft no GitHub — credential stealer embutido em Claude Code, Gemini CLI e extensões VS Code
TechCrunch#Security#GitHub#SupplyChain#Microsoft

O Miasma worm infectou pelo menos 73 repositórios Microsoft no GitHub, inserindo um credential stealer em ferramentas populares de AI coding — incluindo Claude Code, Gemini CLI e extensões do VS Code. O malware rouba passwords e credenciais sensíveis quando devs abrem as ferramentas comprometidas. A Microsoft desativou os repositórios e notificou "um pequeno número de clientes" sem divulgar o volume total de downloads afetados. É o segundo incidente conhecido em semanas, com pesquisadores apontando possível re-comprometimento do projeto Durable Task — sugerindo que a resposta ao primeiro breach pode não ter eliminado completamente o vetor.

Ler na fonte →
03
xAI aluga 330 mil GPUs para Anthropic e Google por US$ 2,2 bilhões por mês — o laboratório de AI que virou data center REIT
martinalderson.com / Hacker News#AI#xAI#Industry#Infrastructure

A análise de Martin Alderson documenta a transformação da xAI: contratos de aluguel de GPUs com a Anthropic ($1.25B/mês, 220 mil GPUs) e com o Google ($920M/mês, 110 mil GPUs) geram receita combinada de ~$25 bilhões por ano — suficiente para recuperar todo o capex em 18 meses com margem significativa. A xAI continua desenvolvendo o Grok, mas a atividade econômica dominante hoje é alugar infraestrutura para competidores diretos. O argumento central: isso é mais próximo de um REIT de data center ou operadora de co-location do que de um laboratório de frontier AI — e tem implicações diretas para a valuation da SpaceX no seu IPO.

Ler na fonte →
04
Xiaomi open-sourcea MiMo-v2.5-Pro-UltraSpeed: modelo de 1 trilhão de parâmetros a 1.000 tokens/segundo em 8 GPUs commodity
Xiaomi MiMo Blog / Hacker News#AI#LLM#Performance#OpenSource

A Xiaomi open-sourceu o MiMo-v2.5-Pro-UltraSpeed, conseguindo 1.000+ tokens/segundo com um modelo de 1 trilhão de parâmetros num único nó de 8 GPUs padrão. O sistema combina quantização FP4 seletiva nos Expert do MoE, DFlash (decodificação especulativa com predição paralela em bloco, ~6.3 tokens aceitos por round em coding) e TileRT (kernels persistentes com warp specialization). A capacidade do modelo permanece equivalente ao MiMo-V2.5-Pro original — apenas a velocidade muda, a ~3x o custo de inferência. Checkpoint FP4 disponível no HuggingFace. Para aplicações com decisão em tempo real como trading, detecção de fraude e diagnóstico médico, muda o que é viável em hardware commodity.

Ler na fonte →
05
OpenCV 5 lançado: suporte ONNX sobe de 22% para 80%, LLMs rodando nativamente e inferência 4-36% mais rápida
OpenCV / Hacker News#ComputerVision#ML#OpenSource#Performance

O OpenCV 5 chegou com o maior salto de capacidades desde a versão 3. O novo DNN engine graph-based elevou o suporte a operadores ONNX de ~22% para mais de 80%, com formas dinâmicas e fusão inteligente de operadores. Modelos como Qwen 2.5, Gemma 3 e PaliGemma rodam nativamente via tokenizers e KV-cache built-in, sem runtimes externos. Inferência 4-36% mais rápida versus versão 4.x em benchmarks que vão de YOLOv8 a OWLv2; suporte nativo a FP16, BF16 e inteiros de 64 bits. A API C legada foi depreciada, mas três engines coexistem por uma API unificada (ENGINE_AUTO por padrão) para migração gradual sem reescrever código.

Ler na fonte →
06
FrontierCode: benchmark do Cognition AI mede código pronto para produção — Opus 4.8 lidera, mas acerta apenas 13.4% das tarefas mais difíceis
Cognition AI#AI#Benchmark#CodeQuality#Engineering

O Cognition AI lançou o FrontierCode, benchmark que avalia se o código gerado por IA passaria no code review de um maintainer de projeto real — não apenas se compila e passa nos testes. As 50 tarefas mais difíceis (Diamond) foram criadas por mais de 20 maintainers de projetos como Celery, Budibase e Mattermost, com 40+ horas de trabalho por tarefa. Resultado: Claude Opus 4.8 lidera com 13.4% no Diamond e 34.3% no Main; GPT-5.5 marca 6.3%; Gemini 3.1 Pro, 4.7%. É o primeiro benchmark que separa sistematicamente 'código que funciona' de 'código que seria aceito em produção por um maintainer experiente'.

Ler na fonte →
07
Postgres 19 chega com query hints depois de 20 anos — pg_plan_advice constrange o planner sem substituí-lo
pgEdge Blog / Hacker News#PostgreSQL#Database#Engineering#Performance

O Postgres 19 introduz `pg_plan_advice` e `pg_stash_advice`, 20 anos após Robert Haas propor hints pela primeira vez e encontrar resistência da comunidade. A implementação escolhida não substitui o planner: os 'conselhos' constrangem o espaço de busca do otimizador, e conselho ruim degrada graciosamente — o planner marca os nós afetados como `Disabled` e recai para alternativas em vez de produzir um plano catastrófico. O `pg_stash_advice` persiste os conselhos na shared memory por query ID, aplicando automaticamente entre sessões sem modificar o SQL da aplicação.

Ler na fonte →
08
Akita On Rails: Ratatui + Bubbletea para TUIs em Rust — e por que LLMs mudaram a economia de escrever ferramentas pequenas
Akita On Rails#Rust#TUI#AI#Tools

Fabio Akita publicou ontem um post prático sobre construção de TUIs em Rust com Ratatui e ratatui-bubbletea — uma biblioteca de componentes e theming inspirada no Charm's Bubble Tea do Go. O ponto central: com um LLM escrevendo a maior parte do Rust, o custo de lidar com o borrow checker some, tornando Rust competitivo com Python e Go para utilitários pequenos. Os projetos resultantes incluem ai-usagebar (monitor de limites de API de LLMs), clock-tui com tarefas e calendário, e um módulo GTK para o GNOME Geary que evita manter um fork.

Ler na fonte →

NEWSLETTER

Receba os próximos drops direto no e-mail

Sem frequência forçada. Só quando tiver algo que vale o clique.

Compartilhe este drop

Comentarios