← News

NEWS DROP

25 de junho de 2026

7 itens

Quarta-feira, 25 de junho.

A OpenAI revelou ontem o Jalapeño — o primeiro processador de inferência customizado da empresa, desenvolvido em parceria com a Broadcom. O chip foi construído especificamente para rodar modelos de IA já treinados em resposta a consultas de usuários, não para o pré-treinamento, que continua em hardware Nvidia. Os primeiros benchmarks internos mostram desempenho por watt "significativamente melhor que as alternativas estado-da-arte" — e a empresa destacou o baixo custo operacional especificamente para modelos de coding em tempo real. O deal com a Broadcom havia sido anunciado em outubro de 2025; este é o primeiro produto concreto saindo dele. Com 692 pontos no HN, é a maior história técnica do dia: a OpenAI está construindo a pilha completa, do chip ao modelo, eliminando a dependência exclusiva da Nvidia em inferência de produção.

Ainda no front da Anthropic: a empresa acusou formalmente a Alibaba de conduzir "o maior ataque de distilação já registrado" contra o Claude. Em carta enviada ao Senado americano em 10 de junho e tornada pública ontem, a Anthropic documenta que parceiros afiliados à Alibaba criaram aproximadamente 25 mil contas fraudulentas e realizaram 28,8 milhões de trocas com o Claude entre 22 de abril e 5 de junho — o objetivo era construir um modelo menor usando as saídas do Claude como dado de treinamento, processo conhecido como distilação. Dois dias depois da carta, o Departamento de Comércio dos EUA restringiu o acesso global aos modelos Mythos e Fable da Anthropic por medo de uso militar na China. O resultado: dois modelos frontier da Anthropic ficaram temporariamente inacessíveis para todos os usuários no mundo.

A Qualcomm anunciou ontem a aquisição da Modular — startup de Chris Lattner — por US$ 3,9 bilhões. O nome importa: Lattner criou o LLVM (o compilador por baixo de quase todo código compilado moderno), a linguagem Swift, liderou os chips TPU no Google e brevemente o programa Autopilot da Tesla. A Modular construiu o Mojo — linguagem de programação para IA — e o MAX Engine, um runtime de inferência que roda modelos em qualquer hardware (CPU, GPU, NPU, chips customizados) sem reescrever código para cada arquitetura. O motivo estratégico da Qualcomm é direto: entrar no mercado de data centers para IA com hardware competitivo precisa de software que torne esse hardware atrativo — e a Modular resolve exatamente esse problema.

Uma descoberta de segurança com impacto imediato para qualquer equipe que usa GitHub Actions: a Novee Security publicou o "Cordyceps" — uma classe sistemática de vulnerabilidades em configurações de CI/CD que permite que qualquer atacante sem autenticação execute código, roube credenciais ou envenene artefatos de build via pull request malicioso. O scan de 30 mil repositórios de alto impacto encontrou mais de 300 completamente exploráveis — incluindo repos do Azure Sentinel (Microsoft), do AI Agent Development Kit (Google), do Apache e do Cloudflare. O vetor central: workflows com pull_request_target que não isolam o código não confiável do contexto privilegiado com acesso a secrets. Uma conta gratuita do GitHub é suficiente para explorar.

Três itens mais curtos para fechar. A Nvidia publicou os detalhes do sistema de resfriamento líquido a 45°C desenvolvido para a geração Rubin de aceleradores de IA: sem ventiladores, 100% líquido, e em climas favoráveis com dry coolers externos é possível zerar o consumo de água — contra os 2,6 milhões de galões anuais por megawatt das instalações convencionais. Uma instalação de 50MW pode economizar mais de US$ 4 milhões por ano só em resfriamento. 326 pontos no HN. Na Config 2026 (24-25 de junho), a Figma anunciou o Motion — ferramenta de animação diretamente no canvas com timeline e keyframes —, Code Layers (converter qualquer camada em código interativo com um clique), plugins generativos criados por prompt, shaders com IA e as Weave Tools para processos generativos baseados em nós. É a maior expansão de funcionalidades que a Figma lançou de uma vez. E no Brasil: a Prefeitura do Rio lançou o "Rio 3.5 Open" afirmando ser um modelo proprietário de 397 bilhões de parâmetros que superaria referências do mercado. Pesquisadores examinaram os pesos em horas e encontraram colinearidade de 0,99 com uma mistura fixa de 60% do modelo chinês Nex N2 Pro e 40% do Qwen — sem qualquer treinamento adicional. A prefeitura admitiu o erro.

Sete itens. Boa quarta.

01
OpenAI Jalapeño: primeiro chip de inferência customizado da empresa, feito com Broadcom — desempenho por watt superior às alternativas atuais
TechCrunch / Hacker News#AI#Hardware#OpenAI#Infrastructure

A OpenAI revelou o Jalapeño, processador de inferência desenvolvido com a Broadcom especificamente para servir respostas de modelos treinados — não para pré-treinamento, que continua em hardware Nvidia. Benchmarks internos apontam desempenho por watt significativamente superior às alternativas estado-da-arte, com destaque para custo operacional em modelos de coding em tempo real. O projeto integra a estratégia de empilhar otimizações em todas as camadas, do chip ao deploy. É o primeiro produto concreto do deal Broadcom anunciado em outubro de 2025. 692 pontos no HN.

Ler na fonte →
02
Anthropic acusa Alibaba de maior ataque de distilação já registrado: 25 mil contas falsas, 28,8 milhões de trocas com o Claude em 45 dias
CNBC / Reuters#AI#Security#Claude#China

Em carta enviada ao Senado americano em 10 de junho e tornada pública ontem, a Anthropic documenta que parceiros afiliados à Alibaba criaram ~25 mil contas fraudulentas e realizaram 28,8 milhões de trocas com o Claude entre 22 de abril e 5 de junho — para distilação em escala das capacidades do modelo. Dois dias depois da carta, o Departamento de Comércio dos EUA restringiu o acesso global aos modelos Mythos e Fable por risco de uso militar na China, tornando-os temporariamente indisponíveis para todos os usuários no mundo. 394 pontos no HN.

Ler na fonte →
03
Qualcomm adquire Modular por US$ 3,9B: Chris Lattner (LLVM, Swift, TPU do Google) e o MAX Engine entram na stack de IA da empresa
Reuters / Bloomberg#AI#Industry#Acquisition#Compilers

A Qualcomm anunciou ontem a compra da Modular, startup fundada por Chris Lattner — criador do LLVM, da linguagem Swift e ex-lead de TPU no Google. A Modular construiu o Mojo (linguagem de IA) e o MAX Engine, runtime de inferência que roda modelos em qualquer hardware — CPU, GPU, NPU e chips customizados — sem reescrever código para cada arquitetura. O deal de US$ 3,9B (19,2M de ações + US$ 300M para funcionários) posiciona a Qualcomm para competir no mercado de data centers de IA com uma plataforma de software que torna o hardware da empresa viável para qualquer dev. 196 pontos no HN.

Ler na fonte →
04
Cordyceps: classe de vulnerabilidade em CI/CD expõe 300+ repos de Microsoft, Google, Apache e Cloudflare a ataques sem autenticação
Novee Security / The Hacker News#Security#CI/CD#GitHub#SupplyChain

A Novee Security publicou o Cordyceps — uma classe sistemática de falhas em workflows GitHub Actions que permite execução de código, roubo de credenciais e envenenamento de artefatos de build via PR malicioso, sem qualquer autenticação. O vetor: workflows com pull_request_target que não isolam código não confiável do contexto privilegiado com acesso a secrets. Scan de 30 mil repos encontrou mais de 300 completamente exploráveis, incluindo Azure Sentinel (Microsoft) e AI Agent Development Kit (Google). Uma conta gratuita do GitHub é suficiente para atacar.

Ler na fonte →
05
Nvidia: resfriamento líquido a 45°C para data centers de IA — sem ventiladores, potencial de zero consumo de água em instalações de 50MW
Nvidia Blog / Hacker News#Infrastructure#AI#Hardware#Energy

A Nvidia detalhou o sistema de resfriamento por líquido a 45°C desenvolvido para a geração Rubin de aceleradores: sem ventiladores, refrigeração 100% líquida via cold plates em todos os chips e componentes de rede. Em climas favoráveis com dry coolers externos, é possível zerar o consumo de água — contra os 2,6 milhões de galões anuais por megawatt de instalações convencionais. Uma planta de 50MW pode economizar mais de US$ 4 milhões por ano só em resfriamento e água, sem impacto no desempenho dos chips. 326 pontos no HN.

Ler na fonte →
06
Figma Config 2026: Motion com timeline e keyframes, Code Layers, shaders com IA e plugins generativos — maior lançamento da história da ferramenta
Figma Blog#Design#DevTools#AI#WebDev

Na Config 2026 (24-25 de junho), a Figma anunciou: Motion — ferramenta de animação de UI diretamente no canvas com timeline, keyframes, presets e geração por IA; Code Layers — converter qualquer camada de design em código interativo com um clique ou prompt; Plugins Generativos — criar ferramentas customizadas descrevendo comportamento e controles, sem setup local; Shaders com IA — descrever efeito visual e ter o código gerado; e Weave Tools — processos generativos baseados em nós para transformar e encadear assets. Rollout gradual iniciado em 24 de junho.

Ler na fonte →
07
Prefeitura do Rio lança 'Rio 3.5 Open' de 397B parâmetros — pesquisadores encontram colinearidade de 0,99 com mistura de modelos chineses em horas
Tecnoblog#AI#Brazil#LLM#Policy

A Prefeitura do Rio anunciou o Rio 3.5 Open como modelo proprietário de 397 bilhões de parâmetros que supostamente superaria referências do mercado. Pesquisadores examinaram os pesos camada por camada e encontraram colinearidade de 0,99 com uma combinação fixa de 60% do modelo chinês Nex N2 Pro e 40% do Qwen — um raw merge matemático sem qualquer treinamento adicional. A Nex-AGI, laboratório de IA de Xangai, foi a primeira a denunciar a cópia. O IplanRio confirmou o uso de fusão de pesos e atribuiu a publicação dos arquivos de teste a uma falha operacional. A prefeitura admitiu o erro.

Ler na fonte →

NEWSLETTER

Receba os próximos drops direto no e-mail

Sem frequência forçada. Só quando tiver algo que vale o clique.

Compartilhe este drop

Comentarios