Uma equipe de três pessoas na OpenAI construiu um produto beta em produção com aproximadamente 1 milhão de linhas de código e 1.500 pull requests em cinco meses — sem escrever uma linha manualmente. Tudo foi gerado pelo Codex. O throughput médio foi de 3,5 PRs por engenheiro por dia. O resultado prático é uma nova disciplina que eles chamam de 'harness engineering': projetar o ambiente (regras de contexto, estado entre execuções, scaffolding de validação) que torna a geração de código por agentes confiável o suficiente para produção. A documentação de processo está no post; a lição é que o trabalho humano migrou do teclado para o desenho do ambiente.
NEWS DROP
07 de junho de 2026
7 itens
Domingo, 7 de junho.
O artigo do OpenAI sobre 'harness engineering' está no topo do Hacker News com quase 200 pontos — e merece atenção de qualquer engenheiro que usa agentes de IA. A empresa documentou um experimento interno de cinco meses: uma equipe de três pessoas começou com um repositório vazio e escreveu zero linhas de código manualmente. Tudo — 1 milhão de linhas de produção, 1.500 pull requests — foi gerado pelo Codex. O throughput médio foi de 3,5 PRs por engenheiro por dia, subindo conforme a equipe cresceu para sete. A descoberta central: o trabalho do humano migrou de escrever código para projetar o ambiente que torna a geração confiável — o que eles chamam de 'harness'. Isso inclui regras de contexto, gerenciamento de estado entre execuções longas, estrutura de prompts que minimiza deriva e scaffolding de validação. Não é post de hype; é documentação de processo com números reais.
No mesmo espírito, uma designer da Jane Street publicou ontem como abandonou o Figma em favor do Claude Code para a maior parte do seu trabalho. O ponto central é um desequilíbrio histórico: engenheiros sempre puderam construir provas de conceito; designers precisavam convencer outros a construírem por eles. Com Claude Code, o ciclo 'spec → mockup → proposta → implementação' colapsa em: descreve o problema, constrói o protótipo funcional, itera, sobe para produção. A consequência prática: revisores recebem uma feature completa, não um wireframe — o que exige comunicação explícita de que o resultado ainda é uma proposta, não uma decisão tomada.
O ntsc-rs chegou ao topo do HN hoje com 338 pontos — o projeto open source em Rust que emula com precisão física os artefatos de TV analógica NTSC e VHS. A diferença em relação a outros efeitos de vídeo vintage é o método: modelagem dos processos analógicos reais de transmissão e codificação, não filtros visuais de aproximação. Resultado: roda em tempo real em resoluções muito acima do que o NTSC original operava, e funciona como plugin nativo em After Effects, Premiere, DaVinci Resolve e qualquer host OpenFX. É o tipo de projeto que demonstra o que Rust viabiliza fora do domínio de sistemas.
Dois itens técnicos complementares. O LWN publicou análise da proposta de substituição do padrão fork()/exec() no kernel Linux — mecanismo com 55 anos de uso que copia todo o estado do processo pai para jogá-lo fora imediatamente depois com o exec(). A proposta atual favorece processos vazios configurados via pidfd, análogo ao fsconfig() de filesystems, reduzindo overhead significativo em criação intensiva de processos como containerização. E o Google lançou na quinta o Colab CLI — ferramenta open source (Apache 2.0) que provisiona sessões Colab com GPU T4, L4, A100 ou H100 direto do terminal: `colab new --gpu A100`, `colab exec script.py`, `colab stop`. Zero friction para quem precisa de acelerador remoto sem abrir o browser.
O Akita On Rails publicou esta semana sua posição sobre a controvérsia de contribuições de IA em projetos open source — e o argumento é prático: proibir não resolve. A solução que Akita usa nos próprios projetos é LLM em code review de PRs antes do merge, com supervisão humana no loop. O debate segue em maiúsculas na comunidade; a posição é que o ecossistema vai precisar adaptar o processo de manutenção, não bloquear o fluxo.
Fechando no Tecnoblog: a PEVAC-PS, vacina desenvolvida com apoio da plataforma de IA DIOSynVax, passou pelo primeiro teste em humanos no Reino Unido. A plataforma usou IA para identificar regiões conservadas do coronavírus entre variantes — o objetivo é proteger contra mutações futuras que ainda não existem, não apenas as cepas conhecidas. Resultados preliminares mostraram segurança e ativação de resposta imunológica. É o primeiro resultado público de eficácia clínica de uma vacina projetada por IA de ponta a ponta.
Sete itens. Bom domingo.
Edwin Morris, designer na Jane Street, descreve como trocou a cadeia tradicional 'spec → Figma → proposta → implementação' por um ciclo direto com Claude Code: descreve o problema, gera o protótipo funcional, itera e sobe para produção. O argumento central é histórico: engenheiros sempre puderam construir provas de conceito; designers precisavam convencer outros a construírem por eles. Com Claude Code isso muda — mas a consequência é que revisores recebem features completas, o que exige comunicação explícita de que o artefato ainda é uma proposta colaborativa, não uma decisão tomada.
O ntsc-rs é um efeito de vídeo open source escrito em Rust que emula os artefatos de transmissão NTSC e codificação VHS simulando os processos analógicos reais — não filtros visuais de aproximação. A diferença de abordagem produz resultados mais autênticos e roda em tempo real com multithreading e aceleração SIMD em resoluções muito acima das do NTSC original. Funciona como plugin nativo em After Effects, Premiere Pro, DaVinci Resolve e qualquer host OpenFX compatível. 338 pontos no HN hoje.
O LWN analisa a proposta de spawn templates de Li Chen e a direção que a comunidade do kernel está preferindo: ao invés de copiar todo o estado do processo pai (fork) para descartá-lo logo depois (exec), criar processos vazios configurados incrementalmente via chamadas pidfd_config() — análogo ao fsconfig() para filesystems. A abordagem elimina o custo de cópia de estado que o fork acumula em cenários de criação intensiva de processos, como containerização e servidores de alta concorrência. 297 pontos no HN.
Lançado em 5 de junho, o Colab CLI é uma ferramenta open source que conecta o terminal local a runtimes remotos do Google Colab — sem precisar abrir o browser. Os comandos principais: `colab new --gpu H100` provisiona a sessão, `colab exec script.py` roda o código no runtime remoto, `colab stop` encerra e libera a VM. Suporta GPUs T4, L4, A100 e H100, além de TPUs v5e1 e v6e1. Os artefatos (modelos, datasets, notebooks .ipynb com replay) são recuperáveis localmente. Instalação via `uv tool install` a partir do repositório no GitHub.
Fabio Akita publica sua posição sobre a controvérsia crescente de pull requests gerados por IA em projetos open source: banir é ineficaz porque é indetectável em escala. A alternativa prática que ele usa nos próprios projetos é LLM no processo de code review de PRs antes do merge, mantendo supervisão humana no loop. O argumento central é que a comunidade de manutenção precisará adaptar seu processo de triagem e revisão — não bloquear o fluxo de contribuições — para sobreviver ao volume que os agentes vão gerar.
A PEVAC-PS, desenvolvida com apoio da plataforma de IA DIOSynVax, completou o primeiro estágio de testes clínicos humanos no Reino Unido com resultados de segurança e ativação de resposta imunológica. A diferença de abordagem: a IA identificou regiões conservadas do coronavírus entre diferentes variantes para projetar proteção contra mutações futuras ainda desconhecidas — não apenas cepas existentes. É o primeiro resultado público de eficácia clínica de uma vacina projetada end-to-end com IA.
NEWSLETTER
Receba os próximos drops direto no e-mail
Sem frequência forçada. Só quando tiver algo que vale o clique.