Anthropic lança Claude Opus 4.8 com melhorias em agentes e honestidade

A Anthropic anunciou em 28 de maio de 2026 o Claude Opus 4.8, nova versão do seu modelo mais avançado. O lançamento chegou 41 dias depois do Opus 4.7, ritmo que a empresa atribui à resposta ao mercado competitivo e às críticas sobre o desempenho da versão anterior.
O modelo traz melhorias em tarefas agênticas, raciocínio e honestidade. Junto com ele, a Anthropic lançou duas novas funcionalidades: os dynamic workflows (fluxos de trabalho dinâmicos) no Claude Code, o agente de codificação da empresa. Na prática, o pacote inclui também o effort control (controle de esforço), disponível no claude.ai.
O que mudou no Opus 4.8
Nos benchmarks divulgados pela Anthropic, o Opus 4.8 avançou em frentes que interessam a quem usa o modelo para desenvolvimento e automação:
- Score de coding agêntico subiu de 64,3% para 69,2% no SWE-Bench Pro (benchmark de resolução de issues reais de software), superando o GPT-5.5 nesse quesito.
- Raciocínio multidisciplinar com ferramentas (Humanity's Last Exam) foi de 54,7% para 57,9%.
- O modelo é cerca de quatro vezes menos propenso a deixar falhas no próprio código sem sinalizar, segundo os testes da Anthropic.
- O fast mode agora opera a 2,5x a velocidade e ficou três vezes mais barato em comparação com modelos anteriores.
O preço base não mudou: US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de saída. O fast mode cobra US$ 10 e US$ 50, respectivamente.
Junto com o modelo, a Anthropic lançou os dynamic workflows em versão prévia de pesquisa no Claude Code. O recurso faz o modelo escrever scripts de orquestração que disparam dezenas a centenas de subagentes paralelos em uma sessão, verificando os resultados antes de devolver ao usuário.
Na prática, o dev Jarred Sumner usou o recurso para portar o Bun do Zig para Rust. Segundo a Anthropic, o resultado foram 750.000 linhas de Rust, com 99,8% dos testes passando em onze dias. O recurso está disponível nos planos Enterprise, Team e Max.
O effort control, disponível no claude.ai e no Cowork (agente de desktop da Anthropic para trabalho com arquivos e aplicativos locais), adiciona um seletor ao lado do modelo. Com ele, a pessoa usuária escolhe quanto esforço o Claude aplica à resposta, entre três níveis além do padrão.
São eles: extra, max e ultracode (exclusivo do Claude Code), que combina raciocínio em nível máximo com orquestração automática de workflows.
Por que isso importa para quem trabalha com tecnologia
O Opus 4.8 chega num cenário em que OpenAI, Google e outras empresas ampliaram suas ofertas de modelos e ferramentas para devs em poucas semanas. Para quem usa o Claude Code no dia a dia, algumas mudanças são concretas:
- Honestidade operacional: o modelo passou a sinalizar ativamente incertezas e problemas nas próprias saídas, reduzindo o retrabalho causado por código com falhas silenciosas. A Bridgewater Associates, cliente da Anthropic, reportou à empresa que o Opus 4.8 identifica proativamente problemas nos resultados de análises, algo que outros modelos costumavam ignorar.
- Escala de automação: os dynamic workflows abrem a possibilidade de delegar migrações inteiras de codebase ao Claude Code, não apenas arquivos avulsos. Isso muda o que é viável fazer com um único agente em uma sessão.
- Controle de custo por tarefa: o effort control dá granularidade real sobre o consumo de tokens por resposta, algo que faltava para quem gerencia orçamento de API em produção.
Um ponto de atenção: os dynamic workflows consomem bem mais tokens do que uma sessão padrão do Claude Code. A Anthropic aumentou os limites de taxa para acomodar o uso, mas vale monitorar o consumo antes de ligar o ultracode em projetos grandes sem estimativa prévia.
Quer aprender a usar modelos como o Opus 4.8 em fluxos reais?
Se você quer trabalhar com agentes autônomos, orquestração de subagentes e projetos de código em escala, a Alura tem trilhas completas de IA aplicada. Lá, você encontra uma formação dedicada à criação de agentes de IA com LangChain e LangGraph.
Tem também a carreira de Engenharia de IA para quem quer um percurso completo, do zero até projetos em produção.









