Anthropic lança Claude Opus 4.8 com melhorias em agentes e honestidade

A Anthropic anunciou em 28 de maio de 2026 o Claude Opus 4.8, nova versão do seu modelo mais avançado. O lançamento chegou 41 dias depois do Opus 4.7, ritmo que a empresa atribui à resposta ao mercado competitivo e às críticas sobre o desempenho da versão anterior.

O modelo traz melhorias em tarefas agênticas, raciocínio e honestidade. Junto com ele, a Anthropic lançou duas novas funcionalidades: os dynamic workflows (fluxos de trabalho dinâmicos) no Claude Code, o agente de codificação da empresa. Na prática, o pacote inclui também o effort control (controle de esforço), disponível no claude.ai.

O que mudou no Opus 4.8

Nos benchmarks divulgados pela Anthropic, o Opus 4.8 avançou em frentes que interessam a quem usa o modelo para desenvolvimento e automação:

Score de coding agêntico subiu de 64,3% para 69,2% no SWE-Bench Pro (benchmark de resolução de issues reais de software), superando o GPT-5.5 nesse quesito.
Raciocínio multidisciplinar com ferramentas (Humanity's Last Exam) foi de 54,7% para 57,9%.
O modelo é cerca de quatro vezes menos propenso a deixar falhas no próprio código sem sinalizar, segundo os testes da Anthropic.
O fast mode agora opera a 2,5x a velocidade e ficou três vezes mais barato em comparação com modelos anteriores.

O preço base não mudou: US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de saída. O fast mode cobra US$ 10 e US$ 50, respectivamente.

Junto com o modelo, a Anthropic lançou os dynamic workflows em versão prévia de pesquisa no Claude Code. O recurso faz o modelo escrever scripts de orquestração que disparam dezenas a centenas de subagentes paralelos em uma sessão, verificando os resultados antes de devolver ao usuário.

Na prática, o dev Jarred Sumner usou o recurso para portar o Bun do Zig para Rust. Segundo a Anthropic, o resultado foram 750.000 linhas de Rust, com 99,8% dos testes passando em onze dias. O recurso está disponível nos planos Enterprise, Team e Max.

O effort control, disponível no claude.ai e no Cowork (agente de desktop da Anthropic para trabalho com arquivos e aplicativos locais), adiciona um seletor ao lado do modelo. Com ele, a pessoa usuária escolhe quanto esforço o Claude aplica à resposta, entre três níveis além do padrão.

São eles: extra, max e ultracode (exclusivo do Claude Code), que combina raciocínio em nível máximo com orquestração automática de workflows.

Por que isso importa para quem trabalha com tecnologia

O Opus 4.8 chega num cenário em que OpenAI, Google e outras empresas ampliaram suas ofertas de modelos e ferramentas para devs em poucas semanas. Para quem usa o Claude Code no dia a dia, algumas mudanças são concretas:

Honestidade operacional: o modelo passou a sinalizar ativamente incertezas e problemas nas próprias saídas, reduzindo o retrabalho causado por código com falhas silenciosas. A Bridgewater Associates, cliente da Anthropic, reportou à empresa que o Opus 4.8 identifica proativamente problemas nos resultados de análises, algo que outros modelos costumavam ignorar.
Escala de automação: os dynamic workflows abrem a possibilidade de delegar migrações inteiras de codebase ao Claude Code, não apenas arquivos avulsos. Isso muda o que é viável fazer com um único agente em uma sessão.
Controle de custo por tarefa: o effort control dá granularidade real sobre o consumo de tokens por resposta, algo que faltava para quem gerencia orçamento de API em produção.

Um ponto de atenção: os dynamic workflows consomem bem mais tokens do que uma sessão padrão do Claude Code. A Anthropic aumentou os limites de taxa para acomodar o uso, mas vale monitorar o consumo antes de ligar o ultracode em projetos grandes sem estimativa prévia.

Quer aprender a usar modelos como o Opus 4.8 em fluxos reais?

Se você quer trabalhar com agentes autônomos, orquestração de subagentes e projetos de código em escala, a Alura tem trilhas completas de IA aplicada. Lá, você encontra uma formação dedicada à criação de agentes de IA com LangChain e LangGraph.

Tem também a carreira de Engenharia de IA para quem quer um percurso completo, do zero até projetos em produção.

Trilhas por carreira

IA

Dados

Cyber

DevOps & Cloud

UX & UI

Mobile & Front-End

Back-End

Negócios

Cursos por área de atuação

Data

IA

Cyber

Tech & Business

Dev

Praticar

Imersões

7 Days of Code

Aprofundar

Artigos

Podcasts

Tech Guide

Vídeos Extras

Nosso Impacto

Depoimentos de Alunos

Cases de Sucesso Exclusivo para estudantes Alura

Anthropic lança Claude Opus 4.8 com melhorias em agentes e honestidade

O que mudou no Opus 4.8

Por que isso importa para quem trabalha com tecnologia

Quer aprender a usar modelos como o Opus 4.8 em fluxos reais?

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Imersões

7 Days of Code

Artigos

Podcasts

Tech Guide

Vídeos Extras

Depoimentos de Alunos

Cases de Sucesso Exclusivo para estudantes Alura

Anthropic lança Claude Opus 4.8 com melhorias em agentes e honestidade

O que mudou no Opus 4.8

Por que isso importa para quem trabalha com tecnologia

Quer aprender a usar modelos como o Opus 4.8 em fluxos reais?

Leia também

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP