A Anthropic acaba de lançar sua mais nova geração de modelos de Inteligência Artificial, o Claude 4, disponível em duas versões principais: Claude Sonnet 4 e Claude Opus 4. Este lançamento, conforme detalhado em um vídeo recente por Matt Berman, não é apenas uma atualização incremental; ele sinaliza uma mudança estratégica significativa para a empresa. A Anthropic parece estar se afastando da competição direta no saturado mercado de chatbots de uso geral para se consolidar como uma provedora de infraestrutura de ponta para agentes de IA, com um foco notável em revolucionar a codificação e tarefas complexas.
O Claude 4 chega com a promessa de estabelecer novos padrões para codificação, raciocínio avançado e agentes de IA. A Anthropic destaca que o Claude Opus 4 é, possivelmente, o melhor modelo de codificação do mundo, evidenciando a nova direção da empresa. Uma de suas características mais impressionantes é a capacidade de lidar com tarefas de 'longo horizonte', ou seja, processos que podem se estender por minutos ou até horas sem perder o contexto ou a linha de raciocínio, um avanço crucial para a execução de trabalhos complexos no mundo real.
Tanto o Sonnet 4 quanto o Opus 4 são modelos híbridos, oferecendo dois modos de operação: respostas quase instantâneas sem 'pensamento' aprofundado, ou um modo de 'pensamento estendido' para raciocínio mais complexo. Durante este pensamento estendido, os modelos podem utilizar ferramentas, como a pesquisa na web, que já se tornou um recurso esperado em modelos de ponta. O vídeo de Matt Berman demonstra a interface do Perplexity, onde o usuário pode alternar entre Claude Sonnet 4 e Opus 4, além de ativar ou desativar o pensamento estendido e acessar diversas ferramentas de busca integradas, como Google Drive, Gmail e Calendar.
A habilidade do Claude 4 em manter a coerência e o desempenho em tarefas que se estendem por longos períodos é um dos seus grandes trunfos. Isso é particularmente relevante para fluxos de trabalho de agentes e tarefas de codificação complexas, onde a persistência da memória e a capacidade de seguir instruções precisas ao longo do tempo são essenciais. A Anthropic também enfatizou a melhoria na capacidade de seus modelos de lidar com sua própria memória, extraindo e salvando fatos chave para manter a continuidade.
O Claude Opus 4 supera drasticamente os modelos anteriores em capacidades de memória. Comportamentos como o uso de 'atalhos' ou 'brechas' para completar tarefas foram significativamente reduzidos. A Anthropic informa que ambos os modelos são 65% menos propensos a engajar nesse tipo de comportamento em comparação com o Sonnet 3.7 em tarefas agênticas. Este aprimoramento, juntamente com o foco em segurança, visa tornar os modelos mais confiáveis e precisos.
A estratégia da Anthropic com o Claude 4 é clara: em vez de tentar vencer a corrida dos chatbots de consumo, a empresa está se posicionando como uma fornecedora de infraestrutura para o desenvolvimento de agentes de IA sofisticados. Essa mudança foi corroborada por Jared Kaplan, Chief Science Officer da Anthropic, que, de acordo com o Techmeme, afirmou que a empresa cessou investimentos em chatbots no final de 2024 para focar na capacidade do Claude de executar tarefas complexas. Este movimento estratégico visa capacitar desenvolvedores com ferramentas robustas para criar a próxima geração de aplicações de IA.
O Claude Code, agora em disponibilidade geral e integrado com os modelos Claude 4, é a personificação dessa nova estratégia. Ele foi projetado para se integrar profundamente ao fluxo de trabalho dos desenvolvedores, oferecendo suporte a tarefas em segundo plano via GitHub Actions e integrações nativas com ambientes de desenvolvimento populares como VS Code e JetBrains. Suas edições propostas aparecem inline nos arquivos, otimizando a revisão e o rastreamento dentro da interface do editor.
A adoção do Claude 4 por grandes players do mercado reforça sua proposta de valor. Thomas Dohmke, CEO do GitHub, anunciou que o Claude Sonnet 4 agora está disponível em todos os planos do GitHub Copilot, servindo como o novo modelo base para o renomado agente de codificação. Além disso, o vídeo de Matt Berman destaca a integração com a Box AI, onde o Claude 4 será empregado para extrair metadados de documentos, automatizar fluxos de trabalho e realizar análises profundas de dados corporativos. A facilidade de uso do Claude Code com os SDKs da Box, bastando fornecer links para a documentação do desenvolvedor, exemplifica a flexibilidade e o poder da plataforma.
A Anthropic, criadora do Model Context Protocol (MCP), integrou profundamente este framework em sua API. Isso permite que o Claude 4 se conecte a qualquer servidor MCP remoto, ampliando drasticamente suas capacidades. A API do Claude 4 também introduz quatro novas funcionalidades: uma ferramenta de execução de código (inicialmente Python), o conector MCP, uma API de Arquivos para acesso e processamento de documentos, e a capacidade de armazenar prompts em cache por até uma hora, otimizando custos e latência.
Os benchmarks são sempre um ponto de grande interesse em lançamentos de modelos de IA. Para o Claude 4, os resultados são promissores, mas com nuances.
Em testes como o SWE-bench verificado (focado em engenharia de software), tanto o Opus 4 quanto o Sonnet 4 demonstraram melhorias significativas em relação às gerações anteriores e a modelos concorrentes. O Sonnet 4, por exemplo, atingiu 80.2% com 'parallel test-time compute' (onde múltiplas soluções são amostradas e a melhor é escolhida). O Opus 4 também se destacou em 'agentic terminal coding' com 50.0%. Contudo, como apontado por John Schoenieth no X (antigo Twitter) e visualizado no vídeo de Matt Berman, em algumas métricas específicas, o desempenho do Claude 4 foi inferior ou apenas comparável ao do Claude 3.7. Isso indica que, embora haja um avanço geral, a performance pode variar dependendo da tarefa e da metodologia de avaliação.
Em termos de custo, o Claude Opus 4 é precificado em $15 por milhão de tokens de entrada e $75 por milhão de tokens de saída. Já o Claude Sonnet 4, posicionado como uma opção mais acessível e eficiente para uso diário, custa $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída. Ambos os modelos estão disponíveis via API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud.
O lançamento do Claude 4 é mais do que a introdução de novos modelos; é uma declaração da Anthropic sobre seu futuro e sua visão para a IA. Ao focar em fornecer uma infraestrutura robusta e especializada para agentes de IA, especialmente na área de codificação, a empresa se posiciona como uma facilitadora chave para desenvolvedores e empresas que buscam construir aplicações de IA mais inteligentes, autônomas e capazes. A ênfase em tarefas de longo horizonte, memória aprimorada e integrações profundas com o ecossistema de desenvolvimento sugere um futuro onde os agentes de IA desempenharão papéis cada vez mais complexos e integrados em nossos fluxos de trabalho. Resta observar como esta evolução da Anthropic e dos modelos Claude influenciará a trajetória da inteligência artificial nos próximos anos.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.