Amazon Nova Act: A Revolução dos Agentes de IA da Amazon para Navegação Web e Automação de Tarefas
Descubra o Amazon Nova Act, o novo agente de IA da Amazon treinado para executar ações em navegadores web. Análise, benchmarks e o futuro da automação com IA.

Introdução ao Amazon Nova Act: O Novo Agente de IA da Amazon
A Amazon, através do seu laboratório de pesquisa Amazon AGI Labs, anunciou recentemente uma novidade promissora no campo da inteligência artificial: o Amazon Nova Act. Este modelo de IA foi projetado para funcionar como um agente capaz de executar ações complexas dentro de um navegador web, prometendo transformar a maneira como interagimos com a internet e automatizamos tarefas.
Apresentado como um avanço significativo, o Amazon Nova Act se posiciona como uma ferramenta poderosa para desenvolvedores e, futuramente, para o público em geral, com potencial para simplificar desde compras online até a gestão de tarefas cotidianas. O anúncio inicial, datado simbolicamente como 31 de março de 2025 no vídeo de apresentação, destaca a visão futurista da Amazon para seus agentes de IA.
O que é o Amazon Nova Act?
O Amazon Nova Act é um modelo de IA treinado especificamente para entender e executar instruções que resultam em ações concretas em páginas da web. Isso significa que ele pode, por exemplo, preencher formulários, navegar por menus, clicar em botões e realizar processos de checkout, tudo de forma autônoma após receber um comando.
Inicialmente, o acesso ao Amazon Nova Act e seus recursos, incluindo a obtenção de chaves de API, está disponível através do site nova.amazon.com/act, com foco primário em clientes localizados nos Estados Unidos. A plataforma mais ampla, Amazon Nova, engloba uma família de modelos, incluindo:
- Nova Micro: Modelo rápido, focado apenas em texto, para respostas de baixa latência.
- Nova Lite: Modelo multimodal que compreende texto, imagens e vídeos.
- Nova Pro: Modelo multimodal de alta capacidade, combinando qualidade e velocidade para uma vasta gama de tarefas.
- Nova Canvas: Especializado na geração de imagens.
- Nova Reel: Dedicado à geração de vídeos.
Esses modelos indicam a ambição da Amazon em cobrir diversas frentes da geração e interação com IA, e o Amazon Nova Act surge como o componente de ação e automação nesse ecossistema.
Amazon Nova Act SDK e o Potencial para Desenvolvedores
Com o lançamento do Amazon Nova Act, a Amazon também disponibilizou uma prévia de pesquisa do Amazon Nova Act SDK. Este kit de desenvolvimento de software permite que desenvolvedores comecem a experimentar e construir agentes que podem completar tarefas em um navegador web. Exemplos práticos incluem submeter um pedido de 'fora do escritório' em um sistema interno ou agendar um lembrete no calendário.
A ideia é que, utilizando o SDK, os desenvolvedores possam criar soluções personalizadas que interagem com a web de maneira inteligente, abrindo um leque de possibilidades para automação de processos de negócios e assistentes pessoais mais eficientes. O código e exemplos podem ser encontrados no repositório GitHub aws/nova-act.
Agentes de IA e Desempenho do Amazon Nova Act
O Amazon Nova Act é fundamentalmente sobre Agentes de IA – sistemas que não apenas processam informação, mas também agem com base nela em ambientes digitais. Esses agentes são uma evolução dos modelos de linguagem grandes (LLMs), que tradicionalmente respondem a perguntas ou geram texto, mas o Nova Act vai além, executando tarefas.
Benchmarks: Amazon Nova Act em Comparação
A Amazon AGI Labs divulgou benchmarks comparando o Amazon Nova Act com outros modelos de ponta, como o Claude 3.7 Sonnet da Anthropic e o OpenAI CUA (Computer User Agent, uma referência aos modelos da OpenAI como o ChatGPT, capazes de interagir com interfaces).
- ScreenSpot Web Text: Avalia a capacidade de seguir instruções em linguagem natural para interagir com elementos textuais na tela. O Amazon Nova Act obteve 0.939, superando o Claude 3.7 Sonnet (0.900) e o OpenAI CUA (0.883).
- ScreenSpot Web Icon: Mede a interação com elementos visuais (ícones) baseada em instruções. Novamente, o Amazon Nova Act liderou com 0.879, contra 0.854 do Claude e 0.806 do OpenAI CUA.
- GroundUI Web: Testa a compreensão e interação com vários elementos de UI na web. Neste benchmark, o Claude 3.7 Sonnet (0.825) e o OpenAI CUA (0.823) apresentaram desempenho ligeiramente superior ao Amazon Nova Act (0.805).
Esses resultados, embora preliminares e baseados em testes internos da Amazon, sugerem que o Nova Act é altamente competitivo, especialmente em tarefas que envolvem a interpretação de linguagem natural para interação direta com elementos da web.
Capacidades e Casos de Uso do Amazon Nova Act
O vídeo de demonstração ilustra o Amazon Nova Act realizando uma tarefa completa no site Sweetgreen: fazer um pedido de salada. O agente navega pelo menu, seleciona opções de entrega, escolhe itens, adiciona ao carrinho, lida com banners de cookies, prossegue para o checkout e até seleciona uma gorjeta, tudo de forma autônoma após receber instruções em linguagem natural.
Isso demonstra o potencial do Amazon Nova Act para:
- Automatizar compras online e pedidos de comida.
- Gerenciar calendários e e-mails (ex: configurar respostas de 'fora do escritório').
- Preencher formulários complexos.
- Interagir com sistemas internos de empresas.
A Amazon sugere que o objetivo é que esses agentes realizem tarefas complexas de múltiplos passos, como organizar um casamento ou lidar com tarefas complexas de TI, para aumentar a produtividade dos negócios. A capacidade de programar esses agentes, como demonstrado no repositório GitHub com um script para pedir uma cafeteira na Amazon, indica um futuro onde a automação de tarefas via web será muito mais acessível e personalizável.
O Futuro com Agentes de IA como o Amazon Nova Act
O lançamento do Amazon Nova Act é um passo importante na direção de um futuro onde assistentes de IA não são apenas informativos, mas proativos e executores. A capacidade de interagir com a web de forma tão granular e autônoma tem implicações vastas:
- Para Consumidores: Simplificação radical de tarefas online, desde compras e reservas até a gestão de informações pessoais.
- Para Empresas: Automação de processos de back-office, atendimento ao cliente, e otimização de fluxos de trabalho que dependem de interação com plataformas web.
- Para Desenvolvedores: Uma nova fronteira para a criação de aplicações e serviços que alavancam a web de maneiras inovadoras.
A Amazon, com seu ecossistema robusto que inclui Amazon Bedrock para acesso a modelos de fundação, está claramente investindo para ser uma líder neste espaço. A integração do Nova Act com outros serviços da Amazon e a sua eventual disponibilização global poderão acelerar significativamente a adoção de agentes de IA.
Conclusão sobre o Amazon Nova Act
O Amazon Nova Act representa um desenvolvimento empolgante no universo da inteligência artificial. Ao focar na capacidade de 'agir' na web, a Amazon está pavimentando o caminho para uma nova geração de assistentes virtuais e ferramentas de automação. Embora ainda em estágio inicial e com acesso limitado, os benchmarks promissores e as demonstrações de capacidade indicam um potencial transformador. À medida que o SDK se desenvolve e o acesso se expande, podemos esperar uma onda de inovação impulsionada por agentes de IA como o Nova Act, tornando a interação digital mais inteligente, eficiente e, quem sabe, um pouco mágica. A comunidade de tecnologia certamente estará de olho nos próximos passos da Amazon nesta arena competitiva e de rápida evolução.