A Anthropic, uma das empresas líderes em pesquisa e desenvolvimento de inteligência artificial, anunciou recentemente uma atualização que promete redefinir a interação homem-máquina: a capacidade de seus modelos de IA, incluindo os novos Claude 3.5 Sonnet e Claude 3.5 Haiku, de controlar computadores para executar tarefas complexas. Essa funcionalidade, denominada "uso de computador", representa um salto significativo em direção a verdadeiros agentes de IA de baixo nível, capazes de operar em nosso nome de forma autônoma.
No vídeo demonstrativo apresentado por Matt Wolfe, vemos um exemplo prático impressionante: a IA é instruída a encontrar os cinco vídeos mais populares de seu canal no YouTube, extrair as datas e títulos, e organizar essas informações em uma planilha. Tudo isso é realizado pela IA, que abre o navegador, navega até o YouTube, realiza a pesquisa, clica nos vídeos, abre uma planilha e insere os dados, demonstrando um nível de automação que até pouco tempo parecia distante.
A nova capacidade dos modelos Claude de interagir com o computador não é uma simples integração com aplicativos específicos. Trata-se de uma ferramenta que permite à IA visualizar a tela do computador, entender o contexto e tomar ações como mover o mouse, clicar e digitar, simulando o uso humano de um sistema operacional e seus aplicativos.
No exemplo prático, a IA executa uma série de etapas:
Este processo, que envolveria vários minutos de trabalho manual, é completado pela IA de forma autônoma, apenas com um comando inicial.
Para utilizar essa funcionalidade avançada, não basta acessar a interface web do Claude. É necessário um processo de configuração que envolve alguns passos técnicos, mas que abre um leque de possibilidades para desenvolvedores e entusiastas.
Instalação do Docker: O primeiro passo é instalar o Docker, uma plataforma que permite criar, implantar e executar aplicativos em contêineres. O Docker Desktop pode ser baixado diretamente do site oficial para Windows, Mac ou Linux.
Obtenção da Chave de API da Anthropic: É preciso ter uma chave de API da Anthropic. Isso é feito acessando o console da Anthropic (console.anthropic.com), fazendo login (por exemplo, com uma conta Google) e gerando uma nova chave de API na seção apropriada. É importante nomear a chave de forma identificável e salvá-la em um local seguro, pois ela só será exibida uma vez.
Execução do Código no Terminal do Docker: Com o Docker instalado e a chave de API em mãos, o próximo passo é executar um comando específico no terminal do Docker. Este comando, fornecido pela Anthropic (e disponível na descrição do vídeo de Matt Wolfe), inclui a chave de API e instrui o Docker a baixar e executar a imagem do agente de IA. O código é algo como: docker run -e ANTHROPIC_API_KEY=SUA_CHAVE_API_AQUI -v $HOME/.anthropic:/home/computeruse/.anthropic -p 5900:5900 -p 8501:8501 -p 6080:6080 -p 8080:8080 -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest
. É crucial substituir "SUA_CHAVE_API_AQUI" pela chave de API real.
Acesso à Interface do Agente: Após a execução do comando, o terminal indicará que o ambiente está pronto e fornecerá um endereço local (normalmente http://localhost:8080
) para ser aberto no navegador. Esta página web é a interface de controle do agente de IA, onde os comandos são inseridos e as ações do agente na área de trabalho virtual são visualizadas.
A demonstração é empolgante e mostra um potencial imenso para automação de tarefas repetitivas e complexas. A IA da Anthropic consegue não apenas seguir instruções, mas também interpretar a tela, tomar decisões contextuais (como fechar um pop-up de "Dica do Dia" no LibreOffice) e interagir com diferentes softwares.
Apesar do avanço, a tecnologia ainda está em seus estágios iniciais. No vídeo, o agente encontra algumas dificuldades:
Mesmo com essas limitações, a direção que a Anthropic está tomando é clara: criar agentes de IA cada vez mais capazes e autônomos. A capacidade de interagir com um ambiente de desktop virtual abre portas para a automação de fluxos de trabalho, assistência virtual personalizada e novas formas de interação com a tecnologia.
O lançamento da funcionalidade de "uso de computador" pela Anthropic, com seus modelos Claude 3.5 Sonnet e Claude 3.5 Haiku, é um marco importante. Estamos testemunhando a transição da IA de ser uma ferramenta de processamento de linguagem ou geração de conteúdo para se tornar um verdadeiro assistente digital capaz de realizar ações no mundo digital.
A perspectiva é que, com o aprimoramento contínuo desses modelos e a superação das limitações atuais, os agentes de IA poderão assumir uma gama cada vez maior de tarefas, liberando os humanos para se concentrarem em atividades mais criativas e estratégicas. A segurança é uma preocupação evidente, e a Anthropic destaca que o agente opera em um ambiente virtualizado, mas a evolução para interações com o sistema real do usuário será um passo crucial e que exigirá robustos mecanismos de controle e permissão.
Este é apenas o começo de uma nova era da inteligência artificial, onde a capacidade de "fazer" se junta à capacidade de "entender" e "gerar". O trabalho da Anthropic é, sem dúvida, um dos que mais impulsionam essa fronteira.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.