surf.new: Revolucione a Automação Web com Agentes de IA Open Source

O Que é o surf.new? Uma Nova Fronteira para Agentes de IA na Web

A automação de tarefas na web atingiu um novo patamar com o surgimento do surf.new, uma plataforma inovadora projetada para implantar agentes de Inteligência Artificial (IA) diretamente no ambiente online. Apresentado como um "playground para testar diferentes agentes web", o surf.new capacita esses agentes a navegar e interagir com páginas da web de maneira similar à humana. O mais impressionante é que esta ferramenta é 100% gratuita e de código aberto, democratizando o acesso a tecnologias avançadas de automação.

Com o surf.new, é possível automatizar uma vasta gama de atividades, desde a coleta de conteúdo (web scraping) e a compilação de listas de informações até tarefas mais complexas, como contornar sistemas de CAPTCHA. Isso abre um leque de possibilidades para desenvolvedores, pesquisadores e entusiastas da IA que buscam otimizar processos e extrair dados da web de forma eficiente.

Tecnologias Poderosas por Trás do surf.new

O desempenho e a versatilidade do surf.new são impulsionados por uma combinação de tecnologias de ponta no campo da Inteligência Artificial e desenvolvimento web.

steel.dev: O Navegador Inteligente

No coração do surf.new está o steel.dev, que fornece a infraestrutura de navegador de IA. O steel.dev é um browser open source especializado para agentes de IA, permitindo que eles controlem frotas de navegadores na nuvem e interajam com elementos da web de forma precisa.

Langchain: Orquestração e Processamento de IA

Para a orquestração e processamento das tarefas de IA, o surf.new utiliza o Langchain. Este framework robusto facilita a construção de aplicações alimentadas por Modelos de Linguagem de Grande Escala (LLMs), gerenciando o fluxo de informações e as interações entre os diferentes componentes da IA.

Suporte Flexível a Modelos de Linguagem (LLMs) com surf.new

Uma das grandes vantagens do surf.new é sua flexibilidade no uso de LLMs. A plataforma permite que os usuários utilizem qualquer modelo de linguagem grande, seja localmente através do Ollama – que possibilita rodar LLMs como Llama 2 em seu próprio hardware – ou por meio de provedores de API renomados como OpenAI, DeepSeek e Anthropic. Essa adaptabilidade garante que os usuários possam escolher o LLM que melhor se adequa às suas necessidades e recursos.

surf.new em Ação: Casos de Uso e Demonstrações

O vídeo de apresentação do surf.new demonstra de forma prática suas capacidades. Em um dos exemplos, um agente de IA é instruído a encontrar o voo mais barato de São Francisco para Tóquio para a semana seguinte. O agente navega pelo Google Flights, insere os parâmetros de busca, analisa os resultados e identifica a melhor opção, incluindo a companhia aérea e o preço.

Outra demonstração impressionante envolve a extração de dados de um diretório de parceiros da Databricks. O agente do surf.new navega pelo site, filtra empresas na América, percorre múltiplas páginas e, por fim, preenche um documento do Google Docs com a lista de empresas encontradas. Tarefas como resumir as cinco principais notícias do Hacker News ou listar os cinco vídeos mais populares de um canal do YouTube e colá-los em um bloco de notas online também são executadas com agilidade, mostrando a capacidade do surf.new de lidar com informações e formatos variados.

BrowserUse vs. Claude Computer Use: Qual Agente Escolher no surf.new?

O surf.new oferece a opção de alternar entre dois agentes de navegador principais: o BrowserUse e uma versão web do Claude Computer Use. Conforme destacado na apresentação, o BrowserUse é altamente recomendado. A razão para isso é seu desempenho superior, evidenciado pelos altos scores em benchmarks. No teste de Precisão de Agentes Web (Web Agent Accuracy), o BrowserUse alcançou uma taxa de sucesso de 89%, superando o Operator da OpenAI, que registrou 87%. A versão do Claude Computer Use, por outro lado, ainda é considerada experimental dentro da plataforma surf.new.

Como Começar com o surf.new: Instalação e Configuração Local

Para aqueles que desejam explorar o surf.new localmente, o processo de instalação é direto, embora exija alguns pré-requisitos:

  • Git: Essencial para clonar o repositório.
  • Node.js: Versão 18 ou superior, juntamente com o npm.
  • Python: Versão 3.11 ou superior.
  • Chave de API do steel.dev: Necessária para a instância local. É possível se registrar gratuitamente no site do steel.dev.

Com os pré-requisitos atendidos, os passos são:

  1. Clonar o repositório do surf.new do GitHub: git clone https://github.com/steel-dev/surf.new
  2. Navegar para o diretório clonado: cd surf.new
  3. Instalar as dependências de frontend: npm install
  4. Criar um ambiente virtual Python e ativá-lo. Em seguida, instalar as dependências de backend: pip install -r requirements.txt
  5. Configurar as variáveis de ambiente. Isso envolve copiar o arquivo .env.example para .env.local e adicionar sua chave de API do steel.dev e outras variáveis necessárias, como as configurações para usar Ollama ou outras APIs de LLM.
  6. Rodar o servidor de desenvolvimento: npm run dev

Após esses passos, o surf.new estará acessível localmente, geralmente em http://localhost:3001.

Mantenha-se Atualizado com o Mundo da IA

Para complementar o uso de ferramentas como o surf.new, é crucial manter-se informado sobre os avanços na área de IA. O vídeo menciona o lançamento de uma nova newsletter pelo canal "World of AI", que promete atualizações semanais sobre os últimos desenvolvimentos, comparações de LLMs, notícias de IA e rankings de agentes de IA, um recurso valioso para quem deseja estar na vanguarda da tecnologia.

Conclusão: O Futuro da Automação Web com surf.new

O surf.new se apresenta como uma ferramenta promissora e acessível para a implantação de agentes de IA na web. Sua natureza open source, combinada com o suporte a tecnologias poderosas como steel.dev e Langchain, e a flexibilidade na escolha de LLMs, o tornam uma adição valiosa ao arsenal de qualquer desenvolvedor ou entusiasta da automação. A capacidade de executar tarefas complexas de forma autônoma, como demonstrado nos exemplos, solidifica seu potencial para transformar a maneira como interagimos e extraímos valor da internet.