O cenário da inteligência artificial generativa não para de nos surpreender, e a mais recente novidade que promete redefinir paradigmas é o Devin, apresentada pela Cognition AI como a primeira engenheira de software totalmente autônoma do mundo. Anunciada com grande expectativa, Devin já está disponível para acesso em app.devin.ai e levanta questões importantes sobre o futuro do desenvolvimento de software e o papel dos profissionais da área.
Devin não é apenas mais um assistente de codificação. A proposta da Cognition AI, liderada pelo CEO Scott Wu, é que Devin atue como um colega de equipe, capaz de assumir tarefas complexas do início ao fim. Descrito como um "engenheiro júnior talentoso", Devin se destaca por sua capacidade de aprender, planejar e executar projetos de software com um nível de autonomia inédito.
A ferramenta foi projetada para colaborar com equipes humanas, complementando suas habilidades e, idealmente, aumentando a produtividade. A Cognition AI enfatiza que Devin trabalha melhor sob a supervisão de um gerente experiente, assim como um engenheiro júnior humano.
As demonstrações e informações divulgadas revelam um conjunto robusto de habilidades que tornam Devin uma ferramenta potencialmente transformadora.
Devin demonstrou proficiência em diversas atividades cruciais no ciclo de vida do desenvolvimento de software, incluindo:
Para se encaixar nos fluxos de trabalho existentes, Devin possui integrações nativas com ferramentas essenciais:
Devin não se limita a interagir com ferramentas externas; ele possui seu próprio ambiente de desenvolvimento integrado, que inclui:
A Cognition AI apresentou diversas demonstrações para ilustrar o potencial de Devin.
Em um exemplo notável, Devin foi encarregado de realizar testes de Quality Assurance (QA) em sua própria plataforma. A IA conseguiu fazer login, testar diferentes funcionalidades, identificar problemas e, crucialmente, fornecer um relatório estruturado dos resultados. Esse tipo de "autoteste" demonstra a capacidade de Devin de lidar com tarefas de ponta a ponta.
Para testar suas habilidades em cenários reais, Walden, um dos desenvolvedores da Cognition AI, mostrou Devin assumindo um trabalho real da plataforma Upwork. A tarefa consistia em configurar um modelo de visão computacional para detecção de danos em estradas. Devin analisou o repositório GitHub fornecido, leu a documentação, configurou o ambiente, baixou imagens para teste, depurou o código (inclusive adicionando `print` statements para entender o fluxo de dados) e, por fim, gerou um relatório com os resultados e imagens de exemplo.
Outra demonstração envolveu a correção de uma issue reportada em um repositório no GitHub. Devin clonou o projeto, leu a documentação, instalou as dependências necessárias (como Rust e Cargo), modificou o código para resolver o problema (alterando a cor do status de saída de um processo) e testou as alterações antes de apresentar um resumo do que foi feito.
A Cognition AI divulgou dados de performance que posicionam Devin à frente de outros modelos de IA conhecidos. No benchmark SWE-bench, que avalia a capacidade de resolver problemas reais de engenharia de software, Devin teria superado modelos como Claude 2, diversas versões do SWE-Llama, GPT-4 e ChatGPT 3.5. É importante notar, como o próprio vídeo menciona, que algumas dessas comparações podem ter sido feitas com versões mais antigas dos modelos concorrentes.
A empresa também afirmou que Devin utiliza seus próprios modelos de IA proprietários e que, em testes internos, superou o modelo o1-preview da OpenAI. Esses resultados, se consistentes, indicam um avanço significativo na capacidade de IAs realizarem tarefas complexas de desenvolvimento.
O acesso ao Devin é feito através de sua plataforma web. Após o login ou cadastro, o sistema solicita permissão para acessar as contas do GitHub e Slack do usuário, essenciais para seu funcionamento. Em seguida, é pedido o nome da organização.
O plano apresentado durante a demonstração é o "Teams plan", com um custo de $500 por mês. Este plano inclui:
Calculando com base nos ACUs, o custo horário do Devin seria de aproximadamente $8 por hora, um valor consideravelmente competitivo quando comparado ao custo de um desenvolvedor humano.
A chegada de Devin gerou um misto de entusiasmo e ceticismo na comunidade de desenvolvimento.
O potencial de uma ferramenta como Devin é imenso. A capacidade de automatizar tarefas de desenvolvimento, desde a concepção até a implementação e teste, pode acelerar significativamente os ciclos de desenvolvimento, reduzir custos e permitir que desenvolvedores humanos foquem em problemas de maior complexidade e criatividade.
Apesar do otimismo, Devin não está isento de desafios. Alguns usuários e especialistas, como os citados no vídeo, ainda consideram ferramentas como o Cursor (um editor de código focado em IA) mais eficientes para certas tarefas, ou veem o custo de Devin como um impeditivo.
Um ponto de atenção foi um incidente de segurança ocorrido logo após o lançamento. A Cognition AI reportou que um usuário expôs acidentalmente uma URL de VSCode Live Share enquanto usava a funcionalidade "Use Devin's Machine", o que poderia permitir que terceiros acessassem o mesmo código que estava sendo editado. A empresa afirmou ter desabilitado e investigado a funcionalidade imediatamente, verificando que as URLs eram geradas aleatoriamente e que o acesso não autorizado só seria factível se a URL fosse publicamente exposta. Medidas adicionais de autenticação foram implementadas para proteger o acesso a essas URLs.
Streamers como ThePrimeagen também testaram a ferramenta ao vivo, encontrando algumas dificuldades e levantando questões sobre a segurança e a real autonomia de Devin em cenários menos controlados, incluindo a exposição acidental de URLs que poderiam dar acesso a repositórios.
A grande questão que surge com IAs como Devin é sobre o futuro dos desenvolvedores humanos. A visão da Cognition AI parece ser a de colaboração, onde Devin atua como um assistente superpoderoso. No entanto, a automação de tarefas hoje realizadas por engenheiros juniores e plenos inevitavelmente levará a uma reconfiguração do mercado de trabalho na área de tecnologia.
Devin representa, sem dúvida, um marco importante na evolução da inteligência artificial aplicada à engenharia de software. Suas capacidades demonstram um avanço notável na autonomia e na capacidade de lidar com tarefas complexas. No entanto, como toda tecnologia emergente, ainda enfrenta desafios de usabilidade, custo, segurança e aceitação pela comunidade.
Se Devin será a revolução prometida ou apenas mais uma ferramenta no arsenal dos desenvolvedores, ainda é cedo para dizer. O que é certo é que a IA continuará a transformar a maneira como criamos software, e acompanhar essa evolução é crucial para todos os profissionais da área.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.