A Google continua a expandir as fronteiras da inteligência artificial com o lançamento da mais recente atualização do seu modelo de linguagem, o Gemini 2.5 Pro. Anunciado por Logan Kilpatrick, líder de produto para o Gemini no Google AI Studio, esta nova versão, lançada em preview em maio, promete um desempenho ainda melhor em codificação, especialmente em desenvolvimento front-end, edição e transformação de código.
Em uma postagem no Twitter, Logan Kilpatrick destacou que o Gemini 2.5 Pro recebeu um upgrade significativo em relação à versão de março. A nova iteração (preview 05-06) é agora "ainda melhor em codificação, com ganhos significativos em desenvolvimento web front-end, edição e transformação". Esta melhoria é um passo importante para desenvolvedores que buscam ferramentas de IA mais poderosas e eficientes.
Um dos destaques da atualização é o desempenho do Gemini 2.5 Pro na WebDev Arena. O modelo alcançou uma pontuação Elo de 1420, superando o Claude 3.7 Sonnet. Este resultado posiciona o Gemini 2.5 Pro como uma ferramenta de ponta para tarefas de desenvolvimento web, refletindo sua capacidade aprimorada de gerar código de alta qualidade e relevância.
Além dos ganhos em performance, Kilpatrick mencionou que a equipe corrigiu "diversos problemas de chamada de função que os usuários vinham reportando", tornando o modelo "muito mais confiável". Essa atenção ao feedback da comunidade e o foco na estabilidade são cruciais para a adoção em larga escala de ferramentas de IA no desenvolvimento de software. Silas Alberti, da equipe fundadora da Cognition, corroborou a eficácia do modelo, afirmando que o Gemini 2.5 Pro atualizado "atinge um desempenho de liderança em nossas avaliações de desenvolvimento júnior" e foi o primeiro modelo a resolver um de seus desafios complexos de refatoração de backend de roteamento de requisições, comportando-se como um desenvolvedor sênior ao tomar decisões corretas e escolher boas abstrações.
O vídeo de apresentação demonstrou várias aplicações práticas do Gemini 2.5 Pro, ilustrando seu potencial para transformar o fluxo de trabalho dos desenvolvedores.
Uma demonstração impressionante mostrou o Gemini 2.5 Pro criando uma aplicação de aprendizado interativo a partir de um único vídeo do YouTube. Utilizando sua compreensão de vídeo aprimorada, o modelo gerou uma interface de usuário (UI) completa e funcional. Essa capacidade de transformar conteúdo multimídia em aplicações práticas abre novas avenidas para a educação e criação de conteúdo.
Outro exemplo destacou como o Gemini 2.5 Pro simplifica o desenvolvimento web front-end. O modelo foi capaz de adicionar automaticamente novas funcionalidades, como um reprodutor de vídeo, a aplicações existentes no estilo das "Gemini 95 starter apps". Ao gerar código CSS de forma autônoma e eliminar a necessidade de inspeção manual de arquivos de design, o Gemini 2.5 Pro acelera o desenvolvimento e permite que os desenvolvedores se concentrem em aspectos mais estratégicos.
A capacidade do Gemini 2.5 Pro de gerar código para simulações complexas também foi exibida. Com um único prompt, o modelo criou uma simulação em tempo real com iluminação dinâmica e um ciclo completo de dia e noite. Essa demonstração, realizada no canvas do Gemini, evidencia a habilidade do modelo em lidar com tarefas de codificação intrincadas e gerar aplicações visuais sofisticadas sem intervenção manual extensiva.
O vídeo apresentou uma comparação lado a lado entre o Gemini 2.5 Pro e o Claude 3.7 Sonnet na tarefa de criar uma landing page para um SaaS. Enquanto o Gemini 2.5 Pro gerou a página rapidamente e com funcionalidades animadas, o Claude 3.7 Sonnet demonstrou uma inferência mais lenta. Ambos os modelos produziram resultados visualmente atraentes, mas o Gemini 2.5 Pro se destacou pela velocidade e interatividade, com uma formatação que pareceu mais robusta na demonstração.
Foi apresentada uma tabela de comparação de benchmarks entre a nova versão preview (05-06) do Gemini 2.5 Pro e a versão experimental anterior (03-25). Curiosamente, a versão mais antiga ainda superava a nova em algumas métricas, com exceção de codificação e compreensão de vídeo, que são justamente os focos da atualização mais recente. Isso sugere que, embora o novo modelo seja especializado e aprimorado para tarefas de desenvolvimento, a versão anterior ainda pode ter suas vantagens em outros domínios específicos. De acordo com o Google for Developers Blog, essas melhorias são contínuas e visam entregar ferramentas cada vez mais poderosas aos desenvolvedores.
Desenvolvedores interessados em experimentar o Gemini 2.5 Pro podem acessá-lo através do Gemini App, selecionando a versão 2.5 Pro (experimental). O modelo também está disponível no Google AI Studio, onde é possível selecionar a versão preview mais recente (atualmente, 05-06). Ambas as plataformas oferecem uma maneira de interagir e testar as capacidades do modelo.
É importante notar que existem limites de taxa para o uso do Gemini 2.5 Pro, especialmente na camada gratuita. Informações detalhadas sobre os níveis de uso e os respectivos limites de requisições por minuto (RPM), tokens por minuto (TPM) e requisições por dia (RPD) podem ser encontradas na documentação oficial do Gemini API. Para uso mais intensivo, existem níveis pagos que oferecem limites mais altos.
A Google também está incentivando os desenvolvedores a se manterem atualizados através de recursos como o World of AI Newsletter, que oferece notícias e insights sobre o que está acontecendo no espaço da IA.
Em resumo, o Gemini 2.5 Pro representa um avanço considerável nas capacidades de IA para codificação e desenvolvimento web. Com melhorias notáveis em desempenho, confiabilidade e funcionalidades inovadoras, como a geração de UI a partir de vídeos e a criação de simulações complexas, o modelo da Google se posiciona como uma ferramenta indispensável para desenvolvedores que buscam otimizar seus fluxos de trabalho e explorar novas possibilidades criativas. Resta acompanhar as futuras iterações e o impacto que essa tecnologia terá no ecossistema de desenvolvimento.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.