O Google anunciou uma grande reestruturação em sua oferta de inteligência artificial: o Bard foi rebatizado como Gemini, e uma nova versão paga, o Gemini Advanced, foi lançada, prometendo acesso ao modelo de IA mais poderoso da empresa, o Gemini Ultra. Esta mudança sinaliza um esforço renovado do Google para competir de forma mais agressiva no crescente mercado de IA generativa.
Recentemente, o Google confirmou que seu chatbot de IA, anteriormente conhecido como Bard, passará a se chamar Gemini. Esta mudança de nome visa unificar a marca em torno da família de modelos de IA Gemini, que inclui o Gemini Pro (anteriormente usado no Bard gratuito) e o mais potente Gemini Ultra. Ao acessar o antigo endereço bard.google.com, os usuários agora são recebidos com a mensagem "Bard agora é Gemini", indicando que esta é a melhor forma de ter acesso direto à IA do Google, mantendo todas as capacidades que os usuários já conheciam e amavam, com a promessa de melhorias contínuas na "era Gemini".
Juntamente com a mudança de nome, o Google introduziu o Gemini Advanced, uma versão premium que oferece acesso ao Gemini Ultra 1.0. Esta é a resposta do Google a ofertas como o ChatGPT Plus da OpenAI, posicionando o Gemini Ultra como seu modelo de IA mais capaz e sofisticado até o momento.
O Gemini Ultra é o modelo de linguagem grande (LLM) mais avançado do Google, projetado para lidar com tarefas altamente complexas. De acordo com o Google, o Gemini Ultra supera significativamente os modelos anteriores em áreas como codificação, raciocínio lógico, seguimento de instruções detalhadas e colaboração criativa. A empresa já havia feito declarações ambiciosas sobre o Gemini, com o CEO do Google DeepMind, Demis Hassabis, afirmando, conforme noticiado pela Wired há cerca de seis meses, que seu próximo algoritmo eclipsaria o ChatGPT. Posteriormente, em dezembro, um artigo da Forbes destacou as alegações do Google de que o Gemini seria mais poderoso que o GPT-4 da OpenAI. Com o Gemini Advanced, os usuários agora têm a chance de testar essas afirmações na prática.
O Gemini Advanced está disponível através de uma assinatura do plano Google One AI Premium. Após um período de teste gratuito de dois meses, o serviço custará US$19,99 por mês, o mesmo preço do ChatGPT Plus. Este plano também inclui 2TB de armazenamento no Google One e, em breve, integrará o Gemini ao Gmail, Docs e outros serviços do Google Workspace.
O Gemini Advanced, e consequentemente o Gemini Ultra, está otimizado para inglês no momento, mas já está disponível em mais de 150 países e territórios. Além disso, o Google lançou um novo aplicativo Gemini para dispositivos Android e iOS. Inicialmente, o aplicativo está disponível em inglês nos Estados Unidos, com planos de expansão para japonês, coreano e inglês globalmente (exceto Reino Unido, Suíça e países da Área Econômica Europeia) nas próximas semanas. O lançamento no Canadá também já ocorreu para a versão web.
Com o lançamento do Gemini Advanced, diversos criadores de conteúdo e especialistas em IA começaram a testar suas capacidades. A análise de Matt Wolfe, complementada por observações de outros YouTubers como Fireship, MattVidPro AI, TheAIGRID, Matthew Berman, All About AI e David Ondrej, fornece um panorama inicial interessante.
Um consenso quase unânime é a impressionante velocidade do Gemini Advanced. As respostas são geradas de forma significativamente mais rápida em comparação com o GPT-4, chegando a ser, segundo algumas estimativas, duas a três vezes mais veloz. Esta agilidade é um ponto positivo considerável na experiência do usuário.
Em testes de criatividade, como a escrita de poemas, o Gemini Advanced demonstrou ser bastante competente. MattVidPro AI, por exemplo, solicitou um poema sobre a relação entre sanduíches de sorvete e o planeta Saturno, e o resultado foi um poema considerado "lindo" e com rimas perfeitas. O canal Fireship também testou a criatividade pedindo um poema sobre JavaScript no estilo de Bukowski, e considerou o resultado do Gemini o melhor entre os modelos testados, destacando sua capacidade de capturar um tom mais "sombrio" e até incluir "profanidades leves".
Nos testes de resolução de problemas lógicos, os resultados foram mistos. Em um teste proposto por MattVidPro AI envolvendo o disparo e a queda simultânea de balas de uma arma, o Gemini Advanced acertou a resposta, inclusive fornecendo um diagrama explicativo. No entanto, Matthew Berman apresentou um problema sobre o número de camisas secando ao sol e, posteriormente, um enigma sobre assassinos em uma sala, e o Gemini Advanced errou ambas as respostas, enquanto o GPT-4 acertou a primeira. Curiosamente, Chris, do canal All About AI, apresentou um problema de lógica muito similar ao das camisas e o Gemini Advanced também errou inicialmente, demonstrando uma certa inconsistência.
A capacidade de codificação também apresentou resultados variados. Fireship notou que, para tarefas de nível júnior, tanto o Gemini Advanced quanto o GPT-4 se saíram bem, com o GPT-4 produzindo um código um pouco mais simplista e o Gemini um código mais complexo, mas que necessitou de uma pequena correção manual (a adição de `package main`) para funcionar. TheAIGRID, ao testar a criação de um bot de trading em PineScript para TradingView, descobriu que o código inicial gerado pelo Gemini não funcionou, mas, ao repetir o prompt, a segunda tentativa produziu um código funcional. Matthew Berman, por sua vez, teve dificuldades em fazer o Gemini Ultra criar um jogo da cobrinha funcional, mesmo após várias tentativas. Chris, do All About AI, também enfrentou problemas iniciais com um jogo da cobrinha, mas após algumas interações, conseguiu um resultado funcional.
A geração de imagens no Gemini é alimentada pelo modelo Imagen 2. Em testes, Matt Wolfe conseguiu gerar imagens de um cientista maluco no laboratório e variações realistas de uma mulher em um banco de parque. No entanto, a capacidade de gerar imagens parece estar sendo implementada gradualmente ou pode variar conforme a região, já que David Ondrej não conseguiu gerar uma imagem de um "gato verde voador", recebendo a resposta "Isso não é algo que eu possa fazer ainda". MattVidPro AI, por outro lado, conseguiu gerar imagens de um "gato mago", embora com alguns resultados curiosos, como um gato com três orelhas, mas também imagens de boa qualidade. A capacidade de colocar texto em imagens, como a palavra "Wizard", também foi demonstrada com sucesso.
Quanto à interpretação de imagens, os resultados são inconsistentes. Em um teste com um meme de Kermit, o Gemini explicou o humor de forma genérica, focando na "justaposição" do personagem, mas não capturou a nuance específica do meme. Matthew Berman teve um resultado ainda mais curioso ao pedir para o Gemini descrever uma imagem do logo da Meta com uma lhama; o Gemini identificou a imagem como sendo sobre o modelo LaMDA do Google AI. AI Explained encontrou dificuldades com imagens contendo rostos, precisando censurá-los para obter uma resposta. Upload de PDFs, uma funcionalidade útil presente em concorrentes como Claude e ChatGPT, ainda não parece estar disponível no Gemini.
O lançamento do Gemini e do Gemini Advanced ocorre em um momento estratégico, coincidindo com grandes atualizações da Microsoft em seu produto Copilot, que também é oferecido a US$20 por mês e terá um anúncio durante o Super Bowl. Essa movimentação do Google visa claramente intensificar a competição com a OpenAI e a Microsoft, que têm ganhado bastante tração no mercado de IA.
Apesar de algumas inconsistências iniciais, é importante lembrar que esta é apenas a primeira versão do Gemini Ultra disponível ao público. O Google tem um vasto histórico de inovação em IA e possui uma quantidade imensa de dados para treinar seus modelos. A promessa de integrações mais profundas com o ecossistema Google (Workspace, Maps, YouTube, Flights, Hotels) através das "Extensões" é um diferencial importante que pode agregar muito valor aos usuários já imersos nesses serviços.
Como sempre no dinâmico campo da IA, o Gemini de hoje é o "pior que ele jamais será". Espera-se que o Google continue aprimorando o modelo rapidamente, corrigindo as falhas e expandindo suas capacidades. A gratuidade por dois meses é um convite para que os usuários explorem e decidam se o Gemini Advanced atende às suas necessidades, especialmente em comparação com as alternativas já estabelecidas.
A corrida da IA está mais acirrada do que nunca, e o Google, com o Gemini, está mostrando que não pretende ficar para trás. Resta acompanhar de perto os próximos capítulos dessa evolução.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.