A competição no campo da Inteligência Artificial (IA) está mais acirrada do que nunca, com gigantes da tecnologia como Google e Microsoft disputando a liderança. Recentemente, o Google realizou uma apresentação ao vivo diretamente de Paris para divulgar seus avanços em IA. No entanto, conforme destacado em uma análise em vídeo, o evento deixou a desejar, parecendo mais uma tentativa de alcançar a Microsoft do que uma demonstração de inovações revolucionárias.
Um primeiro sinal de alerta foi a desativação dos comentários na transmissão do YouTube, sugerindo uma possível antecipação de feedback negativo. Além disso, os primeiros nove minutos da apresentação foram dedicados a recapitular conquistas passadas do Google em IA, como o Google Tradutor e o Google Lens, em vez de focar em novidades impactantes.
Uma das demonstrações envolveu o Google Lens, que agora permitirá aos usuários identificar elementos dentro de vídeos. No exemplo exibido, um usuário recebe um vídeo de Paris, pressiona o botão de energia para ativar o Google Assistente e usa a função "pesquisar na tela". O Lens então identifica um marco, como o Palácio de Luxemburgo.
Embora a integração dessa funcionalidade ao celular seja interessante, a tecnologia de reconhecimento de imagem para identificar objetos, plantas ou locais já existe em diversos aplicativos. A apresentação do Google, nesse sentido, não trouxe uma sensação de novidade avassaladora, mas sim a incorporação de uma capacidade já conhecida ao seu ecossistema.
O ponto alto da apresentação deveria ser o Bard, a IA conversacional do Google desenvolvida com a tecnologia LaMDA, posicionada como concorrente direto do ChatGPT. A demonstração incluiu exemplos de como o Bard poderia ajudar a planejar a compra de um carro familiar, considerando orçamento, segurança e tipo de combustível, ou sugerir paradas em uma viagem de carro.
Apesar da tecnologia por trás do Bard ser, sem dúvida, avançada – o Google inclusive mencionou seu papel fundamental no desenvolvimento da arquitetura Transformer, base para muitas IAs generativas atuais, como detalhado no artigo "Transformer: A Novel Neural Network Architecture for Language Understanding" – a demonstração prática pareceu replicar funcionalidades já vistas no ChatGPT. Mais criticamente, o Bard foi anunciado como disponível apenas para "testadores confiáveis", sem acesso público imediato. Isso contrasta fortemente com a estratégia da Microsoft, que já integrou funcionalidades semelhantes ao Bing e ao navegador Edge, tornando-as acessíveis ao público.
O Google Maps também recebeu destaque com a introdução do "Immersive View", que transforma mapas 2D em uma visualização multidimensional do mundo real. Essa tecnologia, que utiliza IA para fundir bilhões de imagens do Street View e aéreas, é potencializada por Neural Radiance Fields (NeRFs) – uma tecnologia que também tem sido explorada por empresas como a Luma AI para criar modelos 3D realistas.
Com o Immersive View, os usuários podem sobrevoar edifícios, encontrar entradas e ter uma noção da área, inclusive com um controle deslizante de tempo para ver como o local se parece em diferentes horários e condições climáticas. Outra funcionalidade demonstrada foi a capacidade de usar a câmera para identificar estabelecimentos próximos em realidade aumentada, verificando se estão abertos, o nível de movimento e avaliações. Embora visualmente impressionante, a sensação é de uma melhoria incremental sobre funcionalidades já existentes, como a visualização de horários de pico em estabelecimentos. O vídeo também mencionou recomendações aprimoradas de paradas de carregamento para veículos elétricos, uma tecnologia que, conforme apontado pelo apresentador do vídeo, já existe em sistemas como os da Tesla há anos.
A apresentação do Google, embora tenha mostrado avanços tecnológicos interessantes, pareceu reativa e menos impactante em comparação com os recentes anúncios da Microsoft. A percepção geral é que, enquanto o Google relembrou suas contribuições passadas e apresentou funcionalidades que ou já existiam de alguma forma ou não estão imediatamente disponíveis para o grande público (como o Bard), a Microsoft tem sido mais ágil em lançar inovações em IA de forma acessível.
A "guerra da IA" entre essas gigantes da tecnologia está apenas começando, e é provável que vejamos muitos outros desenvolvimentos emocionantes. No entanto, com base nesta última rodada de anúncios, a Microsoft parece estar um passo à frente em termos de impacto e disponibilidade de suas novas ferramentas de Inteligência Artificial para o consumidor final.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.