Explosão de Novidades em IA: OpenAI, Google, Meta e Mais Inovações da Semana

A inteligência artificial (IA) continua sua marcha implacável de inovação, e esta semana não foi exceção. Vimos uma enxurrada de anúncios significativos de gigantes da tecnologia como OpenAI, Anthropic, Google e Meta, além de avanços empolgantes de outras empresas e projetos que estão moldando o futuro. Vamos mergulhar nas principais novidades.

OpenAI Revoluciona a Busca e Experiência do Usuário no ChatGPT

A OpenAI esteve particularmente ativa, introduzindo melhorias e novas funcionalidades para o ChatGPT que prometem transformar a maneira como interagimos com a IA.

ChatGPT Search: A Nova Ferramenta de Busca da OpenAI

Uma das grandes novidades é o lançamento do ChatGPT Search, uma funcionalidade que integra capacidades de busca diretamente na interface do ChatGPT. Similar em conceito a ferramentas como o Perplexity AI, o ChatGPT Search permite que usuários Pro obtenham respostas rápidas e contextuais com links para fontes relevantes na web. Essa funcionalidade, que já havia sido demonstrada meses atrás e testada com um grupo seleto, agora está sendo liberada para todos os usuários Pro. Para utilizá-la, basta procurar o novo ícone de busca na caixa de mensagem do ChatGPT. Em um exemplo prático, ao perguntar “Quais são os melhores canais do YouTube para seguir sobre IA?”, o ChatGPT Search listou canais como Two Minute Papers e, curiosamente, o próprio canal de Matt Wolfe, o apresentador do vídeo que originou este resumo.

Apesar da novidade, uma análise comparativa sugere que, no momento, o Perplexity AI ainda pode oferecer respostas com um pouco mais de detalhe e contexto, categorizando as informações de forma mais granular. No entanto, espera-se que o ChatGPT Search evolua rapidamente.

Buscando no Histórico e Melhorias na Experiência Desktop

Outra adição bem-vinda ao ChatGPT é a capacidade de pesquisar no histórico de conversas. Um novo ícone de busca no canto superior esquerdo permite que os usuários encontrem facilmente chats anteriores, como demonstrado com uma busca por “computação quântica”.

Além disso, a OpenAI aprimorou seus aplicativos desktop para Mac e Windows. A funcionalidade de Voz Avançada, que permite interações por voz com o ChatGPT de forma conversacional, agora está disponível em ambas as plataformas. É importante notar que, para acessar essa novidade, pode ser necessário atualizar o aplicativo desktop para a versão mais recente.

Voz Avançada no Desktop e o Futuro Segundo a Liderança da OpenAI (AMA)

A equipe de liderança da OpenAI, incluindo o CEO Sam Altman, Kevin Weil (CPO), Mark Chen (SVP de Pesquisa), Srinivas Narayanan (VP de Engenharia) e Jakub Pachocki (Cientista Chefe), participou de um “Ask Me Anything” (AMA) no Reddit, revelando insights sobre os próximos passos da empresa.

O Que Esperar do GPT-5 e Modelos de Imagem?

Quando questionados sobre um novo modelo de texto para imagem, considerando o DALL-E 3 como “um pouco desatualizado”, Sam Altman respondeu que “a próxima atualização valerá a espera”, mas que ainda não há um plano de lançamento definido. Sobre o aguardado GPT-5, Altman mencionou que haverá “lançamentos muito bons ainda este ano”, mas “nada que chamaremos de GPT-5”, sugerindo que um sucessor direto com esse nome não chegará em 2024.

AGI com Hardware Atual e o Potencial dos Agentes de IA

Um ponto particularmente interessante foi a afirmação de Sam Altman de que a OpenAI acredita que a Inteligência Artificial Geral (AGI) é alcançável com o hardware atual. Além disso, Kevin Weil, CPO da OpenAI, indicou que a capacidade do ChatGPT de realizar tarefas autonomamente e iniciar interações (como enviar uma mensagem primeiro) será um “grande tema em 2025”, apontando para o desenvolvimento de agentes de IA mais proativos.

Anthropic Expande o Claude com Voz e Desktop

A Anthropic, outra importante jogadora no campo da IA, também trouxe novidades para seu modelo Claude.

Ditado por Voz no Claude Móvel

Usuários dos aplicativos móveis do Claude para iPhone, iPad e Android agora podem ditar suas mensagens por voz. No entanto, diferentemente da funcionalidade de voz do ChatGPT, o Claude ainda responderá em texto, não em áudio.

Aplicativo Claude para Desktop

Seguindo a tendência, a Anthropic lançou aplicativos desktop para Mac e Windows, oferecendo uma interface similar à versão web para facilitar o acesso ao Claude.

Google Amplia Alcance da IA em Busca e Desenvolvimento

O Google continua a integrar IA em seus produtos e a oferecer novas ferramentas para desenvolvedores.

AI Overviews em Escala Global

A funcionalidade AI Overviews na Busca do Google, que fornece resumos gerados por IA no topo dos resultados de pesquisa, foi expandida para mais de 100 países. Isso significa que uma audiência global crescente terá acesso a essa experiência de busca aprimorada por IA.

Gemini API e Grounding com a Busca Google

Para desenvolvedores, a Gemini API e o Google AI Studio agora oferecem “Grounding” com a Busca Google. Isso permite que aplicações construídas com a Gemini API possam consultar a web para obter respostas mais precisas e atualizadas, similar ao que o ChatGPT Search e o Perplexity AI fazem.

O Papel Crescente da IA na Codificação do Google

Refletindo a importância da IA internamente, o CEO do Google, Sundar Pichai, comentou que “mais de um quarto de todo o novo código no Google é gerado por IA, depois revisado e aceito por engenheiros”. Esse dado, divulgado pela The Verge, demonstra o impacto significativo da IA no próprio processo de desenvolvimento da gigante da tecnologia.

Meta Investe em Busca, Notícias e IA Aberta

A Meta também fez movimentos estratégicos importantes no cenário da IA.

NotebookLlama: A Versão Aberta do Gerador de Podcast do Google

A Meta lançou o NotebookLlama, uma versão de código aberto do NotebookLM do Google, uma ferramenta que pode, entre outras coisas, gerar podcasts a partir de documentos. O NotebookLlama está disponível no GitHub, permitindo que desenvolvedores explorem e construam sobre essa tecnologia.

Parceria Estratégica com a Reuters

A Axios reportou que a Meta fechou um acordo plurianual com a Reuters. Esse acordo permitirá que o chatbot de IA da Meta utilize conteúdo de notícias da Reuters para fornecer respostas em tempo real sobre notícias e eventos atuais.

Rumo a um Motor de Busca Próprio com IA?

Especulações indicam que a Meta está, segundo relatos da TechBullion, desenvolvendo seu próprio motor de busca alimentado por IA, um movimento que a colocaria em competição mais direta com Google e OpenAI nesse espaço.

Outras Inovações Notáveis no Mundo da IA

Além dos gigantes, outras empresas e projetos continuam a impulsionar a fronteira da IA.

Grok da xAI Agora Entende Imagens

O Grok, da xAI de Elon Musk, adicionou capacidades de compreensão de imagem. Agora, os usuários dos planos X Premium podem interagir com o Grok utilizando imagens, similarmente a outros modelos multimodais.

Recraft V3: O Misterioso Gerador de Imagens que Supera Concorrentes

Um novo e misterioso gerador de imagens chamado Red Panda surgiu em um leaderboard de IA, superando modelos estabelecidos como Midjourney e Flux. Posteriormente, a empresa Recraft revelou que este era seu modelo Recraft V3. Este modelo se destaca por sua capacidade de gerar imagens com textos longos e complexos, mantendo a coerência. O Recraft V3 está disponível em recraft.ai e também possui uma API.

ElevenLabs e a Clonagem de Voz a Partir do X (Twitter)

A ElevenLabs lançou o X to Voice (xtovoice.com), uma ferramenta de código aberto que permite gerar uma voz única a partir de um perfil do X (anteriormente Twitter), analisando o estilo e o conteúdo dos tweets do usuário.

Suno Personas: Personalizando a Criação Musical com IA

A Suno, conhecida por sua plataforma de geração de música por IA, introduziu o recurso Personas. Ele permite salvar a “essência” de uma música – vocais, estilo, vibração – e aplicá-la a novas criações. Isso oferece um novo nível de personalização para os usuários Pro e Premier em beta.

D-ID e Avatares para Conversas em Tempo Real

A D-ID anunciou novos avatares de alta qualidade capazes de conversas em tempo real, melhorando a interação e o engajamento com o público de forma mais humanizada.

Wonder Dynamics Apresenta Wonder Animation para Cenas 3D

A Wonder Dynamics, que anteriormente permitia substituir atores em vídeos por personagens CGI, agora lançou o Wonder Animation. Essa nova ferramenta, como destacado pela TechCrunch, permite converter vídeos capturados com múltiplas câmeras diretamente em cenas 3D totalmente animadas, substituindo não apenas os personagens, mas todo o ambiente.

Oasis: O Minecraft Gerado por IA em Tempo Real da Decart e Etched

As empresas Decart e Etched colaboraram para criar o Oasis, um mundo semelhante ao Minecraft gerado inteiramente por IA em tempo real. Cada novo frame é gerado dinamicamente conforme o jogador se move. Embora demonstre um potencial incrível, a tecnologia ainda apresenta desafios de consistência, com elementos do cenário mudando ou desaparecendo conforme a perspectiva do jogador muda.

Physical Intelligence (Pi Zero) e o Avanço da Robótica com IA

A empresa Physical Intelligence apresentou o Pi Zero (π₀), um modelo de fundação para robôs de propósito geral. Esses robôs podem aprender a realizar tarefas observando outros robôs ou humanos, com o objetivo de desenvolver inteligência física artificial. Demonstrações incluem robôs realizando tarefas como dobrar roupas, arrumar mesas e montar caixas de forma autônoma.

Esta semana foi, sem dúvida, repleta de avanços que continuam a expandir os horizontes da inteligência artificial. Desde buscas mais inteligentes e interações por voz aprimoradas até a geração de mundos virtuais em tempo real e robôs aprendendo tarefas complexas, o ritmo da inovação é verdadeiramente impressionante. Fique atento para mais novidades, pois o mundo da IA não para de nos surpreender.