A Revolução da IA em Ebulição: Novidades da OpenAI, Google, Meta e o Futuro da Criação de Conteúdo

A Revolução da IA em Ebulição: Novidades da OpenAI, Google, Meta e o Futuro da Criação de Conteúdo

O universo da Inteligência Artificial (IA) testemunhou uma das semanas mais movimentadas dos últimos tempos, com uma avalanche de anúncios e lançamentos que prometem remodelar a forma como interagimos com a tecnologia. Desde avanços em modelos de linguagem e geração de mídia até novas ferramentas de hardware e debates sobre regulamentação, o cenário da IA está em constante transformação. Vamos explorar as principais novidades que marcaram estes dias intensos.

Avanços da OpenAI: Voz, Modelos de Linguagem e Parcerias Estratégicas

A OpenAI, uma das protagonistas no campo da IA, apresentou atualizações significativas e viu sua relação com parceiros estratégicos evoluir.

Novo Modo de Voz Avançado do ChatGPT

Um dos destaques foi o início da implementação gradual do novo Modo de Voz Avançado para usuários do ChatGPT Plus. Esta funcionalidade, que anteriormente gerou controvérsia pela semelhança de uma das vozes com a da atriz Scarlett Johansson, promete conversas mais naturais e em tempo real. A IA agora é capaz de interromper e ser interrompida, além de perceber e responder às emoções do usuário. Demonstrações revelaram a capacidade da IA de cantar 'Parabéns a Você' com a voz de um sapo e até mesmo simular o anúncio de um piloto de avião pelo intercomunicador. O acesso, por enquanto, está restrito a um pequeno grupo de usuários.

GPT-4o Long Output: Mais Capacidade para Desenvolvedores

Para desenvolvedores, a OpenAI está oferecendo uma versão experimental do GPT-4o com uma capacidade de saída expandida para até 64.000 tokens por requisição. Conhecido como GPT-4o Long Output, este modelo está disponível para participantes do programa alfa através da API, utilizando o nome de modelo gpt-4o-64k-output-alpha. Esta maior capacidade de geração de texto abre portas para novos casos de uso que exigem respostas mais longas e detalhadas.

Microsoft Agora Vê OpenAI Como Concorrente em IA e Busca

Uma reviravolta interessante surgiu na relação entre a Microsoft e a OpenAI. Apesar de ter investido reportados US$ 13 bilhões e deter 49% da OpenAI, a Microsoft passou a listar a empresa como uma concorrente em IA e busca em seus relatórios financeiros. Esta mudança, conforme noticiado pela CNBC, ocorre dias após a OpenAI anunciar um protótipo de seu próprio motor de busca, o SearchGPT.

OpenAI e a Regulamentação da Inteligência Artificial

No âmbito regulatório, a OpenAI endossou publicamente alguns projetos de lei do Senado dos Estados Unidos que visam moldar a política de IA do país. Entre eles estão o Future of AI Innovation Act, que formalizaria o United States AI Safety Institute como um órgão federal para definir padrões para modelos de IA, o NSF AI Education Act e o CREATE AI Act. A empresa também se comprometeu a fornecer acesso antecipado aos seus próximos modelos para o U.S. AI Safety Institute, buscando, segundo analistas, construir uma boa relação com legisladores e ter um assento na mesa durante as discussões sobre a regulamentação da IA.

Google Acelera na Corrida da Inteligência Artificial

O Google não ficou para trás, apresentando diversas atualizações para seus modelos e ferramentas de IA.

Gemini 1.5 Pro (0801) Assume a Liderança

Uma nova versão experimental do Gemini 1.5 Pro, identificada como 0801 (referente a 1º de agosto), foi disponibilizada no Google AI Studio e através da API Gemini. Este modelo rapidamente alcançou o topo do LMSys Chatbot Arena Leaderboard, um ranking baseado no feedback de usuários que comparam respostas de diferentes modelos de linguagem. O Gemini 1.5 Pro (0801) destacou-se em áreas como matemática, acompanhamento de instruções e codificação.

Gemma 2: Modelos Menores, Mais Seguros e Transparentes

O Google também lançou o Gemma 2, uma nova família de modelos de linguagem menores e de código aberto. A principal novidade é o Gemma 2 2B, um modelo com 2 bilhões de parâmetros que, segundo o Google, supera modelos significativamente maiores em benchmarks. Juntamente com ele, foram apresentados o ShieldGemma, um conjunto de modelos classificadores de conteúdo para segurança, e o Gemma Scope, uma ferramenta de interpretabilidade para entender melhor o funcionamento interno dos modelos.

Novas Funcionalidades de IA no Google Chrome

O navegador Google Chrome também recebeu um impulso de IA, com três novas funcionalidades. O Google Lens agora está integrado ao desktop, permitindo que usuários selecionem áreas de uma imagem para buscar informações. Outra novidade é a capacidade de comparar produtos abertos em diferentes abas e a busca por histórico usando linguagem natural, como perguntar 'qual foi a sorveteria que visitei semana passada?'.

Meta Inova com Ferramentas de Criação e Segmentação por IA

A Meta continua a investir pesado em IA, com foco em ferramentas para criadores e avanços em modelos de visão computacional.

Adeus aos Chatbots de Celebridades, Olá ao AI Studio Personalizado

A Meta decidiu descontinuar seus chatbots de IA que imitavam celebridades, como Snoop Dogg e MrBeast, que não tiveram a recepção esperada. Em vez disso, a empresa lançou o Meta AI Studio, uma plataforma que permite a qualquer pessoa criar seus próprios personagens de IA personalizados. Os usuários podem definir o nome, avatar, tom e instruções específicas para seus AIs, que podem ser compartilhados no Instagram, Messenger e WhatsApp.

SAM 2: A Próxima Geração de Segmentação de Imagens e Vídeos

A Meta também apresentou o Segment Anything Model 2 (SAM 2), uma evolução do seu modelo de segmentação de objetos em imagens e, agora, também em vídeos. O SAM 2 demonstra uma capacidade aprimorada de rastrear objetos mesmo quando eles são temporariamente ocultados, o que representa um avanço significativo para edição de vídeo e outras aplicações de visão computacional. Uma demonstração interativa do SAM 2 está disponível em sam2.metademolab.com.

O Universo da Geração de Imagem e Vídeo por IA em Expansão

A capacidade de gerar e manipular imagens e vídeos com IA continua a evoluir rapidamente, com várias plataformas anunciando melhorias.

Midjourney V6.1: Qualidade e Coerência Aprimoradas

O Midjourney lançou a versão V6.1 de seu modelo de geração de imagens. Esta atualização traz melhorias significativas na qualidade da imagem, coerência e na capacidade de gerar texto. Além disso, introduz um novo modelo de upscaling e personalização, prometendo resultados ainda mais impressionantes e realistas.

Runway Gen-3 Alpha: De Imagem para Vídeo e Modo Turbo

A Runway, conhecida por suas ferramentas de IA para vídeo, expandiu as capacidades do seu modelo Gen-3 Alpha. Agora, além de texto para vídeo, o modelo suporta imagem para vídeo, permitindo animar imagens estáticas. A empresa também anunciou o Gen-3 Alpha Turbo, uma versão mais rápida e barata do modelo, que promete gerar vídeos em cerca de 11 segundos, em comparação com os 20-25 segundos da versão padrão.

Leonardo.AI Une Forças com Canva

Uma notícia importante para o mercado de design: o Leonardo.AI, uma popular plataforma de geração de imagens por IA, foi adquirido pelo Canva. Segundo o anúncio, o Leonardo.AI continuará a operar de forma independente, com sua própria equipe e aplicativo, mas suas tecnologias e modelos, incluindo o proprietário Phoenix, serão integrados ao Canva, prometendo democratizar ainda mais a criação de conteúdo visual com IA.

Black Forest Labs e o Modelo FLUX.1

Uma nova empresa surgiu no cenário da IA generativa, a Black Forest Labs, fundada por alguns dos pesquisadores e engenheiros por trás do Stable Diffusion. Eles anunciaram seu primeiro modelo de texto para imagem, o FLUX.1, que já está disponível para uso no Glif.app e no Hugging Face. O modelo promete um novo estado da arte em detalhes de imagem, aderência ao prompt, diversidade de estilo e complexidade de cena.

Ferramentas de Lip-Sync com IA: Rendernet Narrator e Captions App

A tecnologia de sincronia labial (lip-sync) com IA também viu novidades. A Rendernet introduziu o Narrator, uma ferramenta que permite enviar um vídeo, adicionar um script e sincronizar os lábios do personagem com o novo áudio. De forma similar, o Captions App lançou uma funcionalidade de 'AI Twin', que permite criar um avatar digital de si mesmo para vídeos.

IA em Hardware e Dispositivos: Do Cotidiano ao Especializado

A Inteligência Artificial não se limita a software; ela está cada vez mais presente no hardware que usamos.

Qualcomm AI Hub: Potencializando a IA On-Device

A Qualcomm está investindo fortemente em IA on-device (executada diretamente no dispositivo). O Qualcomm AI Hub é uma plataforma que simplifica a implementação de modelos de IA para visão, áudio e fala em dispositivos de borda. Ele oferece uma coleção de mais de 100 modelos de IA otimizados e permite que desenvolvedores otimizem, validem e implantem seus próprios modelos em plataformas Qualcomm. A empresa demonstrou tecnologias impressionantes, como óculos de Realidade Aumentada (AR) com tradução em tempo real e controle de computadores por expressões faciais.

NVIDIA e Shutterstock Lançam Edify-3D

A NVIDIA, em colaboração com a Shutterstock, lançou o Edify-3D. Este modelo, acessível em build.nvidia.com, permite a geração de modelos 3D a partir de texto ou imagens, utilizando dados licenciados da Shutterstock, o que pode aliviar preocupações com direitos autorais.

Stable Fast 3D da Stability AI: Geração Rápida de Ativos 3D

A Stability AI introduziu o Stable Fast 3D, um modelo que promete gerar ativos 3D de alta qualidade a partir de uma única imagem em menos de um segundo. Embora a qualidade ainda possa variar, especialmente com imagens em ângulos, a velocidade é um diferencial notável. O modelo está disponível via API e no Hugging Face.

A Controvérsia do Dispositivo 'Friend'

Um novo dispositivo de IA vestível chamado Friend, um colar que ouve o usuário durante todo o dia e envia mensagens de texto contextuais, gerou polêmica. Lançado por Avi Schiffmann, o produto foi acusado de copiar o nome e o conceito de um projeto de hardware de código aberto também chamado Friend, de Nik Shevchenko. A situação se tornou ainda mais curiosa quando se descobriu que a empresa por trás do novo Friend gastou US$ 1,8 milhão, de um total de US$ 2,5 milhões arrecadados, para adquirir o domínio friend.com. Macy Agilliam, que trabalha para o Morning Brew (um dos investidores do novo Friend), tuitou parabenizando quem vendeu o domínio, ao que Schiffmann respondeu que ela 'trabalha para o investidor dele'.

IA nos Drive-Thrus do Taco Bell e Escovas de Dente Inteligentes

A IA está chegando aos drive-thrus do Taco Bell, que planeja usar tecnologia de voz AI para atender pedidos em centenas de lojas até o final de 2024. Enquanto isso, o Ars Technica reportou sobre as 'escovas de dente AI' que prometem usar algoritmos avançados para ajudar a escovar melhor os dentes, mas também levantam preocupações sobre privacidade de dados.

Impactos e Desafios da Inteligência Artificial

Com tantos avanços, surgem também discussões importantes sobre o impacto da IA na sociedade e a necessidade de regulamentação.

Greve dos Dubladores de Videogames por Preocupações com IA

Seguindo os passos dos roteiristas e atores de Hollywood, os dubladores de videogames também estão considerando uma greve, em parte devido a preocupações sobre como a IA poderia replicar suas vozes e aparências sem consentimento ou compensação justa. Este é um tema que, segundo especialistas, pode se desenrolar de forma diferente do cinema e TV, já que as ferramentas para criar vozes e personagens de IA totalmente novos, sem vínculo com atores reais, já existem.

Casa Branca e a Regulamentação do Código Aberto em IA

A Casa Branca declarou que, por enquanto, não vê necessidade de restringir a Inteligência Artificial de código aberto. Um relatório da NTIA (National Telecommunications and Information Administration) argumenta que as evidências atuais não são suficientes para justificar restrições a modelos de IA com 'pesos amplamente disponíveis', embora ressalte a importância de monitorar perigos potenciais.

Perplexity Lança Programa para Editores

O Perplexity AI anunciou o Perplexity Publishers' Program, uma iniciativa para compartilhar receita com veículos de notícias cujo conteúdo é utilizado como fonte em suas respostas. Atualmente, os parceiros iniciais incluem grandes nomes como TIME, Der Spiegel, Fortune, Entrepreneur, The Texas Tribune e WordPress.com. A medida visa fornecer crédito adequado e construir confiança com os produtores de conteúdo.

IA nas Olimpíadas: Transformando o Esporte

A Inteligência Artificial está desempenhando um papel cada vez maior nos esportes, e as Olimpíadas não são exceção. A IA está sendo usada para auxiliar no julgamento, identificar talentos, analisar os movimentos dos atletas e otimizar o treinamento, mostrando como a tecnologia pode transformar até mesmo as competições esportivas tradicionais.

Outras Notícias Relevantes no Mundo da IA

Anthropic Claude Chega ao Brasil

Uma boa notícia para os usuários brasileiros: o assistente de IA Claude, da Anthropic, agora está oficialmente disponível no Brasil. Consumidores e empresas no país já podem acessar o Claude através de seu site e aplicativos móveis.

Atraso no Lançamento do Apple Intelligence

Os aguardados recursos de IA da Apple, conhecidos como Apple Intelligence, chegarão um pouco mais tarde do que o inicialmente previsto. Segundo informações, a empresa planeja lançar essas funcionalidades como parte de atualizações de software em outubro, algumas semanas após os lançamentos iniciais do iOS 18 e iPadOS 18, previstos para setembro.

Conclusão

Esta semana demonstrou, mais uma vez, a velocidade vertiginosa com que a Inteligência Artificial está evoluindo. Novas ferramentas, modelos mais poderosos e debates cruciais sobre o futuro da tecnologia surgem a cada dia. Embora o potencial seja imenso, os desafios relacionados à ética, regulamentação e impacto social continuam a exigir atenção e discussão. Uma coisa é certa: a revolução da IA está em plena ebulição, e o que vimos é apenas o começo de uma transformação profunda em diversos setores da nossa vida.