Revoluções na IA: Voz Avançada do ChatGPT, Meta Quest 3S e o Futuro com Sam Altman
OpenAI: Inovações, Reestruturações e Desafios em Inteligência Artificial
A OpenAI continua a ser uma força motriz no desenvolvimento da inteligência artificial, e esta semana trouxe uma série de anúncios significativos que impactam desde usuários finais até a estrutura da própria empresa.
Modo de Voz Avançado do ChatGPT: Uma Nova Era de Interação com IA
Uma das notícias mais aguardadas foi o lançamento completo do modo de voz avançado para o ChatGPT, agora disponível para todos os usuários Plus e Team. Este recurso, que Sam Altman, CEO da OpenAI, mencionou em um tweet, promete uma interação muito mais natural e fluida. A OpenAI destacou a inclusão de Instruções Personalizadas, Memória, cinco novas vozes e sotaques aprimorados. Para aqueles que não tiveram acesso imediato, a reinstalação do aplicativo ChatGPT pareceu resolver o problema para a maioria. A capacidade da IA de manter conversas mais longas e contextuais foi demonstrada, e até mesmo usos criativos, como um usuário que conseguiu fazer a IA cantar um dueto da música "Eleanor Rigby" dos Beatles, mostram o potencial lúdico da tecnologia. Contudo, é importante notar que existem limites de taxa diária para o uso do modo de voz avançado, com usuários sendo notificados quando restam aproximadamente 15 minutos de uso.
Reestruturação da OpenAI: Rumo ao Lucro com Sam Altman
Em uma mudança estratégica, a OpenAI está se reestruturando para se tornar uma corporação de benefício com fins lucrativos. De acordo com reportagens da Reuters, essa alteração visa tornar a empresa mais atraente para investidores. O conselho sem fins lucrativos não terá mais o controle final, e Sam Altman receberá participação acionária na nova entidade. Rumores indicam que a participação de Altman pode ser de cerca de 7%, e com a empresa avaliada em aproximadamente 150 bilhões de dólares, isso representaria um valor significativo. A organização sem fins lucrativos original continuará a existir, mas com uma participação minoritária na nova estrutura com fins lucrativos.
Partidas Notáveis na OpenAI
Coincidindo com grandes anúncios, a OpenAI viu a saída de figuras importantes. A CTO Mira Murati anunciou sua decisão de deixar a empresa após seis anos e meio, conforme comunicado em seu perfil no X (anteriormente Twitter). Ela expressou gratidão a Sam Altman e Greg Brockman pela confiança e oportunidade de liderar a organização técnica. Logo após, foi reportado que o Diretor de Pesquisa Bob McGrew e o Vice-Presidente de Pesquisa Barret Zoph também deixaram a empresa. Sam Altman indicou que as decisões foram tomadas de forma independente e amigável, e que o momento coincidiu com a necessidade de uma transição suave para a próxima geração de liderança.
Sam Altman e a "Era da Inteligência": Visões sobre o Futuro da IA
Sam Altman publicou um artigo em seu blog pessoal intitulado "The Intelligence Age". Nele, discute o futuro da inteligência artificial, prevendo que, nas próximas décadas, a IA permitirá feitos que pareceriam mágicos para as gerações anteriores. Ele vislumbra um futuro com superinteligência possivelmente em "alguns milhares de dias", onde cada pessoa poderá ter equipes de IA pessoais, especialistas virtuais em diversas áreas e tutores virtuais personalizados.
Jony Ive e OpenAI: Uma Nova Parceria de Hardware em Inteligência Artificial
Foi confirmado que Jony Ive, o renomado designer por trás de produtos icônicos da Apple como o iPod, iPhone e Apple Watch, está trabalhando com a OpenAI em um novo dispositivo de hardware. Detalhes sobre o projeto ainda são escassos, mas a colaboração entre uma mente tão influente no design e uma líder em IA gera grandes expectativas.
Meta Connect 2024: Realidade Mista e Inteligência Artificial em Foco
O evento Meta Connect 2024 trouxe uma enxurrada de anúncios, consolidando a aposta da Meta na inteligência artificial e na realidade mista.
Meta Quest 3S: Realidade Mista Mais Acessível
A Meta revelou o Meta Quest 3S, um headset de realidade mista mais acessível, com preço inicial de 299 dólares. Ele compartilha muitas capacidades do Meta Quest 3, mas com um custo menor, tornando a tecnologia mais acessível a um público maior. Junto com o novo headset, foi anunciado um novo jogo do Batman, que promete ser uma experiência imersiva.
Meta AI: Mais Inteligente, Multimodal e com Vozes de Celebridades
Os produtos de IA da Meta estão se tornando mais inteligentes e úteis. A IA agora é multimodal, capaz de compreender e processar texto, áudio, imagens e vídeos. Usuários poderão editar imagens usando comandos de texto e interagir com a IA usando vozes de celebridades, incluindo Kristen Bell – uma escolha interessante, dado que Bell já havia se manifestado sobre o uso de seus dados por IAs. A Meta também está implementando tradução por IA e sincronização labial para Reels no Instagram, além de uma "Creator AI" que permitirá a criação de versões virtuais de criadores de conteúdo.
Llama 3.2: O Poder do Código Aberto da Meta
A Meta anunciou o Llama 3.2, seu mais recente modelo de linguagem de código aberto. Este modelo é multimodal, treinado em 90 bilhões de parâmetros e estará disponível no Hugging Face, reforçando o compromisso da Meta com a comunidade de IA de código aberto.
Ray-Ban Meta Glasses: Novas Funcionalidades de Inteligência Artificial
Os óculos Ray-Ban Meta Glasses receberam atualizações de IA, incluindo uma função de memória (para lembrar onde você estacionou, por exemplo), tradução em tempo real e a capacidade de escanear códigos QR. Essas funcionalidades visam tornar os óculos ainda mais úteis no dia a dia.
Project Orion: O Futuro dos Óculos de Realidade Aumentada da Meta
Um dos anúncios mais futuristas foi o Project Orion, um projeto de óculos de realidade aumentada que se assemelham a óculos normais, mas com capacidade de projetar informações e interfaces no campo de visão do usuário. Embora ainda em desenvolvimento e com previsão de lançamento para consumidores apenas por volta de 2027, o Project Orion representa a visão da Meta para o futuro da computação vestível.
Google Inova com NotebookLM e Atualizações Gemini em Inteligência Artificial
O Google também apresentou novidades importantes, especialmente em suas ferramentas de IA focadas em produtividade e pesquisa.
NotebookLM: Sua Ferramenta de Pesquisa Pessoal Aprimorada com IA
O NotebookLM, uma plataforma experimental do Google, recebeu atualizações significativas. Agora, ele suporta arquivos de áudio e URLs do YouTube como fontes. Isso significa que você pode fazer upload de gravações de aulas, palestras ou colar links de vídeos do YouTube, e o NotebookLM ajudará a resumir, criar guias de estudo, linhas do tempo e FAQs baseados nesse conteúdo. Steven Johnson, que trabalha no Google, exemplificou como estudantes podem gravar aulas, fazer anotações breves e depois usar o NotebookLM para expandir essas notas e criar resumos em áudio, tornando o estudo mais eficiente e acessível.
Atualizações nos Modelos Gemini: Mais Poder e Acessibilidade
O Google anunciou modelos Gemini atualizados e prontos para produção, com destaque para a redução de preços do Gemini 1.5 Pro para desenvolvedores que utilizam a API, além de limites de taxa aumentados. Essas mudanças visam facilitar o acesso e a construção de aplicações com os modelos de IA do Google.
Outras Notícias Impactantes no Mundo da Inteligência Artificial
Além dos grandes players, outras empresas e iniciativas também marcaram a semana com avanços e discussões importantes no campo da IA.
Parcerias e Expansões: Snapchat e Google Gemini
O Snapchat anunciou uma parceria expandida com o Google Cloud para usar o Gemini em seu chatbot My AI e em outros recursos de IA generativa, buscando aprimorar a experiência do usuário com capacidades multimodais.
Segurança em IA: Microsoft e Cloudflare Lançam Ferramentas
A Microsoft lançou uma nova ferramenta de segurança de IA chamada "Correction", integrada ao Azure AI Studio. Seu objetivo é detectar e reescrever automaticamente conteúdo incorreto ou alucinações geradas por sistemas de IA, comparando-os com fontes de dados do cliente. Enquanto isso, a Cloudflare introduziu uma nova ferramenta de auditoria de IA para ajudar criadores de conteúdo a controlar melhor o acesso de bots aos seus sites, permitindo bloquear a raspagem de dados por IAs.
Novos Horizontes para Modelos de Linguagem e Aplicações de IA
A AMD revelou seu primeiro modelo de linguagem pequeno, o AMD-135M, possivelmente focado em inferência em dispositivos móveis. A Duolingo, conhecida por seu aplicativo de aprendizado de idiomas, lançou o "Adventures", um minijogo com IA, e um recurso de videochamada com a personagem Lily, uma IA, para simular conversas naturais e personalizadas. A Suno, plataforma de geração de música por IA, adicionou um recurso de corte para usuários Pro e Premier, permitindo ajustar o início e o fim das músicas geradas.
James Cameron e Stability AI: Uma Colaboração Inesperada
Em uma notícia que surpreendeu muitos, o cineasta James Cameron, diretor de blockbusters como Terminator, Avatar e Titanic, juntou-se ao conselho de diretores da Stability AI. Sua entrada em uma empresa de IA é notável, considerando que grande parte de Hollywood tem se posicionado com cautela ou até mesmo contra o uso irrestrito de IA na indústria cinematográfica.
Regulamentação e Ética: FTC e a Lei de Segurança de Inteligência Artificial da Califórnia
A Federal Trade Commission (FTC) dos EUA anunciou um combate a alegações e esquemas de IA enganosos, visando empresas que usam o hype da IA para vender tecnologias de forma desonesta. Empresas como DoNotPay, que se autointitulava o "primeiro robô advogado do mundo", estão entre as investigadas por não cumprir suas promessas. Paralelamente, a Califórnia aguarda a decisão do governador Gavin Newsom sobre o projeto de lei SB 1047, que visa regulamentar a segurança em IA e tem gerado um intenso debate entre a indústria de tecnologia, que em grande parte se opõe, e a indústria do entretenimento, que apoia a medida.
AlphaChip do Google DeepMind: Inteligência Artificial Projetando Chips de IA Mais Eficientes
O Google DeepMind revelou o AlphaChip, um programa de IA que está transformando o design de chips de computador. Essencialmente, é um modelo de IA projetado para ajudar a criar novos chips que são melhores e mais eficientes no treinamento de outros modelos de IA, criando um ciclo de otimização e avanço na capacidade computacional.
Esta semana demonstrou o ritmo acelerado da inovação em inteligência artificial. Desde interações por voz mais naturais e acessíveis até reestruturações corporativas e debates sobre regulamentação, o campo da IA está em constante evolução, prometendo transformar fundamentalmente como interagimos com a tecnologia e o mundo ao nosso redor.