O universo da Inteligência Artificial (IA) está em ebulição. Após uma semana de anúncios surpreendentes, que incluiu o lançamento do GPT-4 pela OpenAI e a integração de IA no Google Workspace, a velocidade das inovações não diminuiu. Pelo contrário, esta semana já nos presenteou com cinco novas revelações que prometem transformar ainda mais a maneira como interagimos com a tecnologia. Vamos mergulhar nessas novidades.
Mal nos recuperamos do impacto do Gen-1, e a Runway Research já anunciou o Runway Gen-2. Esta nova ferramenta representa um salto significativo na capacidade de gerar vídeos a partir de texto, imagens ou outros clipes de vídeo.
O Gen-2 é um sistema de IA multimodal que permite criar vídeos inovadores. A grande promessa é a funcionalidade completa de texto para vídeo. Como a própria Runway afirma: "Se você pode dizer, agora você pode ver." Isso significa que basta um prompt de texto para sintetizar vídeos em qualquer estilo imaginável.
A empresa divulgou um vídeo demonstrativo com exemplos impressionantes, como "um surfista pegando uma onda" ou "um leão em uma sala de estar", todos gerados a partir de simples descrições textuais. O Gen-2 já possui uma lista de espera e será liberado gradualmente nas próximas semanas.
Esta semana também marca a conferência GTC da Nvidia, onde a empresa apresenta seus maiores avanços. O CEO da Nvidia, Jensen Huang, declarou que estamos vivendo o "momento iPhone da IA", sinalizando uma transformação comparável à revolução dos smartphones.
Um dos destaques foi o anúncio da Nvidia AI Foundations. Trata-se de um serviço de nuvem projetado para fornecer poder computacional impressionante a qualquer pessoa, permitindo que empresas e desenvolvedores criem, refinem e operem modelos de linguagem grandes (LLMs) e IA generativa personalizados, utilizando seus próprios dados.
A plataforma Nvidia AI Foundations incluirá modelos para linguagem (Nemo), visual (Picasso) e biologia (BioNemo), além de parcerias com gigantes como Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure. A Nvidia também anunciou uma parceria com a Adobe para desenvolver capacidades de IA de próxima geração para o futuro da criatividade.
Falando em Adobe, a empresa também revelou o Adobe Firefly beta, seu novo modelo de arte generativa por IA. Um diferencial importante é que o Firefly foi treinado exclusivamente com imagens licenciadas, incluindo o acervo do Adobe Stock, e conteúdo de código aberto, visando evitar problemas de direitos autorais.
O Firefly promete uma gama de funcionalidades, como texto para imagem, efeitos de texto impressionantes (como transformar letras em pipoca ou chocolate derretido), e a capacidade de recolorir vetores (em breve). A Adobe planeja inclusive compensar os artistas cujas imagens foram utilizadas no treinamento dos modelos.
Atualmente, o Firefly beta tem algumas limitações: não suporta upload ou exportação de conteúdo de vídeo, não permite editar ou iterar sobre sua própria arte (apenas gerar novo conteúdo), e é destinado apenas para uso não comercial durante a fase beta. Interessados podem se inscrever na lista de espera no site da Adobe.
A Microsoft não ficou para trás e anunciou que agora é possível criar imagens diretamente no chat do Bing. Essa funcionalidade utiliza uma versão mais avançada do DALL-E, o modelo de geração de imagens da OpenAI.
O acesso à ferramenta, chamada Bing Image Creator, pode ser feito através do bing.com/create. As imagens geradas demonstram uma qualidade notável, superando as versões anteriores do DALL-E. A integração direta no Bing Chat, embora ainda não totalmente liberada para todos, promete uma experiência mais fluida e visual para os usuários.
Para fechar a semana com chave de ouro, o Google começou a liberar o acesso público ao Bard, sua IA conversacional e resposta ao Bing Chat e ChatGPT.
O Bard, baseado no modelo de linguagem LaMDA do Google, é uma IA de busca conectada à web. Inicialmente, o acesso está sendo liberado para usuários nos Estados Unidos e Reino Unido, através de uma lista de espera em bard.google.com. Relatos indicam que o acesso está sendo concedido rapidamente. Ben Tossell, conhecido por sua newsletter Ben's Bites, já demonstrou que o Bard não possui um corte de conhecimento temporal, acessando informações em tempo real através do Google Search.
Corroborando o sentimento de rápida evolução, Bill Gates publicou um artigo em seu blog, GatesNotes.com, intitulado "A Era da IA Começou". Ele compara o desenvolvimento da IA à criação do microprocessador, do computador pessoal, da internet e do celular, afirmando que a IA mudará fundamentalmente como as pessoas trabalham, aprendem, viajam, cuidam da saúde e se comunicam.
Gates enfatiza que a IA tem o potencial de reduzir algumas das piores desigualdades do mundo, impulsionar a produtividade e trazer avanços significativos em saúde e educação. Ele acredita que todos deveriam se beneficiar da inteligência artificial, não apenas aqueles em países ricos.
A velocidade com que a IA está avançando é, no mínimo, estonteante. Cada dia traz novas ferramentas, capacidades e discussões sobre o impacto dessas tecnologias. Acompanhar todas essas novidades pode ser um desafio, mas é inegavelmente um momento empolgante para testemunhar e participar dessa revolução tecnológica. Para se manter atualizado com as últimas ferramentas e notícias de IA, você pode visitar o FutureTools.io e assinar a newsletter gratuita.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.