A segunda semana de março de 2023 entrou para a história como, possivelmente, a mais movimentada e impactante no universo da Inteligência Artificial (IA). Quase diariamente, fomos bombardeados com anúncios revolucionários de gigantes da tecnologia e startups inovadoras, redefinindo o que esperamos da IA generativa e suas aplicações. Este artigo resume e analisa os principais acontecimentos que marcaram essa semana frenética.
A semana começou com a Universidade de Stanford apresentando o Stanford Alpaca 7B, um modelo de linguagem grande (LLM) treinado com apenas 52.000 instruções, de forma similar ao GPT-3 da OpenAI. A grande vantagem do Alpaca é sua leveza e eficiência, permitindo que seja executado em computadores locais com um custo significativamente menor – a universidade estima menos de $600 para reproduzir o treinamento. Testes preliminares indicaram que o Alpaca se comporta de maneira qualitativamente similar ao text-davinci-003 da OpenAI, apesar de ser surpreendentemente pequeno e barato. Isso representa um passo importante para a democratização do acesso a LLMs poderosos, antes restritos a grandes corporações com vastos recursos computacionais.
A capacidade de rodar LLMs localmente abre um leque de possibilidades, desde maior privacidade de dados até a personalização extrema de chatbots e assistentes virtuais. Em breve, poderemos ter versões personalizadas de ferramentas como o ChatGPT rodando em nossos próprios dispositivos, sem a necessidade de conexão constante com a internet.
A terça-feira foi, sem dúvida, o dia mais agitado, com múltiplos anúncios de peso disputando a atenção do público.
O Google anunciou uma nova era para a IA em seu Google Workspace, prometendo integrar funcionalidades de IA generativa, similares ao GPT-3, em ferramentas como Google Docs, Gmail, Sheets, Slides e Meet. Isso significa que, em breve, teremos assistência para escrever e-mails, resumir documentos, gerar ideias e até criar apresentações inteiras diretamente nas aplicações que usamos diariamente. Além disso, o Google revelou a PaLM API e o MakerSuite, ferramentas destinadas a desenvolvedores para que possam construir suas próprias aplicações sobre os modelos de linguagem do Google.
A Anthropic, uma empresa de pesquisa em IA que recebeu investimentos significativos do Google, apresentou seu chatbot Claude. Embora inicialmente acessível via API para parceiros selecionados como Notion e Poe (da Quora), Claude promete ser um assistente de IA útil, honesto e inofensivo, focado em segurança.
O anúncio mais esperado da semana veio da OpenAI: o lançamento do GPT-4. Este novo modelo é multimodal, capaz de processar não apenas texto, mas também imagens como entrada. O GPT-4 pode resolver problemas difíceis com maior precisão, graças ao seu conhecimento geral mais amplo e habilidades de resolução de problemas. Ele supera o ChatGPT em suas capacidades de raciocínio avançado e pode lidar com mais de 25.000 palavras de texto, permitindo casos de uso como criação de conteúdo de formato longo, conversas estendidas e análise de documentos. Usuários do ChatGPT Plus já podem experimentar o GPT-4.
Para completar a avalanche de notícias, a Microsoft confirmou que o novo Bing, seu motor de busca com funcionalidades de chat, já vinha rodando em uma versão customizada do GPT-4 nas últimas cinco semanas. Isso explica o salto de qualidade percebido por muitos usuários na ferramenta.
A quarta-feira foi dominada pela Midjourney, a popular ferramenta de geração de imagens por IA.
A Midjourney anunciou o lançamento da Midjourney Magazine, uma publicação física e digital que apresenta uma curadoria de imagens da comunidade, entrevistas e conteúdo sobre IA generativa. O primeiro exemplar pode ser obtido gratuitamente com o código promocional SUBSCRIBER (oferta por tempo limitado).
A grande novidade foi o lançamento do Midjourney V5. Esta nova versão promete imagens muito mais realistas, com melhorias significativas na renderização de mãos (um desafio histórico para IAs geradoras de imagem), maior qualidade de imagem (aumento de 2x na resolução), e maior variedade estilística. O V5 também introduz a funcionalidade de 'tiling' para criar padrões contínuos e permite o uso de 'image weights' para dar mais ênfase a imagens de referência. Além disso, o estilo de prompt mudou, incentivando o uso de linguagem natural e frases completas, similar ao ChatGPT, o que pode facilitar a integração com outras ferramentas de IA no futuro. A Midjourney também revelou estar trabalhando em uma API, o que permitirá que outros produtos e serviços utilizem sua tecnologia de geração de arte.
A Microsoft não parou nos anúncios do Bing e, na quinta-feira, revelou o Microsoft 365 Copilot. Similar à iniciativa do Google Workspace, o Copilot integrará o poder dos LLMs (baseados em GPT-4) com os dados do usuário no Microsoft Graph (calendário, e-mails, chats, documentos, reuniões) e nos aplicativos do Microsoft 365 como Word, Excel, PowerPoint, Outlook e Teams. A proposta é transformar a produtividade, permitindo que a IA auxilie na criação de documentos, análise de dados em planilhas, elaboração de apresentações, gerenciamento de e-mails e resumo de reuniões. A Microsoft também apresentou o Business Chat, uma ferramenta que utiliza dados de todos os aplicativos Microsoft para responder perguntas e auxiliar em tarefas complexas.
Enquanto as gigantes ocidentais brilhavam, a Baidu, gigante chinesa de buscas, lançou seu rival para o ChatGPT, chamado Ernie. No entanto, o lançamento foi recebido com ceticismo. A apresentação se baseou em respostas pré-gravadas, sem demonstrações ao vivo, o que gerou desconfiança sobre as reais capacidades do modelo. Como resultado, as ações da Baidu caíram 10%, indicando que o Ernie não impressionou investidores e o público.
A semana foi intensa, mas o ritmo não deve diminuir. Na próxima semana (20-23 de março), acontece o evento GTC da Nvidia, descrito como 'A Conferência para a Era da IA e do Metaverso', com palestras de líderes de empresas como DeepMind, OpenAI e Meta. Esperam-se grandes anúncios sobre hardware e software para IA.
Além disso, Emad Mostaque, fundador da Stability.ai (criadora do Stable Diffusion), insinuou em seu Twitter que mais lançamentos importantes (não deles) ocorrerão na próxima semana, e que novidades sobre o Stable Diffusion (possivelmente o Stable Diffusion 3.0 ou uma versão XL) também estão a caminho.
Esta semana demonstrou que a Inteligência Artificial está evoluindo a uma velocidade impressionante. A cada dia, novas ferramentas e modelos surgem, prometendo transformar a maneira como trabalhamos, criamos e interagimos com a tecnologia. Para se manter atualizado nesse cenário dinâmico, é crucial acompanhar as notícias e experimentar as novas ferramentas. Plataformas como FutureTools.io, que agregam e organizam as melhores ferramentas de IA, tornam-se cada vez mais indispensáveis.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.