A inteligência artificial (IA) continua sua trajetória de evolução acelerada, e a última semana foi particularmente movimentada, trazendo uma avalanche de anúncios e lançamentos que prometem remodelar a forma como interagimos com a tecnologia. Desde atualizações massivas nos modelos da OpenAI até a chegada de novos concorrentes e dispositivos inovadores, o cenário da IA está mais dinâmico do que nunca. Este artigo mergulha nos principais destaques, analisando o impacto e as possibilidades futuras dessas novidades.
O evento DevDay da OpenAI foi, sem dúvida, o grande protagonista da semana, com a empresa revelando uma série de atualizações e novos produtos que demonstram seu compromisso contínuo com a vanguarda da pesquisa e desenvolvimento em IA.
Uma das maiores novidades foi o anúncio do GPT-4 Turbo. Este modelo aprimorado chega com uma impressionante janela de contexto de 128.000 tokens, o que equivale a aproximadamente 300 páginas de texto em um único prompt. Isso significa que o modelo pode processar e reter uma quantidade significativamente maior de informações, permitindo interações mais complexas e resultados mais coesos em tarefas extensas. Além disso, o GPT-4 Turbo promete desempenho otimizado e preços mais acessíveis, tanto para tokens de entrada quanto de saída, em comparação com o GPT-4 tradicional.
A OpenAI também introduziu melhorias significativas em suas APIs. Destacam-se as atualizações nas chamadas de função (function calling), que agora permitem descrever funções de aplicativos ou APIs externas para os modelos, que podem então escolher inteligentemente gerar um objeto JSON contendo os argumentos para chamar essas funções. Houve também um aprimoramento no seguimento de instruções e a introdução do modo JSON, garantindo que o modelo responda com um JSON válido.
A Assistants API é outra grande adição, projetada para ajudar desenvolvedores a construir experiências semelhantes a agentes dentro de suas próprias aplicações. Essa API permite que os modelos acessem conhecimento extra, chamem modelos e ferramentas para executar tarefas, incluindo Code Interpreter e Retrieval. Isso abre portas para a criação de bots personalizados capazes de interagir com dados adicionais fornecidos pelo usuário, servindo como contexto para respostas mais precisas e relevantes.
Novas modalidades também foram integradas à API, incluindo:
Para completar, a OpenAI anunciou preços mais baixos para o uso de suas APIs e limites de taxa mais altos, tornando o desenvolvimento com seus modelos mais acessível.
Talvez o anúncio mais impactante para o usuário final tenha sido a introdução dos GPTs. Essencialmente, os GPTs são versões personalizadas do ChatGPT que combinam instruções, conhecimento extra e uma combinação de habilidades. Eles parecem estar substituindo os plugins e permitem que qualquer pessoa crie chatbots especializados para tarefas específicas, programando-os com informações próprias e instruções personalizadas, tudo isso utilizando linguagem natural, sem a necessidade de codificação.
Acompanhando essa novidade, a OpenAI anunciou o lançamento da GPT Store para o final deste mês. Nesta loja, os usuários poderão encontrar GPTs criados por outros desenvolvedores e, futuramente, os criadores dos GPTs mais populares poderão até mesmo compartilhar a receita gerada pelo uso de suas criações. Isso cria um ecossistema promissor para a inovação e monetização de IAs personalizadas.
O ChatGPT também se tornou mais unificado, eliminando a necessidade de alternar entre diferentes modos (como plugins, DALL-E ou navegação na web). Agora, o sistema decide automaticamente qual ferramenta utilizar com base no prompt do usuário, embora ainda seja possível selecionar modos específicos através da seção "Explore".
Com tantas novidades e o aumento da demanda, o ChatGPT enfrentou uma interrupção significativa de aproximadamente 90 minutos durante a semana. A OpenAI atribuiu parte dessa instabilidade a ataques DDoS (Distributed Denial of Service), com o grupo hacker Anonymous Sudan reivindicando a responsabilidade.
Paralelamente, a OpenAI está buscando ativamente parcerias de dados. O objetivo é criar um arquivo de código aberto (Open-Source Archive) para treinar modelos de linguagem grandes, que seria público e utilizável por qualquer pessoa em treinamento de IA. Além disso, buscam dados privados para treinar modelos de IA proprietários, incluindo seus modelos de fundação e modelos personalizados, garantindo o tratamento adequado da sensibilidade e controle de acesso desses dados.
Outra medida importante anunciada foi o Copyright Shield, um compromisso da OpenAI em proteger seus clientes com salvaguardas de direitos autorais em seus sistemas. A empresa se propõe a intervir e defender os clientes, além de arcar com os custos incorridos, caso enfrentem reivindicações legais relacionadas à violação de direitos autorais ao usar recursos disponíveis do ChatGPT Enterprise e sua plataforma de desenvolvedores.
O ecossistema de IA não se resume apenas à OpenAI. Outros grandes nomes e startups inovadoras também apresentaram avanços significativos.
A xAI, empresa de inteligência artificial de Elon Musk, começou a oferecer acesso ao seu chatbot, Grok. Treinado com dados do Twitter (agora X) e atualizado em tempo real, Grok se destaca por sua personalidade um tanto "atrevida", capaz de usar palavrões, contar piadas e apresentar um humor sarcástico, refletindo a própria persona de Musk. Para acessar o Grok, é necessário ser assinante do X Premium Plus (cerca de US$ 16 por mês) e entrar em uma lista de espera. Elon Musk também planeja integrar o Grok diretamente aos veículos da Tesla no futuro.
A Humane lançou oficialmente o AI Pin, um dispositivo vestível (wearable) impulsionado pela OpenAI. Custando US$ 699, mais uma assinatura mensal de US$ 24 que inclui um número de telefone e cobertura de dados via T-Mobile, o AI Pin busca ser uma alternativa aos smartphones. Ele interage com o usuário através de voz, toque e gestos, e possui a capacidade de projetar informações na palma da mão do usuário. O dispositivo vem com câmera embutida, alto-falante e uma "luz de confiança" para indicar quando está gravando. Suas funcionalidades incluem desde responder a perguntas e enviar mensagens de texto até tradução em tempo real e identificação de objetos e informações nutricionais.
O Google expandiu sua Experiência Generativa de Busca (SGE) para mais de 120 novos países e territórios, embora alguns mercados importantes como Canadá, Austrália e Reino Unido ainda não tenham acesso.
A Amazon está, segundo relatos, desenvolvendo um novo modelo de IA chamado "Olympus" para competir com o ChatGPT e o Bard. O objetivo é incorporá-lo à sua loja online e aos alto-falantes inteligentes Alexa. Este modelo pode ser revelado já em dezembro. Vale lembrar que a Amazon investiu recentemente US$ 4 bilhões na Anthropic, criadora do Claude, o que sugere uma possível colaboração ou uso dessa tecnologia.
A Samsung também anunciou seu próprio modelo de IA generativa, chamado "Gauss". Ele irá alimentar várias tecnologias de IA em seus dispositivos, oferecendo funcionalidades como traduções, resumo de documentos, assistência de codificação e geração de imagens, tudo operando diretamente no dispositivo.
O YouTube continua a experimentar novos recursos de IA. Um deles é a capacidade de resumir os tópicos dos comentários de um vídeo usando IA, organizando grandes seções de comentários em temas facilmente digeríveis. Outra ferramenta em desenvolvimento é uma IA conversacional que permitirá aos usuários mergulhar mais fundo no conteúdo que estão assistindo, fazendo perguntas e recebendo recomendações de conteúdo relacionado, tudo sem interromper a reprodução.
No campo da geração de vídeo, a PlaiDay (P L A I Day) surge como uma nova ferramenta que permite gerar vídeos a partir de texto e, crucialmente, trocar os rostos nos vídeos gerados usando uma selfie do usuário. Isso possibilita a criação de personagens consistentes em diferentes cenas. A Polycam, conhecida por sua tecnologia de escaneamento 3D Gaussian Splatting, lançou uma atualização que elimina automaticamente "flutuadores" comuns, melhorando a qualidade das reconstruções 3D.
A Blockade Labs, que oferece um gerador de skyboxes 360°, adicionou um novo criador de malhas 3D (em beta), permitindo transformar esses mundos 360° em malhas 3D com profundidade, que podem ser baixadas em formato GLB e usadas em softwares 3D.
Por fim, um vídeo circulou mostrando a "1st AI Machine", um dispositivo físico para edição de vídeo gerado por IA, aparentemente uma criação da SpecialGuestX para a 1stAveMachine, impulsionada pela Runway. Este aparelho permite definir quadros de storyboard, estilos e música para que a IA gere um vídeo único diretamente no dispositivo, sem necessidade de conexão com a internet para a geração em si.
A velocidade com que a inteligência artificial está evoluindo é verdadeiramente impressionante. As novidades desta semana, desde os avanços da OpenAI até as inovações de empresas como xAI, Humane, Google, Amazon, Samsung e outras ferramentas criativas, demonstram um campo em efervescência. Modelos mais poderosos, interfaces mais intuitivas, dispositivos vestíveis inteligentes e a integração da IA em todos os aspectos da nossa vida digital são apenas o começo. Para se manter atualizado com todas essas transformações, é fundamental acompanhar de perto as notícias e explorar as novas ferramentas que surgem a cada dia. O futuro, claramente, será cada vez mais moldado pela inteligência artificial.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.