Novidades em IA: Claude Mais Colaborativo, Gemini 1.5 Pro com Janela de Contexto de 2M e Mais!

Explosão de Novidades no Mundo da Inteligência Artificial: Claude, Gemini, OpenAI e Mais

O universo da Inteligência Artificial (IA) está em constante ebulição, e esta semana não foi exceção. Diversas empresas líderes, como Anthropic, Google e OpenAI, anunciaram atualizações significativas em suas plataformas e modelos, prometendo transformar ainda mais a maneira como interagimos com a tecnologia. Vamos mergulhar nas principais novidades.

Anthropic Inova com Novos Recursos para o Claude

A Anthropic revelou uma série de aprimoramentos para seu modelo de IA, o Claude, tornando-o uma ferramenta ainda mais poderosa e colaborativa.

Projetos no Claude: Organização e Contexto Aprimorados

Uma das grandes novidades é a introdução dos "Projetos". Similar aos GPTs personalizados da OpenAI, os Projetos permitem que os usuários organizem seus fluxos de trabalho de forma mais eficiente. É possível fazer upload de diversos arquivos (com limite de 30MB no total) para fornecer contexto específico a um projeto. Assim, cada vez que você interagir com o Claude dentro daquele projeto, ele utilizará as informações carregadas, mantendo a consistência e relevância das respostas.

Além disso, é possível fornecer instruções personalizadas para cada projeto, definindo como o Claude deve se comportar e responder. A capacidade de compartilhar projetos com membros da equipe também foi adicionada, facilitando a colaboração.

Interface do Usuário Renovada e Funcionalidades Adicionais

A interface do usuário do Claude recebeu uma leve atualização. A barra lateral agora aparece automaticamente ao mover o mouse para a esquerda da tela, onde é possível acessar chats recentes, projetos e configurações. O botão de perfil foi movido para o canto inferior esquerdo. Outras melhorias incluem a capacidade de favoritar chats para acesso rápido e a opção de upgrade para um plano de equipe.

A funcionalidade "Artefatos", que permite ao Claude gerar conteúdo como snippets de código, documentos de texto ou designs de website em uma janela dedicada ao lado da conversa, também foi destacada. Para demonstrar os Projetos, o apresentador criou um projeto chamado "Artigos de Pesquisa", carregou alguns PDFs e o Claude foi capaz de listar os artigos e encontrar correlações entre eles, seguindo as instruções personalizadas fornecidas.

Google Expande Fronteiras com Gemini 1.5 Pro e Mais Novidades

O Google também não ficou para trás, anunciando avanços impressionantes.

Gemini 1.5 Pro: Uma Janela de Contexto Gigantesca

O Gemini 1.5 Pro agora ostenta uma janela de contexto de 2 milhões de tokens, o que equivale a aproximadamente 1,5 milhão de palavras. Para se ter uma ideia, toda a série de livros Harry Potter possui cerca de 1,1 milhão de palavras, e a série completa de Game of Thrones (Canção de Gelo e Fogo) tem aproximadamente 1,7 milhão. Isso significa que o modelo pode processar e manter o contexto de volumes massivos de informação.

Além disso, o Gemini 1.5 Pro agora possui capacidade de execução de código e o modelo de código aberto Gemma 2 foi disponibilizado, superando o Llama 3 e o Grok-1 em diversos benchmarks.

Outros Anúncios do Google

O Google Translate está adicionando 110 novos idiomas, incluindo Cantonês, NKo e Tamazight, utilizando IA para essa expansão. A empresa também está implementando a barra lateral do Gemini no Gmail, permitindo resumir conversas, mostrar e-mails não lidos e rascunhar e-mails. Esta funcionalidade estará disponível para clientes do Google Workspace com Gemini Business, Enterprise, Education ou assinantes do Google One AI Premium.

OpenAI Aprimora ChatGPT e Explora Novas Fronteiras

A OpenAI continua a evoluir seus produtos e a expandir sua influência.

Modo de Voz Avançado e CriticGPT

O aguardado Modo de Voz Avançado do ChatGPT Plus, que demonstrou interações incrivelmente naturais, teve seu lançamento alfa adiado por mais um mês. A OpenAI está aprimorando a capacidade do modelo de detectar e recusar conteúdo prejudicial, além de melhorar a experiência do usuário. Alguns usuários já estão recebendo acesso antecipado e relatam que o sistema pode até gerar efeitos sonoros de fundo durante a narração de histórias.

A empresa também treinou um novo modelo baseado no GPT-4 chamado CriticGPT, projetado para identificar erros na saída de código do ChatGPT, auxiliando os treinadores humanos.

Expansão de Acesso e Aquisições Estratégicas

O aplicativo de desktop do ChatGPT para Mac agora está disponível para todos os usuários, não apenas para assinantes Plus. Além disso, a OpenAI adquiriu a Multi, uma plataforma de colaboração remota que permite compartilhamento de tela simultâneo, cursores compartilhados e a capacidade de digitar nos aplicativos de outros usuários. Essa aquisição sugere um futuro onde o ChatGPT poderá auxiliar na resolução de problemas diretamente na tela do usuário.

Outras Notícias Relevantes no Mundo da Inteligência Artificial

O cenário da IA foi movimentado por diversas outras notícias impactantes.

IA na Publicidade e Criação de Vídeo

A Toys "R" Us utilizou o modelo Sora da OpenAI para criar um novo comercial, gerando debates sobre o uso de IA na publicidade. Enquanto isso, o LTX Studio lançou a atualização "Visions", oferecendo maior flexibilidade na criação de vídeos, incluindo a capacidade de começar do zero ou a partir de um roteiro, gerar storyboards, aplicar referências de estilo via upload de imagem e exportar pitch decks completos. A plataforma também cria locuções, trilhas sonoras e permite o uso de personagens consistentes.

Questões Legais e Parcerias na Indústria Musical e de Mídia

As gravadoras entraram com processos contra as startups de música por IA Suno e Udio, alegando treinamento com músicas protegidas por direitos autorais. Em contrapartida, o YouTube está buscando acordos com grandes gravadoras para licenciar músicas para treinar suas próprias ferramentas de IA musical, adotando uma abordagem de "permissão primeiro".

A TIME Magazine anunciou uma parceria de conteúdo estratégico com a OpenAI. A OpenAI terá acesso aos arquivos históricos da TIME para aprimorar seus produtos, enquanto a TIME utilizará a tecnologia da OpenAI para desenvolver novos produtos para seu público. A TIME também fez parceria com a ElevenLabs para implementar o "Audio Native", um reprodutor de áudio incorporável com narrações realistas de seus artigos.

Novos Aplicativos e Ferramentas de IA

A ElevenLabs também lançou o Reader App para iOS (com versão para Android em breve), que permite ouvir qualquer texto em qualquer lugar com vozes de alta qualidade. Já a Character.AI introduziu um recurso que permite aos usuários conversar com avatares de IA por meio de chamadas telefônicas.

Avanços em Hardware e Mudanças Corporativas

A empresa Etched anunciou o Sohu, um chip especializado para Transformers, que, segundo eles, é 20 vezes mais rápido que os H100s da Nvidia. Em resposta, a Groq (GROQ) anunciou ter alcançado internamente 400.000 tokens por segundo com o modelo Llama 3 70B.

A Stability AI nomeou um novo CEO, Prem Akkaraju, ex-CEO da Weta Digital (conhecida por seus efeitos visuais em filmes como Avatar e O Senhor dos Anéis), e garantiu financiamento adicional. Infelizmente, a Rabbit R1 enfrentou uma violação de dados onde chaves de API codificadas foram encontradas em seu código-fonte, permitindo acesso a todas as respostas do R1, informações pessoais e até mesmo a capacidade de "brickar" os dispositivos.

Por fim, a Figma anunciou um grande redesenho com IA em sua conferência Config, introduzindo novas ferramentas generativas de IA que podem criar designs de aplicativos a partir de prompts de texto e gerar texto automaticamente, substituindo o Lorem Ipsum.

O ritmo da inovação em IA continua acelerado, com novas ferramentas e parcerias surgindo a cada semana. Para se manter atualizado sobre as últimas novidades e descobrir mais ferramentas de IA, visite o site FutureTools.io e assine a newsletter gratuita.