Explosão de Novidades em IA: De Meta CM3Leon e Llama 2 a Elon Musk xAI e o Futuro da Criação de Conteúdo
O universo da inteligência artificial (IA) continua em franca expansão, com uma avalanche de notícias e lançamentos impactando diversos setores. Nas últimas semanas, vimos desde novos modelos generativos de texto e imagem até parcerias estratégicas e debates acalorados sobre direitos autorais e o futuro do trabalho. Este artigo compila e analisa os principais destaques, oferecendo um panorama do que está acontecendo no dinâmico campo da IA.
Meta Inova com CM3Leon: Uma Nova Fronteira em Modelos Generativos de Texto e Imagem
A Meta (anteriormente Facebook) anunciou recentemente o CM3Leon (pronuncia-se "Chameleon"), um modelo generativo de última geração para texto e imagens. Este modelo se destaca por sua eficiência e capacidade de realizar uma variedade de tarefas.
Capacidades do CM3Leon
O CM3Leon demonstrou proficiência em:
- Texto para Imagem: Gerar imagens a partir de descrições textuais, como um "pequeno cacto usando um chapéu de palha e óculos de sol neon no deserto do Saara", ou até mesmo incorporar texto específico dentro das imagens, como o número "1991" em uma placa de pare.
- Edição de Imagem Guiada por Texto: Modificar imagens existentes com base em instruções textuais. Por exemplo, transformar a "Moça com Brinco de Pérola" em um homem barbudo, adicionar óculos de sol, envelhecê-la ou aplicar pintura facial.
- Tarefas de Texto: Realizar legendagem de imagens e responder a perguntas sobre o conteúdo visual. Em um exemplo, o modelo descreveu detalhadamente uma imagem de um cachorro segurando um graveto.
- Objeto para Imagem: Gerar imagens com posicionamento específico de objetos, utilizando coordenadas fornecidas no prompt.
- Segmentação para Imagem: Criar imagens a partir de mapas de segmentação.
Os exemplos divulgados pela Meta indicam uma qualidade impressionante, com o CM3Leon conseguindo gerar imagens complexas e realistas, incluindo mãos humanas, um desafio comum para modelos anteriores.
Tecnologia Autoregressiva e Treinamento
Diferentemente dos modelos de difusão (como Stable Diffusion, DALL-E e Midjourney) ou das Redes Generativas Adversariais (GANs), o CM3Leon utiliza um modelo autoregressivo. De forma simplificada, enquanto modelos de difusão refinam uma imagem a partir de ruído e GANs utilizam duas IAs competindo entre si, um modelo autoregressivo constrói a imagem pixel por pixel, de forma sequencial.
É importante notar que o CM3Leon foi treinado utilizando um vasto conjunto de dados do Shutterstock, composto exclusivamente por imagens e textos licenciados, o que pode mitigar algumas preocupações sobre direitos autorais no treinamento.
Disponibilidade Futura
A Meta ainda não anunciou quando o CM3Leon estará disponível para o público consumidor, mas a tecnologia parece promissora para superar algumas das limitações dos modelos de IA generativa atuais.
Elon Musk e xAI: Colaborações com Tesla e Twitter para uma IA "Maximalmente Curiosa"
Recentemente, Elon Musk forneceu mais detalhes sobre sua nova startup de IA, a xAI. Durante um Twitter Space, Musk delineou planos ambiciosos.
A Sinergia entre xAI, Tesla e Twitter
A xAI planeja colaborar estreitamente com outras empresas de Musk, como a Tesla e o Twitter (agora X). A ideia é utilizar os dados do Twitter para treinar uma IA descrita como "maximalmente curiosa".
Hardware e Supercomputação Dedicados
A Tesla está desenvolvendo silício personalizado (processadores e GPUs) que promete ser de 3 a 5 vezes mais capaz que o hardware atual, com uma próxima versão potencialmente 4 a 5 vezes superior. Além disso, o supercomputador Dojo da Tesla será empregado no treinamento da IA, utilizando dados provenientes dos veículos da empresa.
Visão para o Futuro da IA com a xAI
O objetivo da xAI é desenvolver uma inteligência artificial que compreenda o mundo físico para além da internet, aproveitando dados como os de direção da Tesla. Ainda não há informações concretas sobre quando os produtos ou serviços da xAI serão revelados ao público.
Wix Integra IA para Criação de Websites via Chat
A popular plataforma de construção de websites, Wix, anunciou a integração de inteligência artificial em suas ferramentas. Com o Wix AI, os usuários poderão criar websites inteiros através de prompts de texto em uma interface de chat.
Como Funciona o Wix AI
O sistema de IA do Wix fará perguntas para entender as necessidades do usuário e, com base nas respostas, gerará o site completo, incluindo texto, imagens e layout. Posteriormente, o usuário poderá personalizar o site gerado. Esta funcionalidade representa um avanço significativo na automação da criação de websites.
Microsoft 365 Copilot: Preços Anunciados e o Impacto no Mercado
A Microsoft revelou o preço do seu aguardado Microsoft 365 Copilot: US$ 30 por usuário, por mês. Este valor se aplica a clientes empresariais que utilizam os planos Microsoft 365 E3, E5, Business Standard e Business Premium. A definição do preço é um passo importante para a adoção em larga escala desta ferramenta de produtividade baseada em IA, e será interessante observar a resposta do mercado, especialmente em comparação com ofertas similares do Google Workspace.
Llama 2: A Parceria entre Meta e Microsoft para um Modelo de Linguagem Aberto
Uma das notícias de maior impacto no cenário da IA foi a parceria entre Meta e Microsoft para o lançamento do Llama 2. Este é descrito como a próxima geração do modelo de linguagem grande (LLM) de código aberto da Meta.
Acesso e Licenciamento do Llama 2
O Llama 2 está disponível gratuitamente para pesquisa e uso comercial, podendo ser acessado através de plataformas como o Hugging Face (especificamente o Llama2 70B Chatbot). No entanto, a licença possui algumas ressalvas importantes: os materiais do Llama não podem ser usados para aprimorar outros LLMs (exceto derivados do próprio Llama 2) e, caso um produto que utilize o Llama 2 atinja mais de 700 milhões de usuários ativos mensais, será necessário obter uma licença direta da Meta. Adicionalmente, a Meta se reserva o direito de encerrar a licença em caso de litígio.
Esta colaboração entre gigantes da tecnologia visa democratizar o acesso a LLMs poderosos, fomentando a inovação. Para a Microsoft, é uma jogada estratégica, pois agora possui parcerias com os principais LLMs (OpenAI e Meta) e acesso prioritário a GPUs da NVIDIA, além de ativos estratégicos como GitHub e Azure.
O Comportamento do ChatGPT está Mudando? Análise de um Estudo Recente
Um estudo conduzido por pesquisadores da Universidade de Stanford e da UC Berkeley levantou questões sobre a consistência do desempenho do ChatGPT (tanto GPT-3.5 quanto GPT-4) ao longo do tempo.
O Estudo e Suas Conclusões
O artigo científico, intitulado "How Is ChatGPT's Behavior Changing over Time?", sugere que os modelos podem estar se tornando menos capazes em certas tarefas, especialmente em matemática. Por exemplo, a precisão do GPT-4 na identificação de números primos caiu drasticamente de 97.6% em março de 2023 para apenas 2.4% em junho de 2023. Curiosamente, o GPT-3.5 demonstrou uma melhora na mesma tarefa durante o mesmo período.
Contrapontos e Debates
A OpenAI, por sua vez, nega que o GPT-4 tenha se tornado "mais burro", afirmando que cada nova versão é aprimorada. Uma hipótese levantada é que o uso mais intensivo dos modelos simplesmente expõe mais suas falhas. O especialista em IA Rob Lennon argumentou no Twitter que testar LLMs com base em problemas matemáticos não é a forma mais adequada de avaliar suas capacidades linguísticas, que são seu foco principal.
IA e Jornalismo: Parcerias e Ferramentas em Desenvolvimento
A inteligência artificial está cada vez mais presente no campo do jornalismo, com iniciativas para auxiliar na criação e distribuição de notícias.
OpenAI e o Projeto de Jornalismo Americano
A OpenAI anunciou uma parceria com o American Journalism Project, comprometendo-se a investir US$ 5 milhões e fornecer até US$ 5 milhões em créditos de API para ajudar organizações de notícias locais a utilizarem IA para aprimorar seu trabalho.
Google e a Ferramenta "Genesis" para Redação de Notícias
Paralelamente, o Google está testando uma ferramenta de IA, internamente chamada de "Genesis", capaz de redigir artigos de notícias. Esta ferramenta foi apresentada a grandes veículos como The New York Times, The Washington Post e The Wall Street Journal. No entanto, alguns executivos dessas publicações expressaram preocupação, considerando a ferramenta "perturbadora" e notando que ela parecia desconsiderar o esforço envolvido na produção de notícias precisas.
Questões de Direitos Autorais na Era da IA
O uso de material protegido por direitos autorais no treinamento de modelos de IA continua sendo um ponto de grande debate legal e ético.
Autores Exigem Fim do "Roubo" de Livros por IAs
Mais de 8.500 autores de ficção, não-ficção e poesia assinaram uma carta aberta instando as empresas de IA a cessarem o uso de suas obras para treinar LLMs sem permissão ou compensação. A carta solicita permissão para uso de material protegido, compensação justa pelo uso passado e contínuo das obras e compensação quando o resultado gerado pela IA infringir direitos autorais. É importante ressaltar que, segundo o artigo do TechCrunch, nenhuma ameaça legal explícita foi feita nesta carta.
Juiz Americano Encontra Falhas em Processo de Artistas Contra Empresas de IA
Em um caso relacionado, um juiz dos Estados Unidos identificou falhas no processo movido por artistas contra empresas de geração de imagens por IA, como Stability AI, Midjourney e DeviantArt. O juiz considerou improvável que os artistas tivessem sucesso em sua alegação de que as imagens geradas por prompts de texto usando seus nomes violavam seus direitos autorais, pois, de acordo com a Reuters, não haveria "similaridade substancial" entre as obras originais dos artistas e as imagens criadas pelos sistemas de IA.
Este é um terreno legal complexo. Artistas frequentemente se inspiram em outros artistas, mas a questão é se a IA está simplesmente se inspirando ou reproduzindo obras de forma que infrinja direitos autorais, especialmente quando há monetização envolvida.
GitHub Copilot Chat Beta Disponível para Organizações
O GitHub Copilot Chat, um assistente de chat baseado em IA para auxiliar no desenvolvimento de código, agora está disponível em versão beta para todas as organizações que utilizam o GitHub para empresas. Este assistente é treinado com dados do GitHub e visa facilitar e acelerar o processo de codificação.
Illumine AI: Convertendo Imagens 2D em Experiências 3D
A Illumine AI, uma empresa já mencionada por suas inovações em IA, lançou um novo recurso que permite converter imagens 2D, especialmente aquelas geradas por ferramentas como Midjourney, em ambientes 3D exploráveis. Para isso, é necessário um mapa de profundidade (depth map) da imagem 2D.
Uma maneira fácil de gerar esse mapa de profundidade é através da ferramenta online convert.leiapix.com. Após o upload da imagem e do mapa de profundidade na plataforma InstaVerse da Illumine AI, é possível navegar pela imagem como se fosse um espaço tridimensional. Embora a movimentação excessiva possa causar distorções, a ferramenta oferece uma forma divertida e gratuita de experimentar a conversão de 2D para 3D.
Conclusão
As últimas semanas foram repletas de avanços e debates significativos no campo da inteligência artificial. Desde novos modelos de geração de imagem e texto até parcerias estratégicas entre gigantes da tecnologia e a intensificação das discussões sobre ética e direitos autorais, fica claro que a IA está evoluindo em um ritmo acelerado. Para se manter atualizado sobre as últimas notícias e ferramentas de IA, visite FutureTools.io, um recurso que compila diariamente as novidades mais relevantes do setor. O futuro da IA está sendo moldado agora, e cada novo desenvolvimento nos aproxima de um cenário onde essa tecnologia estará ainda mais integrada ao nosso cotidiano.