Notícias de IA: GPT-4 Mais Rápido, DALL-E 3 no ChatGPT, Robôs Policiais e Mais!

Explore as últimas notícias de IA: GPT-4 mais rápido, DALL-E 3 no ChatGPT, mudanças na OpenAI, robôs policiais em Dubai, e muito mais. Fique por dentro das novidades!

Notícias de IA: GPT-4 Mais Rápido, DALL-E 3 no ChatGPT, Robôs Policiais e Mais!

Últimas Novidades no Mundo da Inteligência Artificial

O universo da Inteligência Artificial (IA) está em constante ebulição, e esta semana, apesar de um ritmo mais calmo em grandes anúncios, trouxe desenvolvimentos notáveis que merecem destaque. Desde otimizações em modelos de linguagem até novas aplicações em robótica e arte generativa, o cenário da IA continua a surpreender e a expandir suas fronteiras.

Otimização e Acesso Ampliado a Modelos de Linguagem

Um dos destaques é a crescente velocidade do GPT-4. Conforme monitoramento da empresa Portkey, a latência do GPT-4 tem diminuído consistentemente, aproximando-se dos níveis do GPT-3.5. Essa melhoria de desempenho é crucial para aplicações que exigem respostas rápidas, tornando o modelo mais robusto e versátil.

Falando em modelos da OpenAI, a empresa anunciou oficialmente a disponibilidade do DALL-E 3 no ChatGPT Plus e Enterprise. Embora muitos usuários já tivessem acesso prévio, a oficialização marca a ampla distribuição dessa poderosa ferramenta de geração de imagens. Para utilizá-la, basta ser assinante do ChatGPT Plus e selecionar a opção DALL-E 3 sob o GPT-4 na interface.

Mudanças Estratégicas e o Foco em AGI na OpenAI

Rowan Cheung, um observador atento do setor, apontou uma mudança sutil, porém significativa, nos valores fundamentais da OpenAI. A empresa agora enfatiza um "Foco em AGI" (Inteligência Artificial Geral), declarando: "Estamos comprometidos em construir uma AGI segura e benéfica que terá um impacto positivo massivo no futuro da humanidade. Qualquer coisa que não ajude com isso está fora de escopo."

Essa mudança de direcionamento levanta discussões sobre o que realmente significa AGI. Em uma entrevista, Sam Altman, CEO da OpenAI, definiu AGI como o "equivalente a um humano mediano que você poderia contratar como colega de trabalho... que poderia fazer qualquer coisa que você ficaria feliz com um colega de trabalho remoto fazendo apenas atrás de um computador... o que inclui aprender a ser médico, aprender a ser um programador muito competente... uma das habilidades de uma AGI não é nenhum marco específico, mas a meta-habilidade de aprender a descobrir as coisas e que ela pode decidir se tornar boa no que quer que você precise."

Em outra notícia relacionada à OpenAI, a empresa decidiu descontinuar o projeto "Arrakis". Inspirado no universo de "Dune", o modelo Arrakis estava sendo desenvolvido com o objetivo de baratear o custo de aplicações de IA como o ChatGPT, mas foi abandonado por não atingir as expectativas de eficiência.

Expansão e Controvérsias no Ecossistema de Chatbots

A Anthropic anunciou que seu chatbot, Claude.ai, está agora disponível em 95 países. Conhecido por sua grande janela de contexto, o Claude é especialmente útil para resumir longos documentos em PDF, arquivos CSV e transcrições. No entanto, a Anthropic enfrenta um processo judicial da Universal Music por supostamente distribuir letras de músicas protegidas por direitos autorais e utilizá-las no treinamento de seus modelos. Curiosamente, enquanto o Claude 2 fornece letras quando solicitado, o ChatGPT se recusa a fazê-lo para músicas protegidas, e o Google já exibe letras de músicas há anos.

A Inflection AI, criadora do chatbot Pi, anunciou que sua IA agora pode pesquisar na web em tempo real, fornecendo respostas atualizadas aos usuários.

Enquanto isso, a empresa chinesa Baidu afirmou que seu chatbot Ernie AI não é inferior ao GPT-4, destacando melhorias em compreensão, geração, raciocínio e memória em sua versão Ernie 4.0. No entanto, o modelo ainda não está disponível publicamente e, historicamente, tem sido focado no idioma chinês.

Avanços e Desafios na Robótica e Hardware para IA

No campo do hardware, novas restrições de exportação dos EUA bloquearam o envio do chip H800 da Nvidia para a China. Anteriormente, o H100 já havia sido bloqueado por seu alto poder de processamento. A Nvidia havia desenvolvido o H800, com especificações inferiores, como uma alternativa para o mercado chinês, mas as novas regras fecharam essa brecha, afetando também os chips A800.

Em notícias sobre robótica, a Amazon declarou que seus novos robôs alimentados por IA reduzirão o tempo de atendimento de pedidos em 25%. Em Dubai, a polícia está implementando carros de patrulha autônomos equipados com drones, câmeras 360º e tecnologia de reconhecimento facial para patrulhar bairros. Além disso, foi divulgado um vídeo do robô humanoide Figure 01, demonstrando sua capacidade de caminhada dinâmica.

A Nvidia também anunciou o Eureka, uma técnica aprimorada de aprendizado por reforço que visa dotar robôs de extrema destreza manual, utilizando modelos de linguagem grandes (LLMs).

IA na Geração de Arte e Conteúdo Multimídia

O mercado de arte generativa por IA continua aquecido. A plataforma Wirestock.io, patrocinadora do vídeo que originou este artigo, permite que criadores vendam suas imagens geradas por IA e fotografias de banco de imagens. A Wirestock facilita o processo ao submeter o conteúdo para diversos sites de stock, cuidando de metadados, títulos e tags. Eles também oferecem um bot no Discord para geração, mixagem e reimaginação de imagens. Usuários premium podem reter 100% dos ganhos, e há um cupom de desconto (MATT20) para 20% de desconto na assinatura.

O Midjourney, popular ferramenta de geração de imagens, anunciou atualizações: o Upscaler v5.2 trará um modo sutil, upscaling de 2x e 4x, mais detalhes e melhor qualidade de imagem; a versão v5.2 também incluirá um novo customizador de estética e estilo. A equipe do Niji Journey lançou um aplicativo para Android e iOS. O aguardado site do Midjourney terá sua Fase 1 lançada na próxima semana, com a Fase 2 prevista para o mês seguinte, embora a geração de imagens diretamente pelo site não esteja inicialmente disponível. A versão V6 do Midjourney, com melhor compreensão de prompts e maior coerência, tem lançamento previsto para o final de novembro.

Outra ferramenta interessante é o Morph Studio, que promete gerar clipes de vídeo de 5 a 7 segundos em alta resolução a partir de texto. Já a Masterpiece X, em parceria com a Nvidia, está desenvolvendo a capacidade de gerar assets 3D animados a partir de prompts de texto.

Outras Aplicações e Implicações da IA

IA Aprendendo a Jogar Pokémon

Um vídeo viral de Peter Whidden demonstrou uma IA treinada com aprendizado por reforço para jogar Pokémon. A IA opera múltiplas instâncias do jogo simultaneamente, aprendendo através de um sistema de pontuação. O código do projeto está disponível no GitHub para interessados.

Impacto da IA no Mercado de Trabalho

O Stack Overflow, conhecido site de perguntas e respostas para programadores, demitiu mais de 100 funcionários (28% de sua equipe). Esse movimento é parcialmente atribuído ao crescente uso de ferramentas de IA como ChatGPT e Claude por desenvolvedores para obter ajuda com codificação, reduzindo a dependência da plataforma.

IA na Publicidade e Comunicação

O YouTube está implementando um novo recurso de publicidade baseado em IA que permite às marcas direcionar anúncios para momentos culturais específicos. A IA identificará vídeos relacionados a eventos (como o Halloween, por exemplo) para otimizar a veiculação dos anúncios.

A Descript, ferramenta de edição de áudio e vídeo, anunciou um grande lançamento de recursos de IA, incluindo novas vozes sintéticas, funcionalidade de texto para fala aprimorada e autorização de voz ultrarrápida, melhorando significativamente sua ferramenta Overdub.

De forma controversa, o prefeito de Nova York, Eric Adams, utilizou IA para realizar robocalls em idiomas que ele não fala, como espanhol, iídiche, mandarim, cantonês e crioulo haitiano. A iniciativa gerou críticas, com alguns considerando-a antiética e "orwelliana".

Decodificando Imagens da Atividade Cerebral

A Meta divulgou uma pesquisa sobre a decodificação de imagens em tempo real a partir da atividade cerebral. Utilizando Magnetoencefalografia (MEG), uma técnica de neuroimagem não invasiva, a IA consegue interpretar as representações visuais processadas pelo cérebro. Este método difere de abordagens anteriores baseadas em ressonância magnética (MRI) e representa um avanço na interface cérebro-computador.

O campo da Inteligência Artificial segue em rápida evolução, trazendo tanto promessas quanto desafios. Acompanhar essas transformações é fundamental para entender o impacto que a IA terá em diversos aspectos de nossas vidas.