Revolução da Inteligência Artificial: Níveis de AGI, Projeto Strawberry da OpenAI e Novas Ferramentas que Moldam o Futuro
O campo da Inteligência Artificial (IA) está em constante efervescência, com novidades surgindo a uma velocidade impressionante. Desde os planos ambiciosos da OpenAI para alcançar a Inteligência Artificial Geral (AGI) até o lançamento de novas ferramentas e modelos por diversas empresas, o cenário é de rápida transformação e, por vezes, controvérsia. Este artigo explora os desenvolvimentos mais recentes, analisando o progresso em direção à AGI, projetos inovadores como o "Strawberry", e o impacto ético e prático dessas tecnologias.
O Progresso da OpenAI Rumo à Inteligência Artificial Geral (AGI)
A OpenAI recentemente delineou um roteiro de cinco níveis que marcam o progresso em direção à AGI, um tema que tem gerado grande expectativa e debate na comunidade de IA.
Os Cinco Níveis da AGI Segundo a OpenAI
De acordo com a OpenAI, a jornada para a AGI pode ser compreendida através das seguintes etapas:
- Nível 1: Chatbots e IA com linguagem conversacional. Esta é a fase atual, exemplificada por modelos como o ChatGPT, Claude da Anthropic, e Llama 3 da Meta. Estes sistemas são capazes de manter conversas e gerar texto de forma coesa.
- Nível 2: Raciocinadores e resolução de problemas em nível humano. A OpenAI afirma estar muito próxima de atingir este nível, onde a IA poderá realizar tarefas que exigem um raciocínio mais complexo.
- Nível 3: Agentes e sistemas que podem tomar ações. Nesta etapa, a IA poderá executar tarefas de forma autônoma, como reservar voos ou responder a e-mails em nome do usuário.
- Nível 4: Inovadores e IA que pode auxiliar na invenção. Aqui, a IA não apenas executará tarefas, mas também contribuirá ativamente para a criação de ideias e soluções novas.
- Nível 5: Organizações e IA que pode realizar o trabalho de uma organização inteira. O ápice da AGI, onde sistemas de IA poderiam gerenciar e operar funcionalidades completas de uma empresa.
Atualmente, estamos firmemente no Nível 1, com a OpenAI indicando que o Nível 2 está prestes a ser alcançado.
Projeto Strawberry: A Nova Fronteira do Raciocínio em Inteligência Artificial
Coincidindo com a discussão sobre os níveis de AGI, surgiram notícias sobre o Projeto "Strawberry" da OpenAI. Trata-se de uma nova tecnologia de raciocínio, possivelmente um codinome para o que antes era conhecido como "Q*", conforme especulações. Informações de um documento interno vazado, divulgado pela Reuters, sugerem que o Strawberry visa permitir que a IA realize "pesquisas profundas", planejando e navegando na internet de forma autônoma. Há relatos de que este sistema alcançou mais de 90% de precisão em um conjunto de dados de problemas matemáticos de nível de campeonato. Este desenvolvimento é particularmente relevante, pois parece impulsionar a OpenAI em direção ao Nível 2 de sua escala de AGI.
Controvérsias e Desafios Éticos na Inteligência Artificial
A rápida evolução da IA também levanta questões éticas e controvérsias significativas, especialmente em relação às práticas de empresas líderes como a OpenAI.
Denúncias e Acordos de Confidencialidade na OpenAI
Recentemente, vieram à tona alegações de que a OpenAI estaria, de forma ilegal, impedindo seus funcionários de se comunicarem com reguladores governamentais sobre problemas internos. Essas denúncias, detalhadas em uma carta enviada a Gary Gensler, presidente da Comissão de Valores Mobiliários dos Estados Unidos (SEC), mencionam acordos de não depreciação (NDAs) que poderiam levar à perda de participação acionária investida caso fossem violados. A OpenAI refutou essas alegações, afirmando possuir uma política de proteção a denunciantes. Esta não é a primeira vez que as políticas e contratos da OpenAI com seus funcionários são questionados.
A Polêmica dos Dados de Treinamento de Inteligência Artificial e o Uso de Conteúdo do YouTube
Outra controvérsia significativa gira em torno da origem dos dados de treinamento para modelos de IA. Um artigo da Proof News alega que empresas como Apple, Nvidia e Anthropic teriam utilizado milhares de vídeos do YouTube para treinar seus modelos de IA, sem o consentimento dos criadores. Estes dados seriam provenientes do "The Pile", um vasto conjunto de dados compilado pela EleutherAI, que inclui transcrições de vídeos publicamente disponíveis no YouTube. Conteúdo de YouTubers proeminentes como MKBHD, MrBeast e PewDiePie estaria entre os dados utilizados. A Proof News disponibilizou uma ferramenta de busca para que criadores possam verificar se seus vídeos foram incluídos. Em resposta, a Apple declarou que seu modelo Apple Intelligence não foi treinado com dados do The Pile.
Avanços em Modelos de Inteligência Artificial: Novas Ferramentas e Capacidades
Apesar das controvérsias, o desenvolvimento de novas ferramentas e modelos de IA continua a todo vapor.
DALL-E e a Geração de Imagens com Inteligência Artificial Aprimorada
Especula-se que o modelo de geração de imagens DALL-E da OpenAI, integrado ao ChatGPT, recebeu uma atualização. Observa-se uma melhoria significativa na capacidade de gerar texto legível dentro das imagens, uma área em que o DALL-E anteriormente apresentava dificuldades. Para quem não possui uma conta ChatGPT Plus, é possível acessar o DALL-E 3 gratuitamente através do Bing Image Creator da Microsoft.
Sora: Demonstrações Impressionantes de Vídeo Gerado por Inteligência Artificial
Novos vídeos de demonstração do Sora, o modelo de texto para vídeo da OpenAI, foram compartilhados, exibindo clipes impressionantes que continuam a aumentar a expectativa por seu lançamento público. Embora ferramentas como Runway Gen-3 e Luma's Dream Machine já ofereçam capacidades de geração de vídeo por IA, o potencial do Sora, especialmente para vídeos mais longos, mantém a comunidade de IA em alerta.
Claude da Anthropic Chega ao Android
A Anthropic lançou o aplicativo do seu modelo de linguagem Claude para usuários de Android. Anteriormente disponível apenas para iOS, o Claude é considerado um dos modelos de linguagem mais avançados, competindo diretamente com o ChatGPT.
Gemini do Google: Inteligência Artificial na Tela Bloqueada
O Gemini, modelo de IA do Google, agora pode responder a perguntas gerais mesmo quando o celular Android está bloqueado, oferecendo maior conveniência aos usuários.
Google Vids: Criação de Vídeos com Inteligência Artificial para o Ambiente de Trabalho
O Google anunciou o Google Vids, um aplicativo de criação de vídeo alimentado por IA, projetado para o ambiente de trabalho e integrado ao Google Workspace. Atualmente em fase de testes no Workspace Labs, a ferramenta permite a criação de vídeos no estilo de apresentação de slides a partir de prompts, com funcionalidades para adicionar scripts, narração e vídeos de banco de imagens.
YouTube Music Inova com Busca por Som e Rádio Conversacional com Inteligência Artificial
O YouTube Music está implementando um novo recurso de busca por som, similar ao Shazam, que permite aos usuários encontrar músicas ouvindo um trecho, cantando ou cantarolando. Além disso, está em teste uma funcionalidade de rádio conversacional gerada por IA, onde os usuários podem descrever o que desejam ouvir para criar uma estação de rádio personalizada.
Microsoft Designer: Criatividade com Inteligência Artificial Integrada
O Microsoft Designer, uma plataforma de design gráfico similar ao Canva e alimentada por IA, está sendo integrado a diversos aplicativos da Microsoft, como Word e PowerPoint, através do Copilot. Também foi lançado um aplicativo móvel gratuito para iOS e Android, com recursos como a reformulação de imagens (restyle).
Mistral AI Lança Novos Modelos para Código e Uso Empresarial
A Mistral AI, empresa francesa de IA, lançou dois novos modelos: o Codestral Mamba, focado em geração de código mais rápida e longa (7 bilhões de parâmetros, janela de entrada de 256 mil tokens), e o Mistral-Nemo, uma colaboração com a Nvidia. O Mistral-Nemo é um modelo de 12 bilhões de parâmetros projetado para IA empresarial em dispositivos locais, com uma janela de contexto de 128 mil tokens e uma versão para download prometida para o futuro. Ambos são de código aberto.
GPT-4o Mini da OpenAI: Eficiência e Poder em um Modelo Compacto
A OpenAI lançou o GPT-4o Mini, um novo modelo pequeno, mais eficiente em termos de custo e projetado para substituir o GPT-3.5. Ele suporta texto e visão na API, com planos para incluir entradas e saídas de imagem, vídeo e áudio no futuro. Possui uma janela de contexto de 128 mil tokens e capacidade de saída de 16 mil tokens. O GPT-4o Mini já está disponível para usuários dos planos Gratuito, Plus e Team do ChatGPT e, segundo a OpenAI, supera outros modelos compactos como Gemini Flash e Claude Haiku em benchmarks.
Inteligência Artificial em Aplicações Especializadas e o Futuro da Educação
A IA continua a encontrar novas aplicações em campos especializados e a prometer transformações na educação.
Inteligência Artificial na Odontologia: Precisão em Raios-X Dentários
Um sistema de IA demonstrou uma precisão de 96% na determinação do sexo de indivíduos a partir de raios-X dentários. Embora menos preciso em crianças com menos de seis anos (que ainda não perderam os dentes de leite), essa tecnologia tem um potencial significativo para uso em forense, auxiliando na identificação de restos mortais.
Eureka Labs de Andrej Karpathy: A Educação Nativa em Inteligência Artificial
Andrej Karpathy, ex-pesquisador da OpenAI, anunciou a criação da Eureka Labs, uma empresa de IA e Educação. O objetivo é construir um novo tipo de escola que seja "nativa em IA". A proposta envolve professores especialistas criando os materiais do curso, enquanto um assistente de IA dimensiona o ensino, guiando os alunos de forma personalizada e no idioma de sua preferência. Este modelo visa superar a escassez de especialistas capazes de ensinar um grande volume de alunos globalmente.
Implicações Regulatórias e o Cenário Global da Inteligência Artificial
As complexidades regulatórias continuam a influenciar a disponibilidade de modelos de IA em diferentes regiões.
Meta e a Cautela com Modelos Multimodais de Inteligência Artificial na União Europeia
A Meta anunciou que não oferecerá seus futuros modelos de IA multimodais na União Europeia (UE) devido à falta de clareza no ambiente regulatório, especialmente em relação ao Regulamento Geral sobre a Proteção de Dados (RGPD). No entanto, os modelos Llama, que são apenas de texto, continuarão disponíveis. É possível que o Reino Unido, com uma postura regulatória distinta, tenha acesso a esses modelos multimodais.
O universo da Inteligência Artificial está se expandindo em uma velocidade vertiginosa, trazendo consigo tanto promessas de avanços incríveis quanto desafios éticos e regulatórios complexos. A busca pela AGI, a inovação em modelos de linguagem e geração de mídia, e as discussões sobre o uso de dados e a transparência das empresas são apenas algumas das facetas dessa revolução tecnológica. Acompanhar esses desenvolvimentos é crucial para entendermos o impacto profundo que a IA terá em todos os aspectos de nossas vidas.