Apesar da típica calmaria de notícias durante a semana de Natal, o universo da Inteligência Artificial (IA) não parou. Um dos destaques foi o anúncio do mais recente modelo da OpenAI, o o3, como parte de sua iniciativa "12 Dias de Anúncios". Embora o acesso ao o3 ainda seja limitado, os benchmarks divulgados demonstram um avanço significativo em relação aos seus predecessores e concorrentes.
O modelo o3 da OpenAI, revelado no último dia da série de anúncios da empresa, promete revolucionar diversas áreas com seu desempenho superior. A OpenAI compartilhou dados que colocam o o3 à frente em tarefas complexas, superando inclusive o já robusto modelo o1.
Os resultados apresentados pela OpenAI são notáveis:
No benchmark ARC-AGI, que envolve a resolução de quebra-cabeças visuais, o o3 da OpenAI também mostrou um progresso substancial. Com baixo custo computacional, atingiu 75.7% de acerto, e com alto custo, chegou a 87.5%. Para contextualizar, o desempenho humano médio neste teste é de aproximadamente 76%, e o melhor resultado do modelo o1 foi de 32%. Este avanço é um indicativo da crescente capacidade da IA em tarefas que exigem raciocínio abstrato.
Apesar dos resultados promissores, o custo computacional para operar o o3 da OpenAI, especialmente para atingir os scores mais altos no ARC-AGI, ainda é considerável. Em um gráfico apresentado (que utiliza uma escala logarítmica), o custo por tarefa para o score de 87.5% no ARC-AGI ficaria entre $1.000 e $10.000. Isso levanta questões sobre a viabilidade prática e a verdadeira proximidade da Inteligência Artificial Geral (AGI), dado que modelos como o o3, embora incrivelmente capazes, ainda são caros e possuem limitações.
Um artigo recente do The Information trouxe à tona detalhes sobre a complexa parceria entre a OpenAI e a Microsoft. Uma cláusula no acordo estipula que a parceria pode ser encerrada ou reestruturada caso a OpenAI alcance a AGI. Isso gerou especulações de que a OpenAI poderia declarar ter atingido a AGI para se desvencilhar de certas obrigações contratuais com a Microsoft.
Aparentemente, o acordo define que a AGI seria considerada alcançada quando a OpenAI desenvolver sistemas capazes de gerar lucros que totalizem cerca de US$100 bilhões para seus primeiros investidores, incluindo a Microsoft. Considerando que a OpenAI atualmente opera com perdas anuais na casa dos bilhões e não projeta lucro antes de 2029, essa meta financeira para AGI parece distante. Além disso, a "declaração de AGI suficiente" fica a critério do conselho da OpenAI, adicionando outra camada de subjetividade à questão.
Além do modelo o3, a OpenAI continua a expandir suas ofertas e a interagir com a comunidade.
O modelo o1 da OpenAI, antecessor do o3, está agora disponível dentro do GitHub Copilot. Usuários com assinatura paga podem utilizá-lo, com um limite de 10 mensagens a cada 12 horas. A versão gratuita do Copilot, anunciada recentemente, provavelmente não incluirá o acesso ao o1.
O CEO da OpenAI, Sam Altman, utilizou a plataforma X (anteriormente Twitter) para pedir sugestões sobre o que a empresa deveria construir ou consertar em 2025. Suas respostas a algumas ideias foram reveladoras:
A semana também trouxe outras notícias importantes no setor de IA:
Mesmo com o período festivo, o campo da Inteligência Artificial continua em franca expansão. O anúncio do o3 da OpenAI, as movimentações financeiras da xAI, os avanços em modelos open source como o DeepSeek-V3, e as diversas aplicações práticas que surgem diariamente, desde educação até entretenimento, pintam um cenário de grandes transformações para 2025. A discussão sobre AGI se intensifica, mas os desafios de custo e as definições ainda vagas mostram que há um caminho a ser percorrido. Para se manter atualizado com todas essas novidades e descobrir as ferramentas de IA mais recentes, visite o Future Tools.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.