A fronteira da pesquisa científica está sendo redefinida pela Inteligência Artificial (IA). Recentemente, a Sakana AI, uma empresa inovadora no campo da IA, anunciou um marco significativo: seu sistema, apelidado de "O Cientista de IA" (The AI Scientist), teve seu primeiro artigo científico totalmente gerado por IA, pesquisado, testado e publicado após passar pelo mesmo rigoroso processo de revisão por pares que trabalhos de cientistas humanos.
A Sakana AI, em colaboração com a Universidade da Colúmbia Britânica e a Universidade de Oxford, desenvolveu o "O Cientista de IA v2", uma versão aprimorada de seu sistema original. Este sistema é capaz de conduzir todo o ciclo de pesquisa científica de forma autônoma. O resultado mais recente desse esforço é um artigo que foi submetido e aceito em um workshop da renomada conferência ICLR (International Conference on Learning Representations), uma das principais conferências em aprendizado de máquina e inteligência artificial, ao lado de eventos como NeurIPS e ICML.
É crucial notar que o "O Cientista de IA" é um projeto de código aberto, disponível no GitHub, permitindo que a comunidade global de pesquisadores explore e contribua para seu desenvolvimento. A publicação aceita, intitulada "Regularização Composicional: Obstáculos Inesperados na Melhoria da Generalização de Redes Neurais", representa um passo importante, demonstrando que a IA pode não apenas auxiliar, mas também protagonizar a descoberta científica.
O processo pelo qual "O Cientista de IA" opera é uma emulação sofisticada do método científico humano, dividido em três fases principais, conforme detalhado pela Sakana AI:
A primeira etapa envolve a utilização de Modelos de Linguagem de Grande Escala (LLMs) para gerar ideias e planos de inovação. O sistema então realiza uma verificação de novidade, consultando bancos de dados como o Semantic Scholar, para garantir que a ideia não seja uma repetição de pesquisas existentes. As ideias são pontuadas e arquivadas com base em seu potencial.
Uma vez que uma ideia promissora é selecionada, o Cientista de IA cria um modelo de experimento. O código necessário para o experimento é gerado usando LLMs e ferramentas como o Aider, uma ferramenta de codificação assistida por IA. O sistema executa o experimento, coleta dados numéricos e visuais, e atualiza seu plano com base nos resultados. Esse ciclo de experimentação e atualização é iterativo, permitindo refinar a pesquisa.
Após a conclusão dos experimentos, o sistema utiliza um modelo de manuscrito para redigir o artigo científico. O texto é gerado via LLM e Aider, resultando em um manuscrito completo. Finalmente, outro LLM realiza a revisão do artigo, preparando-o para submissão. Todo esse processo visa emular a comunidade científica humana, desde a concepção da ideia até a publicação.
O artigo gerado pelo Cientista de IA aborda um tema fundamental para o próprio avanço da IA: "Regularização Composicional: Obstáculos Inesperados na Melhoria da Generalização de Redes Neurais". Essencialmente, a IA pesquisou como melhorar a si mesma, investigando métodos de regularização para treinar redes neurais que possam aprimorar sua generalização composicional.
Um aspecto interessante destacado pela Sakana AI é que o artigo reportou um "resultado negativo". Isso significa que a hipótese testada não se confirmou da maneira esperada. Na ciência, resultados negativos são tão importantes quanto os positivos, pois ajudam a direcionar futuras pesquisas e evitam que outros pesquisadores sigam caminhos infrutíferos. A capacidade da IA de identificar e publicar tais resultados é um avanço, considerando que muitos pesquisadores humanos tendem a focar na publicação de resultados positivos.
O manuscrito recebeu uma pontuação média de revisão de 6.33 no workshop da ICLR, posicionando-o acima do limiar médio de aceitação, o que atesta sua qualidade e relevância.
Apesar do sucesso, a Sakana AI é transparente sobre os desafios e limitações. O artigo foi aceito em uma trilha de workshop, que, embora competitiva (taxas de aceitação entre 60-70%), geralmente possui critérios menos rigorosos que a trilha principal de conferências (taxas de aceitação entre 20-30%). Além disso, o sistema, por ser baseado em LLMs de última geração, tem seu desempenho diretamente ligado à performance desses modelos. Se os modelos de fundação continuarem melhorando, o Cientista de IA também melhorará.
A empresa também mencionou que o artigo continha alguns erros, como citações incorretas, que são aspectos a serem aprimorados. No entanto, a transparência do processo, trabalhando em conjunto com os organizadores da ICLR e informando sobre a natureza gerada por IA do trabalho, é um passo importante para estabelecer normas éticas para a ciência gerada por IA.
Este desenvolvimento é um vislumbre do que pode ser a "explosão de inteligência", um conceito onde a IA se torna capaz de se autoaperfeiçoar recursivamente, levando a um avanço exponencial. Como referenciado no vídeo, o documento "Situational Awareness" de Leopold Aschenbrenner explora essa possibilidade. A capacidade de uma IA gerar conhecimento novo e publicável, especialmente sobre seu próprio funcionamento e melhoria, é um indicativo poderoso dessa trajetória.
O futuro do Cientista de IA e de sistemas semelhantes é promissor. A expectativa é que a IA continue a melhorar, potencialmente atingindo e ultrapassando os níveis humanos na geração de publicações científicas de alto impacto, não apenas em conferências de aprendizado de máquina, mas também nos principais periódicos científicos mundiais. A Sakana AI acredita que o mais importante não é como a ciência gerada por IA é julgada em comparação com a ciência humana, mas se suas descobertas auxiliam no florescimento humano, curando doenças ou expandindo nosso conhecimento.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.