ERNIE 4.5 e X1 da Baidu: Novos Modelos de IA Desafiam DeepSeek e ChatGPT com Preços Competitivos
Introdução à Nova Geração de Modelos de IA da Baidu
O cenário da inteligência artificial (IA) está em constante evolução, com novos modelos surgindo e desafiando os gigantes estabelecidos. Recentemente, a Baidu, uma das maiores empresas de tecnologia da China, revelou seus mais novos modelos de IA, o ERNIE 4.5 e o ERNIE X1. Esses lançamentos prometem um desempenho comparável ao DeepSeek R1 e até mesmo ao ChatGPT 4.5, mas com um custo de API drasticamente inferior, acirrando ainda mais a corrida pela supremacia em IA.
Modelos de IA da Baidu: ERNIE 4.5 e X1 em Detalhes
A Baidu apresentou o ERNIE 4.5 como seu mais recente modelo de fundação, enquanto o ERNIE X1 é descrito como um modelo com foco em raciocínio profundo e capacidades multimodais. De acordo com a empresa, o ERNIE X1 entrega um desempenho similar ao DeepSeek R1 pela metade do preço. Ambos os modelos foram disponibilizados gratuitamente para usuários individuais através do site oficial yiyan.baidu.com, com acesso antecipado para alguns usuários.
A Promessa de Desempenho Superior
A Baidu afirma que seus novos modelos alcançam melhorias significativas em compreensão, geração, raciocínio e memória, além de aprimoramentos notáveis na prevenção de alucinações, raciocínio lógico e habilidades de codificação. A empresa também planeja expandir a integração do ERNIE 4.5 e X1 em seu ecossistema, incluindo o Baidu Search e o aplicativo Wenxiaoyan.
Comparativo de Desempenho: Modelos de IA da Baidu vs. Concorrentes
Os benchmarks apresentados pela Baidu e por analistas indicam que o ERNIE 4.5 e o X1 podem superar o DeepSeek R1 e o ChatGPT 4.5 em diversas métricas. Em testes de capacidade multimodal, o ERNIE 4.5 demonstrou pontuações superiores em tarefas como Average Score, OCRBench e MathVista. Em capacidades de texto, o ERNIE 4.5 também se destacou em benchmarks como C-Eval e CMath, superando o DeepSeek-V3-Chat e o GPT-4.5 em alguns casos. Esses resultados sugerem um avanço significativo da Baidu no desenvolvimento de modelos de IA competitivos globalmente.
Análise de Custo-Benefício: Preços de API dos Modelos de IA da Baidu
Um dos aspectos mais impactantes dos novos modelos da Baidu é a sua estrutura de preços para API. Enquanto o GPT-4.5 pode custar $75 para entrada (por 1 milhão de tokens) e $150 para saída, o ERNIE 4.5 e o DeepSeek-R1 apresentam um custo de apenas $0.55 para entrada e $2.2 para saída. Mais impressionante ainda, o ERNIE X1, focado em raciocínio, custa $0.28 para entrada e $1.1 para saída, aproximadamente metade do preço do DeepSeek-R1. Essa diferença de preço, que pode chegar a ser 1% do valor do GPT-4.5, torna os modelos da Baidu uma alternativa extremamente atraente para desenvolvedores e empresas que buscam IA de alta performance com custos reduzidos.
Testes Práticos dos Modelos de IA da Baidu: ERNIE e DeepSeek
Apesar das promessas nos benchmarks e preços, a experiência prática com os modelos ERNIE ainda apresenta desafios e inconsistências, especialmente quando comparada à usabilidade de modelos como o DeepSeek.
Acessibilidade e Interface dos Modelos de IA da Baidu
Acessar os modelos ERNIE através da plataforma yiyan.baidu.com pode ser um desafio para usuários fora da China. A interface primariamente em chinês exige tradução constante, e o processo de cadastro requer verificação por telefone, o que pode ser um obstáculo. Em contraste, o chat.deepseek.com oferece uma experiência mais direta e em inglês, facilitando o acesso. Dentro da plataforma da Baidu, é possível alternar entre diferentes versões do ERNIE, incluindo X1, 4.5, 4.0 Turbo e 3.5.
Desempenho em Escrita com os Modelos de IA da Baidu
Em um teste de geração de artigo otimizado para SEO com o tema "SEO Training Japan", o ERNIE 4.5 apresentou falhas iniciais, com a mensagem "Something went wrong, please regenerate" aparecendo repetidamente. Embora o vídeo indique uma eventual geração bem-sucedida após várias tentativas, a confiabilidade no momento do teste se mostrou um ponto de atenção. O DeepSeek V3, por sua vez, conseguiu gerar o conteúdo solicitado.
Capacidade de Codificação dos Modelos de IA da Baidu
No teste de codificação para criar um jogo da cobrinha (Snake) auto-jogável em HTML, CSS e JavaScript, os resultados foram variados:
- DeepSeek R1: Produziu o melhor resultado, com um jogo funcional e auto-jogável.
- ERNIE X1: Gerou um código funcional, com a cobrinha se movendo rapidamente.
- ERNIE 4.5: Também entregou um código funcional e jogável.
- DeepSeek V3: Apresentou um resultado estranho, não correspondendo exatamente a um jogo da cobrinha tradicional.
Neste cenário, o DeepSeek R1 se destacou, mas os modelos ERNIE X1 e 4.5 demonstraram boa capacidade de codificação.
Desafio de Raciocínio para os Modelos de IA da Baidu
No "Enigma da Maçã no Inverno" ("Há uma árvore do outro lado de um rio no inverno. Como posso pegar uma maçã?"), que testa o raciocínio lógico e a criatividade na resolução de problemas, os modelos ERNIE X1 e ERNIE 4.5 falharam em fornecer respostas completas ou lógicas, frequentemente interrompendo a geração ou apresentando erros. O DeepSeek V3 e o R1, por outro lado, ofereceram soluções mais coerentes, embora o DeepSeek R1 inicialmente não tenha reconhecido que maçãs não crescem no inverno, mas ainda assim propôs métodos para atravessar o rio ou usar ferramentas.
Análise Final: Prós e Contras dos Modelos de IA da Baidu
Os novos modelos ERNIE 4.5 e X1 da Baidu demonstram um potencial imenso, especialmente em termos de custo-benefício e desempenho em benchmarks específicos. A capacidade de codificação também se mostrou promissora.
No entanto, a experiência atual de uso revela instabilidades e problemas de acessibilidade para o público global. A necessidade de tradução e a dificuldade no processo de cadastro são barreiras. Além disso, as falhas em tarefas de escrita e raciocínio, mesmo que possivelmente temporárias devido ao grande volume de acessos iniciais ou por serem versões beta, indicam que os modelos ainda precisam de refinamento para uma utilização prática e confiável em comparação com concorrentes mais estabelecidos como o DeepSeek.
Outro ponto é que, atualmente, os modelos ERNIE não são open source, embora a Baidu tenha anunciado planos para liberar o ERNIE 4.5 até 30 de junho. Plataformas como OpenRouter.ai e Ollama, que facilitam o acesso e a hospedagem local de diversos modelos, ainda não listam os modelos ERNIE, limitando sua acessibilidade para desenvolvedores que preferem esses ecossistemas.
O Impacto dos Modelos de IA da Baidu no Cenário Global
A entrada agressiva da Baidu com modelos de alta performance e preços de API extremamente competitivos sinaliza uma intensificação na corrida global pela IA. A China continua a investir pesadamente em IA, e empresas como a Baidu estão demonstrando capacidade de desenvolver modelos que podem rivalizar com os melhores do mundo. A eventual abertura de código do ERNIE 4.5 poderá acelerar ainda mais sua adoção e desenvolvimento pela comunidade global.
A comparação feita por Julian Goldie, criador do AI Profit Boardroom, destaca tanto o potencial disruptivo quanto os desafios atuais desses novos modelos. A confiabilidade e a facilidade de acesso serão cruciais para que os modelos ERNIE conquistem uma fatia significativa do mercado global.
Conclusão
Os modelos ERNIE 4.5 e X1 da Baidu são, sem dúvida, uma adição empolgante ao ecossistema de IA. Seu desempenho em benchmarks e, principalmente, seus preços de API revolucionários, têm o potencial de democratizar o acesso a IA de ponta. Contudo, os desafios de acessibilidade e a instabilidade demonstrada nos testes práticos indicam que ainda há um caminho a ser percorrido. À medida que a Baidu refina seus modelos e cumpre a promessa de torná-los open source, podemos esperar um impacto ainda maior no competitivo mercado de inteligência artificial.