A inteligência artificial (IA) continua a transformar o panorama da criação de conteúdo, e uma das áreas mais impactadas é a geração de vídeo. Recentemente, um novo protagonista surgiu nesse cenário: o Wan AI, desenvolvido pelo gigante tecnológico Alibaba. Este gerador de vídeo IA se destaca não apenas por suas capacidades impressionantes, mas também por ser totalmente gratuito e de código aberto, prometendo democratizar o acesso a ferramentas de produção de vídeo de alta qualidade.
O Wan AI, especificamente sua versão Wan 2.1, é um modelo de IA projetado para criar vídeos a partir de descrições textuais (text-to-video) ou imagens estáticas (image-to-video). Sua natureza open source, disponibilizada sob a licença Apache 2.0, permite que qualquer pessoa possa baixá-lo, utilizá-lo e modificá-lo sem custos, inclusive para fins comerciais. Isso representa um avanço significativo em relação a muitos modelos de ponta que são proprietários e exigem assinaturas ou pagamentos por uso.
O vídeo de apresentação demonstra uma série de exemplos que atestam a qualidade e versatilidade do Wan AI. A ferramenta se mostra capaz de gerar vídeos com notável consistência, realismo e habilidade em lidar com movimentos complexos.
A funcionalidade text-to-video do Wan AI permite que usuários transformem simples comandos de texto em cenas visualmente ricas. Exemplos notáveis incluem:
Além da geração a partir de texto, o Wan AI também se destaca na conversão de imagens estáticas em clipes animados. Isso abre portas para animar fotografias existentes ou imagens geradas por outras IAs, como as criadas com Stable Diffusion.
O vídeo compara o desempenho do Wan 2.1 com outros modelos de IA de vídeo de ponta, como o Veo2 do Google, Kling 1.6 Pro e Hailuo Minimax. Em diversos prompts desafiadores, o Wan AI demonstrou resultados competitivos e, em alguns casos, superiores, especialmente na consistência e realismo de movimentos complexos e interações.
Um exemplo destacado foi a geração de uma luta de espadas entre samurais, onde o Wan AI produziu uma cena com física e movimentos realistas, superando as distorções e movimentos não naturais vistos nas gerações dos modelos comparados. Similarmente, em prompts como "mulher rindo incontrolavelmente com lágrimas escorrendo" e "ginasta realizando um mortal para trás perfeito na trave de equilíbrio", o Wan AI se mostrou capaz de capturar a essência da ação com maior fidelidade.
É importante notar que, enquanto o Veo2, Kling 1.6 Pro e Hailuo Minimax são modelos comerciais e de código fechado, o Wan AI oferece um desempenho comparável sendo gratuito e acessível. O vídeo menciona que, de acordo com o leaderboard do VBench, uma plataforma de avaliação de modelos de vídeo, o Wan 2.1 figura no topo em termos de pontuação total, superando inclusive modelos renomados como Sora e Luma.
Existem diversas maneiras de experimentar o poder do Wan AI.
Para quem não possui o hardware necessário ou prefere uma solução rápida, existem plataformas online:
Para usuários com conhecimento técnico e hardware adequado, o Wan AI pode ser instalado e executado localmente através do ComfyUI, uma interface gráfica popular para modelos de difusão. Este método permite uso ilimitado e gratuito.
Requisitos e Instalação:
O processo envolve selecionar os modelos corretos nos nós do ComfyUI, inserir os prompts positivos e negativos, ajustar parâmetros como resolução, duração do vídeo (em frames) e, então, iniciar a geração.
O vídeo também menciona uma parceria com a NVIDIA para um sorteio de uma placa de vídeo RTX 6000 Ada com 48GB de VRAM, assinada por Jensen Huang, CEO da NVIDIA. Para participar, é necessário se registrar e assistir a uma sessão do evento GTC, que ocorrerá de 17 a 21 de março, disponível tanto presencialmente em San Jose, Califórnia, quanto virtualmente.
A chegada de ferramentas como o Wan AI é um marco importante. A combinação de alta performance com a gratuidade e a natureza de código aberto tem o potencial de democratizar drasticamente a criação de vídeos, permitindo que mais criadores, desenvolvedores e empresas explorem o poder da IA para contar histórias e comunicar ideias visualmente. A licença Apache 2.0, que permite uso comercial, é um grande incentivo para a adoção em larga escala.
Em resumo, o Wan AI do Alibaba se apresenta como uma solução robusta e acessível no crescente campo da geração de vídeo por inteligência artificial, desafiando modelos estabelecidos e abrindo novas possibilidades criativas para todos.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.