Estamos entrando em uma nova fase da geração de vídeos por inteligência artificial (IA), e os resultados são fenomenais. Com um único prompt, agora é possível criar conteúdo visual dinâmico, incluindo fala, efeitos sonoros, música de fundo e até movimentos de câmera complexos. Uma das ferramentas na vanguarda dessa revolução é o Google Veo, uma ferramenta de vídeo inovadora do Google.
O Google Veo se destaca por sua capacidade de gerar vídeos de alta qualidade com um nível de detalhe e realismo impressionante. Ele estabelece um novo padrão que outros geradores de vídeo, como Kling AI, Minimax, Luma Dream Machine e OpenAI Sora, terão que se esforçar para alcançar. Embora não seja perfeito, o Google Veo demonstra um excelente trabalho com a física dos objetos e uma morfologia de personagem consideravelmente reduzida em comparação com outras ferramentas, especialmente em cenas que não exigem movimento excessivo do personagem.
O Google Veo não se limita a vídeos realistas; ele também eleva a qualidade das animações 3D. Em vez de personagens com movimentos lentos, é possível criar clipes que se assemelham a animações profissionais. Alguns dos recursos notáveis incluem:
O acesso ao Google Veo é feito através da plataforma Flow. Veja um passo a passo simplificado:
Primeiramente, acesse o site do Flow (o vídeo menciona que o link estará na descrição). Faça login com sua conta Gmail.
Será necessário assinar um dos planos do Google AI. Existem duas opções principais: Pro e Ultra. Para quem deseja apenas testar a ferramenta, o Google oferece um mês de assinatura gratuita para o plano Pro, que pode ser cancelado antes do término do período para evitar cobranças. A plataforma também envia um alerta antes do fim do teste.
Após a assinatura, ao criar um novo projeto, você encontrará uma interface similar a outros geradores de vídeo. Existem três opções principais de geração:
Antes de gerar, é possível ajustar parâmetros como o número de saídas por prompt e a qualidade. Existem três modelos de qualidade:
O plano Pro oferece 1000 créditos, permitindo gerar até 10 vídeos com o modelo Veo3. Para mais, é necessário o plano Ultra.
No vídeo, foi utilizado um prompt simples: “uma mulher cortando cebolas em uma cozinha moderna. Ela coloca as cebolas picadas em uma frigideira e, enquanto faz isso, levanta a cabeça, olha para a câmera e diz: 'chegue aqui, estamos quase lá. Muito em breve você poderá criar este estilo de conteúdo sem precisar ficar na frente de uma câmera'”. O resultado foi considerado bom, apesar de a personagem não ter completado a frase no primeiro teste. No segundo, a frase foi dita corretamente.
Para testar a capacidade da ferramenta com personagens conhecidos, foi utilizado o Thanos dos Vingadores. O prompt incluía o personagem com sua armadura e a Manopla do Infinito, em um campo de batalha, dizendo a frase “Eu sou inevitável” e estalando os dedos. O Veo2 gerou um clipe do Thanos, o que é surpreendente, já que muitas IAs costumam bloquear a geração de personagens protegidos. No entanto, ao tentar com o Veo3, o personagem gerado foi diferente, embora a dublagem e a cena tenham sido satisfatórias, exceto pelo estalar de dedos que não saiu como esperado.
O Flow possui um recurso chamado Scene Builder. É possível adicionar uma cena existente (como a da mulher cozinhando) e estendê-la. Para isso, move-se a linha do tempo para o último frame, clica-se no ícone de “+” e seleciona-se “Salvar frame como ativo”. Em seguida, na opção “Frames para Vídeo”, seleciona-se a imagem salva e digita-se a ação desejada para a continuação. No exemplo, foi adicionado: “ela começa a cortar tomates e os joga dentro da frigideira”. O vídeo menciona que o áudio parece não funcionar bem dentro do Scene Builder.
É possível fazer upload de uma imagem que não foi gerada pela IA. No exemplo, foi utilizada uma imagem de um avatar e o prompt: “um homem sentado em uma mesa com um laptop à sua frente. Ele se levanta da mesa e caminha em direção à porta. Ele abre a porta e sai da sala”. O teste com Veo2 resultou em um vídeo onde o personagem se levantava, mas o restante da cena ficou confuso. Com Veo3, o resultado foi similar, indicando que a geração de imagem para vídeo ainda pode precisar de melhorias ou prompts mais descritivos.
Saber o que você quer não é o suficiente; é crucial fornecer à IA o prompt correto. O vídeo demonstra o uso de um construtor de prompts no ChatGPT para auxiliar nesse processo, onde o usuário responde a perguntas sobre os personagens, cenário, diálogo, som e ângulo de câmera para gerar um prompt detalhado.
Um exemplo de prompt gerado pelo ChatGPT para uma cena inspirada em Dean Schneider resultou em um vídeo impressionante de um homem interagindo com um leão, demonstrando o potencial da ferramenta quando alimentada com descrições ricas.
O Google Veo é, sem dúvida, uma ferramenta com potencial para transformar a criação de conteúdo. A qualidade dos vídeos, a consistência dos personagens e a capacidade de integrar elementos complexos como áudio e movimentos de câmera abrem um leque de possibilidades para criadores de conteúdo, animadores e profissionais de marketing.
Apesar de alguns contratempos, como a questão do áudio no Scene Builder ou a performance da conversão de imagem para vídeo em alguns testes, o Google Veo já se posiciona como um forte concorrente no mercado de IA para geração de vídeos. Resta aguardar as próximas atualizações e como a comunidade criativa explorará todo o seu potencial.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.