A inteligência artificial (IA) generativa para vídeo está avançando a passos largos, e ferramentas como o Kling AI estão na vanguarda dessa transformação. Recentemente, o Kling AI lançou seu modelo 2.0, prometendo melhorias significativas em dinâmicas, estética e aderência aos prompts, abrindo um leque de possibilidades para criadores de conteúdo e artistas de VFX. Este artigo explora as capacidades do Kling AI 2.0, com foco em suas ferramentas de imagem para vídeo e o inovador modo multielementos.
O modelo Kling AI 2.0 representa um salto qualitativo na geração de vídeo. Ele aprimora a forma como a IA interpreta e executa os comandos do usuário, resultando em vídeos com movimentos mais fluidos e naturais (dinâmicas), um visual mais refinado e cinematográfico (estética) e uma maior fidelidade ao que foi solicitado no prompt (aderência ao prompt). Esses avanços são cruciais para a criação de efeitos visuais (VFX) convincentes e conteúdo de vídeo de alta qualidade.
Embora a funcionalidade de texto para vídeo do Kling AI seja capaz de produzir efeitos interessantes, o verdadeiro poder para VFX, como demonstrado no vídeo de referência, reside no modo imagem para vídeo. Esta abordagem permite um controle mais refinado sobre o resultado final, partindo de uma imagem base para gerar a animação.
Uma das demonstrações impressionantes é a criação de uma cena onde o chão de um jardim desmorona, revelando um buraco com fumaça. O processo envolve gravar o local, capturar um quadro específico (screenshot) do momento em que o efeito deve ocorrer e, então, inserir essa imagem no Kling AI. Com um prompt como "o chão começa a desmoronar e revela um buraco fundo com fumaça saindo, filmagem manual", o Kling AI gera a animação. A IA se destaca ao reconhecer os ladrilhos e quebrá-los individualmente, além de simular a fumaça de forma realista. A adição do termo "filmagem manual" ajuda a manter a continuidade do movimento da câmera original, resultando em um efeito visual crível quando combinado com o vídeo original e efeitos sonoros.
Outro exemplo impactante é a simulação de uma onda gigante (tsunami) atingindo uma colina vista de um jardim. Similarmente, uma captura de tela do vídeo original é usada como base. O prompt "uma onda de tsunami vem quebrando sobre a colina ao fundo em nossa direção, filmagem manual" instrui o Kling AI a gerar a cena. A ferramenta não apenas cria o efeito da água de forma convincente, mas também aplica um movimento de zoom de câmera de mão, conferindo maior realismo e dramaticidade à cena. Este tipo de efeito pode economizar um tempo considerável para artistas de VFX em projetos menores.
A capacidade do Kling AI de manipular objetos complexos também foi testada com a cena de um carro levitando e se transformando em poeira. A IA interpretou corretamente o prompt, fazendo o carro flutuar, e o efeito de desintegração foi notavelmente bem executado, incluindo a sombra do carro enquanto ele se eleva.
Para quem deseja experimentar com diferentes filmagens, sites como o Pexels oferecem uma vasta gama de vídeos e imagens gratuitas que podem ser utilizados como base para criações no Kling AI.
O modo multielementos é onde o Kling AI realmente brilha, oferecendo funcionalidades como Swap (Troca), Add (Adicionar) e Delete (Deletar). Embora, no momento da gravação do vídeo de referência, este modo utilizasse o modelo Kling 1.6, os resultados já eram impressionantes.
A função Swap permite substituir um objeto em um vídeo por outro. No exemplo, o apresentador filma a si mesmo segurando uma abóbora grande. Utilizando a ferramenta de geração de imagem Kolors 2.0, integrada ao Kling AI, ele cria imagens de criaturas fofas. Em seguida, no modo multielementos (Swap), ele seleciona a abóbora no vídeo e a imagem da criatura. O prompt "trocar abóbora laranja do @ReferenceVideo pela criatura fofa da @Image1" resulta na criatura substituindo a abóbora no vídeo. O Kling AI lida bem com o contato das mãos com o novo objeto, adicionando sombras e mantendo a interação convincente. O mesmo processo foi repetido com sucesso para substituir a abóbora por uma pilha de barras de ouro, com a IA reproduzindo reflexos realistas no material dourado.
Ainda utilizando a função Swap, é possível transformar personagens. Um exemplo mostra o apresentador em um fundo verde (chroma key) sendo transformado em um cavaleiro medieval. A técnica envolve criar a imagem do cavaleiro (por exemplo, usando a ferramenta de geração de imagem do Kling ou o Magnific AI com sua função de referência estrutural para manter a pose) e depois usar o Swap. Outra demonstração envolveu transformar um cachorro correndo em um hipopótamo bebê e depois em um cão robô. Para isso, uma imagem do cachorro foi extraída, editada no Kling AI (ou ferramentas como Canva ou Photopea para remover o fundo) para criar o novo personagem (hipopótamo) e, em seguida, a função Swap foi utilizada para animá-lo no vídeo original. Essa técnica mantém o movimento original do animal, aplicando-o ao novo personagem.
A função Add permite inserir novos elementos em uma cena. No vídeo, um polvo fofo é adicionado sobre a abóbora que o apresentador segura. O prompt "adicionar criatura da @Image1 sobre a abóbora laranja, a criatura está animada e rindo" demonstra como a IA consegue integrar e animar o novo elemento de forma coesa. Outro exemplo notável é a adição de destroços flamejantes de uma espaçonave e uma cidade futurista ao fundo de um vídeo de um caminhão no deserto. Isso ilustra o potencial para extensões de cenário (set extensions) e pintura digital de matte (matte painting) diretamente em vídeo.
A função Delete é igualmente poderosa. Em um vídeo onde o apresentador segura uma abóbora, ao selecionar a abóbora e usar o prompt "deletar a abóbora laranja do @ReferenceVideo", o Kling AI remove o objeto e preenche o espaço de forma surpreendentemente realista, reconstituindo a camisa do apresentador que estava oculta. Resultados semelhantes foram obtidos ao remover uma bola de basquete de uma cena e até mesmo uma pessoa de um sofá, com a IA preenchendo o espaço vazio com o sofá e um travesseiro, demonstrando uma compreensão contextual impressionante. Softwares de edição como o Adobe Premiere Pro estão começando a integrar funcionalidades de IA, mas a capacidade de preenchimento contextual demonstrada pelo Kling AI para vídeo é um grande avanço.
Apesar de todo o seu potencial, o Kling AI possui limitações. Atualmente, os clipes gerados têm no máximo 5 segundos, o que pode ser restritivo para alguns projetos. Além disso, o modelo de precificação é baseado em créditos, e a geração de vídeos com o modelo 2.0 pode consumir uma quantidade considerável de créditos (100 créditos para 5 segundos, 200 para 10 segundos, enquanto o modo multielementos, usando o modelo 1.6, consome 50 créditos para 5 segundos). É recomendável planejar bem o uso dos créditos, especialmente se optar por planos mensais.
O Kling AI 2.0 e suas funcionalidades, especialmente o modo multielementos, demonstram um avanço significativo na tecnologia de geração e edição de vídeo por IA. A capacidade de criar efeitos visuais complexos, alterar objetos e personagens, adicionar ou remover elementos com resultados cada vez mais realistas está transformando o fluxo de trabalho de criadores de conteúdo e artistas de VFX. Embora ainda haja espaço para evolução, especialmente em relação à duração dos clipes e ao custo, o Kling AI já se posiciona como uma ferramenta poderosa e promissora no arsenal da inteligência artificial generativa.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.