No competitivo universo do YouTube, uma miniatura atraente é crucial para capturar a atenção do público. O especialista em IA, Matt Wolfe, revelou em um vídeo detalhado seu processo para criar thumbnails vibrantes e personalizadas, utilizando uma combinação de ferramentas de inteligência artificial como Midjourney e Stable Diffusion, complementadas pelo Canva para a composição final. Este artigo explora o método de Wolfe, oferecendo um guia passo a passo para quem busca otimizar suas miniaturas de vídeo.
Wolfe demonstra seu processo criando uma miniatura para um vídeo intitulado "Por que o Bing Chat é Tão Ruim". A ideia central é transmitir visualmente a frustração com o Bing Chat. Ele idealiza uma imagem com um fundo colorido e intenso, característico de suas miniaturas, um logo do Bing com efeito de "glitch" ou quebra, e seu próprio rosto em uma expressão de desapontamento, como um "facepalm".
O processo criativo de Wolfe inicia-se no Midjourney, uma ferramenta de IA conhecida por gerar imagens a partir de descrições textuais, para criar o plano de fundo da miniatura.
Matt Wolfe prefere o Midjourney para seus fundos devido à capacidade da ferramenta de produzir cores vibrantes e imagens que realmente "saltam" aos olhos, um elemento essencial para se destacar na plataforma do YouTube.
Para quem não possui uma conta, o Midjourney oferece um período de teste gratuito, permitindo a geração de aproximadamente 25 imagens. Após o teste, os planos pagos iniciam-se em cerca de 10 dólares mensais, possibilitando o uso em salas privadas no Discord, evitando a confusão dos canais públicos para novatos.
O uso do Midjourney requer uma conta no Discord, uma plataforma de comunicação gratuita. Wolfe menciona possuir outros vídeos que explicam a integração entre Discord e Midjourney para usuários iniciantes.
Para o fundo da miniatura sobre o Bing Chat, Wolfe busca uma imagem colorida que represente um "glitch". Ele enfatiza o uso de prompts mais concisos, permitindo que o Midjourney exerça mais sua criatividade. O prompt utilizado inclui termos como "Microsoft", "Glitch", "RGB" (para cores intensas), um emoji de arco-íris para reforçar a coloração, o parâmetro "--no people" para excluir pessoas da imagem, e "--ar 16:9" para a proporção correta de miniaturas do YouTube (1280x720 pixels). Após algumas tentativas e re-rolagens para refinar os resultados, Wolfe seleciona uma imagem de um computador antigo com o logo do Windows quebrado e elementos coloridos, que se alinha com sua visão.
Com o fundo pronto, o próximo passo é gerar a imagem do rosto de Matt Wolfe em uma pose específica, utilizando o Stable Diffusion.
Wolfe explica que, para gerar imagens com seu próprio rosto, ele previamente treinou um modelo no Stable Diffusion usando a técnica DreamBooth. Ele possui um vídeo tutorial em seu canal, intitulado "Inject Yourself into the AI and Make Any Image With Your Face! (100% FREE Method)", que ensina esse processo.
Ele utiliza o RunDiffusion, uma plataforma na nuvem para rodar o Stable Diffusion, por oferecer GPUs mais rápidas do que seu computador pessoal. Para obter a pose exata de desapontamento (facepalm), Wolfe emprega a extensão ControlNet, que já vem pré-instalada no RunDiffusion. Ele menciona outro vídeo em seu canal, "Install Stable Diffusion Locally (Quick Setup Guide)", que também cobre o uso do RunDiffusion.
Para a pose de "facepalm", Wolfe busca uma imagem de referência no Google Images e, para evitar problemas de direitos autorais, opta por uma imagem de banco de fotos (Depositphotos) que ele licencia. Essa imagem de referência é usada no ControlNet com o pré-processador "depth" para guiar a IA na geração da pose correta. O prompt para o Stable Diffusion inclui o nome do ator Dominic Cooper (palavra-chave usada no treinamento do seu modelo de rosto), "person facepalm", "upset", e termos artísticos como "digital painting", "artstation", "concept art", juntamente com nomes de artistas como Artgerm e Donato Giancola. Ele também adiciona palavras-chave negativas para evitar deformidades. Após o Inpaint para refinar o rosto, a imagem está pronta.
A etapa final é reunir todos os elementos no Canva, uma popular ferramenta de design gráfico online.
No Canva, Wolfe começa com um template de miniatura do YouTube (1280x720 pixels). Ele importa o fundo gerado pelo Midjourney e o define como plano de fundo da imagem. Em seguida, adiciona a imagem do seu rosto gerada pelo Stable Diffusion, remove o fundo desta usando a funcionalidade do Canva Pro (ou um removedor de fundo gratuito como o Rem BG, disponível no FutureTools.io) e a posiciona. O logo do Bing, também com o fundo removido e um efeito de "glitch" (slice) aplicado no Canva, é colocado sobre o monitor da imagem de fundo. Para dar destaque, ele adiciona um efeito de brilho (glow) escuro tanto ao logo quanto à sua imagem.
Por fim, Wolfe adiciona o texto "BING IS BROKEN!" com um estilo característico: fundo preto com leve transparência e texto branco, para garantir legibilidade e impacto. Ele ajusta o posicionamento e o tamanho dos elementos para criar uma composição visualmente equilibrada e atraente.
O processo de Matt Wolfe demonstra o poder da inteligência artificial como uma ferramenta para democratizar a criação de conteúdo visual de alta qualidade. Mesmo indivíduos sem habilidades artísticas tradicionais podem agora transformar suas visões em imagens impactantes. Ferramentas como Midjourney, Stable Diffusion e Canva estão capacitando criadores a produzir materiais visuais que antes exigiriam considerável tempo, habilidade ou recursos financeiros. A capacidade de gerar fundos únicos, incorporar feições pessoais em artes digitais e compor elementos de forma intuitiva abre um novo leque de possibilidades para youtubers e criadores de conteúdo em geral.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.