Flux AI: Personalize Suas Imagens com Inteligência Artificial e Surpreenda-se

Flux AI: Personalize Suas Imagens com Inteligência Artificial e Surpreenda-se

A geração de imagens por inteligência artificial (IA) atingiu um novo patamar de realismo e personalização. Se antes nos maravilhávamos com paisagens e personagens fictícios criados por algoritmos, agora a fronteira se expande para a possibilidade de inserir nossa própria imagem em cenários fantásticos. O criador de conteúdo Matt Wolfe, em um vídeo recente, explora como utilizar o novo modelo de geração de imagens Flux AI para treinar a IA com sua própria fisionomia, resultando em criações surpreendentes e divertidas.

Flux AI: A Nova Fronteira na Geração de Imagens Realistas com Inteligência Artificial

Matt Wolfe destaca o Flux AI como um dos modelos mais impressionantes atualmente disponíveis para gerar imagens com alto grau de realismo. Segundo ele, a qualidade é comparável ao que se obtém com ferramentas renomadas como o Midjourney. Essa capacidade de gerar imagens fotorrealistas abre um leque de possibilidades criativas, desde a criação de avatares personalizados até a visualização de si mesmo em contextos inusitados, como ao lado do Deadpool em frente a uma explosão ou como o Superman sobrevoando uma cidade.

Explorando o Potencial do Flux AI com Fal.ai

Em um vídeo anterior, Matt Wolfe já havia demonstrado como criar imagens ultra-realistas utilizando o Flux AI através da plataforma Fal.ai. Esta plataforma oferece um modelo específico chamado "Flux Realism LoRA", que permite aos usuários inserir prompts e obter resultados com um nível de detalhe impressionante. O processo, embora acessível, focava na geração de imagens em geral, sem o treinamento específico da fisionomia do usuário.

Treinando Sua Própria Imagem na Inteligência Artificial: O Guia com Replicate.com

A grande novidade apresentada por Matt Wolfe é a capacidade de treinar o modelo Flux AI para reconhecer e reproduzir sua própria imagem. Ele relembra que, há cerca de um ano, demonstrou um método para se inserir em imagens geradas por IA utilizando o Stable Diffusion 1.4, um processo que era consideravelmente mais demorado e complexo, envolvendo ferramentas como DreamBooth e Google Colab, e levando mais de duas horas. Com os avanços recentes e o surgimento de modelos como Stable Diffusion 2, Stable Diffusion XL, Stable Diffusion 3 e, agora, o Flux, o processo tornou-se significativamente mais rápido e eficiente.

Utilizando Replicate.com para Treinar seu LoRA Flux Personalizado

Para treinar sua própria imagem no Flux AI, Matt Wolfe utiliza a plataforma Replicate.com. Ele detalha os passos necessários:

  1. Criação de Conta e Exploração: O primeiro passo é criar uma conta no Replicate.com.
  2. Localizando o AI Toolkit: Dentro da plataforma, é preciso encontrar o "AI Toolkit" desenvolvido pelo usuário Lucataco. Este toolkit é essencial para o treinamento do modelo LoRA com o Flux.
  3. Configurações de Treinamento: Na aba "Train" do AI Toolkit, o usuário pode configurar o treinamento. É crucial selecionar a opção "Create new model" e nomear o modelo de forma que inclua seu nome de usuário no Replicate seguido do nome desejado para o LoRA (ex: seunome/meu-rosto-flux).
  4. Preparação das Imagens: É necessário preparar um arquivo ZIP contendo de 12 a 20 imagens de treinamento (fotos de rosto, no caso de Matt). As imagens devem ser nomeadas de forma descritiva, utilizando um "trigger word" (palavra-chave de ativação) que será usada nos prompts para invocar a fisionomia treinada. Por exemplo, "foto_de_mre_flow.png", onde "mreflow" é a palavra-chave. Matt Wolfe recomenda cerca de 1000 passos de treinamento.
  5. Token do Hugging Face: Um token de acesso do Hugging Face é necessário. Este pode ser obtido criando uma conta na plataforma, acessando as configurações de perfil e gerando um novo token de acesso.
  6. Repo ID e Treinamento: O "Repo ID" no Replicate deve corresponder ao nome do modelo criado no Hugging Face (ex: seunomehuggingface/mre_flow-lora). Após configurar todos os campos, basta clicar em "Create training".

Matt Wolfe menciona que o treinamento no Replicate.com levou cerca de 26 minutos e custaria aproximadamente $2.18, considerando o uso de uma GPU A100. No entanto, ele destaca uma oferta especial: através de um link específico (disponível na descrição do vídeo original), usuários podem obter $10 em créditos no Replicate.com, o que cobriria o custo do treinamento e ainda permitiria gerar dezenas de imagens gratuitamente.

Gerando Imagens com seu LoRA Treinado

Após o treinamento, para gerar imagens com sua fisionomia, volta-se ao perfil de Lucataco no Replicate.com e seleciona-se o modelo "flux-dev-lora". No campo "hf_lora", deve-se inserir o Repo ID do Hugging Face onde o LoRA treinado foi salvo (ex: mattwolfe/mreflow-lora). A partir daí, basta criar prompts utilizando a palavra-chave definida durante o treinamento para que sua imagem seja incorporada às criações.

Otimizando Prompts com Claude AI para Resultados Surpreendentes

Para refinar ainda mais os resultados, Matt Wolfe recorre ao Claude AI. Ele utiliza o recurso de "Projetos" do Claude para criar um "Flux Image Prompt Optimizer". Dentro deste projeto, ele define instruções personalizadas para que o Claude AI otimize os prompts, buscando maior contraste, cores mais brilhantes, estética aprimorada e garantindo que o sujeito principal (identificado pela palavra-chave "mreflow") e seu rosto sejam o foco da imagem. O Claude AI então fornece três variações otimizadas do prompt original, oferecendo mais opções criativas.

Expandindo a Criatividade: Imagens Estáticas para Vídeos com Runway Gen-3

Como um bônus, Matt Wolfe demonstra como levar as imagens estáticas geradas a um novo nível, animando-as com a ferramenta Runway Gen-3. Ao importar a imagem e utilizar o mesmo prompt (ou um similar), é possível criar pequenos clipes de vídeo, como o exemplo dele e do Deadpool caminhando em câmera lenta com uma explosão ao fundo.

A capacidade de treinar modelos de IA como o Flux com nossa própria imagem representa um avanço significativo na personalização da arte digital. Ferramentas como Fal.ai, Replicate.com e Claude AI estão tornando esses processos cada vez mais acessíveis, permitindo que qualquer pessoa explore sua criatividade e se veja em mundos antes imagináveis apenas nos cinemas ou nos sonhos.