Nos últimos tempos, temos testemunhado avanços incríveis na área de inteligência artificial (IA), especialmente no que diz respeito à geração e manipulação de imagens. Enquanto gigantes como o GPT-4 da OpenAI e o Midjourney em sua versão 5 dominam as manchetes, existem diversas outras ferramentas poderosas que, muitas vezes, acabam ofuscadas. Neste artigo, vamos explorar algumas dessas joias escondidas que prometem revolucionar a forma como interagimos com a arte e o design digital, oferecendo funcionalidades impressionantes e, em muitos casos, gratuitas.
Uma das ferramentas fascinantes que merecem destaque é o Face-Landmark-ControlNet. Disponível na plataforma Hugging Face, especificamente no espaço do usuário georgen, esta aplicação permite controlar a geração de imagens do Stable Diffusion com base em marcos faciais.
O funcionamento é engenhoso: você faz o upload de uma foto de um rosto e insere um prompt descritivo. A IA, então, identifica os principais pontos da face original (olhos, nariz, boca, contorno) e tenta aplicar as características do seu prompt, mantendo a estrutura facial original. Como demonstrado no vídeo de referência, é possível pegar uma foto de uma pessoa e transformá-la em um palhaço assustador ou até mesmo alterar o gênero da pessoa na imagem, como converter um homem em uma mulher usando óculos, e a IA se esforça para manter a pose e as proporções faciais.
A tecnologia por trás do Face-Landmark-ControlNet mapeia os "landmarks" (pontos de referência) da face de entrada. Por exemplo, ao transformar uma foto em um "palhaço bobo", a IA primeiro traça onde estão os olhos, o nariz e a boca aberta na imagem original. Em seguida, ela tenta recriar esses elementos na imagem gerada de acordo com o prompt, resultando em uma figura de palhaço que mantém a expressão e a abertura da boca da foto inicial, ainda que de forma estilizada e, por vezes, um tanto quanto bizarra, como o próprio apresentador do vídeo observa.
Outro exemplo interessante é a conversão de uma foto de um homem usando óculos para uma "foto de uma mulher usando óculos". O sistema mapeia os olhos, nariz e o formato geral do rosto do homem e transpõe essas características para a imagem gerada de uma mulher, mantendo a similaridade na pose e nos óculos. O apresentador do vídeo até testa com uma foto sua, pedindo para gerar "uma mulher usando óculos, sorrindo", e o resultado é uma nova imagem que respeita a pose sorridente original.
A ferramenta ainda está em desenvolvimento, e os resultados podem variar, como na tentativa de gerar "o rosto de um robô muito feliz" a partir da foto do apresentador, que resultou em um robô com um rosto humanoide por baixo, mas ainda assim demonstra o potencial criativo da aplicação. É uma prova de que, mesmo em estágios iniciais, essas tecnologias abrem um leque de possibilidades para experimentação visual.
Outra ferramenta que merece atenção é o Stable Diffusion Reimagine, uma cortesia da Stability AI e acessível através do Clipdrop.co. Este utilitário permite que usuários gerem múltiplas variações de uma única imagem sem a necessidade de prompts complexos. Basicamente, você envia uma imagem e a IA a "reimagina" de diversas formas.
O processo é simples: faça o upload de uma imagem e a ferramenta automaticamente cria variações inspiradas na original. O vídeo demonstra isso com uma foto do próprio apresentador, que é reimaginada em estilos ligeiramente diferentes. A beleza do Stable Diffusion Reimagine reside na sua capacidade de explorar diferentes estéticas a partir de uma imagem base, o que pode ser extremamente útil para artistas e designers em busca de inspiração ou variações de um conceito.
A ferramenta se mostra particularmente eficaz com imagens geradas por IA, como as do Midjourney. O apresentador testa com uma de suas imagens favoritas de um astronauta no espaço, gerada no Midjourney v5, e o Stable Diffusion Reimagine oferece novas tomadas da mesma cena, com diferentes ângulos e iluminação, embora, como ele aponta, a qualidade possa não ser exatamente a mesma do Midjourney v5. Mesmo assim, a capacidade de gerar rapidamente múltiplas alternativas é um grande trunfo.
Testes com outras imagens, como uma mulher segurando um sabre de luz, mostram que a ferramenta tenta manter o esquema de cores e a composição geral, mas com variações estilísticas. A plataforma também oferece exemplos "escolhidos a dedo", como a reimaginação de quartos, paisagens, retratos e arte abstrata, onde os resultados são consistentemente impressionantes. Isso sugere que, dependendo da imagem de entrada, o Stable Diffusion Reimagine pode ser uma fonte valiosa para expandir horizontes criativos.
Finalmente, chegamos à ferramenta que o apresentador considera a mais empolgante: o NVIDIA Canvas 1.4, agora com a funcionalidade Panorama em beta. Este software gratuito da NVIDIA permite que você transforme simples pinceladas em paisagens realistas usando IA.
O NVIDIA Canvas já era conhecido por permitir que usuários "pintassem" com materiais do mundo real – como céu, nuvens, colinas, água, areia, neve, montanhas e florestas – e a IA os convertesse em imagens fotorrealistas. O sistema funciona com camadas, semelhante ao Photoshop, e permite exportar os resultados como arquivos PSD, mantendo as camadas para edição posterior.
A grande novidade é a funcionalidade Panorama (Beta). Com ela, você pode criar não apenas imagens estáticas, mas cenas panorâmicas completas em 360 graus. Essas cenas podem ser exploradas em 3D dentro do próprio software e, mais impressionante ainda, podem ser exportadas para uso em motores de jogo como o Unreal Engine. O vídeo mostra um exemplo onde um desenvolvedor de jogos, Dan "Greenskull" Hammill, utilizou uma paisagem criada no NVIDIA Canvas como skybox ou ambiente envolvente para um personagem em seu jogo.
O processo de criação é intuitivo. No modo padrão, você pode pintar uma praia, adicionando areia, mar, rochas e nuvens. A IA interpreta suas pinceladas e as transforma em uma paisagem coesa. O vídeo demonstra a criação de uma cena de praia com falésias rochosas em ambos os lados, um riacho desaguando no mar e nuvens no céu, tudo isso modificando o estilo da iluminação para simular diferentes momentos do dia, como pôr do sol ou noite.
No modo Panorama, o processo é similar, mas a tela de pintura é dividida em uma representação superior e inferior, que se unem para formar a esfera panorâmica. O apresentador cria uma paisagem nevada com montanhas distantes e uma floresta em primeiro plano. Ele destaca como é possível "esculpir" a paisagem, adicionando e removendo elementos, e a IA os integra de forma realista. Ao visualizar em 3D, é possível "olhar ao redor" da cena criada. Essa capacidade de gerar ambientes 3D completos a partir de simples desenhos é um salto significativo, especialmente para desenvolvedores de jogos independentes e artistas conceituais.
Para utilizar o NVIDIA Canvas, basta visitar o site nvidia.com/pt-br/studio/canvas/ e baixar a versão beta. É uma ferramenta que, mesmo sendo gratuita, oferece um poder de criação impressionante.
As ferramentas apresentadas – Face-Landmark-ControlNet, Stable Diffusion Reimagine e NVIDIA Canvas com seu novo modo Panorama – são apenas uma amostra do ritmo acelerado da inovação em inteligência artificial aplicada à criação de imagens. Cada uma, à sua maneira, oferece novas formas de expressão e experimentação, democratizando o acesso a tecnologias que antes eram restritas a grandes estúdios ou exigiam conhecimento técnico aprofundado.
É um momento emocionante para ser um criador digital, e a exploração dessas ferramentas pode não apenas otimizar fluxos de trabalho, mas também inspirar novas formas de arte e design. Conforme essas tecnologias amadurecem, podemos esperar resultados ainda mais refinados e funcionalidades ainda mais surpreendentes.
Para se manter atualizado sobre as últimas novidades em IA, o apresentador do vídeo recomenda seu site FutureTools.io, que cataloga centenas de ferramentas de IA e oferece uma newsletter gratuita com os destaques da semana.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.