A ascensão da inteligência artificial generativa transformou a maneira como criamos e interagimos com conteúdo visual. Ferramentas como o Midjourney permitem a qualquer pessoa gerar imagens impressionantes a partir de descrições textuais, conhecidas como prompts. No entanto, a qualidade da imagem gerada está intrinsecamente ligada à precisão e detalhamento do prompt. É aqui que o ChatGPT, desenvolvido pela OpenAI, pode se tornar um aliado poderoso, mas é preciso saber como utilizá-lo corretamente para essa finalidade.
Muitos usuários, ao pedirem ao ChatGPT para criar um prompt para o Midjourney, recebem um parágrafo descritivo. Embora útil, esse formato não é o mais otimizado para o Midjourney, que funciona melhor com uma série de palavras-chave e descritores específicos. Este artigo explora uma técnica eficaz para "treinar" o ChatGPT a gerar prompts estruturados, resultando em imagens mais ricas e alinhadas com a sua visão criativa.
O desafio fundamental reside na diferença de como o Midjourney interpreta os comandos em comparação com a forma como o ChatGPT, por padrão, gera texto. Enquanto o Midjourney prospera com listas de palavras-chave, estilos, parâmetros técnicos e descrições concisas, o ChatGPT tende a fornecer narrativas mais longas. Como demonstrado em um vídeo explicativo sobre o tema, um pedido genérico ao ChatGPT para "escrever um prompt para uma imagem de um leão" pode resultar em um texto como: "Crie uma peça de arte generativa de um leão usando uma tela circular. O leão deve ser composto por várias formas geométricas..." Embora criativo, este formato não é o ideal para ser inserido diretamente no Midjourney.
A estratégia mais eficaz é fornecer ao ChatGPT um modelo ou uma "fórmula" de como você deseja que o prompt para o Midjourney seja estruturado. Isso condiciona a IA a seguir um padrão específico, resultando em prompts mais úteis.
O processo inicia-se com a definição de uma fórmula clara. Por exemplo, uma fórmula detalhada, como a sugerida no vídeo, pode ser:
(imagem que estamos solicitando), (5 palavras-chave descritivas), (tipo de câmera), (tipo de lente da câmera), (hora do dia), (estilo de fotografia), (tipo de filme)
Ao apresentar essa fórmula ao ChatGPT, é crucial solicitar uma confirmação de que ele compreendeu a estrutura. Um simples "Por favor, responda com 'sim' se você entendeu a fórmula" é suficiente. Uma vez que o ChatGPT confirma o entendimento, ele está pronto para gerar prompts baseados nesse modelo.
Por exemplo, ao solicitar "Escreva-me 5 prompts do Midjourney para fotografia urbana" após o treinamento com a fórmula, o ChatGPT pode gerar respostas como:
Ocasionalmente, o ChatGPT pode incluir parênteses da fórmula original nos prompts gerados. Embora isso possa não prejudicar significativamente a interpretação do Midjourney, é uma boa prática solicitar ao ChatGPT que reescreva os prompts sem os parênteses para maior clareza e otimização. Um comando como "Por favor, reescreva os mesmos 5 prompts, mas sem os parênteses" geralmente resolve essa questão.
A eficácia dessa técnica é visível nos resultados. Utilizando os prompts gerados e refinados pelo ChatGPT, pode-se obter imagens no Midjourney que capturam com precisão os detalhes especificados.
Seguindo a fórmula, prompts para fotografia urbana podem gerar imagens como uma rua movimentada em preto e branco, capturando a essência vibrante e caótica de uma cidade, ou arranha-céus futuristas durante a "hora azul", com iluminação e reflexos específicos.
A flexibilidade dessa abordagem permite explorar uma vasta gama de temas e estilos. No vídeo de demonstração, o apresentador expande para outros temas, como carros clássicos e atletas famosos em estilos de desenhos animados, utilizando uma fórmula ligeiramente diferente:
(assunto da imagem), no estilo de (nome de um desenho animado), (5 adjetivos), (verbo que o sujeito está realizando)
Com essa nova fórmula, o ChatGPT gerou prompts criativos como:
Esses exemplos demonstram como o ChatGPT pode adaptar-se a diferentes estruturas de prompt, desde que claramente instruído, auxiliando na criação de imagens verdadeiramente únicas e específicas no Midjourney.
Para extrair o máximo dessa colaboração entre IAs:
--ar 16:9
para aspect ratio ou --q 2
para maior qualidade, antes de submetê-los ao Midjourney.Dominar a arte de criar prompts é essencial para desbloquear todo o potencial de plataformas de geração de imagens como o Midjourney. Ao utilizar o ChatGPT de forma estratégica, fornecendo-lhe estruturas claras, você pode otimizar significativamente esse processo, economizar tempo e, o mais importante, dar vida às suas ideias visuais com uma precisão e criatividade surpreendentes. A combinação inteligente dessas duas poderosas ferramentas de inteligência artificial abre um novo leque de possibilidades para artistas digitais, designers e entusiastas da IA.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.