ChatGPT e Midjourney: Guia para Criar Prompts Perfeitos e Imagens Surpreendentes

ChatGPT e Midjourney: Guia para Criar Prompts Perfeitos e Imagens Surpreendentes

ChatGPT e Midjourney: Guia para Criar Prompts Perfeitos e Imagens Surpreendentes

A ascensão da inteligência artificial generativa transformou a maneira como criamos e interagimos com conteúdo visual. Ferramentas como o Midjourney permitem a qualquer pessoa gerar imagens impressionantes a partir de descrições textuais, conhecidas como prompts. No entanto, a qualidade da imagem gerada está intrinsecamente ligada à precisão e detalhamento do prompt. É aqui que o ChatGPT, desenvolvido pela OpenAI, pode se tornar um aliado poderoso, mas é preciso saber como utilizá-lo corretamente para essa finalidade.

Muitos usuários, ao pedirem ao ChatGPT para criar um prompt para o Midjourney, recebem um parágrafo descritivo. Embora útil, esse formato não é o mais otimizado para o Midjourney, que funciona melhor com uma série de palavras-chave e descritores específicos. Este artigo explora uma técnica eficaz para "treinar" o ChatGPT a gerar prompts estruturados, resultando em imagens mais ricas e alinhadas com a sua visão criativa.

Entendendo o Desafio dos Prompts para Midjourney e ChatGPT

O desafio fundamental reside na diferença de como o Midjourney interpreta os comandos em comparação com a forma como o ChatGPT, por padrão, gera texto. Enquanto o Midjourney prospera com listas de palavras-chave, estilos, parâmetros técnicos e descrições concisas, o ChatGPT tende a fornecer narrativas mais longas. Como demonstrado em um vídeo explicativo sobre o tema, um pedido genérico ao ChatGPT para "escrever um prompt para uma imagem de um leão" pode resultar em um texto como: "Crie uma peça de arte generativa de um leão usando uma tela circular. O leão deve ser composto por várias formas geométricas..." Embora criativo, este formato não é o ideal para ser inserido diretamente no Midjourney.

A Solução: Treinando o ChatGPT com Fórmulas para Midjourney

A estratégia mais eficaz é fornecer ao ChatGPT um modelo ou uma "fórmula" de como você deseja que o prompt para o Midjourney seja estruturado. Isso condiciona a IA a seguir um padrão específico, resultando em prompts mais úteis.

A Estratégia de Fórmula para Midjourney com ChatGPT

O processo inicia-se com a definição de uma fórmula clara. Por exemplo, uma fórmula detalhada, como a sugerida no vídeo, pode ser:

(imagem que estamos solicitando), (5 palavras-chave descritivas), (tipo de câmera), (tipo de lente da câmera), (hora do dia), (estilo de fotografia), (tipo de filme)

Ao apresentar essa fórmula ao ChatGPT, é crucial solicitar uma confirmação de que ele compreendeu a estrutura. Um simples "Por favor, responda com 'sim' se você entendeu a fórmula" é suficiente. Uma vez que o ChatGPT confirma o entendimento, ele está pronto para gerar prompts baseados nesse modelo.

Por exemplo, ao solicitar "Escreva-me 5 prompts do Midjourney para fotografia urbana" após o treinamento com a fórmula, o ChatGPT pode gerar respostas como:

  • Imagem de uma rua movimentada da cidade, vibrante, energética, diversa, caótica, arenosa, DSLR, lente grande angular, final da tarde, fotografia de rua, filme preto e branco.
  • Imagem de um arranha-céu moderno, elegante, impressionante, imponente, reflexivo, futurista, câmera mirrorless, lente telefoto, hora azul, fotografia arquitetônica, filme colorido.

Refinando os Prompts Gerados pelo ChatGPT para o Midjourney

Ocasionalmente, o ChatGPT pode incluir parênteses da fórmula original nos prompts gerados. Embora isso possa não prejudicar significativamente a interpretação do Midjourney, é uma boa prática solicitar ao ChatGPT que reescreva os prompts sem os parênteses para maior clareza e otimização. Um comando como "Por favor, reescreva os mesmos 5 prompts, mas sem os parênteses" geralmente resolve essa questão.

Exemplos Práticos: ChatGPT e Midjourney em Ação

A eficácia dessa técnica é visível nos resultados. Utilizando os prompts gerados e refinados pelo ChatGPT, pode-se obter imagens no Midjourney que capturam com precisão os detalhes especificados.

Criando Cenários Urbanos com ChatGPT e Midjourney

Seguindo a fórmula, prompts para fotografia urbana podem gerar imagens como uma rua movimentada em preto e branco, capturando a essência vibrante e caótica de uma cidade, ou arranha-céus futuristas durante a "hora azul", com iluminação e reflexos específicos.

Explorando Estilos Artísticos e Temas Diversos com ChatGPT e Midjourney

A flexibilidade dessa abordagem permite explorar uma vasta gama de temas e estilos. No vídeo de demonstração, o apresentador expande para outros temas, como carros clássicos e atletas famosos em estilos de desenhos animados, utilizando uma fórmula ligeiramente diferente:

(assunto da imagem), no estilo de (nome de um desenho animado), (5 adjetivos), (verbo que o sujeito está realizando)

Com essa nova fórmula, o ChatGPT gerou prompts criativos como:

  • Michael Jordan, no estilo Looney Tunes, voando, imparável, feroz, determinado, enterrando.
  • Serena Williams, no estilo Bob Esponja Calça Quadrada, esmagando, ágil, poderosa, focada, sacando.
  • Usain Bolt, no estilo Tom e Jerry, correndo, rápido como um raio, competitivo, animado, vencendo.
  • Simone Biles, no estilo As Meninas Superpoderosas, virando, graciosa, destemida, forte, caindo.
  • Cristiano Ronaldo, no estilo Os Simpsons, marcando, carismático, habilidoso, energético, celebrando.

Esses exemplos demonstram como o ChatGPT pode adaptar-se a diferentes estruturas de prompt, desde que claramente instruído, auxiliando na criação de imagens verdadeiramente únicas e específicas no Midjourney.

Maximizando o Potencial da Dupla ChatGPT e Midjourney

Para extrair o máximo dessa colaboração entre IAs:

  • Experimente com Fórmulas: Não se limite a um único modelo. Crie e teste diferentes fórmulas para diversos tipos de imagem. Inclua elementos como iluminação, emoção, paleta de cores, ou até mesmo referências a artistas específicos.
  • Seja Específico: Quanto mais detalhada for sua fórmula e suas solicitações subsequentes, mais alinhados com sua intenção serão os prompts gerados pelo ChatGPT.
  • Itere e Refine: A engenharia de prompt é um processo iterativo. Gere múltiplos prompts, teste-os no Midjourney e ajuste sua fórmula ou suas instruções ao ChatGPT com base nos resultados.
  • Adicione Parâmetros do Midjourney: Lembre-se que você pode adicionar parâmetros específicos do Midjourney aos prompts gerados pelo ChatGPT, como --ar 16:9 para aspect ratio ou --q 2 para maior qualidade, antes de submetê-los ao Midjourney.

Dominar a arte de criar prompts é essencial para desbloquear todo o potencial de plataformas de geração de imagens como o Midjourney. Ao utilizar o ChatGPT de forma estratégica, fornecendo-lhe estruturas claras, você pode otimizar significativamente esse processo, economizar tempo e, o mais importante, dar vida às suas ideias visuais com uma precisão e criatividade surpreendentes. A combinação inteligente dessas duas poderosas ferramentas de inteligência artificial abre um novo leque de possibilidades para artistas digitais, designers e entusiastas da IA.