A inteligência artificial (IA) tem avançado a passos largos, transformando inúmeras áreas do conhecimento e da indústria. Recentemente, uma das ferramentas de IA mais comentadas, o ChatGPT, desenvolvido pela OpenAI, começou a explorar o vasto campo da edição de imagens. Através de funcionalidades como o Code Interpreter, usuários têm testado os limites dessa tecnologia para manipular fotografias. Neste artigo, analisaremos as capacidades atuais, as limitações e o futuro promissor do ChatGPT na edição de imagens, com base nas explorações detalhadas pelo canal PiXimperfect.
Para começar a explorar a edição de imagens com o ChatGPT, alguns passos são necessários. Primeiramente, é preciso ter uma assinatura do ChatGPT Plus, que oferece acesso a modelos mais avançados e funcionalidades adicionais.
Com a assinatura Plus, o próximo passo é habilitar os recursos beta. Isso é feito acessando as "Configurações" (Settings) da sua conta, navegando até "Recursos Beta" (Beta features) e ativando as opções "Code Interpreter" e "Plugins". O Code Interpreter permite que o ChatGPT execute código Python, o que é fundamental para a manipulação de imagens, enquanto os plugins podem estender suas funcionalidades.
Ao iniciar uma nova conversa, é crucial selecionar o modelo GPT-4 e, em seguida, escolher a opção "Code Interpreter" no menu suspenso. Isso garante que você esteja utilizando a versão mais capaz do modelo para essas tarefas. Uma vez ativado, um ícone de "+" aparecerá na caixa de mensagem, permitindo o upload de arquivos, incluindo imagens.
O canal PiXimperfect realizou diversos testes para avaliar a eficácia do ChatGPT em tarefas comuns de edição de imagens. Vamos analisar alguns exemplos.
Em um dos testes, foi utilizada uma imagem de um "Dumbledore genérico" com a solicitação de aplicar um color grading similar ao dos filmes mais recentes da saga Harry Potter, com um tom esverdeado. O ChatGPT explicou os passos que seguiria, como carregar a imagem, aplicar o tom esverdeado e ajustar contraste e brilho. O resultado demonstrou uma tentativa de seguir as instruções, aplicando um filtro verde. Embora não seja um resultado profissional, mostra um potencial inicial da ferramenta.
Outro desafio foi solicitar ao ChatGPT que fizesse uma imagem de uma mulher com chapéu "saltar" (pop), aplicando um color grading cinematográfico quente, sem estourar os realces. A IA detalhou um plano de ação incluindo aumento de contraste, tonalização quente, proteção de realces e até uma vinheta sutil. No entanto, o processo foi marcado por erros e múltiplas tentativas. O resultado final foi sutil, e uma comparação rápida com uma edição manual no Adobe Photoshop revelou a superioridade do software dedicado para essa tarefa específica, alcançando o efeito desejado em poucos segundos.
Utilizando uma foto de um alto-falante com bastante ruído digital, o pedido foi para remover o ruído e clarear a imagem. O ChatGPT conseguiu reduzir o ruído, mas o resultado também apresentou uma perda significativa de detalhes e um aspecto geral "lavado" ou desbotado. Novamente, uma comparação com o filtro Camera Raw do Photoshop mostrou que as ferramentas especializadas ainda oferecem um controle e qualidade muito superiores.
Para uma imagem escura de uma paisagem, a solicitação foi para aumentar a exposição e melhorar as cores. O ChatGPT iniciou o processo, clareando a imagem. Ao ser instruído para corrigir as cores, o primeiro resultado foi insatisfatório, com uma tonalidade excessivamente avermelhada. Após feedback, a IA tentou uma "normalização de RGB", que melhorou o aspecto, mas ainda assim o resultado não foi ideal, mostrando a dificuldade da ferramenta em interpretar nuances de cor de forma precisa.
Talvez o teste mais revelador das limitações atuais do ChatGPT tenha sido no retoque de pele. Com uma imagem de uma modelo com acne, foi solicitado que a IA removesse as imperfeições, suavizasse a pele, mas mantivesse a textura natural. Apesar de explicar técnicas como remoção de manchas e suavização da pele, e até mesmo mencionar a separação de frequência após várias tentativas e erros de "restrições de memória", o resultado foi desastroso, transformando a imagem em um borrão irreconhecível. Este exemplo contrastou fortemente com o desempenho de plugins de IA especializados, como os da Retouch4me, que realizam retoques profissionais com resultados impressionantes em segundos, preservando a textura da pele e oferecendo controle ao usuário.
Um pedido aparentemente simples de recortar uma imagem para o formato quadrado do Instagram, garantindo que os rostos presentes não fossem cortados, também apresentou dificuldades. O ChatGPT afirmou que detectaria os rostos e determinaria o recorte ideal. O resultado, no entanto, foi um recorte que não atendia completamente ao solicitado, cortando partes dos sujeitos de forma indesejada, mesmo após detectar os rostos.
O vídeo também explora a utilização de plugins, como o "Image Editor", que podem ser instalados na loja de plugins do ChatGPT. A principal limitação observada é que esses plugins, no momento, não permitem o upload direto de imagens; é necessário fornecer um link (URL) da imagem já hospedada online. No teste de recorte para o Instagram usando o plugin, o resultado também foi insatisfatório, demonstrando que mesmo com extensões, a precisão ainda é um desafio.
Com base nos testes apresentados, fica claro que, embora o ChatGPT com Code Interpreter demonstre uma capacidade teórica de entender e descrever processos de edição de imagens, sua execução prática ainda está em um estágio beta e apresenta limitações significativas. Os resultados são frequentemente inconsistentes, com erros de processamento, e nem sempre atingem o nível de qualidade esperado por profissionais ou mesmo entusiastas da fotografia. As ferramentas dedicadas como Adobe Photoshop, Lightroom e plugins de IA especializados continuam sendo a escolha mais confiável para edição de imagens de alta qualidade.
Paralelamente à edição de imagens, o vídeo menciona como a IA está sendo utilizada em outras áreas da criação de conteúdo. Um exemplo é o patrocinador do vídeo, Epidemic Sound, que utiliza uma ferramenta de IA chamada Soundmatch. Essa tecnologia analisa um clipe de vídeo e sugere trilhas sonoras que se adequam ao tom, humor e ritmo do conteúdo, otimizando o tempo dos criadores na busca pela música perfeita.
É inegável o potencial do ChatGPT e de outras inteligências artificiais na edição de imagens. Estamos testemunhando apenas o começo dessa jornada. Assim como a tecnologia fotográfica evoluiu, as ferramentas de IA também estão em constante desenvolvimento. No entanto, como destacado no vídeo, a IA, pelo menos em seu estado atual, funciona melhor como uma assistente, necessitando de um "diretor" humano para guiar o processo criativo e tomar as decisões finais. A capacidade de realizar tarefas manuais repetitivas é um dos grandes trunfos, mas a visão artística e a interpretação subjetiva ainda são domínios essencialmente humanos.
O ChatGPT, especialmente com o Code Interpreter, abre uma janela fascinante para o futuro da edição de imagens assistida por IA. Ele pode entender comandos complexos e até mesmo explicar as etapas técnicas envolvidas. Contudo, os exemplos práticos mostram que ainda há um longo caminho a ser percorrido para que possa competir em termos de precisão, confiabilidade e qualidade com softwares e plugins especializados. Por enquanto, a IA na edição de imagens é uma ferramenta promissora que pode otimizar certos fluxos de trabalho, mas a expertise e a sensibilidade do editor humano continuam sendo insubstituíveis para alcançar resultados verdadeiramente impactantes e personalizados. A tecnologia é uma aliada, mas a criatividade e a intenção artística vêm da singularidade de cada um de nós.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.