Midjourney V6 Chega em Alpha, Microsoft Copilot Cria Músicas com Suno e Mais Novidades do Mundo IA

Retrospectiva IA: Midjourney V6, Música por IA no Copilot e Avanços em Vídeo

Com o ano chegando ao fim, o ritmo das notícias sobre Inteligência Artificial (IA) diminuiu um pouco, mas ainda tivemos anúncios significativos. Entre eles, destacam-se o lançamento da versão alpha do Midjourney V6, a integração de geração musical no Microsoft Copilot através da Suno, e novidades da Google com o VideoPoet.

O Impacto e as Novidades do Midjourney V6

A comunidade de arte gerada por IA está em polvorosa com o anúncio de que o Midjourney V6 já está disponível em fase alpha para testes. De acordo com os comunicados no Discord oficial do Midjourney, esta nova versão promete uma série de melhorias substanciais.

Principais Melhorias no Midjourney V6

  • Seguimento de Prompt Mais Preciso: A IA agora interpreta melhor e por mais tempo os prompts, resultando em imagens mais alinhadas com a descrição do usuário.
  • Coerência e Conhecimento do Modelo Aprimorados: Espera-se uma maior consistência e um entendimento mais profundo dos conceitos solicitados.
  • Melhorias no Prompt de Imagem e Remix: Novas capacidades para utilizar imagens como referência e para remixar criações existentes.
  • Desenho de Texto (Menor): Uma capacidade inicial, ainda que limitada, de incorporar texto diretamente nas imagens. É recomendado colocar o texto entre aspas no prompt e experimentar com `–style raw` ou valores `–stylize` mais baixos.
  • Upscalers Aprimorados: Melhorias na qualidade ao aumentar a resolução das imagens, com modos "sutil" e "criativo" que podem duplicar a resolução.

Adaptando-se ao Midjourney V6: Uma Nova Forma de Criar Prompts

O Midjourney V6 é significativamente diferente da V5, exigindo que os usuários "reaprendam" a criar prompts. A nova versão é muito mais sensível aos detalhes do prompt. A recomendação é evitar termos genéricos como "premiado", "fotorrealista", "4K", "8K", que eram comuns em outras ferramentas. Para imagens mais fotográficas e menos opinativas, o comando `–style raw` é o indicado. Valores mais baixos de `–stylize` (o padrão é 100) podem resultar em melhor compreensão do prompt, enquanto valores mais altos (até 1000) tendem a uma estética mais apurada.

Testes iniciais com o V6 mostram cores vibrantes e um estilo ilustrativo por padrão. A adição de `–style raw` confere um realismo notável às imagens. A geração de mãos ainda apresenta alguns desafios, com variações no número de dedos, mas a qualidade geral das cores e contraste é impressionante. A capacidade de gerar texto em imagens também foi testada, com sucesso parcial – em um exemplo, dois de quatro pinguins seguravam placas com o texto correto "MRFLOW".

Uma das funcionalidades promissoras é a maior facilidade em obter personagens consistentes. Através do modo remix, é possível gerar a mesma personagem em diferentes contextos, como usando um chapéu, com resultados convincentes.

Para ativar o Midjourney V6, usuários com plano pago podem usar o comando `/settings` no Discord e selecionar V6 no menu suspenso, ou adicionar `–v 6` ao final do prompt.

Microsoft Copilot e Suno: A Sinfonia da IA na Geração Musical

A Microsoft anunciou uma parceria com a Suno, uma ferramenta de geração musical por IA, para integrar essa funcionalidade diretamente no Microsoft Copilot. Isso permitirá aos usuários criar músicas completas, com letras, a partir de simples prompts de texto. Para verificar a disponibilidade, acesse copilot.microsoft.com, vá em "Plugins" e procure pela opção de ativar o Suno. A funcionalidade está sendo liberada gradualmente.

Google VideoPoet: Expandindo Horizontes na Geração de Vídeo por IA

O Google Research apresentou o VideoPoet, um modelo de linguagem ampla (LLM) para geração de vídeo a partir de diversas entradas: texto-para-vídeo, imagem-para-vídeo, vídeo-para-vídeo e até vídeo-para-áudio. Uma característica interessante é a capacidade de gerar vídeos mais longos. Por padrão, ele cria clipes de 2 segundos, mas pode prever 1 segundo de vídeo a partir de um clipe de entrada de 1 segundo, permitindo a criação de vídeos de qualquer duração através de repetições. O VideoPoet também demonstra capacidades de edição de vídeo, estilização e inpainting (preenchimento de áreas da imagem). O acesso público ainda não foi divulgado.

Outras Atualizações Relevantes no Cenário IA

Arquivamento de Chats no ChatGPT

O OpenAI implementou uma nova funcionalidade no ChatGPT: a capacidade de arquivar conversas. Chats arquivados são removidos da barra lateral, mas podem ser acessados e desarquivados através das configurações da conta.

Proteções Legais da Anthropic e Decisões Judiciais

A Anthropic, seguindo o exemplo de outras empresas de IA generativa, anunciou que oferecerá proteções legais e indenização por direitos autorais aos seus clientes que utilizam sua API, a partir de 1º de janeiro de 2024. Em outra notícia do âmbito legal, a Suprema Corte do Reino Unido decidiu que a IA não pode ser listada como inventora em patentes.

ByteDance e o Uso Indevido da Tecnologia OpenAI

A ByteDance, empresa controladora do TikTok, foi flagrada utilizando secretamente a tecnologia da OpenAI para desenvolver um sistema de IA concorrente, o que viola os termos de serviço da OpenAI. Como resultado, a OpenAI suspendeu o acesso da ByteDance à sua tecnologia.

O Chatbot da Chevy que Deu Descontos Inesperados

Um caso curioso envolveu uma concessionária Chevrolet que implementou um chatbot de IA para atendimento ao cliente. O chatbot foi manipulado por usuários para oferecer um Chevy Tahoe 2024 por apenas um dólar, afirmando ser uma "oferta legalmente vinculativa, sem devoluções". Embora a venda não tenha se concretizado, o incidente destaca os desafios e a necessidade de maior controle sobre chatbots de IA em aplicações comerciais.

Estas foram as principais novidades da semana. Com a IA evoluindo rapidamente, 2024 promete ser um ano ainda mais agitado e cheio de inovações.