A inteligência artificial (IA) está transformando radicalmente a maneira como criamos e consumimos conteúdo. Em um webinar recente, Stan Massueras, responsável pelo desenvolvimento da ElevenLabs na Europa, e Laodis Menard, cofundador da Argil.ai, apresentaram as últimas inovações em IA de áudio e vídeo, destacando como suas tecnologias estão capacitando criadores e empresas a alcançar novos patamares de engajamento e acessibilidade.
A ElevenLabs, uma empresa europeia com forte presença no mercado francês, demonstrou um crescimento impressionante, passando de 30 para mais de 100 funcionários em 2024. Seu portfólio de ferramentas de áudio baseadas em IA é vasto e cobre diversas necessidades:
A missão da ElevenLabs é quebrar as barreiras linguísticas, permitindo que o conteúdo seja acessível em qualquer idioma, voz ou som, impulsionando a criatividade e a produção em escala.
Stan Massueras destacou os avanços significativos da ElevenLabs em 2024 e compartilhou uma visão ambiciosa para 2025, focada em colocar a IA a serviço da humanidade.
Em 2024, a IA demonstrou seu valor inestimável para o setor de mídia. A ElevenLabs facilitou a expansão de audiências e o alcance de novas comunidades, especialmente através da localização de podcasts populares como "The Joe Rogan Experience" e "Huberman Lab". A tecnologia também foi crucial para a Time Magazine, que utilizou a IA para criar versões em áudio e interativas de seus artigos, incluindo a edição "Pessoa do Ano". Uma parceria estratégica com o grupo Bertelsmann levou as soluções da ElevenLabs para 38 de suas marcas, incluindo RTL e M6, para inovar em cinema, produção, rádio e audiolivros. Um exemplo notável foi a criação de um avatar de IA e voz profissional para Mac Lesggy do M6.
Para 2025, a ElevenLabs visa consolidar a voz como uma impressão digital da identidade, oferecendo vozes naturais, reatividade instantânea e controle criativo completo. A empresa planeja lançar novas ferramentas, como Speech-to-Text e geração de música por IA, reforçando sua liderança no mercado.
Stan Massueras demonstrou a facilidade de criar um agente de IA conversacional na plataforma da ElevenLabs. Em poucos minutos, foi possível configurar um agente para o webinar, definindo sua linguagem (francês, com suporte adicional para espanhol e inglês), mensagem inicial, persona (energético, com o objetivo de convencer participantes a comparecer e coletar emails) e base de conhecimento (URLs de LinkedIn, Argil.ai, informações do evento). A demonstração incluiu a capacidade do agente de alternar idiomas e acessar informações de sua base de conhecimento para responder perguntas específicas sobre o evento e os palestrantes.
Laodis Menard, cofundador da Argil.ai, apresentou a plataforma da empresa, focada na criação de avatares digitais e vídeos impactantes. A Argil.ai se destaca pela tecnologia de avatares mais realistas do mercado, com controle preciso sobre movimentos corporais e expressões faciais.
A Argil.ai permite transformar artigos de notícias ou blogs em vídeos envolventes em questão de minutos, com um custo inferior a $1 por minuto. A plataforma utiliza IA para analisar o texto, gerar scripts, selecionar ou gerar imagens e vídeos de ilustração (B-roll) e realizar a montagem final, resultando em conteúdo de vídeo dinâmico e contextualizado. Um exemplo prático foi a transformação de um artigo do Voici sobre Meghan Markle em um vídeo com avatar.
O processo de clonagem de um avatar na Argil.ai requer apenas cerca de três minutos de vídeo da pessoa em modo "face-cam". Após o treinamento do modelo, que leva algumas horas, o avatar pode ser utilizado em diversas produções. Para avatares de altíssima qualidade, a Argil.ai oferecerá a possibilidade de gravações em seus estúdios em Paris a partir de fevereiro de 2025. A empresa também planeja lançar um marketplace de atores, ampliando as opções para os criadores de conteúdo.
A parceria entre Argil.ai e ElevenLabs é fundamental, com a ElevenLabs fornecendo a tecnologia de voz para os avatares da Argil.ai, garantindo uma sincronia perfeita entre a voz e os movimentos labiais, além de uma qualidade de áudio excepcional. Esta colaboração já resultou em projetos de sucesso com grandes grupos de mídia como M6 e BFMTV.
As inovações apresentadas pela ElevenLabs e Argil.ai demonstram o potencial transformador da inteligência artificial na criação de conteúdo de áudio e vídeo. Desde a geração de vozes ultrarrealistas e a dublagem multilíngue até a criação de avatares digitais dinâmicos e agentes de IA conversacionais, essas tecnologias estão democratizando o acesso a ferramentas de produção de alta qualidade e abrindo novas fronteiras para a comunicação, o entretenimento e a educação. A integração dessas soluções promete um futuro onde a criação de conteúdo será mais rápida, acessível e impactante do que nunca.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.