A Meta AI, sob a liderança de Mark Zuckerberg, surpreendeu a comunidade de inteligência artificial ao lançar sua nova família de modelos, Llama 4, em um sábado. Este lançamento não apenas demonstra a rápida evolução no campo da IA, mas também reforça o compromisso da Meta com modelos open source de ponta. A família Llama 4 chega com três modelos principais: Llama 4 Scout, Llama 4 Maverick e o colossal Llama 4 Behemoth, cada um projetado para diferentes escalas e aplicações, prometendo revolucionar desde a compreensão de texto e visual até a geração de código e o raciocínio complexo.
A Meta não lançou apenas um, mas três modelos massivos sob a bandeira Llama 4, cada um com características e capacidades distintas, visando atender a uma ampla gama de necessidades no desenvolvimento de IA.
O Llama 4 Scout é um modelo com 17 bilhões de parâmetros ativos e 16 "experts" (especialistas em uma arquitetura Mixture-of-Experts). Seu grande destaque é uma janela de contexto recorde de 10 milhões de tokens, o que equivale a processar textos com mais de 5 milhões de palavras. Essa capacidade permite ao Scout superar modelos como Gemma 3, Gemini 2.0 Flash-Lite e Mistral 3.1 em diversos benchmarks. A arquitetura iRope, mencionada no contexto de sua capacidade de lidar com contextos longos, é fundamental para essa performance, permitindo tarefas como sumarização de múltiplos documentos e raciocínio sobre grandes bases de código de forma eficiente.
Compartilhando os 17 bilhões de parâmetros ativos do Scout, o Llama 4 Maverick eleva o número de "experts" para 128, totalizando 400 bilhões de parâmetros. Este modelo é descrito como o mais poderoso multimodal open source da Meta, com inteligência líder na indústria e respostas rápidas a baixo custo. Ele se destaca em tarefas de "image grounding" (ancoragem de imagem), superando o GPT-4o da OpenAI e o Gemini 2.0 Flash do Google. Em benchmarks de raciocínio e codificação, o Maverick iguala o DeepSeek v3.1, mesmo com metade do seu tamanho, e alcançou uma impressionante pontuação Elo de mais de 1400 no LM Arena.
Ainda em treinamento, o Llama 4 Behemoth é o mais robusto da família, com 288 bilhões de parâmetros ativos, 16 "experts" e um total de 2 trilhões de parâmetros. Mesmo em fase de desenvolvimento, já demonstra superioridade em relação a modelos como GPT-4.5, Claude 3.7 Sonnet e Gemini 2.0 Pro em benchmarks STEM. O Behemoth é posicionado como o modelo "professor" mais inteligente para destilação, servindo de base para o treinamento e aprimoramento dos outros modelos da série Llama 4.
Os modelos Llama 4 introduzem avanços significativos que têm o potencial de transformar a maneira como interagimos e utilizamos a inteligência artificial.
A capacidade do Llama 4 Scout de processar até 10 milhões de tokens em sua janela de contexto é um marco. Isso pode potencialmente eliminar a necessidade de técnicas como Retrieval-Augmented Generation (RAG) em muitos cenários, pois o modelo pode analisar volumes de informação muito maiores diretamente. Aplicações como sumarização de múltiplos documentos extensos, análise profunda de grandes bases de código e compreensão de narrativas complexas tornam-se mais viáveis e eficientes.
Tanto o Scout quanto o Maverick utilizam a arquitetura Mixture-of-Experts (MoE). Neste tipo de arquitetura, cada token de entrada ativa apenas um subconjunto dos "experts" (parâmetros especializados), tornando o processo mais eficiente em termos computacionais e de treinamento. Essa eficiência permite que modelos poderosos, como o Scout, caibam em uma única GPU NVIDIA H100, democratizando o acesso a capacidades de IA de ponta.
Os modelos Llama 4 Scout e Maverick são os primeiros modelos de linguagem grande (LLMs) open source da Meta com multimodalidade nativa. Eles utilizam "early fusion" para integrar dados de texto e visão de forma coesa desde o início do processamento. Isso abre portas para experiências de IA mais ricas e personalizadas, onde a compreensão e geração de conteúdo podem se basear em múltiplas formas de informação simultaneamente.
A Meta disponibilizou os modelos Llama 4 Scout e Maverick para download através do site llama.meta.com e da plataforma Hugging Face. Desenvolvedores e pesquisadores com a infraestrutura necessária podem hospedar esses modelos localmente. Além disso, é possível interagir com o Llama 4 através do chatbot da Meta AI e, para desenvolvedores que buscam APIs, o OpenRouter oferece acesso gratuito ao Llama 4 Maverick e ao Scout, facilitando a integração em diversas aplicações.
O vídeo de apresentação demonstra a capacidade dos modelos Llama 4 em diversas tarefas. O Llama 4 Scout, por exemplo, foi capaz de gerar o frontend para um aplicativo de notas adesivas (sticky notes) de forma rápida e funcional. Em testes de codificação, como a implementação do Jogo da Vida de Conway em Python, o Llama 4 Maverick demonstrou sua competência. Embora tenha enfrentado dificuldades em tarefas de geração de SVG mais complexas, como desenhar uma borboleta de forma precisa, o modelo se saiu bem em problemas de matemática envolvendo álgebra e movimento relativo, além de realizar análises de imagem, identificando corretamente a raça de um cachorro (Jack Russell Terrier) e descrevendo a cena. Em testes de raciocínio lógico com múltiplos condicionais, o Maverick também foi capaz de chegar à conclusão correta, identificando o culpado em um cenário hipotético. A capacidade de sumarização e compreensão de artigos extensos, facilitada pela grande janela de contexto do Scout, também foi destacada.
Em resumo, a família Meta Llama 4 representa um avanço significativo no campo da inteligência artificial, combinando alta performance, multimodalidade nativa e uma janela de contexto expansiva com a filosofia open source. Esses modelos prometem capacitar desenvolvedores e pesquisadores a criar aplicações de IA ainda mais sofisticadas e acessíveis, impulsionando a inovação em diversas áreas. O Llama 4 Behemoth, em particular, sinaliza um futuro onde modelos ainda mais poderosos estarão disponíveis, continuando a expandir as fronteiras do que é possível com a inteligência artificial.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.