Inteligência Artificial

Mistral Large: O Novo Gigante da IA que Desafia o GPT-4

Xavier

31 Mai 2025 • 4 min read

A Mistral AI, empresa europeia que tem se destacado no cenário da inteligência artificial, anunciou recentemente o lançamento do seu mais novo e avançado modelo de linguagem: o Mistral Large. Este modelo chega com a promessa de capacidades de raciocínio de ponta, estabelecendo um novo padrão no campo e posicionando-se como um forte concorrente para os principais LLMs do mercado. O Mistral Large já está disponível através da plataforma da própria Mistral, "La Plateforme", e também no Azure AI da Microsoft, seu primeiro parceiro de distribuição.

O que é o Mistral Large?

O Mistral Large, também referido como Au Large, é o modelo de linguagem mais sofisticado desenvolvido pela Mistral AI até o momento. Ele foi projetado para oferecer geração de texto de vanguarda e um nível de raciocínio superior, tornando-o ideal para tarefas complexas. Suas principais aptidões incluem raciocínio multilíngue complexo, compreensão profunda de texto, capacidade de transformação de dados e geração de código eficiente. De acordo com a Mistral AI, este modelo representa um marco significativo em sua missão de fornecer modelos de IA abertos e de ponta.

Desempenho e Benchmarks do Mistral Large

Em termos de desempenho, o Mistral Large demonstra resultados impressionantes em diversos benchmarks amplamente utilizados. No MMLU (Measuring Massive Multitask Language Understanding), um benchmark que avalia a compreensão massiva de linguagem em múltiplas tarefas, o Mistral Large alcançou uma pontuação de 81.2%. Este resultado o coloca à frente de modelos renomados como Claude 2 da Anthropic, Gemini Pro do Google, GPT-3.5 da OpenAI e Llama 2 70B da Meta. No MMLU, ele se posiciona como o segundo melhor modelo disponível via API, ficando atrás apenas do GPT-4, que obteve 86.4%.

A Mistral AI destaca que seu novo modelo principal supera consistentemente outros modelos como GPT-3.5 e Llama 2 70B em uma variedade de benchmarks comuns que avaliam raciocínio e conhecimento. Em testes como HellaSwag (raciocínio de senso comum), WinoGrande (raciocínio de senso comum), Arc Challenge (raciocínio e resposta a perguntas) e TruthfulQA (veracidade), o Mistral Large exibe forte performance, aproximando-se e, em alguns casos específicos de Arc Challenge, superando o GPT-4.

Capacidades Essenciais do Mistral Large

O Mistral Large não se destaca apenas em benchmarks, mas também por um conjunto robusto de capacidades:

Multilinguismo Avançado: É nativamente fluente em inglês, francês, espanhol, alemão e italiano. Sua compreensão vai além da tradução literal, abrangendo nuances gramaticais e contexto cultural de cada idioma.
Ampla Janela de Contexto: Possui uma janela de contexto de 32.000 tokens, o que permite ao modelo processar e recordar informações precisas de documentos extensos com maior eficácia.
Seguimento Preciso de Instruções: A capacidade de seguir instruções com precisão é um dos seus pontos fortes, permitindo que desenvolvedores criem políticas de moderação e guiem o comportamento do modelo de forma mais granular. Por exemplo, a Mistral AI utilizou essa capacidade para configurar a moderação em nível de sistema para sua interface de chat, Le Chat.
Chamada de Função Nativa (Function Calling): O modelo é nativamente capaz de realizar chamadas de função. Isso, combinado com um modo de saída restrito implementado na "La Plateforme", facilita o desenvolvimento de aplicações e a modernização de pilhas tecnológicas em escala, permitindo interações mais complexas com ferramentas e bases de dados externas.

Acesso ao Mistral Large e Parceria com a Microsoft

O Mistral Large está acessível através de duas vias principais: "La Plateforme", a infraestrutura própria da Mistral AI hospedada na Europa, e o Azure. A Microsoft é o primeiro parceiro de distribuição do Mistral Large, tornando o modelo disponível para um público mais amplo de desenvolvedores e empresas através de seus serviços de nuvem. É importante notar que, atualmente, o Mistral Large é um modelo de código fechado (closed-source).

Para facilitar a interação com seus modelos, incluindo o Large, a Mistral AI também lançou uma nova interface de chat chamada "Le Chat", acessível em chat.mistral.ai. Esta interface, atualmente em versão beta, permite aos usuários experimentarem diretamente as capacidades dos modelos Mistral.

Mistral Large no Azure AI Studio

A parceria com a Microsoft permite que os usuários acessem o Mistral Large através do Azure AI Studio e do Azure Machine Learning. O modelo pode ser utilizado em um esquema de "pay-as-you-go", oferecendo flexibilidade para empresas de diferentes portes. A Microsoft detalhou em seu blog os passos para começar a usar o Mistral Large no Azure, desde a abertura do modelo no catálogo até sua implantação.

Conheça Também o Mistral Small e Outras Novidades

Juntamente com o Mistral Large, a Mistral AI também introduziu o Mistral Small. Este modelo foi otimizado para tarefas que exigem baixa latência e um custo reduzido. Apesar de ser uma versão menor, o Mistral Small supera o desempenho do Mixtral 8x7B (um modelo de mistura de especialistas da própria Mistral) e apresenta uma latência ainda menor. Ele se beneficia das mesmas inovações presentes no Mistral Large, como RAG (Retrieval Augmented Generation) e chamada de função.

A empresa também está simplificando sua oferta de endpoints. Agora, existem endpoints open-weight com preços competitivos para os modelos open-source open-mistral-7B e open-mixtral-8x7B. Além disso, foram introduzidos novos endpoints de modelos otimizados: mistral-small-2402 e mistral-large-2402. O modelo mistral-medium continua sendo mantido.

Foco em Desenvolvedores: Formato JSON e Chamada de Função no Mistral Large

A Mistral AI demonstra um forte compromisso com a comunidade de desenvolvedores, e isso se reflete nas funcionalidades do Mistral Large. Uma característica importante é o modo de formato JSON, que força a saída do modelo de linguagem a ser um JSON válido. Essa funcionalidade é crucial para desenvolvedores que precisam integrar a saída do LLM em outras aplicações e sistemas de forma estruturada.

A capacidade de chamada de função (function calling) é outra ferramenta poderosa. Ela permite que os desenvolvedores interajam com os endpoints da Mistral utilizando um conjunto de suas próprias ferramentas. Isso possibilita interações mais complexas e personalizadas, seja com código interno, APIs externas ou bancos de dados, abrindo um leque de possibilidades para a criação de aplicações sofisticadas.

Conclusão

O lançamento do Mistral Large e do Mistral Small solidifica a posição da Mistral AI como uma força inovadora no campo da inteligência artificial. Com seu desempenho competitivo, especialmente em raciocínio e tarefas multilíngues, o Mistral Large se apresenta como uma alternativa viável e poderosa aos modelos de linguagem de grande escala existentes. A parceria estratégica com a Microsoft para disponibilização no Azure amplia significativamente seu alcance, prometendo impulsionar novas aplicações e soluções baseadas em IA. Para desenvolvedores e empresas, a chegada desses novos modelos significa mais opções e ferramentas avançadas para construir a próxima geração de produtos e serviços inteligentes.