A Mistral AI, empresa europeia que tem se destacado no cenário da inteligência artificial, anunciou recentemente o lançamento do seu mais novo e avançado modelo de linguagem: o Mistral Large. Este modelo chega com a promessa de capacidades de raciocínio de ponta, estabelecendo um novo padrão no campo e posicionando-se como um forte concorrente para os principais LLMs do mercado. O Mistral Large já está disponível através da plataforma da própria Mistral, "La Plateforme", e também no Azure AI da Microsoft, seu primeiro parceiro de distribuição.
O Mistral Large, também referido como Au Large, é o modelo de linguagem mais sofisticado desenvolvido pela Mistral AI até o momento. Ele foi projetado para oferecer geração de texto de vanguarda e um nível de raciocínio superior, tornando-o ideal para tarefas complexas. Suas principais aptidões incluem raciocínio multilíngue complexo, compreensão profunda de texto, capacidade de transformação de dados e geração de código eficiente. De acordo com a Mistral AI, este modelo representa um marco significativo em sua missão de fornecer modelos de IA abertos e de ponta.
Em termos de desempenho, o Mistral Large demonstra resultados impressionantes em diversos benchmarks amplamente utilizados. No MMLU (Measuring Massive Multitask Language Understanding), um benchmark que avalia a compreensão massiva de linguagem em múltiplas tarefas, o Mistral Large alcançou uma pontuação de 81.2%. Este resultado o coloca à frente de modelos renomados como Claude 2 da Anthropic, Gemini Pro do Google, GPT-3.5 da OpenAI e Llama 2 70B da Meta. No MMLU, ele se posiciona como o segundo melhor modelo disponível via API, ficando atrás apenas do GPT-4, que obteve 86.4%.
A Mistral AI destaca que seu novo modelo principal supera consistentemente outros modelos como GPT-3.5 e Llama 2 70B em uma variedade de benchmarks comuns que avaliam raciocínio e conhecimento. Em testes como HellaSwag (raciocínio de senso comum), WinoGrande (raciocínio de senso comum), Arc Challenge (raciocínio e resposta a perguntas) e TruthfulQA (veracidade), o Mistral Large exibe forte performance, aproximando-se e, em alguns casos específicos de Arc Challenge, superando o GPT-4.
O Mistral Large não se destaca apenas em benchmarks, mas também por um conjunto robusto de capacidades:
O Mistral Large está acessível através de duas vias principais: "La Plateforme", a infraestrutura própria da Mistral AI hospedada na Europa, e o Azure. A Microsoft é o primeiro parceiro de distribuição do Mistral Large, tornando o modelo disponível para um público mais amplo de desenvolvedores e empresas através de seus serviços de nuvem. É importante notar que, atualmente, o Mistral Large é um modelo de código fechado (closed-source).
Para facilitar a interação com seus modelos, incluindo o Large, a Mistral AI também lançou uma nova interface de chat chamada "Le Chat", acessível em chat.mistral.ai. Esta interface, atualmente em versão beta, permite aos usuários experimentarem diretamente as capacidades dos modelos Mistral.
A parceria com a Microsoft permite que os usuários acessem o Mistral Large através do Azure AI Studio e do Azure Machine Learning. O modelo pode ser utilizado em um esquema de "pay-as-you-go", oferecendo flexibilidade para empresas de diferentes portes. A Microsoft detalhou em seu blog os passos para começar a usar o Mistral Large no Azure, desde a abertura do modelo no catálogo até sua implantação.
Juntamente com o Mistral Large, a Mistral AI também introduziu o Mistral Small. Este modelo foi otimizado para tarefas que exigem baixa latência e um custo reduzido. Apesar de ser uma versão menor, o Mistral Small supera o desempenho do Mixtral 8x7B (um modelo de mistura de especialistas da própria Mistral) e apresenta uma latência ainda menor. Ele se beneficia das mesmas inovações presentes no Mistral Large, como RAG (Retrieval Augmented Generation) e chamada de função.
A empresa também está simplificando sua oferta de endpoints. Agora, existem endpoints open-weight com preços competitivos para os modelos open-source open-mistral-7B e open-mixtral-8x7B. Além disso, foram introduzidos novos endpoints de modelos otimizados: mistral-small-2402 e mistral-large-2402. O modelo mistral-medium continua sendo mantido.
A Mistral AI demonstra um forte compromisso com a comunidade de desenvolvedores, e isso se reflete nas funcionalidades do Mistral Large. Uma característica importante é o modo de formato JSON, que força a saída do modelo de linguagem a ser um JSON válido. Essa funcionalidade é crucial para desenvolvedores que precisam integrar a saída do LLM em outras aplicações e sistemas de forma estruturada.
A capacidade de chamada de função (function calling) é outra ferramenta poderosa. Ela permite que os desenvolvedores interajam com os endpoints da Mistral utilizando um conjunto de suas próprias ferramentas. Isso possibilita interações mais complexas e personalizadas, seja com código interno, APIs externas ou bancos de dados, abrindo um leque de possibilidades para a criação de aplicações sofisticadas.
O lançamento do Mistral Large e do Mistral Small solidifica a posição da Mistral AI como uma força inovadora no campo da inteligência artificial. Com seu desempenho competitivo, especialmente em raciocínio e tarefas multilíngues, o Mistral Large se apresenta como uma alternativa viável e poderosa aos modelos de linguagem de grande escala existentes. A parceria estratégica com a Microsoft para disponibilização no Azure amplia significativamente seu alcance, prometendo impulsionar novas aplicações e soluções baseadas em IA. Para desenvolvedores e empresas, a chegada desses novos modelos significa mais opções e ferramentas avançadas para construir a próxima geração de produtos e serviços inteligentes.
Exploramos as consequências das armas nucleares no espaço para a Terra e a importância de leis internacionais
Descubra como a HeyRosie, uma startup de Inteligência Artificial, está revolucionando o atendimento telefônico para pequenos negócios, oferecendo uma solução mais eficiente e acessível. Conheça os insights de Jordan Gal.
Explore os limites do ChatGPT Operator da OpenAI! Testamos sua capacidade de multitarefa, desde encontrar produtos a criar planos de negócios com IA. Veja os sucessos e desafios.