Френският стартъп за изкуствен интелект Mistral AI представи новия си модел „Large 2“, който обещава производителност, сравнима с водещите модели в индустрията.
Large 2 е модел с 123 млрд. параметри, който според френската компания превъзхожда своя предшественик в генерирането на код, математиката и разсъжденията. Моделът има контекстен прозорец от 128 000 токена и поддържа множество езици, сред които френски, немски, испански, италиански, португалски, арабски, хинди, руски, китайски, японски и корейски. Освен това, може да работи с над 80 програмни езика, включително Python, Java, C, C++, JavaScript и др.
От Mistral AI твърдят, че Large 2 поставя нови стандарти по отношение „производителност/стойност“, като същевременно е много по-бърз и точен от своя предшественик. Според тестовете на компанията, Large 2 се доближава до водещите модели в индустрията.
Например, в областта на кодирането, новият модел значително превъзхожда своя предшественик и се конкурира с модели като GPT-4о и Llama 3.1 405B. Забележително е, че го постига с около една четвърт от параметрите на Llama 3.1 (123B срещу 405B).
Интересното при Large 2 е, че е проектиран така, че да сведе до минимум т.нар. „халюцинации“ или генерирането на правдоподобно звучаща, но фактически невярна или несъответстваща на действителността информация. Според френската компания, моделът е обучен да бъде по-внимателен и точен в отговорите си, като признава, когато не може да намери решение или няма достатъчно информация.
Large 2 е достъпен на официалния уебсайт на Mistral, HuggingFace, както и на платформите Google Vertex AI, Azure AI Studio, Amazon Bedrock и IBM Watson. Освен това, всеки, който желае да го тества, може да го направи безплатно на чатбот платформата на компанията, наречена Le Chat.
Важно е да отбележим, че моделът е лицензиран като „отворен“ само за изследователски цели. За търговска употреба се изисква отделен лиценз и споразумение с френската компания.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!