Френският стартъп за изкуствен интелект Mistral представи своя първи специализиран модел за генериране на програмен код, наречен Codestral.
Codestral е отворен модел с 22 млрд. параметъра и контекстен прозорец от 32 хиляди токена. Той е обучен върху „разнообразен набор от данни от над 80 програмни езика, включително най-популярните, като Python, Java, C, C++, JavaScript и Bash“.
Според Mistral, Codestral „спестява време и усилия на разработчиците“, а „широката му езикова база гарантира, че ще може да подпомага разработчиците в различни среди за програмиране и проекти“.
От компанията твърдят, че моделът „поставя нов стандарт по отношение на производителност/латентност при генерирането на програмен код“. Според техните сравнителни тестове за C++, Bash, Java, PHP, TypeScript и C# и други, Codestral превъзхожда значително по-големи модели като 70-милиардния CodeLlama 3 и 33-милиардния Deep SeekCoder.
Освен това, благодарение на по-големия си контекстен прозорец от 32 000 токена, Codestral превъзхожда всички останали модели в RepoBench – сравнителен тест за генериране на по-дълъг код.
Mоделът е достъпен за изтегляне от платформата HuggingFace и чрез специален API на адрес codestral.mistral.ai, а всеки, който желае да го изпробва безплатно, може да го направи на чатбот платформата на френската компания, наречена Le Chat.
Освен това е интегриран и в приложения от трети страни като Continue.dev и Tabnine, където разработчиците могат да го използват в среди като VSCode и JetBrains.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!