Днес, 18 юли, два месеца след пускането на GPT-4o, OpenAI представи по-малка версия на модела, наречена GPT-4o mini. Новият модел е създаден като заместител на GPT-3.5 Turbo и ще бъде интегриран в ChatGPT.

GPT-4o mini разполага с голям контекстен прозорец от 128K токена и информация, актуализирана до октомври 2023 г. Моделът е проектиран да бъде по-бърз и по-евтин от своите предшественици, а OpenAI го описва като „най-способния и икономичен малък модел, наличен днес“. Цената на GPT-4o mini е 15 цента за 1 милион входни токена и 60 цента за 1 милион изходни, което го прави 60% по-евтин от GPT-3.5 Turbo. За сравнение, цената на GPT-4o е $2.50 за 1 милион входни и $5 за 1 милион изходни токена.

GPT-4o mini и по-големият му брат GPT-4o са част от стремежа на OpenAI да бъде лидер в областта на „мултимодалността“, което се отнася до способността на изкуствения интелект да обработва и генерира различни видове данни, като текст, изображения, аудио и видео. Въпреки че в момента както GPT-4o, така и GPT-4o mini поддържат само текст и изображения, OpenAI посочва, че в бъдеще ще работят и с видео и аудио.

OpenAI също така обясни, че GPT-4o mini ще бъде първият модел на компанията, който използва техника, наречена „йерархия на инструкциите“. Тази техника дава предимство на някои инструкции пред други, което затруднява извършването на атаки с инжектиране на указания (prompts) или т.нар. „jailbreaks“, като по този начин увеличава сигурността и устойчивостта на модела.

Що се отнася до производителността, от OpenAI твърдят, че GPT-4o mini постига резултат от 82% на MMLU теста (Massive Multitask Language Understanding), който измерва способностите на модела за разсъждение. За сравнение, конкурентните модели Claude 3 Haiku на Anthropic и Gemini 1.5 Flash от Google постигат съответно 73,8% и 77,9%. По-големите модели като GPT-4o и Gemini Ultra достигат резултати от 88,7% до 90%.

GPT-4o mini
Source: OpenAI

В областта на математиката и програмирането GPT-4o mini също се представя впечатляващо, постигайки 87,0% на MGSM теста (математическо разсъждение) и 87,2% на HumanEval (програмиране). За сравнение, Gemini Flash постигa съответно 75,5% и 71,5%, а Claude Haiku – 71,7% и 75,9%. Освен това, моделът се представя добре и на MMMU теста (мултимодално разсъждение), постигайки резултат от 59,4% в сравнение с 56,1% за Gemini Flash и 50,2% за Claude Haiku.

Новият модел ще бъде достъпен както за потребители на безплатната версия на ChatGPT, така и за абонатите на ChatGPT Plus и Team, а през следващата седмица ще бъде на разположение и за корпоративните клиенти на ChatGPT Enterprise.

За разработчиците моделът ще бъде достъпен чрез различни API, включително Assistants API, Chat Completions API и Batch API.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: