Google обяви Gemini – AI модел, определен от технологичния гигант като „най-голямия и способен модел в историята на компанията.“ Той е резултат от мащабни усилия на различни екипи в Google, включително Google DeepMind и Google Research.
Горд и развълнуван съм да обявя началото на ерата Gemini – първата стъпка към един наистина универсален модел на изкуствен интелект
– заяви Демис Хасабис, съосновател и главен изпълнителен директор на Google DeepMind.
Gemini може да разбере заобикалящия ни свят по начина, по който ние го правим, и да възприема всякакъв вид вход и изход, т.е. не само текст като повечето модели, но и код, аудио, изображение и видео.
Seeing some qs on what Gemini *is* (beyond the zodiac :). Best way to understand Gemini’s underlying amazing capabilities is to see them in action, take a look ⬇️ pic.twitter.com/OiCZSsOnCc
— Sundar Pichai (@sundarpichai) December 6, 2023
Gemini 1.0, първият основополагащ модел, има три варианта: Ultra, за „много сложни задачи„, Pro, за „широк спектър от задачи„, и Nano, който може да се използва за специфични задачи и в мобилни устройства, като Pixel 8 Pro на Google.
Тази нова ера от модели представлява едно от най-големите научни и инженерни усилия, които сме предприемали като компания. Искрено се вълнувам от това, което предстои, и от възможностите, които Gemini ще разкрие за хората навсякъде по света
– заяви Сундар Пичай, главен изпълнителен директор на Alphabet Inc. и Google.
Според тестовете на Google, Gemini Ultra е първият модел, който превъзхожда човешките експерти в Maсивното многозадачно разбиране на езика (Measuring Massive Multitask Language Understanding, MMLU), като използва комбинация от 57 предмета като математика, физика, история, право, медицина и етика за проверка на познанията за света и способностите за решаване на проблеми. Предполага се, че моделът може да разбира нюансите и аргументите в сложни дисциплини.
Google твърди, че Gemini превъзхожда GPT-4 на OpenAI при 30 от 32 широко използвани академични теста за изследване и разработване на големи езикови модели. Най-същественото предимство на Gemini пред GPT-4 е способността му да разбира и взаимодейства с видео и аудио, тъй като от самото начало е проектиран като мултимодален модел.
От днес чатботът Bard на Google ще се захранва от Pro версията и ще се предлага на английски език в над 170 държави, само че България и страните от ЕС не са измежду тях.
Gemini също ще се използва за захранване на други продукти на Google, като например Search, Chrome и Duet AI, а от 13 декември разработчиците и корпоративните клиенти на Google ще имат достъп до Gemini Pro чрез API в Google AI Studio или Google Cloud Vertex AI.
В началото на следващата година технологичният гигант планира да пусне Bard Advanced, който ще се захранва от Gemini Ultra.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!