Тази година, по време на конференция за разработчици Google I/O 2024, технологичният гигант представи множество интересни продукти и услуги, като централно място зае изкуственият интелект (AI).
The Gemini era is here, bringing the magic of AI to the tools you use every day. Learn more about all the announcements from #GoogleIO → https://t.co/ZQaDrmItuh pic.twitter.com/9Tu1C6WNqQ
— Google (@Google) May 14, 2024
Gemini 1.5 Pro с 1 милион токена вече и в България
От днес платената версия на чатбота Gemini (Gemini Advanced) използва текущия най-добър модел на Google – Gemini 1.5 Pro, който има контекстен прозорец от 1 милион токена (около 700 000 думи) .
Gemini Advanced вече се предлага в над 150 държави (включително България) и поддържа над 35 езика, в това число и български, а от Google предлагат двумесечен безплатен пробен период за новорегистрирани потребители.
Starting today, Gemini Advanced gives you access to our next-generation AI model, 1.5 Pro, with a 1 million token context window. Upload your documents — up to 1,500 pages — so you can tackle more complex problems than ever before. https://t.co/oES28UZ4n0 #GoogleIO pic.twitter.com/lKpmFF1Aqw
— Google (@Google) May 14, 2024
Project Astra
Може би най-интересният анонс от тазгодишната конференция I/O и директен отговор на Google по отношение на новия асистент на OpenAI, е Project Astra.
Google DeepMind го описва като „универсален агент, който разбира и реагира на света по същия начин като нас, хората“.
Project Astra е AI асистент, създаден да вижда света през „очите“ на вашия телефон или смарт очила, използвайки камера и гласово разпознаване, за да предоставя контекстуални отговори в реално време.
Project Astra is a prototype from @GoogleDeepMind exploring how a universal AI agent can be truly helpful in everyday life. Watch our prototype in action in two parts, each captured in a single take, in real time ↓ #GoogleIO pic.twitter.com/uMEjIJpsjO
— Google (@Google) May 14, 2024
Някои от възможностите на Project Astra, като например разбирането на видео, ще се появят в продукти на Google, като приложението Gemini, по-късно тази година, съобщи компанията в блог пост.
Google Veo
В началото на годината OpenAI показа Sora, своя AI видео модел, който предизвика истински фурор. В отговор на това, по време на Google I/O, технологичният гигант представи Veo – модел за генериране на видеоклипове от текст, изображения или видео, разработен от Google DeepMind.
Introducing Veo: our most capable generative video model. 🎥
— Google DeepMind (@GoogleDeepMind) May 14, 2024
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH
Veo може да генерира висококачествени видеоклипове с резолюция 1080p, които могат да бъдат с продължителност над минута, в широк спектър от стилове – от фотореализъм през сюрреализъм до анимация. „Моделът улавя точно нюансите и тона на указанията (prompts) и осигурява безпрецедентно ниво на творчески контрол“, посочват от Google DeepMind.
През следващите седмици някои от тези функции на Veo ще бъдат достъпни за избрани потребители чрез VideoFX – нов експериментален инструмент в labs.google. Желаещите да получат достъп до услугата могат да се запишат в списък с чакащи. В бъдеще някои от възможностите на Veo ще бъдат включени в YouTube Shorts и други продукти.
We put our cutting-edge video generation model Veo in the hands of filmmaker @DonaldGlover and his creative studio, Gilga.
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Let’s take a look. ↓ #GoogleIO pic.twitter.com/oNLDq1YlHC
Imagen 3
В областта на генераторите на изображения Google представи Imagen 3, най-новата и усъвършенствана версия на модела за генериране на изображения от текст, разработен от Google DeepMind. Imagen 3 разбира указанията по-добре и може да генерира висококачествени изображения в широк спектър от формати и стилове.
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
— Google DeepMind (@GoogleDeepMind) May 14, 2024
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
От днес Imagen 3 е достъпен за избрани потребители в ImageFX, като Google предлага и списък с чакащи, в който можете да се запишете. Моделът скоро ще бъде наличен и във Vertex AI.
4. Imagen 3: the highest quality text-to-image generation model yet.
— Lior⚡ (@AlphaSignalAI) May 14, 2024
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts. pic.twitter.com/5K0WW2RlJK
AI Overviews
По време на Google I/O технологичният гигант представи и AI Overviews, функция, която използва AI за обобщаване на резултатите от търсенето, с цел бързо и лесно намиране на информация. Първоначално услугата ще бъде достъпна в САЩ, а до края на годината ще достигне до повече от 1 милиард потребители в цял свят, заявиха от Google.
This is Search in the Gemini era. #GoogleIO pic.twitter.com/JxldNjbqyn
— Google (@Google) May 14, 2024
AI Overviews използва многопластово разсъждение чрез моделите Gemini. По този начин, когато зададете сложни въпроси, които изискват множество стъпки за отговор, търсачката разделя тези въпроси на части, определя реда за тяхното решаване и предоставя изчерпателни отговори.
Coming soon, we’ll bring new multi-step reasoning capabilities to Google Search. It breaks your bigger question down into parts and figures out which problems to solve and in what order, so research that might've taken you minutes or even hours can be done in seconds. #GoogleIO pic.twitter.com/Op8Iu7K21m
— Google (@Google) May 14, 2024
От Google дори представиха опция, която ще позволява задаването на въпроси, използвайки видео, директно в Google Search. Тази възможност ще бъде достъпна по-късно тази година.
And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024
Trillium TPU
Google представи и следващото си поколение – по-точно шестото – на своите чипове за изкуствен интелект Tensor Processing Units (TPU). Наречени Trillium, те ще бъдат пуснати на пазара по-късно тази година.
Тези нови TPU ще се отличават с 4,7-кратно увеличение на изчислителната производителност в сравнение с предишното поколение. Trillium TPU са част от хиперкомпютъра за изкуствен интелект на Google Cloud – революционна архитектура за суперкомпютри, разработена специално за най-съвременните натоварвания с изкуствен интелект, посочват от компанията.
6. Trillium, a TPU (GPU competitor) that delivers a 4.7x improvement in compute performance per chip over the previous generation, TPU v5e. pic.twitter.com/vgS3ESOC9R
— Lior⚡ (@AlphaSignalAI) May 14, 2024
Gemini 1.5 Flash и Gemma 2
Технологичният гигант представи и Gemini 1.5 Flash – по-лека и по-ефективна в сравнение с Gemini 1.5 Pro версия, оптимизирана за задачи, изискващи обработка на голям обем данни и работа с високи скорости. Той е проектиран с приоритет върху ниската латентност и ценова рентабилност, което го прави подходящ за приложения, при които бързото време за реакция е от решаващо значение.
Що се отнася до цената, 1 млн. токена при Gemini 1.5 Flash струват $0,35, което го прави доста по-изгоден от Gemini 1.5 Pro, при който 1 млн. токена са на цена от $3,50.
Today, we’re excited to introduce a new Gemini model: 1.5 Flash. ⚡
— Google DeepMind (@GoogleDeepMind) May 14, 2024
It’s a lighter weight model compared to 1.5 Pro and optimized for tasks where low latency and cost matter – like chat applications, extracting data from long documents and more. #GoogleIO pic.twitter.com/WP26QVUHC7
Google обяви и нов модел от серията Gemma, който има 27 милиарда параметри. Той ще бъде пуснат на пазара през юни и ще бъде оптимизиран за работа както с графичните процесори TPU на Google, така и с тези на Nvidia, съобщиха от компанията. Google твърди, че Gemma 2 (27B) има производителност, сравнима с тази на Llama 3 (70B).
Get a sneak peek of Gemma 2, our next generation of models that will include a 27B parameter instance launching in a few weeks. Built on new architecture, Gemma 27B outperforms models twice its size and can run on a single TPU host in Vertex AI. #GoogleIO pic.twitter.com/MtmXLzlufa
— Google (@Google) May 14, 2024
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!