По време на годишната си конференция Cloud Next 2024, която се провежда в Лас Вегас, Google обяви редица нови услуги и обновления. Сред най-вълнуващите новости са публичната бета версия на Gemini 1.5 Pro, Vertex AI Agent Builder – услуга за създаване на AI агенти, както и възможността за създаване на кратки видеоклипове с Imagen 2.0.
Now a few words from Sundar Pichai, CEO of Google and Alphabet, on Gemini 1.5 Pro…#GoogleCloudNext pic.twitter.com/LXW33rTjhS
— Google Cloud (@googlecloud) April 9, 2024
Gemini 1.5 Pro предлага безпрецедентен контекстуален прозорец от 1 милион токени, което означава, че моделът може да обработва до 700 000 думи или около 30 000 реда код наведнъж. Това е около четири пъти повече от количеството данни, които водещият модел на Anthropic, Claude 3, може да приеме като входни данни, и около осем пъти повече от максималния контекст на GPT-4 Turbo на OpenAI.
We're bringing you the world's largest context window with Gemini 1.5 Pro—now available in preview in Vertex AI!
— Google Cloud (@googlecloud) April 9, 2024
We're also announcing the ability to process audio streams including speech. #GoogleCloudNext pic.twitter.com/5oEhwI8AyN
Освен това, Gemini 1.5 Pro вече може да обработва аудио файлове и да извлича информация от източници като бизнес обаждания или видеа, без да се изисква писмен транскрипт. Това дава възможност за безпроблемен междумодален анализ, който осигурява разбиране на текст, изображения, видеоклипове и аудио, посочват от компанията.
Gemini 1.5 Pro е наличен и през Google AI Studio, но за съжаление в момента достъпът от България е ограничен.
Gemini 1.5 Pro can now listen: Gemini 1.5 Pro can now process audio inputs like lecture or earnings calls and carry out various tasks, available in both Gemini API and Google AI Studio.
— Unwind AI (@_unwind_ai) April 10, 2024
Google AI Studio: https://t.co/UjTpnWu5Tu pic.twitter.com/zBEzqouKqo
Imagen 2.0, моделът на Google за генериране на изображения също получава разширени функции за редактиране на снимки, включително inpainting и outpainting.
We’re also updating Imagen 2’s image generation capability with advanced photo editing features, including inpainting & outpainting 🖌️
— Google Cloud (@googlecloud) April 9, 2024
With Imagen 2 on Vertex AI (now GA), remove unwanted elements in an image, add new elements & more. #GoogleCloudNext pic.twitter.com/rTrSiBeB9W
По-интересното обаче е, че моделът вече може да създава и кратки видеоклипове или „живи изображения“ от текстови описания. С 24 кадъра в секунда и резолюция 360×640, Imagen 2.0 може да генерира динамични сцени от различни ъгли, на различни тематики, като природа, храна, животни и др. Освен това, функцията за дигитални водни знаци, задвижвана от SynthID на Google DeepMind, е вече общодостъпна за клиентите на компанията.
Today’s preview of text-to-live image capabilities makes Imagen even more powerful for enterprises!
— Google Cloud (@googlecloud) April 9, 2024
Now marketing and creative teams can generate animated images, such as gifs and more, from a text prompt → https://t.co/hgrxByQfil #GoogleCloudNext pic.twitter.com/lN6ohzfYHN
За разработчиците Google представи Gemini Code Assist – AI инструмент за кодиране, насочен към бизнеса. Той ще бъде достъпен чрез плъгини за популярни редактори като VS Code и JetBrains.
App development news from #GoogleCloudNext: Gemini Code Assist, code customization, and more!
— Google Cloud (@googlecloud) April 9, 2024
Learn more about the new solutions to enhance developer productivity with #generativeAI, and make it easier to create your own gen AI apps on Google Cloud → https://t.co/AKGy9VqwEH pic.twitter.com/SkDwJc9lLn
Освен това, Google добавя CodeGemma към Vertex AI – нов модел от семейството отворени езикови модели Gemma.
Технологичният гигант представи и Vertex AI Agent Builder – „услуга, която съчетава мощта на базовите модели, възможностите за търсене в Google и богат набор от инструменти за разработчици“. Целта на тази услуга е да подпомогне бизнеса в процеса на изграждане и внедряване на генеративни AI агенти, които могат да се използват в широк спектър от сценарии и приложения
Vertex AI Agent Builder позволява на хората много лесно и бързо да създават разговорни агенти
– заяви Томас Куриан, главен изпълнителен директор на Google Cloud.
Можете да изграждате и внедрявате готови за производство генеративни AI агенти, да ги инструктирате и насочвате по същия начин, както хората, за да подобрите качеството и точността на отговорите от моделите.
To help you easily build and deploy enterprise-ready #generativeAI experiences—no matter your skill level—we’re pleased to announce at #GoogleCloudNext: Vertex AI Agent Builder 🎉
— Google Cloud (@googlecloud) April 9, 2024
Take a closer look at Vertex AI Agent Builder’s capabilities → https://t.co/omv0YGaaTb pic.twitter.com/vSgtxja5BP
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!