Днес, по време на събитие, предавано на живо, OpenAI представи GPT-4o – революционен мултимодален модел на изкуствен интелект (AI), предлагащ разширени възможности за работа с текст, изображения, видео и аудио.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
Главният технологичен директор на OpenAI, Мира Мурати, обясни, че GPT-4o („o“ за „omni“) ще осигури „интелигентност на ниво GPT-4“ за всички потребители, включително и за тези, които използват безплатната версия на ChatGPT. Платените абонати, от друга страна, ще се радват на до пет пъти по-голям капацитет на заявки.
По време на събитието OpenAI демонстрира гласовите възможности на GPT-4o, които, за разлика от всички предишни версии, са изключително бързи и без никакво забавяне. Моделът демонстрира почти мигновена реакция по време на гласови разговори, може да регулира емоционалния си тон и дори да улавя емоциите на потребителите въз основа на техния глас, подобно на изкуствения интелект с емоционална интелигентност на Hume.
OpenAI just announced "GPT-4o". It can reason with voice, vision, and text.
— Lior⚡ (@AlphaSignalAI) May 13, 2024
The model is 2x faster, 50% cheaper, and has 5x higher rate limit than GPT-4 Turbo.
It will be available for free users and via the API.
The voice model can even pick up on emotion and generate… pic.twitter.com/X8zqN9bxFp
So now #OpenAI can work on visual recognition and relate it to emotional states. pic.twitter.com/fVGJBq55Ds
— Matt Capon (@MattLCapon) May 13, 2024
OpenAI has just demonstrated its new GPT-4o model doing real-time translations 🤯 pic.twitter.com/Cl0gp9v3kN
— Tom Warren (@tomwarren) May 13, 2024
GPT-4o разполага и с подобрени възможности за възприемане и анализ на визуална информация, които позволяват на потребителите да взаимодействат с изкуствения интелект чрез изображения и видео. Компанията представи и нова десктоп версия на ChatGPT, чрез която чатботът дори може да вижда екрана на потребителите и да им помага с различни проблеми. Тя ще бъде първоначално налична за macOS, а на по-късен етап и за Windows.
Live demo of coding assistance and desktop app pic.twitter.com/GlSPDLJYsZ
— OpenAI (@OpenAI) May 13, 2024
It's only been 2 hours since Open AI launched GPT-4o, and people are going crazy over it.
— Angry Tom (@AngryTomtweets) May 13, 2024
Here are 10 wild examples you don't want to miss:
1. Math Problems with GPT-4o pic.twitter.com/BRE755yGRv
GPT-4o as tested by @BeMyEyes: pic.twitter.com/WeAoVmxUFH
— Greg Brockman (@gdb) May 14, 2024
Новият гласов (и видео) режим е най-добрият компютърен интерфейс, който някога съм използвал
– написа в своя блог главният изпълнителен директор на OpenAI, Сам Алтман.
Усещането е като на изкуствен интелект от филмите; и все още е малко изненадващо за мен, че е истински.
GPT-4o също така може да генерира комбинации от аудио, текст и изображения.
GPT-4o can also generate any combination of audio, text, and image outputs, which leads to interesting new capabilities we are still exploring.
— Greg Brockman (@gdb) May 13, 2024
See e.g. the "Explorations of capabilities" section in our launch blog post (https://t.co/f1fDnDBVAK), or these generated images: pic.twitter.com/5x63sBKZPY
За да направи своята технология „по-достъпна и полезена в световен мащаб“, OpenAI сподели в блог пост, че „езиковите възможности на GPT-4o са подобрени по отношение на качеството и скоростта, като ChatGPT вече поддържа повече от 50 езика (включително български) при регистрация и влизане, потребителски настройки и др.“
За разработчиците API-тата на GPT-4o ще се предлагат на половин цена и с два пъти по-висока скорост от GPT-4 Turbo, както и пет пъти по-високи рейт лимити.
OpenAI заяви, че GPT-4o ще бъде пуснат първо за платените абонати на ChatGPT Plus, Team и Enterprise през следващите дни, като в крайна сметка ще бъде на разположение и за безплатните потребители на ChatGPT.
Новият гласов режим, от друга страна, ще бъде пуснат през следващите седмици за абонатите на ChatGPT Plus, поясниха от компанията.
Можете да изгледате цялото събитие в канала на OpenAI в YouTube.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!