OpenAI обяви, че „GPT-4 Turbo with Vision“, най-новият модел от серията GPT-4, който включва възможност за визуално възприятие, е вече общодостъпен за разработчици през API.

От OpenAI твърдят, че моделът е „значително подобрен“, особено в областта на математиката. GPT-4 Turbo with Vision запазва контекстен прозорец от 128 000 токена, подобно на GPT-4 Turbo, и разполага с информация до декември 2023 г.

Моделът поддържа извикване на функции и JSON режим при работа с изображения – нещо, за което много разработчици настояваха. GPT-4 Turbo with Vision има способността да анализира едновременно текст и изображения в една API заявка, елиминирайки нуждата от използване на отделни модели и опростявайки процеса за разработчиците.

Моделът е достъпен за всички платени клиенти на OpenAI API и скоро ще бъде интегриран и в интерфейса на ChatGPT за крайните потребители.

OpenAI сподели някои начини, по които разработчиците вече използват модела. Например Devin, нашумелият AI асистент за софтуерно инженерство, използва GPT-4 Turbo с Vision за различни задачи свързани с програмирането, Healthify, приложение за здраве и фитнес, го прилага за сканиране на снимки на ястия и предоставяне на информация за хранителни стойности, а компанията Make Real го използва за превръщане на рисунки в работещи компоненти за уебсайтове.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: