Meta, компанията зад Facebook, представи нова технология, наречена SceneScript, която може да промени начина, по който изкуственият интелект разбира и взаимодейства с физическия свят около нас.
SceneScript представлява иновативен метод за създаване на дигитални модели на физическите пространства, чрез реконструиране на детайлни 3D сцени. Тази технология е разработена, за да улесни разбирането на пространствени данни от устройства с добавена реалност (AR) и изкуствен интелект (AI).
За разлика от предишни подходи, този използва специален език за описание на пространствените сцени, подобно на начина, по който използваме думи, за да опишем света около нас. Концепцията е сходна с тази при предсказване на следващия токен, която използват и големите езикови модели (LLMs), но вместо да предсказва следващия символ или токен, моделът предсказва архитектурни и пространствени елементи, като „стена“, „врата“, „прозорец“ и т.н., поясняват от екипа на Meta AI.
Една от целите на SceneScript е да обогати големите езикови модели като GPT-4 с възможността за анализ и разсъждения върху физически пространства. Така, те могат да се превърнат в дигитални асистенти от следващо поколение, които разполагат с необходимия контекст от физическия свят за отговаряне на сложни пространствени запитвания, и не само.
Например, благодарение на възможността за разсъждение върху пространствени данни от страна на подобни AI/AR асистенти, можем да зададем въпроси от рода на: „Ще се побере ли това бюро в спалнята ми?“ или „Колко кутии боя ще са ми необходими за боядисване на тази стая?“. Вместо да се налага да търсим ролетка, да записваме измервания и самостоятелно да пресмятаме отговора чрез математически изчисления, чат асистентът с достъп до SceneScript може да предостави отговор за части от секундата, посочват от Meta.
За да тренират модела, от компанията са създали синтетичен набор от данни, наречен Aria Synthetic Environments. Той се състои от 100 000 напълно уникални интериорни пространства, всяко от коeто е описано на езика на SceneScript и е съчетано със симулирано видео, което преминава през всяка сцена.
Компанията дори е предоставила свободен достъп до данните за научни работници, с което се надява да ускори изследванията в тази област.
Вярваме, че SceneScript представлява важен етап по пътя към истински очила за добавена реалност (AR), такива, които ще свържат физическия и дигиталния свят, и сме развълнувани от перспективата на този иновативен подход за оформянето на бъдещето на изкуствения интелект (AI) и машинното обучение (ML)
– споделят от Meta AI.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!