OpenAI разработва нов тип софтуерен агент, който ще може да управлява устройства и да автоматизира сложни задачи, съобщава The Information.
Според информацията агентът ще изпълнява сложни персонални или работни задачи въз основа на човешки команди, без нужда от надзор. Например, ще може ефективно да поеме контрола над устройството на потребителя и да изпълнява задачи като прехвърляне на данни между документи, попълване на отчети и взаимодействие с различни приложения чрез кликвания, движения на курсора и въвеждане на текст.
Софтуерът, разработван от OpenAI, ще може да изпълнява и уеб базирани задачи като събиране на публични данни, създаване на маршрути или резервиране на самолетни билети, посочва The Information.
В края на миналата година група изследователи представиха подобен проект с отворен код, наречен AppAgent. Той е базиран на големи езикови модели (LLM) и основната му задача е да работи с мобилни приложения, имитирайки действия, аналогични на човешките, например докосване и плъзгане по екрана.
AppAgent се научава да навигира и да използва мобилни приложения или чрез автономно обучение, или чрез наблюдение на човешки действия. В резултат на това се създава база от познания, чрез която агентът се справя със сложни задачи в различни приложения, като например социални мрежи, електронна поща, карти, пазаруване и дори инструменти за редактиране на изображения.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!