Amazon Web Services (AWS), най-големият доставчик на облачни услуги в света, е започнал разследване срещу Perplexity AI поради съмнителни практики при събирането на данни, съобщава WIRED. Целта на разследването е да се установи дали компанията е нарушила правилата на AWS, събирайки данни от уебсайтове, които са се опитали да й попречат.
Perplexity AI е стартъп за изкуствен интелект, подкрепен от впечатляваща група инвеститори, включително Джеф Безос, Тоби Лютке, Нат Фридман, Андрей Карпати, Nvidia и други. Компанията, която наскоро придоби статут на еднорог, дори е сочена от някои като потенциален „убиец на Google“ поради иновативния си подход към AI-задвижваното търсене. Амбицията на Perplexity е да създаде „машина за отговори“ – система, която вместо да предоставя списък с резултати, директно отговаря на въпросите на потребителите.
Според WIRED обаче зад кулисите се крият смущаващи практики. Основният проблем е свързан с предполагаемо игнориране на Протокола за изключване на роботи (Robots Exclusion Protocol) от страна на Perplexity. Този протокол е широко разпространен уеб стандарт, чрез който уебсайтовете могат да ограничават достъпа на автоматизирани програми (ботове) до определени страници или раздели. Въпреки че спазването му не е законово задължително, то обикновено е част от условията за ползване на облачни услуги като AWS, които Perplexity използва.
Разследването на WIRED следва скорошен доклад на Forbes, в който издателството установи, че техен ексклузивен материал е бил не само незаконно използван от Perplexity, но и преработен в новия продукт на компанията, наречен „Pages“. „Perplexity присвои нашия труд без наше разрешение и го препубликува в множество платформи – уеб, видео, мобилни – сякаш самата тя е медия“, заявиха от Forbes в своя доклад.
Our reporting on Eric Schmidt’s stealth drone project was posted this AM by @perplexity_ai . It rips off most of our reporting. It cites us, and a few that reblogged us, as sources in the most easily ignored way possible. Note the views. #zeroclick https://t.co/qZamti9E83 pic.twitter.com/8z2AsyHjgM
— John Paczkowski (@JohnPaczkowski) June 7, 2024
„Pages“ е функция, която дава възможност на потребителите на Perplexity лесно да създават визуално привлекателни, изчерпателни и добре структурирани статии по всяка тема. Според Forbes проблемът се състои в това, че продуктът често заобикаля защити като платените стени и пренебрегва авторските права, създавайки резюмета на съдържание, публикувано от издатели, без тяхното разрешение и надлежно цитиране.
We're excited to roll out Perplexity Pages, a simple way to turn your research into visually appealing articles. With formatted images and sections, Pages lets you share in-depth knowledge on any topic. Available now for Pro users and rolling out to all users soon! pic.twitter.com/niSiXxpX09
— Perplexity (@perplexity_ai) May 30, 2024
От друга страна, в своето разследване WIRED установява, че сървър, свързан с Perplexity и хостван в AWS, е използвал скрит IP адрес (44.221.181.252) за достъп до сайтове на Condé Nast (собственик на WIRED) стотици пъти през последните три месеца, въпреки че издателят изрично е блокирал бота. В някои случаи Perplexity е възпроизвеждал съдържанието на WIRED дословно. Подобна активност е забелязана и от The Guardian, Forbes и The New York Times.
Perplexity първоначално отрече обвиненията. Главният изпълнителен директор Аравинд Сринивас заяви пред WIRED, че въпросите им „отразяват дълбоко и фундаментално неразбиране на това как работи Perplexity и интернет“. По-късно пред Fast Company той призна, че въпросният IP адрес принадлежи на трета страна, извършваща услуги по обхождане и индексиране за Perplexity. Сринивас отказа да назове компанията, позовавайки се на споразумение за конфиденциалност. Той също така заяви, че Протоколът за изключване на роботи, предложен за първи път през 1994 г., „не е правна рамка“. Според него появата на изкуствения интелект изисква нов вид работни отношения между създателите на съдържание, издателите и платформи като Perplexity.
Въпреки противоречията, източници твърдят, че Perplexity AI работи по нов модел за споделяне на приходи с реномирани издателства. Междувременно, OpenAI вече предприе стъпки в тази посока, като подкрепяната от Microsoft компания подписа редица споразумения с някои от най-големите медийни организации в света, включително News Corp, Vox Media, The Atlantic, Axel Springer и др. Повечето сделки включват използването на архивно и актуално съдържание на издателите за обучение на AI моделите на OpenAI, както и генериране на отговори в ChatGPT с цитати и препратки към оригиналните статии.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!