ردیت (Reddit) از Perplexity بهدلیل «سرقت سازمانیافته محتوا» آن برای هوش مصنوعی، شکایت کرده است. در شکایت ردیت گفته شده که این شرکت همراه با سه سرویسدهنده استخراج داده (SerpApi ،Oxylabs و AWMProxy) بهطور غیرقانونی از سدهای حفاظت داده آن عبور میکنند تا به محتوای ارزشمند و دارای حق نشر ردیت دست پیدا کنند.
ردیت در شکایت خود رفتار این شرکتها را به «سارقان بانک» تشبیه کرده که چون نمیتوانند وارد خزانه شوند، به ماشین حامل پول حمله میکنند. ردیت میگوید پرپلکسیتی برای دستیابی به داده ردیت «به هر کاری متوسل میشود جز توافق مستقیم با آن»، برخلاف رقبایی که قرارداد قانونی امضا کردهاند.
طبق این شکایت، ردیت در مه 2024 برای پرپلکسیتی نامه توقف فعالیت ارسال کرده و هشدار داده بوده که استخراج داده را متوقف کند. پرپلکسیتی مدعی شده از محتوای Reddit برای آموزش مدلها استفاده نمیکند. اما پس از آن نامه، تعداد ارجاعات به این سرویس در سیستم پرپلکسیتی افزایش پیدا کرده است.
Reddit حتی به پست مخصوصی اشاره کرده که ظاهراً فقط گوگل قادر به استخراج آن بوده، اما پرپلکسیتی «در عرض چند ساعت» همان محتوا را در پاسخهای خود ارائه کرده است. ردیت میگوید تنها راه دسترسی پرپلکسیتی به آن داده این بوده که محتوای Reddit را پس از نمایش در نتایج جستجوی گوگل سرقت کرده و بلافاصله وارد موتور خود کرده است.
Reddit تاکنون قراردادهایی را با OpenAI و گوگل امضا کرده و بهدنبال توافق بهتری با آنها است. این شرکت پیشتر هم از Anthropic (سازنده Claude) هم بهدلیل دسترسی غیرمجاز به پلتفرم خود شکایت کرده بود.
«بِن لی»، مدیر حقوقی ردیت، میگوید:
«شرکتهای هوش مصنوعی در رقابت برای تصاحب محتوای انسانی باکیفیت هستند و همین فشار یک اقتصاد خرابکارانه برای استخراج داده ایجاد کرده است. اسکرپرها [ابزارهای استخراج داده] با دور زدن محافظتها، داده را سرقت میکنند و به مشتریانی میفروشند که برای آموزش مدلها حریص هستند. ردیت هدف اصلی است چون یکی از بزرگترین و پویاترین مجموعههای گفتگوهای انسانی در تاریخ محسوب میشود.»
در پاسخ، «جسی دوایر»، مسئول ارتباطات Perplexity، گفته:
«هنوز این شکایت به دست ما نرسیده، اما ما با تمام توان برای حق کاربران در دسترسی آزاد و منصفانه به دانش عمومی تلاش میکنیم. رویکرد ما اصولی و مسئولانه است و تهدید علیه شفافیت و منافع عمومی را تحمل نمیکنیم.»