آیا استفاده از محتوای قانونی برای آموزش هوش مصنوعی پایان کار خواهد بود؟

مستندات جدید از دادگاه نشان می‌دهد که کارکنان متا درباره استفاده از محتوای دارای حق نشر برای آموزش مدل‌های هوش مصنوعی بحث کرده‌اند.

آیا استفاده از محتوای قانونی برای آموزش هوش مصنوعی پایان کار خواهد بود؟
آیا استفاده از محتوای قانونی برای آموزش هوش مصنوعی پایان کار خواهد بود؟

به گزارش رسانه تحلیلی خبری آناژورنال بر اساس مستندات دادگاهی که روز پنج‌شنبه منتشر شد، کارکنان متا سال‌هاست که به طور داخلی در مورد استفاده از آثار دارای حق نشر که به روش‌های قانونی مشکوک به دست آمده‌اند، برای آموزش مدل‌های هوش مصنوعی این شرکت صحبت می‌کنند.

این مستندات توسط شاکیان در پرونده «کادری علیه متا» ارائه شده است.

یکی از دعاوی مهم در خصوص حقوق نشر مرتبط با هوش مصنوعی که به آرامی در سیستم دادگستری ایالات متحده در حال پیگیری است.

متا در دفاع از خود ادعا کرده که آموزش مدل‌ها با استفاده از آثار محافظت‌شده توسط حق نشر، به ویژه کتاب‌ها، “استفاده منصفانه” است.

اما شاکیان، که شامل نویسندگان مشهور سارا سیلورمن و تا-نهیسی کوتس هستند، با این موضوع مخالف‌اند.

در مستندات قبلی این پرونده آمده بود که مارک زاکربرگ، مدیرعامل متا، به تیم هوش مصنوعی این شرکت اجازه داده بود که از محتوای دارای حق نشر برای آموزش استفاده کنند و مذاکرات مربوط به مجوزهای داده‌های آموزشی با ناشران کتاب را متوقف کرده بودند.

اما مستندات جدید، که بیشتر شامل بخش‌هایی از چت‌های داخلی کارکنان متا است، تصویر واضح‌تری از چگونگی استفاده از داده‌های دارای حق نشر برای آموزش مدل‌های شرکت، از جمله مدل‌های خانواده لاما (Llama)، ارائه می‌دهند.

در یکی از این چت‌ها، کارکنان متا، از جمله ملانی کامبادور، مدیر ارشد تیم تحقیقاتی مدل‌های لاما، در مورد آموزش مدل‌ها با استفاده از آثاری که ممکن است از نظر قانونی مشکل‌ساز باشند، بحث کرده‌اند.

یک مهندس تحقیقاتی متا به نام ژاویر مارٹینت در این چت نوشت: «نظر من این است که [در خط ‘از اجازه خواستن، عذرخواهی بهتر است’] سعی کنیم کتاب‌ها را تهیه کنیم و این موضوع را به مدیران ارشد بفرستیم تا تصمیم‌گیری کنند.»

وی پیشنهاد کرد که به جای توافق‌نامه‌های مجوز با ناشران کتاب، ممکن است خرید کتاب‌های الکترونیکی با قیمت‌های معمولی برای ساخت مجموعه داده آموزشی مفیدتر باشد.

همچنین، در چت دیگری، کامبادور به استفاده از Libgen به عنوان منبع داده‌ای اشاره کرده است.

Libgen یک “مجموعه‌ساز لینک” است که دسترسی به آثار دارای حق نشر از ناشران مختلف را فراهم می‌کند.

این سایت چندین بار به دلیل نقض حقوق نشر شکایت شده و جریمه‌های سنگینی دریافت کرده است.

این مستندات همچنین شامل اطلاعاتی است که نشان می‌دهد متا ممکن است داده‌های Reddit را برای آموزش مدل‌ها جمع‌آوری کرده باشد.

شاکیان پرونده «کادری علیه متا» ادعا می‌کنند که متا از روش‌های خاصی برای تعیین اینکه آیا استفاده از کتاب‌های دارای حق نشر منطقی است یا خیر، با استفاده از کتاب‌های سرقتی و مقایسه آن‌ها با کتاب‌های دارای حق نشر، اقدام کرده است.

این پرونده در دادگاه منطقه‌ای ایالات متحده برای ناحیه شمالی کالیفرنیا، بخش سانفرانسیسکو، در حال بررسی است.

در پاسخ به این پرونده، متا تیم دفاعی خود را تقویت کرده و دو وکیل از دفتر حقوقی پل ویس را به تیم خود اضافه کرده است.

سوالات متداول:

1. آیا متا از محتوای دارای حق نشر برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده است؟

بله، مستندات دادگاهی نشان می‌دهند که کارکنان متا به طور داخلی در مورد استفاده از آثار دارای حق نشر برای آموزش مدل‌های هوش مصنوعی این شرکت بحث کرده‌اند.

این مسئله در پرونده «کادری علیه متا» بررسی می‌شود.

2. آیا استفاده از محتوای دارای حق نشر برای آموزش مدل‌های هوش مصنوعی قانونی است؟

متا ادعا کرده که استفاده از محتوای دارای حق نشر برای آموزش مدل‌ها تحت عنوان “استفاده منصفانه” قرار می‌گیرد.

اما شاکیان این پرونده، از جمله نویسندگان معروف، با این ادعا مخالفت دارند و معتقدند که این اقدامات غیرقانونی است.

3. متا چگونه از داده‌های Libgen برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده است؟

بر اساس مستندات جدید، کارکنان متا در برخی چت‌ها از استفاده از Libgen برای جمع‌آوری داده‌های آموزشی برای مدل‌های هوش مصنوعی خود صحبت کرده‌اند.

Libgen یک وب‌سایت است که دسترسی به محتوای دارای حق نشر را بدون مجوز فراهم می‌کند.

4. نتیجه دادگاه «کادری علیه متا» چه خواهد بود؟

پرونده «کادری علیه متا» هنوز در حال بررسی است و مشخص نیست که دادگاه چه تصمیمی خواهد گرفت.

با این حال، متا اقداماتی برای دفاع از خود انجام داده است، از جمله استخدام وکلا از دفاتر حقوقی معتبر برای تیم دفاعی خود.

فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.