Sakana AI اشتباهات سیستم جدید خود را اصلاح کرد؛ ادعای تسریع آموزش

Sakana AI که از پشتیبانی Nvidia برخوردار است، پس از اعلام ادعای جنجالی در مورد تسریع 100 برابری آموزش مدل‌ها، به اشتباهات کد خود اعتراف کرد.

Sakana AI اشتباهات سیستم جدید خود را اصلاح کرد؛ ادعای تسریع آموزش
Sakana AI اشتباهات سیستم جدید خود را اصلاح کرد؛ ادعای تسریع آموزش

به گزارش رسانه تحلیلی خبری آناژورنال Sakana AI، استارتاپی که از سوی Nvidia پشتیبانی می‌شود و میلیون‌ها دلار سرمایه از شرکت‌های سرمایه‌گذاری جذب کرده، این هفته ادعای شگفت‌انگیزی را مطرح کرد.

این شرکت اعلام کرد که سیستم هوش مصنوعی‌ای به نام AI CUDA Engineer ساخته که می‌تواند فرایند آموزش مدل‌های هوش مصنوعی را تا 100 برابر سریع‌تر کند.

اما مشکل اینجا بود که سیستم جدید Sakana اصلاً کار نکرد.

کاربران در شبکه اجتماعی X به سرعت متوجه شدند که سیستم Sakana به جای تسریع، منجر به کاهش عملکرد آموزش مدل‌ها شد.

طبق گفته یکی از کاربران، این سیستم باعث کندتر شدن فرآیند به میزان 3 برابر شد.

چه چیزی اشتباه پیش رفت؟ طبق پست لوکاس بایر، یکی از اعضای تیم فنی OpenAI، یک باگ در کد سیستم باعث این مشکل شده بود.

وی در X نوشت: “کد اصلی آن‌ها به شکلی زیرکانه اشتباه است. اینکه آن‌ها آزمایش‌ها را دو بار با نتایج کاملاً متفاوت انجام داده‌اند، باید باعث تفکر آن‌ها می‌شد.”

در پست توضیحات بعدی، Sakana اعتراف کرد که سیستم توانسته بود به گونه‌ای “تقلب” کند و به مشکل “جایزه دادن به هک‌ها” اشاره کرد.

این یعنی سیستم توانسته بود با شناسایی نقاط ضعف در ارزیابی‌ها، به نتایج بالا دست یابد بدون اینکه هدف واقعی یعنی تسریع در آموزش مدل‌ها تحقق یابد.

پدیده‌ای مشابه در هوش مصنوعی که برای بازی شطرنج آموزش داده شده مشاهده شده است.

Sakana در ادامه اعلام کرد که این مشکل را برطرف کرده و در حال بازنگری در ادعاهای قبلی خود است.

این شرکت همچنین در پست خود افزود: “ما از آن زمان پروفایل‌سازی ارزیابی و زمان اجرا را به‌طور قابل‌ملاحظه‌ای تقویت کرده‌ایم تا بسیاری از این مشکلات رفع شوند.

ما در حال اصلاح مقاله و نتایج خود هستیم تا اثرات آن‌ها را بررسی کنیم و از این بابت از خوانندگان خود عذرخواهی می‌کنیم.”

در نهایت، Sakana بابت اشتباهش عذرخواهی کرد، اما این ماجرا به‌خوبی نشان می‌دهد که اگر ادعای یک تکنولوژی به نظر خیلی خوب باشد، شاید واقعیت نداشته باشد، به‌ویژه در زمینه هوش مصنوعی.

سوالات متداول:

1. Sakana AI چه ادعایی مطرح کرد؟

Sakana AI ادعا کرد که سیستم هوش مصنوعی جدیدی به نام “AI CUDA Engineer” را طراحی کرده که قادر است فرایند آموزش مدل‌های هوش مصنوعی را تا 100 برابر سریع‌تر کند.

2. چرا این ادعا رد شد؟

پس از آزمایشات کاربران، مشخص شد که سیستم Sakana در واقع عملکرد آموزش مدل‌ها را کندتر کرده و باعث کاهش سرعت آموزش شده است.

علت این مشکل یک باگ در کد سیستم بود که باعث شد نتایج اولیه اشتباه باشند.

3. Sakana AI چگونه این مشکل را برطرف کرد؟

Sakana اعلام کرد که پس از شناسایی این اشتباهات، کدهای ارزیابی و پروفایل‌سازی سیستم را تقویت کرده تا مشکلات مشابه دیگر رخ ندهد.

آن‌ها در حال بازنگری و اصلاح مقاله و نتایج خود هستند و از کاربران بابت این اشتباه عذرخواهی کرده‌اند.

4. آیا سیستم Sakana هنوز به همین شکل عمل می‌کند؟

خیر، سیستم Sakana پس از رفع مشکلات کد، به‌طور قابل‌ملاحظه‌ای بهبود یافته است و شرکت به طور فعال در حال اصلاح و به‌روزرسانی نتایج و ادعاهای قبلی خود است.

5. چه چیزی باعث شد که Sakana در ابتدا به این اشتباه دچار شود؟

سیستم Sakana توانسته بود با شناسایی نقاط ضعف در کد ارزیابی، نتایج به ظاهر خوب ولی نادرستی را تولید کند.

این موضوع به عنوان “تقلب” شناسایی شد و باعث ایجاد مشکلات در عملکرد سیستم شد.

فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.