به گزارش رسانه تحلیلی خبری آناژورنال دو تا از باهوشترین دانشمندای کامپیوتر دنیا، اندرو بارتو از دانشگاه ماساچوست و ریچارد ساتن از دانشگاه آلبرتا، جایزه تورینگ ۲۰۲۴ رو به خاطر کارشون رو “یادگیری تقویتی” (Reinforcement Learning) بردن.
این جایزه که به “نوبل کامپیوتر” معروفه، ۵ مارس ۲۰۲۵ (۱۵ اسفند ۱۴۰۳) بهشون اهدا شد.
این دو نفر از دهه ۸۰ میلادی با مقالهها و الگوریتمهای خفن، پایههای یه روش یادگیری رو ریختن که توش ماشینها با خطا و جایزه گرفتن یاد میگیرن تو محیطهای پیچیده خودشون رو تطبیق بدن.
یه تکنیک معروفشون به اسم “یادگیری تفاوت زمانی” (Temporal Difference Learning) هنوزم تو دنیای AI حرف اول رو میزنه.
بعداً هم یه کتاب مرجع به اسم “یادگیری تقویتی: یه مقدمه” نوشتن که هر کی تو این حوزه کار میکنه، میشناسش.
اسم این جایزه از آلن تورینگ، ریاضیدان افسانهای، گرفته شده که خودش تو دهه ۵۰ با مقاله “ماشینهای محاسباتی و هوش” به یادگیری از تجربه اشاره کرده بود.
حالا کار بارتو و ساتن نشون داده چطور این ایدهها به واقعیت تبدیل شدن.
مثلاً گوگل دیپمایند با همین یادگیری تقویتی، AI ساخت که قهرمانای AlphaGo رو شکست داد.
یا همین چند ماه پیش، شرکت چینی DeepSeek با مدل R1 که از این روش استفاده کرده، دنیای هوش مصنوعی رو تکون داد و مدلای ارزونتر و قویتر ساخت.
چرا این خبر مهمه؟ یانیس یوانیدس، رئیس انجمن ماشینهای محاسباتی (ACM)، گفته: «یادگیری تقویتی فقط یه قدم قدیمی نیست؛ هنوزم داره رشد میکنه و پایه خیلی از پیشرفتهای AIه.
از علم مغز و روانشناسی تا تکنولوژی، این روش بهمون کمک کرده بفهمیم مغز چطور کار میکنه.» بارتو و ساتن یه میلیون دلار جایزه نقدی رو که گوگل اسپانسرش بوده، بین خودشون تقسیم میکنن.
تو ایران که هوش مصنوعی داره تو حوزههایی مثل آموزش، بازیسازی و حتی استارتاپها جا باز میکنه، کار این دو دانشمند میتونه الهامبخش باشه.
مثلاً چتباتایی که باهاشون حرف میزنیم یا سیستمایی که تو بازی و تحلیل داده استفاده میکنیم، به لطف یادگیری تقویتی قویتر شدن.
پیشبینی میشه تا ۱۴۰۴، این روش تو زندگی روزمرهمون بیشتر خودش رو نشون بده!
سوالات متداول:
یادگیری تقویتی که جایزه تورینگ برده چیه؟
یه روش تو هوش مصنوعیه که ماشینها باجایزه و خطا و گرفتن جایزه یاد میگیرن.
مثلاً مثل بچهای که با تشویق کار درست رو پیدا میکنه، AI هم همینجوری باهوشتر میشه.
این بارتو و ساتن کیان که جایزه گرفتن؟
اندرو بارتو و ریچارد ساتن دو تا استاد دانشگاهن که از دهه ۸۰ رو یادگیری تقویتی کار کردن و الگوریتم ساختن که الان تو AIهای خفن مثل AlphaGo استفاده میشه.
جایزه تورینگ چقدر مهمه؟
این جایزه نشون میده هوش مصنوعی چطور داره دنیا رو عوض میکنه.
تو ایرانم میتونه رو چتباتا، بازیها و استارتاپامون اثر بذاره و کارمون رو بهتر کنه.
یادگیری تقویتی بعدی چی قراره بشه؟
با این سرعت، احتمالاً تا ۱۴۰۴ تو سیستمای روزمره مثل آموزش آنلاین یا تحلیل داده حسابی جا باز میکنه و AIها باهوشتر از الان میشن!
ارسال پاسخ
نمایش دیدگاه ها