دو نابغه هوش مصنوعی با یادگیری تقویتی جایزه تورینگ ۲۰۲۴ رو بردند!

اندرو بارتو و ریچارد ساتن با کار رو یادگیری تقویتی، جایزه تورینگ ۲۰۲۴ رو گرفتن! چطور AI رو متحول کردن؟ اینجا بخون و شگفت‌زده شو.

دو نابغه هوش مصنوعی با یادگیری تقویتی جایزه تورینگ ۲۰۲۴ رو بردند!
دو نابغه هوش مصنوعی با یادگیری تقویتی جایزه تورینگ ۲۰۲۴ رو بردند!

به گزارش رسانه تحلیلی خبری آناژورنال دو تا از باهوش‌ترین دانشمندای کامپیوتر دنیا، اندرو بارتو از دانشگاه ماساچوست و ریچارد ساتن از دانشگاه آلبرتا، جایزه تورینگ ۲۰۲۴ رو به خاطر کارشون رو “یادگیری تقویتی” (Reinforcement Learning) بردن.

این جایزه که به “نوبل کامپیوتر” معروفه، ۵ مارس ۲۰۲۵ (۱۵ اسفند ۱۴۰۳) بهشون اهدا شد.

این دو نفر از دهه ۸۰ میلادی با مقاله‌ها و الگوریتم‌های خفن، پایه‌های یه روش یادگیری رو ریختن که توش ماشین‌ها با خطا و جایزه گرفتن یاد می‌گیرن تو محیط‌های پیچیده خودشون رو تطبیق بدن.

یه تکنیک معروفشون به اسم “یادگیری تفاوت زمانی” (Temporal Difference Learning) هنوزم تو دنیای AI حرف اول رو می‌زنه.

بعداً هم یه کتاب مرجع به اسم “یادگیری تقویتی: یه مقدمه” نوشتن که هر کی تو این حوزه کار می‌کنه، می‌شناسش.

اسم این جایزه از آلن تورینگ، ریاضیدان افسانه‌ای، گرفته شده که خودش تو دهه ۵۰ با مقاله “ماشین‌های محاسباتی و هوش” به یادگیری از تجربه اشاره کرده بود.

حالا کار بارتو و ساتن نشون داده چطور این ایده‌ها به واقعیت تبدیل شدن.

مثلاً گوگل دیپ‌مایند با همین یادگیری تقویتی، AI ساخت که قهرمانای AlphaGo رو شکست داد.

یا همین چند ماه پیش، شرکت چینی DeepSeek با مدل R1 که از این روش استفاده کرده، دنیای هوش مصنوعی رو تکون داد و مدلای ارزون‌تر و قوی‌تر ساخت.

چرا این خبر مهمه؟ یانیس یوانیدس، رئیس انجمن ماشین‌های محاسباتی (ACM)، گفته: «یادگیری تقویتی فقط یه قدم قدیمی نیست؛ هنوزم داره رشد می‌کنه و پایه خیلی از پیشرفت‌های AIه.

از علم مغز و روان‌شناسی تا تکنولوژی، این روش بهمون کمک کرده بفهمیم مغز چطور کار می‌کنه.» بارتو و ساتن یه میلیون دلار جایزه نقدی رو که گوگل اسپانسرش بوده، بین خودشون تقسیم می‌کنن.

تو ایران که هوش مصنوعی داره تو حوزه‌هایی مثل آموزش، بازی‌سازی و حتی استارتاپ‌ها جا باز می‌کنه، کار این دو دانشمند می‌تونه الهام‌بخش باشه.

مثلاً چت‌باتایی که باهاشون حرف می‌زنیم یا سیستمایی که تو بازی و تحلیل داده استفاده می‌کنیم، به لطف یادگیری تقویتی قوی‌تر شدن.

پیش‌بینی می‌شه تا ۱۴۰۴، این روش تو زندگی روزمره‌مون بیشتر خودش رو نشون بده!

سوالات متداول:

یادگیری تقویتی که جایزه تورینگ برده چیه؟

یه روش تو هوش مصنوعیه که ماشین‌ها باجایزه و خطا و گرفتن جایزه یاد می‌گیرن.

مثلاً مثل بچه‌ای که با تشویق کار درست رو پیدا می‌کنه، AI هم همین‌جوری باهوش‌تر می‌شه.

این بارتو و ساتن کی‌ان که جایزه گرفتن؟

اندرو بارتو و ریچارد ساتن دو تا استاد دانشگاهن که از دهه ۸۰ رو یادگیری تقویتی کار کردن و الگوریتم ساختن که الان تو AIهای خفن مثل AlphaGo استفاده می‌شه.

جایزه تورینگ چقدر مهمه؟

این جایزه نشون می‌ده هوش مصنوعی چطور داره دنیا رو عوض می‌کنه.

تو ایرانم می‌تونه رو چت‌باتا، بازی‌ها و استارتاپامون اثر بذاره و کارمون رو بهتر کنه.

یادگیری تقویتی بعدی چی قراره بشه؟

با این سرعت، احتمالاً تا ۱۴۰۴ تو سیستمای روزمره مثل آموزش آنلاین یا تحلیل داده حسابی جا باز می‌کنه و AIها باهوش‌تر از الان می‌شن!

فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.