به گزارش رسانه تحلیلی خبری آناژورنال گروهی از محققان در Hao AI Lab دانشگاه کالیفرنیا، سن دیگو، به تازگی آزمایشی جدید با استفاده از بازی کلاسیک سوپر ماریو بروس انجام دادند تا عملکرد مدلهای هوش مصنوعی را ارزیابی کنند.
این تحقیق که با استفاده از یک شبیهساز و فریمورک مخصوص به نام GamingAgent انجام شد، نشان داد که مدلهای مختلف AI در بازی سوپر ماریو، به خصوص مدلهای مبتنی بر استدلال، با چالشهایی روبهرو هستند.
در این آزمایش، مدلهای Anthropic از جمله Claude 3.7 عملکرد بهتری نسبت به سایر مدلها مانند GPT-4o و Gemini 1.5 Pro از گوگل داشتند.
در این آزمایش، AIها وظایفی مانند “اگر مانع یا دشمن نزدیک است، برای جلوگیری از برخورد به سمت چپ بپر” را به عنوان دستورات دریافت میکردند و سپس ورودیهایی برای کنترل ماریو تولید میکردند.
این آزمایش به مدلها فرصتی برای یادگیری برنامهریزی حرکات پیچیده و استراتژیهای بازی داد.
یکی از نکات جالب این بود که مدلهای مبتنی بر استدلال، که به صورت گام به گام برای حل مسائل فکر میکنند، در مقایسه با مدلهای غیر استدلالی که سریعتر عمل میکنند، نتایج ضعیفتری داشتند.
دلیل این امر این است که بازیهای زمان واقعی مانند سوپر ماریو نیاز به عکسالعمل سریع دارند، و مدلهای استدلالی معمولاً زمان بیشتری برای تصمیمگیری نیاز دارند.
این آزمایشها با وجود جذابیت برای علاقهمندان به فناوری و هوش مصنوعی، برخی از محققان را به فکر واداشته است که آیا میتوان ارتباطی معتبر بین تواناییهای بازی AI و پیشرفتهای تکنولوژیک واقعی پیدا کرد یا خیر.
زیرا بازیها نسبت به دنیای واقعی بسیار سادهتر و انتزاعیتر هستند و دادههای تقریباً بیپایانی برای آموزش AI فراهم میکنند.
در نهایت، همچنان نمیتوان به طور قطع گفت که این مدلها چقدر در دنیای واقعی مؤثر خواهند بود، اما این آزمایشها نشان میدهد که هوش مصنوعی هنوز در حال یادگیری و بهبود است.
سوالات متداول:
آیا بازی Super Mario برای آزمایش هوش مصنوعی مناسب است؟
بله، بازی Super Mario به دلیل نیاز به واکنش سریع و تصمیمگیری در زمان واقعی، چالشهای زیادی برای هوش مصنوعی ایجاد میکند.
این بازی به هوش مصنوعی کمک میکند تا استراتژیهای پیچیدهای برای مواجهه با موانع و دشمنان پیدا کند.
کدام مدلهای هوش مصنوعی در آزمایشهای بازی Super Mario بهتر عمل کردند؟
طبق تحقیقات، مدلهای مانند Claude 3.7 و Claude 3.5 از Anthropic بهترین عملکرد را داشتند.
در حالی که مدلهایی مانند GPT-4o و Gemini 1.5 Pro از گوگل در این آزمونها به خوبی عمل نکردند.
چرا مدلهای تفکر منطقی در بازیهای واقعی مانند Super Mario ضعیفتر عمل میکنند؟
مدلهای تفکر منطقی که برای حل مسائل به طور گام به گام عمل میکنند، در بازیهایی که نیاز به تصمیمگیری سریع دارند ضعیف عمل میکنند.
در Super Mario، زمانبندی دقیق برای انجام اقدامات بسیار حیاتی است و مدلهای تفکر منطقی زمان بیشتری برای تصمیمگیری نیاز دارند.
آیا بازیهای ویدئویی به عنوان معیاری برای ارزیابی هوش مصنوعی منطقی هستند؟
بازیهای ویدئویی میتوانند مهارتهای هوش مصنوعی را آزمایش کنند، اما برخی از متخصصان معتقدند که این نوع ارزیابیها ممکن است کامل نباشند زیرا بازیها به طور کلی سادهتر از دنیای واقعی هستند و دادههای نامحدودی برای آموزش AI فراهم میکنند.
ارسال پاسخ
نمایش دیدگاه ها