گام جدید گوگل برای هوشمندتر کردن ربات‌ها

گوگل دیپ‌مایند مدل Gemini Robotics-ER 1.5 را معرفی کرد؛ ربات‌هایی با توانایی تصمیم‌گیری چندمرحله‌ای، یادگیری میان‌رباتی و دسترسی به وب برای حل مسائل پیچیده.

گام جدید گوگل برای هوشمندتر کردن ربات‌ها

به گزارش آناژورنال، گوگل دیپ‌مایند در تازه‌ترین کنفرانس خود از مدل‌های جدید هوش مصنوعی رونمایی کرد که ربات‌ها را قادر می‌سازند وظایف پیچیده‌تر را انجام دهند و حتی برای تکمیل مأموریت‌ها از وب به‌عنوان منبع کمک استفاده کنند.

این گام تازه نشان می‌دهد آینده‌ی ماشین‌ها بیش از پیش با درک، پیش‌بینی و تصمیم‌گیری مستقل گره خورده است.

ربات‌هایی که چند گام جلوتر فکر می‌کنند

کارولینا پارادا، مدیر واحد رباتیک دیپ‌مایند اعلام کرد مدل‌های تازه طوری طراحی شده‌اند که ربات‌ها پیش از هر اقدام بتوانند چندین مرحله را در ذهن شبیه‌سازی کنند. برای مثال، این ربات‌ها اکنون قادرند:

  • لباس‌ها را بر اساس رنگ‌های تیره و روشن دسته‌بندی کنند.
  • چمدانی را با توجه به وضعیت آب‌وهوای لندن ببندند.
  • با جست‌وجوی اینترنت، زباله‌ها را به دسته‌های بازیافتی، کمپوست و سایر بخش‌ها تفکیک کنند.

معرفی مدل Gemini Robotics-ER 1.5

سیستم جدید گوگل با پشتیبانی از Gemini Robotics 1 و نسخه ارتقایافته‌ی آن یعنی Gemini Robotics-ER 1.5 فعالیت می‌کند. این مدل‌ها نخستین‌بار در مارس ۲۰۲۴ معرفی شدند و حالا با قابلیت‌های پیشرفته‌تر به کار گرفته می‌شوند.

مدل ER 1.5 محیط اطراف را تحلیل کرده و در صورت نیاز برای دریافت اطلاعات بیشتر از ابزارهایی مانند جست‌وجوی گوگل استفاده می‌کند. سپس داده‌ها به زبان طبیعی برای Gemini Robotics 1.5 ترجمه می‌شوند تا ربات با کمک بینایی ماشینی و پردازش زبان بتواند وظایف را مرحله‌به‌مرحله اجرا کند.

یادگیری میان‌رباتی؛ انتقال مهارت از یک ربات به دیگری

یکی از برجسته‌ترین ویژگی‌های این سیستم، قابلیت یادگیری میان‌رباتی است. دیپ‌مایند توضیح داد مهارت‌هایی که روی یک ربات آموزش داده می‌شوند، می‌توانند روی ربات‌های دیگر—even با ساختار متفاوت—قابل‌اجرا باشند.

برای نمونه:

  • وظایف آموزش‌دیده روی ربات دو بازوی ALOHA2 به‌سادگی روی ربات دو بازوی Franka اجرا شدند.
  • همان وظایف حتی روی ربات انسان‌نمای Apollo شرکت Apptronik نیز بدون مشکل پیاده‌سازی شدند.

این ویژگی امکان کنترل چندین ربات با یک مدل واحد و انتقال سریع مهارت‌ها را فراهم می‌کند.

دسترسی توسعه‌دهندگان به مدل‌های جدید

دیپ‌مایند اعلام کرده که مدل Gemini Robotics-ER 1.5 از طریق Gemini API در سرویس Google AI Studio برای توسعه‌دهندگان در دسترس قرار گرفته است. البته دسترسی به Gemini Robotics 1.5 فعلاً محدود به شرکای منتخب گوگل خواهد بود.

سوالات متداول

مدل جدید Gemini Robotics-ER 1.5 چه تفاوتی با نسخه قبلی دارد؟
این مدل می‌تواند وظایف پیچیده‌تر را اجرا کند، چند مرحله جلوتر فکر کند و در صورت نیاز از وب برای دریافت اطلاعات استفاده نماید.

آیا قابلیت یادگیری میان‌رباتی در همه ربات‌ها کار می‌کند؟
بله، دیپ‌مایند اعلام کرده مهارت‌های آموزش‌دیده روی یک ربات می‌توانند به ربات‌های دیگر—even با ساختار متفاوت—منتقل شوند.

توسعه‌دهندگان چگونه می‌توانند به این فناوری دسترسی داشته باشند؟
مدل ER 1.5 از طریق Gemini API در Google AI Studio در دسترس است، اما مدل Gemini Robotics 1.5 فعلاً فقط برای شرکای منتخب فعال خواهد بود.

تیم تحریریه آناژورنال متشکل از روزنامه‌نگاران باتجربه و متخصص در حوزه‌های خبری متنوع از جمله اخبار سینمای ایران و جهان، فناوری، و رویدادهای محلی است. این تیم با بیش از چند سال تجربه در رسانه‌ آناژورنال، به ارائه اخبار دقیق، به‌روز و جذاب متعهد است.