به گزارش آناژورنال، گوگل دیپمایند در تازهترین کنفرانس خود از مدلهای جدید هوش مصنوعی رونمایی کرد که رباتها را قادر میسازند وظایف پیچیدهتر را انجام دهند و حتی برای تکمیل مأموریتها از وب بهعنوان منبع کمک استفاده کنند.
این گام تازه نشان میدهد آیندهی ماشینها بیش از پیش با درک، پیشبینی و تصمیمگیری مستقل گره خورده است.
رباتهایی که چند گام جلوتر فکر میکنند
کارولینا پارادا، مدیر واحد رباتیک دیپمایند اعلام کرد مدلهای تازه طوری طراحی شدهاند که رباتها پیش از هر اقدام بتوانند چندین مرحله را در ذهن شبیهسازی کنند. برای مثال، این رباتها اکنون قادرند:
- لباسها را بر اساس رنگهای تیره و روشن دستهبندی کنند.
- چمدانی را با توجه به وضعیت آبوهوای لندن ببندند.
- با جستوجوی اینترنت، زبالهها را به دستههای بازیافتی، کمپوست و سایر بخشها تفکیک کنند.
معرفی مدل Gemini Robotics-ER 1.5
سیستم جدید گوگل با پشتیبانی از Gemini Robotics 1 و نسخه ارتقایافتهی آن یعنی Gemini Robotics-ER 1.5 فعالیت میکند. این مدلها نخستینبار در مارس ۲۰۲۴ معرفی شدند و حالا با قابلیتهای پیشرفتهتر به کار گرفته میشوند.
مدل ER 1.5 محیط اطراف را تحلیل کرده و در صورت نیاز برای دریافت اطلاعات بیشتر از ابزارهایی مانند جستوجوی گوگل استفاده میکند. سپس دادهها به زبان طبیعی برای Gemini Robotics 1.5 ترجمه میشوند تا ربات با کمک بینایی ماشینی و پردازش زبان بتواند وظایف را مرحلهبهمرحله اجرا کند.
یادگیری میانرباتی؛ انتقال مهارت از یک ربات به دیگری
یکی از برجستهترین ویژگیهای این سیستم، قابلیت یادگیری میانرباتی است. دیپمایند توضیح داد مهارتهایی که روی یک ربات آموزش داده میشوند، میتوانند روی رباتهای دیگر—even با ساختار متفاوت—قابلاجرا باشند.
برای نمونه:
- وظایف آموزشدیده روی ربات دو بازوی ALOHA2 بهسادگی روی ربات دو بازوی Franka اجرا شدند.
- همان وظایف حتی روی ربات انساننمای Apollo شرکت Apptronik نیز بدون مشکل پیادهسازی شدند.
این ویژگی امکان کنترل چندین ربات با یک مدل واحد و انتقال سریع مهارتها را فراهم میکند.
دسترسی توسعهدهندگان به مدلهای جدید
دیپمایند اعلام کرده که مدل Gemini Robotics-ER 1.5 از طریق Gemini API در سرویس Google AI Studio برای توسعهدهندگان در دسترس قرار گرفته است. البته دسترسی به Gemini Robotics 1.5 فعلاً محدود به شرکای منتخب گوگل خواهد بود.
سوالات متداول
مدل جدید Gemini Robotics-ER 1.5 چه تفاوتی با نسخه قبلی دارد؟
این مدل میتواند وظایف پیچیدهتر را اجرا کند، چند مرحله جلوتر فکر کند و در صورت نیاز از وب برای دریافت اطلاعات استفاده نماید.
آیا قابلیت یادگیری میانرباتی در همه رباتها کار میکند؟
بله، دیپمایند اعلام کرده مهارتهای آموزشدیده روی یک ربات میتوانند به رباتهای دیگر—even با ساختار متفاوت—منتقل شوند.
توسعهدهندگان چگونه میتوانند به این فناوری دسترسی داشته باشند؟
مدل ER 1.5 از طریق Gemini API در Google AI Studio در دسترس است، اما مدل Gemini Robotics 1.5 فعلاً فقط برای شرکای منتخب فعال خواهد بود.
ارسال پاسخ
نمایش دیدگاه ها