به گزارش رسانه تحلیلی خبری آناژورنال نتایج آزمایش داخلی گوگل نشان میدهند که مدل هوش مصنوعی جدید این شرکت، یعنی Gemini 2.5 Flash، در برخی ارزیابیهای ایمنی نسبت به نسخهی پیشین خود Gemini 2.0 Flash عملکرد ضعیفتری داشته است.
جدیدترین اخبار هوش مصنوعی را در آناژورنال بخوانید.
طبق گزارش فنی منتشرشده، این مدل در دو معیار اصلی «ایمنی متن به متن» و «ایمنی تصویر به متن» به ترتیب ۴.۱ درصد و ۹.۶ درصد پسرفت داشته است.
گوگل در این گزارش توضیح داده که آزمایشها بهصورت خودکار و بدون نظارت انسانی انجام شدهاند.
ایمنی متن به متن بررسی میکند که مدل تا چه حد ممکن است در پاسخ به پیام متنی، دستورالعملهای ایمنی گوگل را نقض کند.
در مقابل، ایمنی تصویر به متن ارزیابی میکند که مدل در برابر پیامهایی که حاوی تصویر هستند، چقدر به دستورالعملهای ایمنی پایبند است.
سخنگوی گوگل در بیانیهای اعلام کرده است که این پسرفت میتواند تا حدی به مثبتهای کاذب مربوط باشد، اما در برخی موارد مدل واقعاً محتوای ناقض محدودیتها را تولید کرده است.
گوگل همچنین تأکید کرد که Gemini 2.5 Flash هنوز در مرحلهی پیشنمایش قرار دارد.
این یافتهها در حالی منتشر میشوند که شرکتهای بزرگ هوش مصنوعی مانند گوگل، اپنایآی و متا در تلاشاند تا مدلهای خود را از نظر اخلاقی و ایمنی انعطافپذیرتر کنند.
برای مثال، متا اعلام کرده مدل LLaMA طوری طراحی شده که دیدگاه خاصی را ترجیح ندهد، و OpenAI نیز وعده داده که مدلهای آیندهاش بیطرفتر باشند.
سوالات متداول:
۱. مدل Gemini 2.5 Flash چه تفاوتی با نسخه 2.0 دارد؟
مدل ۲.۵ نسخه بهروزشدهای از جمینای ۲.۰ است، اما در ارزیابیهای ایمنی، عملکرد ضعیفتری نشان داده و احتمال تولید محتوای نقضکننده دستورالعملها در آن بیشتر است.
۲. منظور از ایمنی متن به متن و تصویر به متن چیست؟
ایمنی متن به متن بررسی میکند که آیا مدل در پاسخ به پیام متنی، محتوای خطرناک یا ناپسند تولید میکند یا خیر. ایمنی تصویر به متن بررسی مشابهی برای پیامهای تصویری انجام میدهد.
۳. آیا این مدل در دسترس عمومی قرار گرفته است؟
خیر، Gemini 2.5 Flash هنوز در مرحله پیشنمایش (Preview) است و بهطور عمومی عرضه نشده.
۴. آیا گوگل قصد دارد این مشکلات را برطرف کند؟
بله، گوگل گفته است که در حال بررسی مشکلات و بازخوردهاست و برخی از نقضها را نیز به مثبتهای کاذب نسبت داده است.
ارسال پاسخ
نمایش دیدگاه ها