عملکرد ضعیف‌ تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!

مدل Gemini 2.5 Flash گوگل در آزمایش‌های ایمنی عملکرد ضعیف‌تری نسبت به نسخه قبلی داشته و محتوای نقض‌کننده بیشتری تولید کرده است.

عملکرد ضعیف‌تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!
عملکرد ضعیف‌تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!
کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال نتایج آزمایش داخلی گوگل نشان می‌دهند که مدل هوش مصنوعی جدید این شرکت، یعنی Gemini 2.5 Flash، در برخی ارزیابی‌های ایمنی نسبت به نسخه‌ی پیشین خود Gemini 2.0 Flash عملکرد ضعیف‌تری داشته است.

جدیدترین اخبار هوش مصنوعی را در آناژورنال بخوانید.

طبق گزارش فنی منتشرشده، این مدل در دو معیار اصلی «ایمنی متن به متن» و «ایمنی تصویر به متن» به ترتیب ۴.۱ درصد و ۹.۶ درصد پسرفت داشته است.

گوگل در این گزارش توضیح داده که آزمایش‌ها به‌صورت خودکار و بدون نظارت انسانی انجام شده‌اند.

ایمنی متن به متن بررسی می‌کند که مدل تا چه حد ممکن است در پاسخ به پیام متنی، دستورالعمل‌های ایمنی گوگل را نقض کند.

در مقابل، ایمنی تصویر به متن ارزیابی می‌کند که مدل در برابر پیام‌هایی که حاوی تصویر هستند، چقدر به دستورالعمل‌های ایمنی پایبند است.

سخنگوی گوگل در بیانیه‌ای اعلام کرده است که این پسرفت می‌تواند تا حدی به مثبت‌های کاذب مربوط باشد، اما در برخی موارد مدل واقعاً محتوای ناقض محدودیت‌ها را تولید کرده است.

گوگل همچنین تأکید کرد که Gemini 2.5 Flash هنوز در مرحله‌ی پیش‌نمایش قرار دارد.

این یافته‌ها در حالی منتشر می‌شوند که شرکت‌های بزرگ هوش مصنوعی مانند گوگل، اپن‌ای‌آی و متا در تلاش‌اند تا مدل‌های خود را از نظر اخلاقی و ایمنی انعطاف‌پذیرتر کنند.

برای مثال، متا اعلام کرده مدل LLaMA طوری طراحی شده که دیدگاه خاصی را ترجیح ندهد، و OpenAI نیز وعده داده که مدل‌های آینده‌اش بی‌طرف‌تر باشند.

سوالات متداول:

۱. مدل Gemini 2.5 Flash چه تفاوتی با نسخه 2.0 دارد؟
مدل ۲.۵ نسخه به‌روزشده‌ای از جمینای ۲.۰ است، اما در ارزیابی‌های ایمنی، عملکرد ضعیف‌تری نشان داده و احتمال تولید محتوای نقض‌کننده دستورالعمل‌ها در آن بیشتر است.

۲. منظور از ایمنی متن به متن و تصویر به متن چیست؟
ایمنی متن به متن بررسی می‌کند که آیا مدل در پاسخ به پیام متنی، محتوای خطرناک یا ناپسند تولید می‌کند یا خیر. ایمنی تصویر به متن بررسی مشابهی برای پیام‌های تصویری انجام می‌دهد.

۳. آیا این مدل در دسترس عمومی قرار گرفته است؟
خیر، Gemini 2.5 Flash هنوز در مرحله پیش‌نمایش (Preview) است و به‌طور عمومی عرضه نشده.

۴. آیا گوگل قصد دارد این مشکلات را برطرف کند؟
بله، گوگل گفته است که در حال بررسی مشکلات و بازخوردهاست و برخی از نقض‌ها را نیز به مثبت‌های کاذب نسبت داده است.

تبلیغ در آناژورنال بنری
فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.