عملکرد ضعیف‌ تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!

مدل Gemini 2.5 Flash گوگل در آزمایش‌های ایمنی عملکرد ضعیف‌تری نسبت به نسخه قبلی داشته و محتوای نقض‌کننده بیشتری تولید کرده است.

عملکرد ضعیف‌تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!

به گزارش رسانه تحلیلی خبری آناژورنال نتایج آزمایش داخلی گوگل نشان می‌دهند که مدل هوش مصنوعی جدید این شرکت، یعنی Gemini 2.5 Flash، در برخی ارزیابی‌های ایمنی نسبت به نسخه‌ی پیشین خود Gemini 2.0 Flash عملکرد ضعیف‌تری داشته است.

جدیدترین اخبار هوش مصنوعی را در آناژورنال بخوانید.

آرتور هیز: دولت آمریکا برای خرید بیت‌کوین پول چاپ نمی‌کند _ چرا دامیننس BTC ممکن است دوباره اوج بگیرد؟

طبق گزارش فنی منتشرشده، این مدل در دو معیار اصلی «ایمنی متن به متن» و «ایمنی تصویر به متن» به ترتیب ۴.۱ درصد و ۹.۶ درصد پسرفت داشته است.

گوگل در این گزارش توضیح داده که آزمایش‌ها به‌صورت خودکار و بدون نظارت انسانی انجام شده‌اند.

سیری هوشمند اپل به تعویق افتاد؛ تیم کوک از پیشرفت‌های جدید خبر داد

ایمنی متن به متن بررسی می‌کند که مدل تا چه حد ممکن است در پاسخ به پیام متنی، دستورالعمل‌های ایمنی گوگل را نقض کند.

در مقابل، ایمنی تصویر به متن ارزیابی می‌کند که مدل در برابر پیام‌هایی که حاوی تصویر هستند، چقدر به دستورالعمل‌های ایمنی پایبند است.

یافتن سرنخ‌ هایی جدید از سیاره نهم در منظومه شمسی: آیا نظریه‌ها تغییر خواهند کرد؟

سخنگوی گوگل در بیانیه‌ای اعلام کرده است که این پسرفت می‌تواند تا حدی به مثبت‌های کاذب مربوط باشد، اما در برخی موارد مدل واقعاً محتوای ناقض محدودیت‌ها را تولید کرده است.

گوگل همچنین تأکید کرد که Gemini 2.5 Flash هنوز در مرحله‌ی پیش‌نمایش قرار دارد.

حالت دسکتاپ اندروید به تمام گوشی‌های اندرویدی می‌آید: تجربه‌ای جدید مشابه ویندوز و macOS

این یافته‌ها در حالی منتشر می‌شوند که شرکت‌های بزرگ هوش مصنوعی مانند گوگل، اپن‌ای‌آی و متا در تلاش‌اند تا مدل‌های خود را از نظر اخلاقی و ایمنی انعطاف‌پذیرتر کنند.

برای مثال، متا اعلام کرده مدل LLaMA طوری طراحی شده که دیدگاه خاصی را ترجیح ندهد، و OpenAI نیز وعده داده که مدل‌های آینده‌اش بی‌طرف‌تر باشند.

کاظمیان: هنوز با پرسپولیس قراردادی امضا نکرده‌ام! توضیحات کامل درباره شایعات انتقال

سوالات متداول:

۱. مدل Gemini 2.5 Flash چه تفاوتی با نسخه 2.0 دارد؟
مدل ۲.۵ نسخه به‌روزشده‌ای از جمینای ۲.۰ است، اما در ارزیابی‌های ایمنی، عملکرد ضعیف‌تری نشان داده و احتمال تولید محتوای نقض‌کننده دستورالعمل‌ها در آن بیشتر است.

۲. منظور از ایمنی متن به متن و تصویر به متن چیست؟
ایمنی متن به متن بررسی می‌کند که آیا مدل در پاسخ به پیام متنی، محتوای خطرناک یا ناپسند تولید می‌کند یا خیر. ایمنی تصویر به متن بررسی مشابهی برای پیام‌های تصویری انجام می‌دهد.

۳. آیا این مدل در دسترس عمومی قرار گرفته است؟
خیر، Gemini 2.5 Flash هنوز در مرحله پیش‌نمایش (Preview) است و به‌طور عمومی عرضه نشده.

۴. آیا گوگل قصد دارد این مشکلات را برطرف کند؟
بله، گوگل گفته است که در حال بررسی مشکلات و بازخوردهاست و برخی از نقض‌ها را نیز به مثبت‌های کاذب نسبت داده است.

چرا بعضی فیلترشکن‌ ها هنوز وصل‌ اند؟ – قطعی اینترنت تا کی ادامه دارد؟

اینستاگرام لیست فالوور های کاربران داخل ایران را مخفی کرد

دفتر محمدجواد ظریف ادعای تماس با رضا پهلوی را تکذیب کرد

گلوبال ژورنال چه گفت؟ ادعای آزمایش موشک قاره‌ پیمای ایران

چرا بعضی فیلترشکن‌ ها هنوز وصل‌ اند؟ – قطعی اینترنت تا کی ادامه دارد؟

اینستاگرام لیست فالوور های کاربران داخل ایران را مخفی کرد

دفتر محمدجواد ظریف ادعای تماس با رضا پهلوی را تکذیب کرد

گلوبال ژورنال چه گفت؟ ادعای آزمایش موشک قاره‌ پیمای ایران

عملکرد ضعیف‌ تر Gemini 2.5 Flash در آزمون‌های ایمنی _ پسرفت گوگل در تولید محتوای مسئولانه!

مدل Gemini 2.5 Flash گوگل در آزمایش‌های ایمنی عملکرد ضعیف‌تری نسبت به نسخه قبلی داشته و محتوای نقض‌کننده بیشتری تولید کرده است.

تاریخ دقیق روز دندانپزشک در سال 1405 چه زمانی است؟

تاریخ دقیق معراج رسول اکرم (ص) در سال 1404 – شب معراج پیامبر کی است؟

تاریخ دقیق روز غزه در سال 1404 کی است؟ – روز غزه کیه؟

تاریخ دقیق روز ملی شدن صنعت نفت ایران در سال 1404 کی است؟