به گزارش آناژورنال، استارتاپ چینی دیپسیک مدل آزمایشی جدیدی به نام DeepSeek-V3.2-Exp با معماری «توجه پراکنده» معرفی کرده است.
این فناوری وعده میدهد هزینه استفاده از هوش مصنوعی برای تحلیل متون طولانی را تا ۵۰ درصد کاهش دهد، اما برخی کارشناسان درباره اعتمادپذیری خروجیها هشدار دادهاند.
معماری «توجه پراکنده» چیست و چگونه هزینهها را کاهش میدهد؟
مدلهای هوش مصنوعی سنتی برای تحلیل متون، باید به تمام کلمات و جملات توجه کنند که پردازش متون طولانی به قدرت محاسباتی و هزینه بالای سرور نیاز دارد.
- معماری جدید دیپسیک با نام توجه پراکنده (DSA) تنها مهمترین بخشهای متن را شناسایی و تحلیل میکند.
- این روش همانند فیلتر کردن گزینههای منطقی برای یافتن مسیر بهینه در یک شرکت هواپیمایی عمل میکند؛ یعنی بهجای پردازش تمام دادهها، فقط دادههای مهم انتخاب میشوند.
- طبق اعلام دیپسیک، این رویکرد میتواند هزینه API برای متون طولانی را تا ۵۰ درصد کاهش دهد.
مزایای توجه پراکنده برای شرکتها و توسعهدهندگان
به گفته گزارش CNBC، کاهش هزینهها میتواند به شرکتهای کوچک و توسعهدهندگان مستقل امکان استفاده از مدلهای قدرتمند هوش مصنوعی را بدهد.
- این فناوری میتواند موجی از خلاقیت و رقابت در بازار هوش مصنوعی ایجاد کند.
- دسترسی آسانتر به مدلهای پیشرفته، باعث افزایش کاربردهای نوآورانه در اپلیکیشنها و تحقیق و توسعه خواهد شد.
نگرانیها و چالشهای اعتمادپذیری
با وجود مزایا، کارشناسان نسبت به قابلیت اعتماد به خروجیها هشدار دادهاند:
- مدلهای توجه پراکنده ممکن است جزئیات مهم را حذف کنند و برخی دادهها را به اشتباه «غیرمهم» تشخیص دهند.
- اکاترینا آلماسک، سرمایهگذار حوزه هوش مصنوعی، میگوید: «سؤال واقعی این است که آیا مدلها مکانیسم درستی برای حذف دادههای غیرمهم دارند؟»
- این مسئله میتواند در حوزه ایمنی و بیطرفی دادهها مشکلساز باشد، زیرا اگر دیدگاهها یا دادههای گروه خاصی به طور سیستماتیک حذف شوند، خروجی مدل ممکن است مغرضانه و غیرقابل اعتماد شود.
سوالات متداول
معماری «توجه پراکنده» چیست؟
«توجه پراکنده» (DSA) روشی است که مدل هوش مصنوعی فقط مهمترین بخشهای متن را شناسایی و تحلیل میکند تا بار محاسباتی کاهش یابد و هزینهها تا ۵۰ درصد کاهش پیدا کند.
چگونه توجه پراکنده هزینه استفاده از هوش مصنوعی را کاهش میدهد؟
به جای پردازش تمام دادهها، سیستم فقط دادههای مهم و گزیده را تحلیل میکند که باعث کاهش نیاز به سرور و منابع محاسباتی میشود.
مزیت اصلی DeepSeek-V3.2-Exp برای شرکتها چیست؟
شرکتها و توسعهدهندگان کوچک میتوانند با هزینه کمتر به مدلهای قدرتمند هوش مصنوعی دسترسی پیدا کنند و اپلیکیشنها و تحقیقات خود را با منابع محدود توسعه دهند.
چه نگرانیهایی درباره اعتمادپذیری مدل وجود دارد؟
مدل ممکن است دادههای مهم را حذف کند یا دیدگاههای خاصی را نادیده بگیرد، که میتواند خروجی را مغرضانه، غیرقابل اعتماد و خطرناک کند.
آیا این مدل برای تحلیل همه نوع داده مناسب است؟
با وجود مزایا، مدل توجه پراکنده بیشتر برای متون طولانی مناسب است و برای کاربردهایی که جزئیات دقیق و بیطرفی داده اهمیت دارد، باید با احتیاط استفاده شود.
ارسال پاسخ
نمایش دیدگاه ها