دیپ‌سیک از مدل هوش مصنوعی جدید خود رونمایی کرد

دیپ‌سیک مدل هوش مصنوعی DeepSeek-V3.2-Exp با معماری «توجه پراکنده» معرفی کرد؛ کاهش ۵۰ درصدی هزینه تحلیل متون طولانی، اما نگرانی درباره اعتمادپذیری وجود دارد.

دیپ‌سیک از مدل هوش مصنوعی جدید خود رونمایی کرد

به گزارش آناژورنال، استارتاپ چینی دیپ‌سیک مدل آزمایشی جدیدی به نام DeepSeek-V3.2-Exp با معماری «توجه پراکنده» معرفی کرده است.

این فناوری وعده می‌دهد هزینه استفاده از هوش مصنوعی برای تحلیل متون طولانی را تا ۵۰ درصد کاهش دهد، اما برخی کارشناسان درباره اعتمادپذیری خروجی‌ها هشدار داده‌اند.

معماری «توجه پراکنده» چیست و چگونه هزینه‌ها را کاهش می‌دهد؟

مدل‌های هوش مصنوعی سنتی برای تحلیل متون، باید به تمام کلمات و جملات توجه کنند که پردازش متون طولانی به قدرت محاسباتی و هزینه بالای سرور نیاز دارد.

  • معماری جدید دیپ‌سیک با نام توجه پراکنده (DSA) تنها مهم‌ترین بخش‌های متن را شناسایی و تحلیل می‌کند.
  • این روش همانند فیلتر کردن گزینه‌های منطقی برای یافتن مسیر بهینه در یک شرکت هواپیمایی عمل می‌کند؛ یعنی به‌جای پردازش تمام داده‌ها، فقط داده‌های مهم انتخاب می‌شوند.
  • طبق اعلام دیپ‌سیک، این رویکرد می‌تواند هزینه API برای متون طولانی را تا ۵۰ درصد کاهش دهد.

مزایای توجه پراکنده برای شرکت‌ها و توسعه‌دهندگان

به گفته گزارش CNBC، کاهش هزینه‌ها می‌تواند به شرکت‌های کوچک و توسعه‌دهندگان مستقل امکان استفاده از مدل‌های قدرتمند هوش مصنوعی را بدهد.

  • این فناوری می‌تواند موجی از خلاقیت و رقابت در بازار هوش مصنوعی ایجاد کند.
  • دسترسی آسان‌تر به مدل‌های پیشرفته، باعث افزایش کاربردهای نوآورانه در اپلیکیشن‌ها و تحقیق و توسعه خواهد شد.

نگرانی‌ها و چالش‌های اعتمادپذیری

با وجود مزایا، کارشناسان نسبت به قابلیت اعتماد به خروجی‌ها هشدار داده‌اند:

  • مدل‌های توجه پراکنده ممکن است جزئیات مهم را حذف کنند و برخی داده‌ها را به اشتباه «غیرمهم» تشخیص دهند.
  • اکاترینا آلماسک، سرمایه‌گذار حوزه هوش مصنوعی، می‌گوید: «سؤال واقعی این است که آیا مدل‌ها مکانیسم درستی برای حذف داده‌های غیرمهم دارند؟»
  • این مسئله می‌تواند در حوزه ایمنی و بی‌طرفی داده‌ها مشکل‌ساز باشد، زیرا اگر دیدگاه‌ها یا داده‌های گروه خاصی به طور سیستماتیک حذف شوند، خروجی مدل ممکن است مغرضانه و غیرقابل اعتماد شود.

سوالات متداول

معماری «توجه پراکنده» چیست؟
«توجه پراکنده» (DSA) روشی است که مدل هوش مصنوعی فقط مهم‌ترین بخش‌های متن را شناسایی و تحلیل می‌کند تا بار محاسباتی کاهش یابد و هزینه‌ها تا ۵۰ درصد کاهش پیدا کند.

چگونه توجه پراکنده هزینه استفاده از هوش مصنوعی را کاهش می‌دهد؟
به جای پردازش تمام داده‌ها، سیستم فقط داده‌های مهم و گزیده را تحلیل می‌کند که باعث کاهش نیاز به سرور و منابع محاسباتی می‌شود.

مزیت اصلی DeepSeek-V3.2-Exp برای شرکت‌ها چیست؟
شرکت‌ها و توسعه‌دهندگان کوچک می‌توانند با هزینه کمتر به مدل‌های قدرتمند هوش مصنوعی دسترسی پیدا کنند و اپلیکیشن‌ها و تحقیقات خود را با منابع محدود توسعه دهند.

چه نگرانی‌هایی درباره اعتمادپذیری مدل وجود دارد؟
مدل ممکن است داده‌های مهم را حذف کند یا دیدگاه‌های خاصی را نادیده بگیرد، که می‌تواند خروجی را مغرضانه، غیرقابل اعتماد و خطرناک کند.

آیا این مدل برای تحلیل همه نوع داده مناسب است؟
با وجود مزایا، مدل توجه پراکنده بیشتر برای متون طولانی مناسب است و برای کاربردهایی که جزئیات دقیق و بی‌طرفی داده اهمیت دارد، باید با احتیاط استفاده شود.

تیم تحریریه آناژورنال متشکل از روزنامه‌نگاران باتجربه و متخصص در حوزه‌های خبری متنوع از جمله اخبار سینمای ایران و جهان، فناوری، و رویدادهای محلی است. این تیم با بیش از چند سال تجربه در رسانه‌ آناژورنال، به ارائه اخبار دقیق، به‌روز و جذاب متعهد است.