مدل R1 جدید DeepSeek با 685 میلیارد پارامتر روی Hugging Face منتشر شد

استارتاپ چینی DeepSeek نسخه‌ای به‌روز از مدل R1 را با ۶۸۵ میلیارد پارامتر در Hugging Face منتشر کرد. این مدل با مجوز MIT و به‌روزرسانی جزئی ارائه شده است.

مدل R1 جدید DeepSeek با 685 میلیارد پارامتر روی Hugging Face منتشر شد
مدل R1 جدید DeepSeek با 685 میلیارد پارامتر روی Hugging Face منتشر شد
📢 تبلیغات در آناژورنال
سئو سرویس تبلیغاتی

به گزارش رسانه تحلیلی خبری آناژورنال، استارتاپ چینی DeepSeek نسخه جدیدی از مدل استدلال‌گر خود یعنی R1 را با ۶۸۵ میلیارد پارامتر در پلتفرم Hugging Face منتشر کرده است.

این نسخه به‌عنوان یک به‌روزرسانی جزئی معرفی شده، اما به‌خاطر اندازه فوق‌العاده بزرگش، توجه زیادی را به خود جلب کرده است.

جدیدترین اخبار تکنولوژی در آناژورنال دنبال کنید.

اطلاعات منتشرشده نشان می‌دهد که این مدل با مجوز MIT در اختیار عموم قرار گرفته است؛ مجوزی که امکان استفاده، اصلاح و بهره‌برداری تجاری از مدل را بدون محدودیت قانونی فراهم می‌کند.

با این حال، تنها فایل‌های وزن و پیکربندی (config) در مخزن قرار داده شده‌اند و هنوز جزئیاتی درباره معماری داخلی یا عملکرد مدل منتشر نشده است.

مدل R1 در اوایل سال ۲۰۲۵ معرفی شد و به‌سرعت به‌دلیل توانایی‌های بالایش در استدلال منطقی و درک زبان طبیعی مورد توجه قرار گرفت.

حتی برخی نهادهای امنیتی ایالات متحده نسبت به این مدل ابراز نگرانی کرده‌اند و آن را یک تهدید احتمالی برای امنیت ملی قلمداد می‌کنند.

حجم ۶۸۵ میلیارد پارامتر این مدل به‌مراتب بیشتر از بسیاری از مدل‌های بزرگ موجود مانند GPT-4 و Claude است و اجرای آن بدون دسترسی به زیرساخت‌های پیشرفته امکان‌پذیر نیست.

این مدل می‌تواند در صورت پشتیبانی کامل از سوی توسعه‌دهندگان، نقش مهمی در اکوسیستم متن‌باز هوش مصنوعی ایفا کند.

اگر بخواهید، در ادامه می‌توانم راهنمای استفاده از این مدل روی Hugging Face را نیز بنویسم یا مقایسه‌ای تحلیلی میان آن و دیگر مدل‌های مطرح انجام دهم.

سوالات متداول

مدل R1 DeepSeek چیست؟
مدل R1 یک هوش مصنوعی استدلال‌گر از استارتاپ چینی DeepSeek است که برای رقابت با مدل‌هایی مانند GPT-4 توسعه یافته.

اندازه مدل جدید R1 چقدر است؟
مدل به‌روز شده R1 دارای ۶۸۵ میلیارد پارامتر است که آن را به یکی از بزرگ‌ترین مدل‌های متن‌باز تبدیل می‌کند.

آیا مدل R1 قابل استفاده تجاری است؟
بله، این مدل تحت مجوز MIT منتشر شده و استفاده تجاری از آن آزاد است.

این مدل روی چه سخت‌افزاری اجرا می‌شود؟
به‌دلیل اندازه بسیار بزرگ، این مدل برای اجرا به سخت‌افزارهای حرفه‌ای (مانند دیتاسنتر یا GPUهای قدرتمند) نیاز دارد و روی سیستم‌های معمولی قابل اجرا نیست.

تفاوت این نسخه جدید با نسخه قبلی R1 چیست؟
تیم DeepSeek این آپدیت را «جزئی» معرفی کرده، اما جزئیات فنی دقیق آن را منتشر نکرده‌اند.

سئو سرویس تبلیغات
آیدا رادور کارشناس تولید محتوا، حدود سال هست که در زمینه تولید محتوا، خبر نویسی فعالیت میکنم