به گزارش رسانه تحلیلی خبری آناژورنال، مایکروسافت بهتازگی از توسعه مدل جدید هوش مصنوعی «1 بیتی» خود با نام BitNet b1.58 2B4T خبر داده است.
این مدل که بهصورت متنباز تحت مجوز MIT منتشر شده، بهطور خاص برای اجرای بهینه روی پردازندههای معمولی مانند اپل M2 طراحی شده است. این ویژگی BitNet را برای استفاده در دستگاههای محدود به منابع سختافزاری ایدهآل میکند.
جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.
مدلهای 1 بیتی یا BitNet به گونهای طراحی شدهاند که به جای استفاده از مدلهای پیچیده و بزرگ، با استفاده از سه مقدار -1، 0 و 1 برای وزنها، حجم حافظه مصرفی را بهشدت کاهش میدهند و سرعت اجرا را افزایش میدهند.
این ویژگیها باعث میشوند که BitNet در شرایط محدودیت منابع عملکرد خوبی از خود نشان دهد.
این مدل جدید مایکروسافت دارای 2 میلیارد پارامتر است و بر روی مجموعه دادهای شامل 4 تریلیون توکن آموزش دیده که معادل حدود 33 میلیون کتاب میباشد.
نتایج تستها نشان میدهند که BitNet از مدلهای مشابه مانند Llama 3.2 و Gemma 3 در آزمونهای GSM8K و PIQA امتیاز بالاتری کسب کرده و در برخی موارد، سرعت اجرای آن تا 2 برابر بیشتر از مدلهای مشابه است.
بااینحال، مدل BitNet بهدلیل نیاز به استفاده از فریمورک اختصاصی مایکروسافت به نام bitnet.cpp، تنها با سختافزارهای خاص سازگار است و پشتیبانی از GPU را ندارد.
این امر نشان میدهد که با وجود مزایای عملکردی، چالشهایی مانند سازگاری سختافزاری هنوز برای توسعه این مدلها وجود دارد.
سوالات متداول
1. مدل BitNet مایکروسافت چیه؟
مدل BitNet یه مدل هوش مصنوعی فشرده است که بهطور خاص برای اجرا روی CPUهای معمولی مثل اپل M2 طراحی شده. این مدل مصرف حافظه خیلی کمی داره و سرعت بالاتری نسبت به مدلهای دیگه داره.
2. چرا مایکروسافت BitNet رو معرفی کرده؟
مایکروسافت این مدل رو معرفی کرده تا هوش مصنوعی با عملکرد عالی رو حتی روی دستگاههایی با منابع محدود، مثل لپتاپهای معمولی یا گوشیهای هوشمند، اجرا کنه.
3. مدل BitNet چطور حافظه رو کم میکنه؟
در مدل BitNet، وزنها با سه مقدار -1، 0 و 1 نمایش داده میشن که باعث میشه حجم دادهها و مصرف حافظه خیلی کمتر بشه و سرعت پردازش هم بیشتر بشه.
4. آیا BitNet میتونه روی گوشی اجرا بشه؟
بله، مدل BitNet به گونهای طراحی شده که میتونه روی گوشیها و دستگاههای دیگه با منابع محدود هم اجرا بشه. حتی روی پردازندههای معمولی مثل اپل M2 هم کار میکنه.
5. مدل BitNet با کدوم مدلهای دیگه مقایسه میشه؟
مدل BitNet در تستها عملکرد بهتری از مدلهایی مثل Llama 3.2 و Gemma 3 نشون داده و حتی در بعضی موارد دو برابر سریعتر عمل کرده.
6. BitNet از GPU پشتیبانی میکنه؟
نه، مدل BitNet فعلاً از GPU پشتیبانی نمیکنه و برای اجرای اون باید از فریمورک خاصی به نام bitnet.cpp استفاده کرد.
7. مزیتهای مدل BitNet نسبت به مدلهای قدیمی چیه؟
بزرگترین مزیت مدل BitNet اینه که مصرف حافظه خیلی کم داره و سرعت اجرای بالاتری داره. در واقع، میتونه بهراحتی روی دستگاههایی با منابع محدود اجرا بشه، بدون اینکه به سختافزار قوی نیاز داشته باشه.
8. چطور میتونم مدل BitNet رو امتحان کنم؟
برای استفاده از مدل BitNet، باید از فریمورک اختصاصی مایکروسافت به نام bitnet.cpp استفاده کنی که الان فقط با سختافزارهای خاصی سازگار هست.
ارسال پاسخ
نمایش دیدگاه ها