مدل جدید هوش مصنوعی CSM-1B منتشر شد؛ آیا آینده دستیارهای صوتی متحول می‌شود؟

شرکت هوش مصنوعی Sesame مدل پایه CSM-1B را که پشتوانه‌ی دستیار صوتی Maya است، به‌صورت متن‌باز منتشر کرد.

مدل جدید هوش مصنوعی CSM-1B منتشر شد؛ آیا آینده دستیارهای صوتی متحول می‌شود؟

به گزارش رسانه تحلیلی خبری آناژورنال شرکت Sesame، استارتاپی که با دستیار صوتی Maya به شهرت رسید، مدل پایه‌ی هوش مصنوعی خود را به‌صورت متن‌باز منتشر کرد.

این مدل که CSM-1B نام دارد، از یک میلیارد پارامتر تشکیل شده و تحت مجوز Apache 2.0 ارائه شده است، به این معنا که کاربران و توسعه‌دهندگان می‌توانند آزادانه از آن استفاده تجاری کنند.

سپاهان باز هم متوقف شد؛ تساوی مقابل نساجی در لیگ برتر

این مدل بر اساس تکنیکی به نام “Residual Vector Quantization” (RVQ) کار می‌کند، که صدای ورودی را به کدهای صوتی دیجیتال تبدیل می‌کند.

این فناوری پیش‌تر در مدل‌های صوتی پیشرفته‌ای مثل SoundStream گوگل و Encodec متا به‌کار رفته است.

CSM-1B بر پایه‌ی یکی از مدل‌های Llama از متا ساخته شده و به یک دیکودر صوتی مجهز شده است.

گزارش: خانواده ترامپ مذاکراتی با بایننس برای خرید سهم در صرافی کریپتو داشتند

این مدل قابلیت تولید صداهای مختلف را دارد، اما به‌طور خاص برای تقلید یک صدای خاص آموزش ندیده است.

Sesame به صراحت اعلام کرده که مدل منتشرشده دارای هیچ‌گونه محدودیت یا فیلتر امنیتی برای جلوگیری از سوءاستفاده نیست.

برنامه بازی‌های لیگ برتر ایران – یکشنبه ۲۶ اسفند

تنها یک سیستم اخلاقی مبتنی بر اعتماد (Honor System) وجود دارد که از کاربران درخواست می‌کند از تقلید صدای افراد بدون رضایت آن‌ها، تولید اخبار جعلی یا هرگونه فعالیت مخرب خودداری کنند.

اما همین موضوع می‌تواند به نگرانی‌های مربوط به کپی‌برداری غیرمجاز از صدا، انتشار اطلاعات جعلی و کلاهبرداری‌های صوتی دامن بزند.

گوگل قابلیت شخصی‌سازی Gemini را معرفی کرد؛ تجربه‌ای جدید از هوش مصنوعی

به‌خصوص که طبق گزارش‌های منتشرشده، تکثیر صدای یک شخص با این مدل کمتر از یک دقیقه زمان می‌برد.

Sesame توسط Brendan Iribe، هم‌بنیان‌گذار Oculus، تأسیس شده و تاکنون سرمایه‌گذاری‌های نامشخصی از Andreessen Horowitz، Spark Capital و Matrix Partners دریافت کرده است.

لبخند سینمای جهان به سعید روستایی و فیلم جدیدش

این شرکت، علاوه بر توسعه‌ی دستیارهای صوتی، اعلام کرده که در حال ساخت عینک‌های هوشمند مبتنی بر هوش مصنوعی است که می‌توانند در تمام طول روز مورد استفاده قرار گیرند.

سوالات متداول:

۱. هوش مصنوعی مدل CSM-1B چیست و چه کاربردی دارد؟

CSM-1B یک مدل هوش مصنوعی تولید صوت است که توسط شرکت Sesame توسعه داده شده است.

این مدل می‌تواند متن را به صوت تبدیل کند و قادر است صداهای مختلفی را تولید کند.

از آن در ساخت دستیارهای صوتی، دوبله‌ی خودکار و ابزارهای گفتاری مبتنی بر هوش مصنوعی استفاده می‌شود.

۲. آیا می‌توان از هوش مصنوعی مدل CSM-1B برای تقلید صدا استفاده کرد؟

بله، این مدل می‌تواند صدای افراد را شبیه‌سازی کند، اما به‌طور خاص برای تقلید صدای یک شخص خاص آموزش داده نشده است.

با این حال، امکان استفاده از آن برای تقلید صدا وجود دارد و این موضوع نگرانی‌هایی درباره سوءاستفاده‌های احتمالی ایجاد کرده است.

۳. هوش مصنوعی CSM-1B رایگان است؟ چطور می‌توان آن را دانلود کرد؟

بله، این مدل تحت مجوز Apache 2.0 به‌صورت متن‌باز منتشر شده است، بنابراین توسعه‌دهندگان می‌توانند آن را به‌صورت رایگان دانلود و استفاده کنند.

این مدل از طریق پلتفرم Hugging Face و GitHub قابل دسترسی است.

۴. دستیار صوتی Maya چه تفاوتی با هوش مصنوعی مدل CSM-1B دارد؟

Maya یک دستیار صوتی مبتنی بر هوش مصنوعی است که از نسخه بهینه‌شده‌ی CSM-1B استفاده می‌کند.

در حالی که CSM-1B یک مدل پایه برای تولید صدا است، Maya دارای قابلیت‌های پردازش گفتار پیشرفته‌تری است و می‌تواند به‌طور طبیعی مکالمه کند.

۵. چگونه می‌توان با هوش مصنوعی مدل CSM-1B صدای خود را شبیه‌سازی کرد؟

برای شبیه‌سازی صدا، ابتدا باید مدل CSM-1B را از Hugging Face دریافت کنید.

سپس می‌توان از ورودی صوتی خود برای آموزش مدل استفاده کرد و صدای تولیدی را بر اساس نیاز تغییر داد.

این فرآیند معمولاً کمتر از یک دقیقه زمان می‌برد.

۶. آیا هوش مصنوعی CSM-1B از زبان فارسی پشتیبانی می‌کند؟

Sesame اعلام کرده که این مدل به دلیل آلودگی داده‌های آموزشی ممکن است توانایی محدودی در پردازش زبان‌های غیرانگلیسی از جمله فارسی داشته باشد، اما عملکرد آن در این زبان‌ها بهینه نیست.

چرا بعضی فیلترشکن‌ ها هنوز وصل‌ اند؟ – قطعی اینترنت تا کی ادامه دارد؟

اینستاگرام لیست فالوور های کاربران داخل ایران را مخفی کرد

دفتر محمدجواد ظریف ادعای تماس با رضا پهلوی را تکذیب کرد

گلوبال ژورنال چه گفت؟ ادعای آزمایش موشک قاره‌ پیمای ایران

چرا بعضی فیلترشکن‌ ها هنوز وصل‌ اند؟ – قطعی اینترنت تا کی ادامه دارد؟

اینستاگرام لیست فالوور های کاربران داخل ایران را مخفی کرد

دفتر محمدجواد ظریف ادعای تماس با رضا پهلوی را تکذیب کرد

گلوبال ژورنال چه گفت؟ ادعای آزمایش موشک قاره‌ پیمای ایران

مدل جدید هوش مصنوعی CSM-1B منتشر شد؛ آیا آینده دستیارهای صوتی متحول می‌شود؟

شرکت هوش مصنوعی Sesame مدل پایه CSM-1B را که پشتوانه‌ی دستیار صوتی Maya است، به‌صورت متن‌باز منتشر کرد.

تاریخ دقیق روز دندانپزشک در سال 1405 چه زمانی است؟

تاریخ دقیق معراج رسول اکرم (ص) در سال 1404 – شب معراج پیامبر کی است؟

تاریخ دقیق روز غزه در سال 1404 کی است؟ – روز غزه کیه؟

تاریخ دقیق روز ملی شدن صنعت نفت ایران در سال 1404 کی است؟