تولید صدا در ۸ ثانیه! انقلابی در هوش مصنوعی با Stable Audio Open!

Stability AI مدل Stable Audio Open را برای چیپ‌های Arm بهینه کرده است. حالا این مدل می‌تواند صداهایی مثل امواج آرام دریا را تنها در ۸ ثانیه تولید کند!

تولید صدا در ۸ ثانیه! انقلابی در هوش مصنوعی با Stable Audio Open!
تولید صدا در ۸ ثانیه! انقلابی در هوش مصنوعی با Stable Audio Open!

به گزارش رسانه تحلیلی خبری آناژورنال Stability AI، استارتاپ حوزه هوش مصنوعی، به تازگی همکاری خود را با شرکت سازنده چیپ Arm اعلام کرده تا مدل هوش مصنوعی تولید صوت خود به نام Stable Audio Open را برای دستگاه‌های موبایل مجهز به چیپ‌های Arm بهینه‌سازی کند.

این مدل قادر به تولید انواع صداها از جمله افکت‌های صوتی است و به ویژه توانایی تبدیل توصیف‌های متنی به صدا را دارد.

به عنوان مثال، با وارد کردن توصیفی مثل “امواج آرام دریا در غروب”، می‌توان صدای آن را تولید کرد.

این اقدام در حالی انجام می‌شود که بسیاری از برنامه‌های مبتنی بر هوش مصنوعی برای تولید صدا، همچنان به پردازش ابری وابسته‌اند و نمی‌توانند به صورت آفلاین کار کنند.

همچنین، برخی از مدل‌های تولید صوت با محتوای تحت‌حمایت کپی‌رایت آموزش دیده‌اند، که این موضوع ممکن است خطراتی از نظر نقض حقوق مالکیت معنوی ایجاد کند.

در حالی که Stable Audio Open تنها از داده‌های صوتی آزاد و بدون کپی‌رایت برای آموزش خود استفاده کرده است.

بهینه‌سازی این مدل برای چیپ‌های Arm باعث افزایش سرعت تولید صدا تا ۳۰ برابر شده است.

به طور خاص، اکنون تولید یک نمونه ۱۱ ثانیه‌ای از صدا تنها در حدود ۸ ثانیه بر روی پردازنده Armv9 انجام می‌شود.

این مدل به زودی در نمایشگاه Mobile World Congress در بارسلونا به نمایش گذاشته خواهد شد.

در حال حاضر، مدل بهینه‌شده Stable Audio Open برای دانلود در دسترس نیست، اما Prem Akkaraju، مدیرعامل Stability AI، اشاره کرده است که این شرکت در آینده قصد دارد مدل‌های خود را برای اپلیکیشن‌ها و دستگاه‌های مصرفی در دسترس قرار دهد.

این اقدام به منظور ارائه مدل‌های هوش مصنوعی به سازندگان و خالقان محتوا صورت گرفته است.

Stability AI، که پیشتر با مدل تصویرسازی خود Stable Diffusion شناخته شده بود، اخیراً با چالش‌هایی در زمینه مدیریت مالی روبه‌رو بوده است.

این شرکت پس از تغییر مدیرعامل و استخدام چهره‌هایی نظیر James Cameron در هیئت مدیره، به دنبال بازسازی و رشد دوباره است.

سوالات متداول:

چرا Stability AI مدل Stable Audio Open را برای چیپ‌های Arm بهینه کرده است؟

Stability AI بهینه‌سازی این مدل را برای افزایش سرعت تولید صدا و اجرای آن بر روی دستگاه‌های موبایل انجام داده است.

چه نوع صدایی می‌تواند مدل Stable Audio Open تولید کند؟

مدل می‌تواند صداهایی مانند امواج آرام دریا، صدای باران و سایر افکت‌های صوتی را از روی توصیف متنی تولید کند.

آیا مدل Stable Audio Open به صورت عمومی در دسترس است؟

خیر، این مدل بهینه‌شده فعلاً برای دانلود در دسترس نیست، اما Stability AI قصد دارد آن را در آینده در اختیار اپلیکیشن‌ها و دستگاه‌های مصرفی قرار دهد.

فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.