Voice Engine OpenAI: کلون صدای خفن یا پروژه‌ای که خاک می‌خوره؟

ابزار Voice Engine از OpenAI بعد از یک سال هنوز تو حالت پیش‌نمایشه! دلیل تأخیر چیه؟ اینجوری با جزئیاتش آشنا شو و نظرت رو بگو.

Voice Engine OpenAI: کلون صدای خفن یا پروژه‌ای که خاک می‌خوره؟
Voice Engine OpenAI: کلون صدای خفن یا پروژه‌ای که خاک می‌خوره؟

به گزارش رسانه تحلیلی خبری آناژورنال حدود یه سال پیش (اواخر مارس ۲۰۲۴)، OpenAI با یه سروصدای حسابی یه پیش‌نمایش کوچیک از ابزار جدیدش به اسم Voice Engine رو کرد که می‌گفت فقط با ۱۵ ثانیه از صدای آدما، می‌تونه صداشون رو کلون کنه.

حالا که ۶ مارس ۲۰۲۵ شده، هنوز خبری از عرضه عمومی این ابزار نیست و OpenAI هیچی درباره زمان لانچش نگفته.

این یعنی یا قراره کلاً بی‌خیالش بشن، یا هنوز دارن رو مخ کار می‌کنن!

به نظر میاد OpenAI یه کم دست‌به‌عصا شده.

از یه طرف ترس از سوءاستفاده داره، از طرف دیگه نمی‌خواد با عجله عرضه کنه و زیر ذره‌بین قانون‌گذارا بره.

این شرکت قبلاً هم متهم شده که بیشتر دنبال محصولای پرزرق‌وبرق بوده تا ایمنی.

یه سخنگوی OpenAI به TechCrunch گفته: «ما داریم با یه گروه محدود از شریکای مورد اعتماد تستش می‌کنیم تا هم کاربردش رو بهتر کنیم، هم امنیتش رو بالا ببریم.»

کاربردایی مثل گفتاردرمانی، یادگیری زبان، پشتیبانی مشتری و حتی ساخت کاراکترای بازی و آواتارای هوش مصنوعی!

Voice Engine که صداش تو API متنی OpenAI و حالت Voice Mode چت‌جی‌پی‌تی استفاده می‌شه، می‌تونه صدای طبیعی و شبیه به گوینده اصلی تولید کنه.

این ابزار از سال ۲۰۲۲ تو دست توسعه بوده و قرار بود مارس ۲۰۲۴ به ۱۰۰ توسعه‌دهنده مورد اعتماد برسه، ولی در لحظه آخر برنامه عقب افتاد.

حالا فقط یه گروه ۱۰ نفره از آخر ۲۰۲۳ بهش دسترسی دارن.

OpenAI گفته بود می‌خواد با این پیش‌نمایش، بحث استفاده مسئولانه از صدای مصنوعی رو راه بندازه و ببینه جامعه چطور با این تکنولوژی کنار میاد.

یکی از شریکای OpenAI، استارتاپ Livox، که برای آدمای دارای معلولیت دستگاه ارتباطی می‌سازه، گفته این ابزار واقعاً کیفیت بالایی داره و برای مشتریاش که دنبال صدای طبیعی به زبانای مختلفن، عالیه.

ولی چون آنلاینه و خیلی از مشتریاش اینترنت ندارن، هنوز نتونستن کامل ازش استفاده کنن.

کارلوس پریرا، مدیر Livox، به TechCrunch گفته: «امیدواریم OpenAI یه نسخه آفلاینش رو زودتر بده.»

این تأخیر نشون می‌ده OpenAI داره محتاط‌تر عمل می‌کنه، به‌خصوص بعد از نگرانی‌هایی مثل سوءاستفاده تو انتخابات پارسال آمریکا.

این ابزار واتر‌مارک داره که بشه منشأ صداهاش رو ردیابی کرد و توسعه‌دهنده‌ها باید رضایت صریح از گوینده بگیرن.

ولی اعمال این قوانین تو مقیاس بزرگ، حتی برای OpenAI، کار راحتی نیست.

کلاهبرداری با کلونینگ صوتی تو ۲۰۲۴ حسابی بالا گرفته و از دور زدن امنیت بانکا تا دیپ‌فیکای جنجالی سلبریتی‌ها رو شامل شده.

شاید OpenAI داره صبر می‌کنه تا یه سیستم احراز هویت صوتی محکم‌تر یا لیست “ممنوعه‌ها” برای صداهای شبیه آدمای معروف درست کنه.

اینکه Voice Engine کی عرضه بشه یا اصلاً بشه، معلوم نیست.

ممکنه هفته دیگه بیاد، یا هیچ‌وقت نیاد! ولی این پیش‌نمایش طولانی، نشون می‌ده OpenAI داره با احتیاط قدم برمی‌داره؛ چه برای ایمنی، چه برای اینکه زیر سؤال نره.

سوالات متداول:

Voice Engine چیه که این‌قدر سرش حرف داره؟

Voice Engine یه ابزار هوش مصنوعی از OpenAIه که با ۱۵ ثانیه از صدای یه نفر، می‌تونه صداش رو کپی کنه و طبیعی حرف بزنه.

از گفتاردرمانی تا کاراکترای بازی می‌تونه باهاش ساخت، ولی هنوز تو فاز تسته و OpenAI عرضه‌ش نکرده.

چرا OpenAI این ابزار صوتی رو هنوز رو نکرده؟

OpenAI نگران سوءاستفاده‌ست، مثل کلاهبرداری یا دیپ‌فیکای جنجالی.

ضمناً می‌خواد مطمئن بشه قانون‌گذارا گیر ندن و سیستمش امن باشه، واسه همین یه ساله معطلش کرده.

این کلون صدای OpenAI برای ما چه فایده‌ای داره؟

اگه عرضه بشه، می‌تونی باهاش صدای خودت رو برای آموزش زبان یا پشتیبانی مشتری فارسی بسازی.

حتی برای کسایی که مشکل تکلم دارن، ولی فعلاً باید صبر کنیم.

کی قراره این Voice Engine رو ببینیم؟

معلوم نیست! OpenAI گفته داره با شریکاش تست می‌کنه، ولی تاریخ مشخصی نداده.

شاید به‌زودی بیاد، شایدم کلاً کنسلش کنن!

فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.