به گزارش رسانه تحلیلی خبری آناژورنال حدود یه سال پیش (اواخر مارس ۲۰۲۴)، OpenAI با یه سروصدای حسابی یه پیشنمایش کوچیک از ابزار جدیدش به اسم Voice Engine رو کرد که میگفت فقط با ۱۵ ثانیه از صدای آدما، میتونه صداشون رو کلون کنه.
حالا که ۶ مارس ۲۰۲۵ شده، هنوز خبری از عرضه عمومی این ابزار نیست و OpenAI هیچی درباره زمان لانچش نگفته.
این یعنی یا قراره کلاً بیخیالش بشن، یا هنوز دارن رو مخ کار میکنن!
به نظر میاد OpenAI یه کم دستبهعصا شده.
از یه طرف ترس از سوءاستفاده داره، از طرف دیگه نمیخواد با عجله عرضه کنه و زیر ذرهبین قانونگذارا بره.
این شرکت قبلاً هم متهم شده که بیشتر دنبال محصولای پرزرقوبرق بوده تا ایمنی.
یه سخنگوی OpenAI به TechCrunch گفته: «ما داریم با یه گروه محدود از شریکای مورد اعتماد تستش میکنیم تا هم کاربردش رو بهتر کنیم، هم امنیتش رو بالا ببریم.»
کاربردایی مثل گفتاردرمانی، یادگیری زبان، پشتیبانی مشتری و حتی ساخت کاراکترای بازی و آواتارای هوش مصنوعی!
Voice Engine که صداش تو API متنی OpenAI و حالت Voice Mode چتجیپیتی استفاده میشه، میتونه صدای طبیعی و شبیه به گوینده اصلی تولید کنه.
این ابزار از سال ۲۰۲۲ تو دست توسعه بوده و قرار بود مارس ۲۰۲۴ به ۱۰۰ توسعهدهنده مورد اعتماد برسه، ولی در لحظه آخر برنامه عقب افتاد.
حالا فقط یه گروه ۱۰ نفره از آخر ۲۰۲۳ بهش دسترسی دارن.
OpenAI گفته بود میخواد با این پیشنمایش، بحث استفاده مسئولانه از صدای مصنوعی رو راه بندازه و ببینه جامعه چطور با این تکنولوژی کنار میاد.
یکی از شریکای OpenAI، استارتاپ Livox، که برای آدمای دارای معلولیت دستگاه ارتباطی میسازه، گفته این ابزار واقعاً کیفیت بالایی داره و برای مشتریاش که دنبال صدای طبیعی به زبانای مختلفن، عالیه.
ولی چون آنلاینه و خیلی از مشتریاش اینترنت ندارن، هنوز نتونستن کامل ازش استفاده کنن.
کارلوس پریرا، مدیر Livox، به TechCrunch گفته: «امیدواریم OpenAI یه نسخه آفلاینش رو زودتر بده.»
این تأخیر نشون میده OpenAI داره محتاطتر عمل میکنه، بهخصوص بعد از نگرانیهایی مثل سوءاستفاده تو انتخابات پارسال آمریکا.
این ابزار واترمارک داره که بشه منشأ صداهاش رو ردیابی کرد و توسعهدهندهها باید رضایت صریح از گوینده بگیرن.
ولی اعمال این قوانین تو مقیاس بزرگ، حتی برای OpenAI، کار راحتی نیست.
کلاهبرداری با کلونینگ صوتی تو ۲۰۲۴ حسابی بالا گرفته و از دور زدن امنیت بانکا تا دیپفیکای جنجالی سلبریتیها رو شامل شده.
شاید OpenAI داره صبر میکنه تا یه سیستم احراز هویت صوتی محکمتر یا لیست “ممنوعهها” برای صداهای شبیه آدمای معروف درست کنه.
اینکه Voice Engine کی عرضه بشه یا اصلاً بشه، معلوم نیست.
ممکنه هفته دیگه بیاد، یا هیچوقت نیاد! ولی این پیشنمایش طولانی، نشون میده OpenAI داره با احتیاط قدم برمیداره؛ چه برای ایمنی، چه برای اینکه زیر سؤال نره.
سوالات متداول:
Voice Engine چیه که اینقدر سرش حرف داره؟
Voice Engine یه ابزار هوش مصنوعی از OpenAIه که با ۱۵ ثانیه از صدای یه نفر، میتونه صداش رو کپی کنه و طبیعی حرف بزنه.
از گفتاردرمانی تا کاراکترای بازی میتونه باهاش ساخت، ولی هنوز تو فاز تسته و OpenAI عرضهش نکرده.
چرا OpenAI این ابزار صوتی رو هنوز رو نکرده؟
OpenAI نگران سوءاستفادهست، مثل کلاهبرداری یا دیپفیکای جنجالی.
ضمناً میخواد مطمئن بشه قانونگذارا گیر ندن و سیستمش امن باشه، واسه همین یه ساله معطلش کرده.
این کلون صدای OpenAI برای ما چه فایدهای داره؟
اگه عرضه بشه، میتونی باهاش صدای خودت رو برای آموزش زبان یا پشتیبانی مشتری فارسی بسازی.
حتی برای کسایی که مشکل تکلم دارن، ولی فعلاً باید صبر کنیم.
کی قراره این Voice Engine رو ببینیم؟
معلوم نیست! OpenAI گفته داره با شریکاش تست میکنه، ولی تاریخ مشخصی نداده.
شاید بهزودی بیاد، شایدم کلاً کنسلش کنن!
ارسال پاسخ
نمایش دیدگاه ها