آمازون از Nova Sonic رونمایی کرد؛ مدل صوتی رقیب ChatGPT

مدل جدید هوش مصنوعی آمازون با نام Nova Sonic معرفی شد؛ مدلی پیشرفته برای تعامل صوتی که با قیمت مقرون‌به‌صرفه، به رقابت با ChatGPT و گوگل وارد شده است.

کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال، آمازون با رونمایی از مدل جدید هوش مصنوعی خود به نام Nova Sonic، گام بلندی در رقابت با غول‌هایی مثل گوگل و OpenAI برداشته است.

این مدل که برای پردازش صوت و تولید گفتار طبیعی طراحی شده، رقیبی جدی برای حالت صوتی ChatGPT یعنی Voice Mode به شمار می‌رود.

جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.

Nova Sonic اکنون از طریق پلتفرم Bedrock در دسترس توسعه‌دهندگان قرار گرفته و طبق اعلام آمازون، در مقایسه با رقبای قدرتمندی همچون GPT-4o، «مقرون‌به‌صرفه‌ترین» مدل صوتی حال حاضر بازار است؛ به‌طوری که حدود ۸۰ درصد ارزان‌تر از مدل GPT-4o عمل می‌کند.

بخش‌هایی از این مدل هوش مصنوعی پیشرفته، هم‌اکنون در نسخه به‌روز شده دستیار صوتی آمازون، یعنی Alexa Plus گنجانده شده است.

Nova Sonic با بهره‌گیری از تخصص گسترده آمازون در سیستم‌های مقیاس‌پذیر، به‌گونه‌ای طراحی شده که در اتصال درخواست‌ها به APIها و دریافت پاسخ‌های لحظه‌ای از منابع مختلف عملکردی هوشمندانه و سریع دارد.

از جمله ویژگی‌های برجسته Nova Sonic می‌توان به تشخیص گفتار دقیق حتی در صورت اشتباهات گفتاری یا صدای نامفهوم کاربر، ارائه رونویسی هم‌زمان از مکالمات، و همچنین مدیریت هوشمند وقفه‌های گفتاری اشاره کرد.

این ویژگی‌ها باعث شده که تجربه صوتی با این مدل بسیار طبیعی‌تر و روان‌تر از مدل‌های قبلی باشد.

در آزمون Multilingual LibriSpeech، Nova Sonic توانست در زبان‌هایی نظیر انگلیسی، فرانسوی، آلمانی، ایتالیایی و اسپانیایی نرخ خطای واژه‌ای (WER) بسیار پایین ۴.۲٪ را به‌دست آورد؛ عددی که نشان‌دهنده دقت بالای این مدل است.

آمازون تأکید کرده که Nova Sonic تنها بخشی از نقشه‌راه بزرگ این شرکت برای دستیابی به هوش مصنوعی جامع (AGI) است؛ مفهومی که در آن سیستم‌های هوش مصنوعی قادر خواهند بود هر کاری که انسان‌ها با کامپیوتر انجام می‌دهند، انجام دهند.

با این رونمایی، به نظر می‌رسد رقابت در عرصه هوش مصنوعی صوتی وارد مرحله‌ای تازه شده است و آمازون به‌طور جدی قصد دارد جایگاه خود را در این میدان تثبیت کند.

سوالات متداول

۱. مدل Nova Sonic آمازون چیه و چه فرقی با ChatGPT Voice Mode داره؟
Nova Sonic یه مدل هوش مصنوعی صوتی جدیده که آمازون معرفی کرده. این مدل می‌تونه گفتار طبیعی تولید کنه و مثل ChatGPT حالت صوتی داره، ولی مزیتش اینه که ارزون‌تره، سریع‌تره و تو فهم جملات کاربر دقت بیشتری داره.

۲. Nova Sonic بهتره یا ChatGPT Voice؟
به گفته آمازون، Nova Sonic تا ۸۰ درصد از GPT-4o ارزون‌تره و دقتش تو تشخیص صدا و پاسخ به درخواست‌ها بالاتره. البته هنوز استفاده گسترده‌ای نداشته که بشه دقیق قضاوت کرد، ولی رقابتش با ChatGPT جدیه.

۳. Nova Sonic رو از کجا میشه استفاده کرد؟
فعلاً Nova Sonic از طریق پلتفرم Bedrock آمازون برای توسعه‌دهنده‌ها قابل استفاده‌ست. همچنین بعضی قابلیت‌هاش تو نسخه جدید دستیار صوتی الکسا پلاس هم به کار رفته.

۴. Nova Sonic فقط زبان انگلیسی رو پشتیبانی می‌کنه؟
نه، این مدل تو تست‌های چندزبانه (مثل LibriSpeech) عملکرد خوبی نشون داده و زبان‌هایی مثل انگلیسی، فرانسوی، آلمانی، ایتالیایی و اسپانیایی رو هم پشتیبانی می‌کنه.

۵. چه کاری از Nova Sonic برمیاد؟
از تولید گفتار طبیعی، مشاوره صوتی سفر، پاسخ به سوالات پیچیده، تبدیل گفتار به متن و حتی اتصال به APIهای مختلف برای انجام کارهای آنلاین پشتیبانی می‌کنه. این یعنی می‌تونه مثل یه مشاور هوشمند عمل کنه.

۶. آیا Nova Sonic رقیب الکسای خود آمازونه؟
نه دقیقاً. Nova Sonic در واقع نسخه‌ی پیشرفته‌تر و جدیدتر از الکسا به حساب میاد و بخشی از قابلیت‌هاش وارد Alexa Plus شده. یعنی می‌خواد هم مکمل باشه، هم به‌روزرسانی.

۷. چه کسایی می‌تونن از Nova Sonic استفاده کنن؟
فعلاً توسعه‌دهنده‌ها و شرکت‌ها از طریق Amazon Bedrock بهش دسترسی دارن. اما احتمال زیاد در آینده به‌صورت عمومی‌تر هم ارائه میشه.

۸. Nova Sonic واقعاً از مدل‌های دیگه بهتره یا فقط تبلیغه؟
طبق ادعای آمازون، دقت بیشتر، هزینه کمتر، و عملکرد سریع‌تری داره. ولی باید دید در عمل چطور عمل می‌کنه چون گوگل و OpenAI هم مدل‌های خیلی قدرتمندی دارن.

تبلیغ در آناژورنال بنری
آیدا رادور کارشناس تولید محتوا