به گزارش رسانه تحلیلی خبری آناژورنال، آمازون با رونمایی از مدل جدید هوش مصنوعی خود به نام Nova Sonic، گام بلندی در رقابت با غولهایی مثل گوگل و OpenAI برداشته است.
این مدل که برای پردازش صوت و تولید گفتار طبیعی طراحی شده، رقیبی جدی برای حالت صوتی ChatGPT یعنی Voice Mode به شمار میرود.
جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.
Nova Sonic اکنون از طریق پلتفرم Bedrock در دسترس توسعهدهندگان قرار گرفته و طبق اعلام آمازون، در مقایسه با رقبای قدرتمندی همچون GPT-4o، «مقرونبهصرفهترین» مدل صوتی حال حاضر بازار است؛ بهطوری که حدود ۸۰ درصد ارزانتر از مدل GPT-4o عمل میکند.
بخشهایی از این مدل هوش مصنوعی پیشرفته، هماکنون در نسخه بهروز شده دستیار صوتی آمازون، یعنی Alexa Plus گنجانده شده است.
Nova Sonic با بهرهگیری از تخصص گسترده آمازون در سیستمهای مقیاسپذیر، بهگونهای طراحی شده که در اتصال درخواستها به APIها و دریافت پاسخهای لحظهای از منابع مختلف عملکردی هوشمندانه و سریع دارد.
از جمله ویژگیهای برجسته Nova Sonic میتوان به تشخیص گفتار دقیق حتی در صورت اشتباهات گفتاری یا صدای نامفهوم کاربر، ارائه رونویسی همزمان از مکالمات، و همچنین مدیریت هوشمند وقفههای گفتاری اشاره کرد.
این ویژگیها باعث شده که تجربه صوتی با این مدل بسیار طبیعیتر و روانتر از مدلهای قبلی باشد.
در آزمون Multilingual LibriSpeech، Nova Sonic توانست در زبانهایی نظیر انگلیسی، فرانسوی، آلمانی، ایتالیایی و اسپانیایی نرخ خطای واژهای (WER) بسیار پایین ۴.۲٪ را بهدست آورد؛ عددی که نشاندهنده دقت بالای این مدل است.
آمازون تأکید کرده که Nova Sonic تنها بخشی از نقشهراه بزرگ این شرکت برای دستیابی به هوش مصنوعی جامع (AGI) است؛ مفهومی که در آن سیستمهای هوش مصنوعی قادر خواهند بود هر کاری که انسانها با کامپیوتر انجام میدهند، انجام دهند.
با این رونمایی، به نظر میرسد رقابت در عرصه هوش مصنوعی صوتی وارد مرحلهای تازه شده است و آمازون بهطور جدی قصد دارد جایگاه خود را در این میدان تثبیت کند.
سوالات متداول
۱. مدل Nova Sonic آمازون چیه و چه فرقی با ChatGPT Voice Mode داره؟
Nova Sonic یه مدل هوش مصنوعی صوتی جدیده که آمازون معرفی کرده. این مدل میتونه گفتار طبیعی تولید کنه و مثل ChatGPT حالت صوتی داره، ولی مزیتش اینه که ارزونتره، سریعتره و تو فهم جملات کاربر دقت بیشتری داره.
۲. Nova Sonic بهتره یا ChatGPT Voice؟
به گفته آمازون، Nova Sonic تا ۸۰ درصد از GPT-4o ارزونتره و دقتش تو تشخیص صدا و پاسخ به درخواستها بالاتره. البته هنوز استفاده گستردهای نداشته که بشه دقیق قضاوت کرد، ولی رقابتش با ChatGPT جدیه.
۳. Nova Sonic رو از کجا میشه استفاده کرد؟
فعلاً Nova Sonic از طریق پلتفرم Bedrock آمازون برای توسعهدهندهها قابل استفادهست. همچنین بعضی قابلیتهاش تو نسخه جدید دستیار صوتی الکسا پلاس هم به کار رفته.
۴. Nova Sonic فقط زبان انگلیسی رو پشتیبانی میکنه؟
نه، این مدل تو تستهای چندزبانه (مثل LibriSpeech) عملکرد خوبی نشون داده و زبانهایی مثل انگلیسی، فرانسوی، آلمانی، ایتالیایی و اسپانیایی رو هم پشتیبانی میکنه.
۵. چه کاری از Nova Sonic برمیاد؟
از تولید گفتار طبیعی، مشاوره صوتی سفر، پاسخ به سوالات پیچیده، تبدیل گفتار به متن و حتی اتصال به APIهای مختلف برای انجام کارهای آنلاین پشتیبانی میکنه. این یعنی میتونه مثل یه مشاور هوشمند عمل کنه.
۶. آیا Nova Sonic رقیب الکسای خود آمازونه؟
نه دقیقاً. Nova Sonic در واقع نسخهی پیشرفتهتر و جدیدتر از الکسا به حساب میاد و بخشی از قابلیتهاش وارد Alexa Plus شده. یعنی میخواد هم مکمل باشه، هم بهروزرسانی.
۷. چه کسایی میتونن از Nova Sonic استفاده کنن؟
فعلاً توسعهدهندهها و شرکتها از طریق Amazon Bedrock بهش دسترسی دارن. اما احتمال زیاد در آینده بهصورت عمومیتر هم ارائه میشه.
۸. Nova Sonic واقعاً از مدلهای دیگه بهتره یا فقط تبلیغه؟
طبق ادعای آمازون، دقت بیشتر، هزینه کمتر، و عملکرد سریعتری داره. ولی باید دید در عمل چطور عمل میکنه چون گوگل و OpenAI هم مدلهای خیلی قدرتمندی دارن.
ارسال پاسخ
نمایش دیدگاه ها