به گزارش رسانه تحلیلی خبری آناژورنال گوگل مدل صوتی Chirp 3 را به پلتفرم Vertex AI خود اضافه میکند.
گوگل امروز اعلام کرد که مدلهای صوتی خود را به پلتفرم توسعهدهندگان Vertex AI میآورد.
این مدلها که شامل ابزارهای تبدیل گفتار به متن و متن به گفتار هستند، با نام Chirp 3 شناخته میشوند و از هفته آینده در دسترس توسعهدهندگان قرار خواهند گرفت.
مدل جدید با اضافه کردن 8 صدای جدید به 31 زبان مختلف، امکانات جدیدی را برای ساخت دستیارهای صوتی، تولید کتابهای صوتی، و ایجاد صداگذاری برای ویدیوها فراهم میکند.
این اقدام گوگل در حالی است که شرکتهای دیگر نیز در حال توسعه سرویسهای صوتی هوش مصنوعی خود هستند.
بهویژه، استارتاپ Sesame اخیراً مدل خود را برای استفاده توسعهدهندگان معرفی کرده است که توانایی تولید صدای بسیار واقعی را دارد.
گوگل همچنان در حال کار بر روی محدودیتهایی برای جلوگیری از استفاده نادرست از Chirp 3 است و به گفته توماس کوریان، مدیر عامل گوگل کلود، تیم ایمنی در حال بررسی این موارد است.
مدل Chirp 3 به عنوان بخشی از پلتفرم Vertex AI در کنار سایر ابزارهای هوش مصنوعی مانند مدلهای Gemini، Imagen (مدل تولید تصویر) و Veo 2 (مدل تولید ویدیو) قرار میگیرد.
این حرکت به گوگل کمک میکند تا در دنیای رقابتی هوش مصنوعی که توسط شرکتهایی مانند مایکروسافت و آمازون رهبری میشود، جایگاه خود را تقویت کند.
گوگل از سالها پیش در حال کار بر روی خدمات صوتی “Chirp” بوده است و این مدل جدید یکی از دستاوردهای مهم در رقابت با سرویسهایی مانند الکسا از آمازون است.
با این حال، همچنان برای دستیابی به صدای انسانی کاملاً طبیعی، همچون آنچه در پروژههای استارتاپهایی مانند Sesame مشاهده میشود، فاصله زیادی وجود دارد.
دمیس هاسابیس، مدیر عامل DeepMind، نیز در یک رویداد اخیر اشاره کرد که پیشرفتهای در حال انجام در حوزه هوش مصنوعی در آینده نزدیک به تحقق اهداف مانند هوش مصنوعی عمومی (AGI) نمیانجامد، ولی تحولهای بزرگی در دهههای آینده شاهد خواهیم بود.
سوالات متداول:
مدل صوتی Chirp 3 چیست؟
مدل Chirp 3 یک ابزار پیشرفته از گوگل برای تبدیل گفتار به متن و متن به گفتار است.
این مدل به توسعهدهندگان امکان میدهد تا دستیارهای صوتی، کتابهای صوتی، صداگذاری برای ویدیوها و سایر برنامههای صوتی را ایجاد کنند.
چه قابلیتهایی به مدل Chirp 3 اضافه شده است؟
مدل Chirp 3 شامل 8 صدای جدید در 31 زبان مختلف است که قابلیتهای تبدیل گفتار به متن و متن به گفتار را بهبود میبخشد.
این مدل امکان ایجاد صدای طبیعیتری را در اپلیکیشنهای مختلف فراهم میکند.
چه کاربردهایی برای Chirp 3 وجود دارد؟
این مدل برای ساخت دستیارهای صوتی، تولید کتابهای صوتی، ایجاد صداگذاری برای ویدیوها و حتی ساخت برنامههای پشتیبانی صوتی مورد استفاده قرار میگیرد.
آیا Chirp 3 مشابه به سرویسهای صوتی دیگر است؟
بله، اما Chirp 3 ویژگیهای منحصر به فردی دارد. در حالی که دیگر مدلها نیز توانایی تولید صدا دارند، گوگل تاکید دارد که این مدل از دقت و تواناییهای بهتری برای حذف محدودیتهای صوتی برخوردار است.
آیا Chirp 3 برای استفاده تجاری هم مناسب است؟
بله، توسعهدهندگان میتوانند از Chirp 3 برای ساخت اپلیکیشنهای صوتی تجاری، مثل سیستمهای پشتیبانی مشتری و دستیارهای شخصی استفاده کنند.
چطور میتوان به Chirp 3 دسترسی پیدا کرد؟
مدل Chirp 3 از طریق پلتفرم توسعهدهندگان گوگل، یعنی Vertex AI، برای کاربران در دسترس است.
این ابزار از هفته آینده به طور عمومی در دسترس قرار خواهد گرفت.
آیا محدودیتهایی برای استفاده از Chirp 3 وجود دارد؟
بله، گوگل اعلام کرده است که برای جلوگیری از سوءاستفادههای احتمالی، برخی محدودیتها برای استفاده از Chirp 3 اعمال خواهد شد.
چه تفاوتهایی بین Chirp 3 و سایر مدلهای صوتی هوش مصنوعی وجود دارد؟
Chirp 3 بهطور خاص به ایجاد صدای طبیعی و قابلیتهای پیشرفتهتر در تبدیل گفتار به متن و برعکس متمرکز است.
این مدل تواناییهای خاصی برای تولید صدای نزدیک به انسان دارد.
ارسال پاسخ
نمایش دیدگاه ها