گوگل از مدل صوتی Chirp 3 رونمایی کرد؛ تغییرات بزرگ در دنیای هوش مصنوعی!

گوگل مدل صوتی Chirp 3 را به پلتفرم Vertex AI خود اضافه می‌کند. این مدل جدید شامل ابزارهای تبدیل گفتار به متن و متن به گفتار با 8 صدای جدید و 31 زبان است.

گوگل از مدل صوتی Chirp 3 رونمایی کرد؛ تغییرات بزرگ در دنیای هوش مصنوعی!
گوگل از مدل صوتی Chirp 3 رونمایی کرد؛ تغییرات بزرگ در دنیای هوش مصنوعی!
تبلیغات بنری آناژورنال
تبلیغات بنری آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال گوگل مدل صوتی Chirp 3 را به پلتفرم Vertex AI خود اضافه می‌کند.

گوگل امروز اعلام کرد که مدل‌های صوتی خود را به پلتفرم توسعه‌دهندگان Vertex AI می‌آورد.

این مدل‌ها که شامل ابزارهای تبدیل گفتار به متن و متن به گفتار هستند، با نام Chirp 3 شناخته می‌شوند و از هفته آینده در دسترس توسعه‌دهندگان قرار خواهند گرفت.

مدل جدید با اضافه کردن 8 صدای جدید به 31 زبان مختلف، امکانات جدیدی را برای ساخت دستیارهای صوتی، تولید کتاب‌های صوتی، و ایجاد صداگذاری برای ویدیوها فراهم می‌کند.

این اقدام گوگل در حالی است که شرکت‌های دیگر نیز در حال توسعه سرویس‌های صوتی هوش مصنوعی خود هستند.

به‌ویژه، استارتاپ Sesame اخیراً مدل خود را برای استفاده توسعه‌دهندگان معرفی کرده است که توانایی تولید صدای بسیار واقعی را دارد.

گوگل همچنان در حال کار بر روی محدودیت‌هایی برای جلوگیری از استفاده نادرست از Chirp 3 است و به گفته توماس کوریان، مدیر عامل گوگل کلود، تیم ایمنی در حال بررسی این موارد است.

مدل Chirp 3 به عنوان بخشی از پلتفرم Vertex AI در کنار سایر ابزارهای هوش مصنوعی مانند مدل‌های Gemini، Imagen (مدل تولید تصویر) و Veo 2 (مدل تولید ویدیو) قرار می‌گیرد.

این حرکت به گوگل کمک می‌کند تا در دنیای رقابتی هوش مصنوعی که توسط شرکت‌هایی مانند مایکروسافت و آمازون رهبری می‌شود، جایگاه خود را تقویت کند.

گوگل از سال‌ها پیش در حال کار بر روی خدمات صوتی “Chirp” بوده است و این مدل جدید یکی از دستاوردهای مهم در رقابت با سرویس‌هایی مانند الکسا از آمازون است.

با این حال، همچنان برای دستیابی به صدای انسانی کاملاً طبیعی، همچون آنچه در پروژه‌های استارتاپ‌هایی مانند Sesame مشاهده می‌شود، فاصله زیادی وجود دارد.

دمیس هاسابیس، مدیر عامل DeepMind، نیز در یک رویداد اخیر اشاره کرد که پیشرفت‌های در حال انجام در حوزه هوش مصنوعی در آینده‌ نزدیک به تحقق اهداف مانند هوش مصنوعی عمومی (AGI) نمی‌انجامد، ولی تحول‌های بزرگی در دهه‌های آینده شاهد خواهیم بود.

سوالات متداول:

مدل صوتی Chirp 3 چیست؟

مدل Chirp 3 یک ابزار پیشرفته از گوگل برای تبدیل گفتار به متن و متن به گفتار است.

این مدل به توسعه‌دهندگان امکان می‌دهد تا دستیارهای صوتی، کتاب‌های صوتی، صداگذاری برای ویدیوها و سایر برنامه‌های صوتی را ایجاد کنند.

چه قابلیت‌هایی به مدل Chirp 3 اضافه شده است؟

مدل Chirp 3 شامل 8 صدای جدید در 31 زبان مختلف است که قابلیت‌های تبدیل گفتار به متن و متن به گفتار را بهبود می‌بخشد.

این مدل امکان ایجاد صدای طبیعی‌تری را در اپلیکیشن‌های مختلف فراهم می‌کند.

چه کاربردهایی برای Chirp 3 وجود دارد؟

این مدل برای ساخت دستیارهای صوتی، تولید کتاب‌های صوتی، ایجاد صداگذاری برای ویدیوها و حتی ساخت برنامه‌های پشتیبانی صوتی مورد استفاده قرار می‌گیرد.

آیا Chirp 3 مشابه به سرویس‌های صوتی دیگر است؟

بله، اما Chirp 3 ویژگی‌های منحصر به فردی دارد. در حالی که دیگر مدل‌ها نیز توانایی تولید صدا دارند، گوگل تاکید دارد که این مدل از دقت و توانایی‌های بهتری برای حذف محدودیت‌های صوتی برخوردار است.

آیا Chirp 3 برای استفاده تجاری هم مناسب است؟

بله، توسعه‌دهندگان می‌توانند از Chirp 3 برای ساخت اپلیکیشن‌های صوتی تجاری، مثل سیستم‌های پشتیبانی مشتری و دستیارهای شخصی استفاده کنند.

چطور می‌توان به Chirp 3 دسترسی پیدا کرد؟

مدل Chirp 3 از طریق پلتفرم توسعه‌دهندگان گوگل، یعنی Vertex AI، برای کاربران در دسترس است.

این ابزار از هفته آینده به طور عمومی در دسترس قرار خواهد گرفت.

آیا محدودیت‌هایی برای استفاده از Chirp 3 وجود دارد؟

بله، گوگل اعلام کرده است که برای جلوگیری از سوءاستفاده‌های احتمالی، برخی محدودیت‌ها برای استفاده از Chirp 3 اعمال خواهد شد.

چه تفاوت‌هایی بین Chirp 3 و سایر مدل‌های صوتی هوش مصنوعی وجود دارد؟

Chirp 3 به‌طور خاص به ایجاد صدای طبیعی و قابلیت‌های پیشرفته‌تر در تبدیل گفتار به متن و برعکس متمرکز است.

این مدل توانایی‌های خاصی برای تولید صدای نزدیک به انسان دارد.

تبلیغات آناژورنال
فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.