به گزارش رسانه تحلیلی خبری آناژورنال شرکت Stability AI مدل هوش مصنوعی جدید خود به نام Stable Virtual Camera را معرفی کرده است.
این فناوری نوآورانه قادر است تصاویر دوبعدی را به ویدئوهایی سهبعدی با عمق و پرسپکتیو واقعگرایانه تبدیل کند.
به بیان دیگر، کاربران میتوانند تنها با یک عکس ثابت، نماهای جدید و متنوعی از صحنه ایجاد کرده و زاویههای دلخواه خود را تنظیم کنند.
قابلیتهای Stable Virtual Camera
Stable Virtual Camera با ترکیب هوش مصنوعی و ابزارهای دوربین مجازی، امکان کنترل بیشتر بر زوایای دید و حرکت دوربین را فراهم میکند.
این مدل میتواند از یک یا چند تصویر، نماهای جدیدی با مسیرهای حرکتی متنوع ایجاد کند.
برخی از مسیرهای حرکتی ارائهشده توسط این مدل شامل:
- Spiral (حرکت چرخشی)
- Dolly Zoom (حرکت جلو و عقب همراه با تغییر فوکوس)
- Move (حرکت ساده به جلو، عقب یا طرفین)
- Pan (حرکت افقی یا عمودی دوربین)
این مدل در نسبتهای تصویر مختلف قابل اجرا است و میتواند تا ۱۰۰۰ فریم ویدئو تولید کند.
با وجود قابلیتهای پیشرفته، نسخهی کنونی Stable Virtual Camera هنوز با چالشهایی روبهرو است.
به گفتهی Stability AI، در شرایطی که تصاویر شامل انسان، حیوان یا بافتهای متحرک باشند، ممکن است کیفیت خروجی کاهش یابد.
همچنین، مسیرهای حرکتی پیچیده و تغییرات شدید زاویهی دید میتوانند باعث ایجاد نویزهای بصری شوند.
مدل Stable Virtual Camera برای پژوهشهای غیرتجاری منتشر شده و از طریق پلتفرم Hugging Face در دسترس کاربران قرار دارد.
Stability AI که در ماههای اخیر با بحرانهای مالی مواجه شده بود، اخیراً با تغییرات مدیریتی و همکاری با آرم (ARM) برای توسعهی مدلهای صوتی جدید، تلاش دارد مسیر خود را بهبود بخشد.
این فناوری میتواند کاربردهای گستردهای در حوزههایی مانند ساخت فیلم، تولید محتوای دیجیتال، تبلیغات و طراحی بازیهای ویدیویی داشته باشد و یک گام مهم در جهت بهبود تجربههای بصری مبتنی بر هوش مصنوعی محسوب میشود.
سوالات متداول:
چطور میتوان از یک عکس، ویدئوی سهبعدی ساخت؟
Stability AI با مدل Stable Virtual Camera این امکان را فراهم کرده است که یک عکس دوبعدی را به ویدئویی سهبعدی با زوایای دید مختلف تبدیل کنید.
این مدل از هوش مصنوعی برای ایجاد پرسپکتیو واقعی استفاده میکند.
آیا Stable Virtual Camera رایگان است؟
در حال حاضر، این مدل برای پژوهشهای غیرتجاری منتشر شده و از طریق پلتفرم Hugging Face قابل استفاده است.
اما برای کاربردهای تجاری، احتمالاً نیاز به مجوز خواهد داشت.
کیفیت ویدئوهای تولید شده توسط Stable Virtual Camera چطور است؟
کیفیت خروجی به عوامل مختلفی مثل وضوح تصویر ورودی، میزان تغییر زاویه دید و نوع صحنه بستگی دارد.
در برخی موارد، ممکن است نویزهای بصری یا کاهش کیفیت در قسمتهایی از ویدئو مشاهده شود.
آیا این فناوری روی همه عکسها به خوبی کار میکند؟
در بیشتر موارد بله، اما Stability AI اعلام کرده است که پردازش تصاویر شامل انسان، حیوان یا بافتهای پویا ممکن است چالشبرانگیزتر باشد و خروجی کاملاً بینقص نباشد.
چه حرکات دوربینی با این فناوری امکانپذیر است؟
مدل Stable Virtual Camera مسیرهای حرکتی مختلفی مانند Dolly Zoom، Pan، Move و Spiral را ارائه میدهد، که امکان کنترل بیشتر بر زوایای دید را فراهم میکند.
ارسال پاسخ
نمایش دیدگاه ها