علی‌ بابا مدل جدید هوش مصنوعی QVQ-Max را معرفی کرد؛ استدلالگر تصویری با قابلیت تحلیل عکس‌ها و فیلم‌ ها

علی‌بابا مدل هوش مصنوعی جدید خود با نام QVQ-Max را معرفی کرد که توانایی تحلیل و استدلال تصاویر و ویدیوها را دارد.

علی‌بابا مدل جدید هوش مصنوعی QVQ-Max را معرفی کرد؛ استدلالگر تصویری با قابلیت تحلیل عکس‌ها و فیلم‌ ها
علی‌بابا مدل جدید هوش مصنوعی QVQ-Max را معرفی کرد؛ استدلالگر تصویری با قابلیت تحلیل عکس‌ها و فیلم‌ ها
کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال علی‌بابا، غول فناوری چینی، از مدل جدید هوش مصنوعی خود از سری Qwen با نام QVQ-Max رونمایی کرد.

این مدل استدلالگر تصویری قادر است محتوای عکس‌ها و ویدیوها را درک کرده و با تحلیل و استدلال اطلاعاتی درباره آنها ارائه دهد.

این مدل هوش مصنوعی به‌ویژه در تحلیل تصاویر و شناسایی عناصر کلیدی عملکرد بسیار خوبی دارد و توانایی کاربرد در تولید فیلم‌نامه و تصویرسازی را نیز داراست.

هوش مصنوعی علی بابا

به گزارش Neowin، علی‌بابا ادعا می‌کند که مدل QVQ-Max شکاف بین مدل‌های هوش مصنوعی مبتنی‌بر متن و اطلاعات واقعی دنیای تصاویر را پر می‌کند.

این مدل می‌تواند واقعیت‌های جهان را مشاهده کند، آنها را درک کند و به آنها فکر کند.

از جمله ویژگی‌های این مدل هوش مصنوعی، توانایی تجزیه‌وتحلیل مسائل علمی و تکنیکی همراه با نمودارها و تصاویر است.

QVQ-Max نخستین نسخه از مدل استدلالگر تصویری علی‌بابا است و این شرکت چینی قصد دارد به‌طور مستمر آن را بهبود داده و ویژگی‌های بیشتری به آن اضافه کند.

علی‌بابا مدل جدید هوش مصنوعی QVQ-Max را معرفی کرد

در ابتدا، هدف شرکت افزایش دقت تشخیص تصویر و سپس بهبود عملکرد در حل مسائل پیچیده و چندمرحله‌ای است.

در نهایت، علی‌بابا قصد دارد این مدل را از تعاملات مبتنی‌بر متن فراتر برده و به قابلیت‌هایی همچون تولید بصری مجهز کند.

برای استفاده از QVQ-Max، کاربران باید به سایت chat.qwen.ai مراجعه کرده و از منوی مدل‌ها، گزینه «Expand more models» را انتخاب کنند.

برای بهره‌مندی بیشتر از قابلیت‌های این مدل، کاربران باید تصاویر را به مدل ارسال کرده و از آن درباره محتوا سؤال کنند.

چند ماه پیش، علی‌بابا مدل دیگری به نام Qwen2.5-Max را منتشر کرد که در بنچمارک‌های مختلف عملکردی بهتر از مدل‌های شناخته‌شده مانند V3 دیپ‌سیک، GPT-4o و Llama-3.1-405B متا داشته است.

سوالات متداول:

1. مدل QVQ-Max چیست و چه قابلیت‌هایی دارد؟

QVQ-Max یک مدل هوش مصنوعی استدلالگر تصویری است که توسط علی‌بابا توسعه یافته است.

این مدل می‌تواند تصاویر و فیلم‌ها را تجزیه و تحلیل کرده و اطلاعات مرتبط با آنها را با دقت بالا ارائه دهد.

به‌طور خاص، QVQ-Max قادر است در حل مسائل علمی، شناسایی عناصر تصویری، تصویرسازی و حتی تولید فیلم‌نامه‌ها از تصاویر عمل کند.

2. چگونه می‌توانم از مدل QVQ-Max استفاده کنم؟

برای استفاده از QVQ-Max، ابتدا باید به وب‌سایت chat.qwen.ai مراجعه کنید.

سپس از منوی مدل‌ها در بالا سمت چپ، گزینه “Expand more models” را انتخاب کرده و مدل QVQ-Max را انتخاب کنید.

برای بهره‌مندی از قابلیت‌های این مدل، بهتر است یک تصویر را ارسال کرده و از مدل سوالات مربوطه را مطرح کنید.

3. آیا QVQ-Max تنها در تحلیل تصاویر کاربرد دارد؟

خیر، QVQ-Max علاوه‌بر تجزیه‌وتحلیل تصاویر، قادر به استدلال درباره محتوای آنها و پاسخ به سوالات مبتنی‌بر اطلاعات تصویری است.

همچنین، این مدل در حل مسائل علمی و فنی همراه با نمودارها و تصاویر نیز می‌تواند کمک کند.

در مراحل آینده، قصد علی‌بابا اضافه کردن قابلیت‌های بیشتر از جمله تولید بصری به این مدل دارد.

4. آیا مدل QVQ-Max می‌تواند با مدل‌های دیگر هوش مصنوعی رقابت کند؟

بله، بر اساس بنچمارک‌های انجام‌شده، مدل QVQ-Max علی‌بابا در مقایسه با مدل‌های هوش مصنوعی دیگر مانند GPT-4o و Llama-3.1-405B از عملکرد بهتری برخوردار است.

علی‌بابا به‌طور مستمر در حال بهبود و توسعه این مدل است تا آن را به سطح بالاتری از دقت و عملکرد برساند.

5. چطور می‌توانم تصاویر خود را برای تحلیل به QVQ-Max ارسال کنم؟

برای ارسال تصاویر، کافی است تصویر مورد نظر را در بخش مربوطه در وب‌سایت chat.qwen.ai بارگذاری کنید و سپس سوالات خود را از مدل بپرسید.

QVQ-Max می‌تواند تصاویر شما را تحلیل کرده و پاسخ‌های دقیق‌تری به شما ارائه دهد.

6. آیا QVQ-Max می‌تواند مسائل پیچیده و چندمرحله‌ای را حل کند؟

بله، QVQ-Max به‌ویژه برای حل مسائل پیچیده و چندمرحله‌ای طراحی شده است.

علی‌بابا قصد دارد دقت مدل در این زمینه‌ها را بهبود بخشد و توانایی‌های بیشتری را به آن اضافه کند تا بتواند در حل مسائل دشوارتر نیز به کاربران کمک کند.

7. آیا این مدل برای استفاده عموم در دسترس است؟

بله، مدل QVQ-Max از طریق وب‌سایت chat.qwen.ai برای عموم کاربران در دسترس است.

شما می‌توانید با مراجعه به این وب‌سایت و استفاده از قابلیت‌های مدل، تصاویر خود را ارسال و از پاسخ‌های هوش مصنوعی بهره‌مند شوید.

تبلیغ در آناژورنال بنری
فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.