انقلاب جدید در ChatGPT؛ تولید تصاویر با دقت بی‌نظیر ممکن شد!

شرکت OpenAI قابلیت "Images in ChatGPT" را معرفی کرد. این ویژگی با استفاده از GPT-4o تصاویر با رنگ‌های دقیق‌تر و متن‌های خواناتر ایجاد می‌کند.

انقلاب جدید در ChatGPT؛ تولید تصاویر با دقت بی‌نظیر ممکن شد!
انقلاب جدید در ChatGPT؛ تولید تصاویر با دقت بی‌نظیر ممکن شد!
کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال OpenAI ویژگی جدیدی به نام “Images in ChatGPT” را معرفی کرد که تجربه تولید تصاویر را به سطح جدیدی می‌رساند.

این قابلیت که با مدل پیشرفته GPT-4o اجرا می‌شود، باعث بهبود دقت رنگ‌ها و خوانایی متن‌ها در تصاویر می‌شود.

به گفته تارا کریستینسن، سخنگوی OpenAI، این ویژگی از امروز در دسترس کاربران قرار می‌گیرد.

او توضیح داد که حتی کاربران نسخه رایگان نیز می‌توانند از این قابلیت استفاده کنند، البته ممکن است محدودیت‌هایی در تعداد تصاویر اعمال شود.

افزایش یکپارچگی تصاویر در مدل جدید ChatGPT
گابریل گو، مدیر تیم تحقیقاتی OpenAI، در مصاحبه‌ای با Verge توضیح داد که این ویژگی با استفاده از مدل GPT-4o omnimodal توسعه یافته است.

مدل‌های قدیمی اغلب در ایجاد تصاویر با تعداد عناصر بالا دچار مشکل می‌شدند، اما اکنون ChatGPT می‌تواند بین ۱۵ تا ۲۰ عنصر را بدون خطا در تصویر جای دهد.

یکی از بزرگ‌ترین پیشرفت‌های این سیستم، بهبود ویژگی “Binding” است.

به گفته گابریل گو، مدل‌های قدیمی ممکن بود هنگام تولید تصاویر به‌اشتباه رنگ و شکل عناصر را جابه‌جا کنند، اما GPT-4o این مشکل را برطرف کرده است.

تفاوت اصلی این مدل با DALL·E چیست؟

برخلاف روش Diffusion که در DALL·E استفاده می‌شد، مدل جدید از تکنیک Autoregressive بهره می‌برد و تصاویر را مرحله‌به‌مرحله، از بالا به پایین و از چپ به راست تولید می‌کند.

این روش باعث افزایش دقت و هماهنگی عناصر در تصویر شده است.

البته این ویژگی هنوز در پردازش متون کوچک و ریز در تصاویر چالش‌هایی دارد، اما کیفیت کلی تصاویر و متن‌ها نسبت به قبل به‌مراتب بهتر شده است.

مدیر تحقیقاتی OpenAI تأکید کرد که تیم این شرکت طی ماه‌های اخیر آزمایش‌های متعددی روی این قابلیت انجام داده است و احتمال دارد در آینده بهبودهای بیشتری در دقت و قابلیت‌های این ویژگی ببینیم.

سوالات متداول:

قابلیت جدید “Images in ChatGPT” چیست؟

این ویژگی به کاربران اجازه می‌دهد تا تصاویر دقیق‌تر و طبیعی‌تری با ChatGPT بسازند، با بهبود رنگ‌ها و متن‌های درون تصویر.

آیا کاربران رایگان هم می‌توانند از این قابلیت استفاده کنند؟

بله، کاربران نسخه رایگان نیز می‌توانند تصاویر ایجاد کنند، اما ممکن است برخی محدودیت‌ها بر اساس میزان استفاده اعمال شود.

مدل GPT-4o چه تفاوتی با مدل‌های قبلی دارد؟

این مدل توانایی پردازش چندحالته (Omnimodal) دارد و می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌طور دقیق در یک تصویر جای دهد، درحالی‌که مدل‌های قدیمی دقت پایین‌تری داشتند.

نظر شما درباره این قابلیت جدید چیست؟ آیا از ChatGPT برای تولید تصاویر استفاده کرده‌اید؟ تجربه خود را با ما به اشتراک بگذارید.

تبلیغ در آناژورنال بنری
فاطمه زاده محمد کارشناس تولید محتوا حدودا 5 سال هست که در حوزه تولید محتوا فعالیت میکنم.