به گزارش رسانه تحلیلی خبری آناژورنال OpenAI ویژگی جدیدی به نام “Images in ChatGPT” را معرفی کرد که تجربه تولید تصاویر را به سطح جدیدی میرساند.
این قابلیت که با مدل پیشرفته GPT-4o اجرا میشود، باعث بهبود دقت رنگها و خوانایی متنها در تصاویر میشود.
به گفته تارا کریستینسن، سخنگوی OpenAI، این ویژگی از امروز در دسترس کاربران قرار میگیرد.
او توضیح داد که حتی کاربران نسخه رایگان نیز میتوانند از این قابلیت استفاده کنند، البته ممکن است محدودیتهایی در تعداد تصاویر اعمال شود.
افزایش یکپارچگی تصاویر در مدل جدید ChatGPT
گابریل گو، مدیر تیم تحقیقاتی OpenAI، در مصاحبهای با Verge توضیح داد که این ویژگی با استفاده از مدل GPT-4o omnimodal توسعه یافته است.
مدلهای قدیمی اغلب در ایجاد تصاویر با تعداد عناصر بالا دچار مشکل میشدند، اما اکنون ChatGPT میتواند بین ۱۵ تا ۲۰ عنصر را بدون خطا در تصویر جای دهد.
یکی از بزرگترین پیشرفتهای این سیستم، بهبود ویژگی “Binding” است.
به گفته گابریل گو، مدلهای قدیمی ممکن بود هنگام تولید تصاویر بهاشتباه رنگ و شکل عناصر را جابهجا کنند، اما GPT-4o این مشکل را برطرف کرده است.
تفاوت اصلی این مدل با DALL·E چیست؟
برخلاف روش Diffusion که در DALL·E استفاده میشد، مدل جدید از تکنیک Autoregressive بهره میبرد و تصاویر را مرحلهبهمرحله، از بالا به پایین و از چپ به راست تولید میکند.
این روش باعث افزایش دقت و هماهنگی عناصر در تصویر شده است.
البته این ویژگی هنوز در پردازش متون کوچک و ریز در تصاویر چالشهایی دارد، اما کیفیت کلی تصاویر و متنها نسبت به قبل بهمراتب بهتر شده است.
مدیر تحقیقاتی OpenAI تأکید کرد که تیم این شرکت طی ماههای اخیر آزمایشهای متعددی روی این قابلیت انجام داده است و احتمال دارد در آینده بهبودهای بیشتری در دقت و قابلیتهای این ویژگی ببینیم.
سوالات متداول:
قابلیت جدید “Images in ChatGPT” چیست؟
این ویژگی به کاربران اجازه میدهد تا تصاویر دقیقتر و طبیعیتری با ChatGPT بسازند، با بهبود رنگها و متنهای درون تصویر.
آیا کاربران رایگان هم میتوانند از این قابلیت استفاده کنند؟
بله، کاربران نسخه رایگان نیز میتوانند تصاویر ایجاد کنند، اما ممکن است برخی محدودیتها بر اساس میزان استفاده اعمال شود.
مدل GPT-4o چه تفاوتی با مدلهای قبلی دارد؟
این مدل توانایی پردازش چندحالته (Omnimodal) دارد و میتواند بین ۱۵ تا ۲۰ عنصر را بهطور دقیق در یک تصویر جای دهد، درحالیکه مدلهای قدیمی دقت پایینتری داشتند.
نظر شما درباره این قابلیت جدید چیست؟ آیا از ChatGPT برای تولید تصاویر استفاده کردهاید؟ تجربه خود را با ما به اشتراک بگذارید.
ارسال پاسخ
نمایش دیدگاه ها