OpenAI از مدل‌های استدلالی o3 و o4-mini با توانایی تفکر تصویری رونمایی کرد

مدل‌های هوش مصنوعی جدید OpenAI با نام‌های o3 و o4-mini با تمرکز بر استدلال، کدنویسی و درک بصری معرفی شدند.

OpenAI از مدل‌های استدلالی o3 و o4-mini با توانایی تفکر تصویری رونمایی کرد
OpenAI از مدل‌های استدلالی o3 و o4-mini با توانایی تفکر تصویری رونمایی کرد
کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال، شرکت OpenAI از دو مدل هوش مصنوعی استدلالی جدید با نام‌های o3 و o4-mini پرده برداشت؛ مدل‌هایی که به‌گونه‌ای طراحی شده‌اند که پیش از پاسخ‌گویی، روند حل مسئله را بررسی کرده و گام‌به‌گام به نتیجه می‌رسند.

بر اساس اطلاعات رسمی منتشرشده، مدل o3 درحال‌حاضر پیشرفته‌ترین مدل استدلالی OpenAI محسوب می‌شود و در آزمون‌هایی نظیر ریاضیات، کدنویسی، تحلیل علوم و درک بصری عملکردی فراتر از مدل‌های قبلی داشته است.

جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.

در مقابل، مدل o4-mini با تمرکز بر تعادل بین عملکرد و هزینه، گزینه‌ای مناسب برای توسعه‌دهندگان با منابع محدود معرفی شده است.

این دو مدل از ابزارهای داخلی ChatGPT مانند جستجوی وب، اجرای کد پایتون، پردازش تصویر و حتی تولید تصویر نیز پشتیبانی می‌کنند.

نسخه‌ای پیشرفته‌تر از o4-mini با نام o4-mini-high نیز معرفی شده که با صرف زمان بیشتر برای پردازش، پاسخ‌هایی دقیق‌تر ارائه می‌دهد.

یکی از ویژگی‌های چشمگیر این دو مدل، توانایی تفکر با تصویر است. به این ترتیب، کاربران می‌توانند تصاویر مختلفی را—even با کیفیت پایین—بارگذاری کنند تا مدل آن‌ها را تحلیل کرده و پاسخ‌های دقیق‌تری ارائه دهد.

در آزمون SWE-bench، مدل o3 بدون نیاز به ساختارهای سفارشی، امتیاز 69.1 درصد را کسب کرده، درحالی‌که o4-mini نیز با 68.1 درصد عملکردی درخشان داشته است.

این در حالی است که مدل Claude 3.7 Sonnet متعلق به شرکت آنتروپیک تنها امتیاز 62.3 درصدی را ثبت کرده است.

OpenAI اعلام کرده که این مدل‌ها از هم‌اکنون در اختیار مشترکین ChatGPT Plus قرار دارند و از طریق API نیز برای توسعه‌دهندگان قابل‌استفاده هستند.

هزینه استفاده از مدل o3، 10 دلار برای هر میلیون توکن ورودی و 40 دلار برای خروجی تعیین شده است. مدل o4-mini نیز با قیمت 1.10 دلار برای ورودی و 4.40 دلار برای خروجی ارائه می‌شود.

سم آلتمن، مدیرعامل OpenAI تأیید کرده است که مدل‌های o3 و o4-mini احتمالاً آخرین مدل‌های استدلالی مستقل شرکت خواهند بود.

پس از آن، مدل جامع‌تری با نام GPT-5 معرفی خواهد شد که قابلیت‌های مدل‌های سنتی و استدلالی را در یک سیستم واحد ترکیب خواهد کرد.

سوالات متداول

۱. فرق مدل o3 با o4-mini چیه؟
مدل o3 قوی‌تر و پیشرفته‌تره و تو زمینه‌هایی مثل کدنویسی، ریاضی و درک تصویر عملکرد بهتری داره. ولی o4-mini یه مدل سبک‌تره که بیشتر برای کسایی خوبه که دنبال سرعت و هزینه کمتر هستن.

۲. مدل o4-mini بهتره یا o3؟
اگه دنبال دقت و قدرت بالا هستی، o3 بهتره. ولی اگه سرعت بالا با قیمت کمتر برات مهم‌تره، o4-mini انتخاب خوبیه.

۳. چطور میشه از مدل‌های o3 و o4-mini استفاده کرد؟
با داشتن اشتراک ChatGPT یا از طریق APIهای OpenAI می‌تونی از این مدل‌ها استفاده کنی.

۴. مدل o3 واقعاً چقدر باهوشه؟
تو تست‌های سخت مثل SWE-bench برای کدنویسی، o3 حدود 69 درصد نمره گرفته که خیلی بالاست. این یعنی تو حل مسائل پیچیده واقعاً قویه.

۵. میشه با این مدل‌ها عکس هم تحلیل کرد؟
آره! یکی از قابلیت‌های خاص این مدلا اینه که می‌تونن حتی عکس‌های بی‌کیفیت رو هم بررسی کنن و اطلاعات دقیقی ازش دربیارن.

۶. قیمت مدل‌های o3 و o4-mini چقدره؟
هزینه مدل o3 برای هر میلیون توکن ورودی 10 دلاره و خروجی 40 دلار. برای o4-mini، قیمتش خیلی کمتره؛ ورودی 1.10 دلار و خروجی 4.40 دلار.

۷. مدل GPT-5 کی میاد؟
هنوز تاریخ دقیقی نگفتن، ولی OpenAI گفته بعد از این دو مدل (o3 و o4-mini)، قراره GPT-5 بیاد که همه قابلیت‌ها رو تو یه مدل ترکیب می‌کنه.

۸. o3 بهتره یا Claude 3؟
تو تست‌ها، مدل o3 نمره بالاتری نسبت به Claude 3 گرفته، پس فعلاً o3 عملکرد بهتری داره.

۹. میشه با o3 کدنویسی کرد؟
کاملاً! مدل o3 واسه برنامه‌نویسی طراحی شده و تو نوشتن و تحلیل کد فوق‌العاده خوب عمل می‌کنه.

۱۰. این مدل‌ها فقط برای حرفه‌ای‌هاست؟
نه، حتی کاربرای عادی هم اگه اشتراک ChatGPT رو داشته باشن می‌تونن ازشون استفاده کنن. البته برای برنامه‌نویسا و توسعه‌دهنده‌ها کاربرد بیشتری داره.

تبلیغ در آناژورنال بنری
آیدا رادور کارشناس تولید محتوا