به گزارش رسانه تحلیلی خبری آناژورنال، استارتاپ آمریکایی Deep Cogito با انتشار نخستین مدلهای زبانی خود بهصورت رسمی وارد رقابت با غولهای حوزه هوش مصنوعی مانند OpenAI، متا و DeepSeek شد.
این شرکت که در شهر سنفرانسیسکو مستقر است، مدلهایی با نام Cogito v1 معرفی کرده که بر پایه نسخه 3.2 از مدل LLaMA شرکت متا توسعه یافتهاند.
جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.
مدلهای جدید این استارتاپ از قابلیت پیشرفتهای تحت عنوان استدلال ترکیبی (Hybrid Reasoning) برخوردارند؛ قابلیتی که امکان ارائه پاسخهای دقیق و بازبینیشده را مشابه مدلهای پیشرفته OpenAI نظیر GPT-4o و DeepSeek R1 فراهم میسازد.
به گفته شرکت، هدف اصلی Deep Cogito دستیابی به هوش فراانسانی است، اما این مسیر را با تأکید بر متنباز بودن تمام مدلها دنبال میکند.
دریشان آرورا، مدیرعامل و یکی از بنیانگذاران Deep Cogito، که سابقه فعالیت بهعنوان مهندس ارشد در گوگل را دارد، اعلام کرده مدلهای آنها در ابعاد خود قویترین نمونههای متنباز هستند و حتی در برخی تستها از مدلهای شرکتهایی مثل متا، DeepSeek و Qwen نیز پیشی گرفتهاند.
نسخه اولیه مدلهای Cogito در پنج اندازه با 3، 8، 14، 32 و 70 میلیارد پارامتر عرضه شدهاند و هماکنون از طریق پلتفرمهای معروفی چون Hugging Face، Ollama و APIهای Fireworks و Together AI در دسترس هستند.
این مدلها تحت مجوز LLaMA منتشر شدهاند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را میدهد.
جالب توجه اینکه Deep Cogito از روشی متفاوت با نام تقطیر و تقویت تکراری (IDA) برای آموزش مدلهایش استفاده کرده است.
این روش برخلاف RLHF، به مدل اجازه میدهد تفکر بهینه را خودش یاد بگیرد و پاسخهایی تولید کند که صرفاً بر اساس دادههای انسانی نباشد.
در آزمونهای استاندارد، مدلهای Cogito درخشان ظاهر شدهاند. برای نمونه:
- Cogito 3B با امتیاز 65.4 درصد در تست MMLU، از مدل LLaMA 3.2 با اختلاف 6.7 درصد پیشی گرفته و در آزمون Hellaswag نیز 18.8 درصد بهتر عمل کرده است.
- Cogito 8B با امتیاز 80.5 درصد در MMLU، عملکردی 12.8 درصد بالاتر از LLaMA 3.1 8B داشته است.
- در بخش Reasoning، نسخه 8B به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU رسیده و از DeepSeek R1 Distill 8B جلو زده است.
با اینکه در برخی آزمونهای خاص مانند MATH، مدلهای رقیب هنوز برتریهایی دارند، اما در مجموع، عملکرد Cogito در بخش استدلال بهمراتب قدرتمندتر بوده است.
طبق اعلام این شرکت، نسخههایی با ابعاد بسیار بزرگتر نیز در راهاند، از جمله مدلهایی با 109، 400 و حتی 671 میلیارد پارامتر که قرار است طی ماههای آینده معرفی شوند.
سوالات متداول
1. مدلهای Cogito چیه و چه فرقی با ChatGPT دارن؟
مدلهای Cogito نسل جدیدی از هوش مصنوعی هستن که متنبازن و توسط یه استارتاپ به اسم Deep Cogito ساخته شدن. اینا توی بعضی تستها حتی از مدلهای معروف مثل ChatGPT هم بهتر عمل کردن، مخصوصاً توی استدلال منطقی.
2. Deep Cogito رقیب OpenAI حساب میشه؟
آره، Deep Cogito با معرفی مدلهای زبانی قوی و متنباز، وارد رقابت جدی با OpenAI، متا و DeepSeek شده. حتی ادعا کرده که مدلهاش در سطح خودشون از بقیه قویترن.
3. فرق آموزش مدلهای Cogito با بقیه چیه؟
Deep Cogito از یه روش جدید به اسم IDA استفاده کرده که تمرکزش روی یادگیری عمیقتر و بهینهتره، بر خلاف روش RLHF که OpenAI استفاده میکنه.
4. آیا میشه از مدلهای Cogito استفاده تجاری کرد؟
بله، ولی تا سقف 700 میلیون کاربر ماهانه. اگه استفادهتون از این حد بیشتر بشه، باید از متا مجوز بگیرین چون این مدلها بر پایه LLaMA ساخته شدن.
5. مدل Cogito قویتره یا DeepSeek R1؟
تو بعضی تستها مثل ARC و MMLU مدل Cogito حتی از DeepSeek R1 هم جلو زده. البته تو تست ریاضی، DeepSeek هنوز یه مقدار برتری داره.
6. چطور میتونم از مدلهای Cogito استفاده کنم؟
الان میتونی این مدلها رو روی پلتفرمهایی مثل Hugging Face، Ollama یا از طریق APIهای Fireworks و Together AI استفاده کنی.
7. آیا Cogito رایگانه؟
فعلاً بله. این مدلها متنباز هستن و استفاده اولیه ازشون رایگانه؛ ولی اگه استفاده گسترده یا تجاری بالا داشته باشی، نیاز به مجوز داری.
8. مدل Cogito چند پارامتر داره و چه سایزهایی داره؟
تا الان ۵ مدل منتشر شده: 3B، 8B، 14B، 32B و 70B. قراره نسخههای خیلی بزرگتر مثل 109B تا حتی 671B هم بهزودی منتشر بشن.
9. مدل Cogito به چه دردی میخوره؟
از تولید متن و پاسخگویی گرفته تا تحلیل داده، چتبات هوشمند، کدنویسی و حتی استفاده تو اپلیکیشنهای کسبوکار. همهکارهست!
10. Deep Cogito ساخت کجاست؟
این استارتاپ توی سنفرانسیسکو مستقره و یکی از بنیانگذارانش قبلاً توی تیم جستوجوی گوگل کار میکرده.
ارسال پاسخ
نمایش دیدگاه ها