مدل‌های جدید Deep Cogito منتشر شدند؛ رقیبی قدرتمند برای OpenAI و متا

استارتاپ Deep Cogito با معرفی مدل‌های قدرتمند و متن‌باز هوش مصنوعی خود وارد رقابت با شرکت‌هایی مثل OpenAI، متا و DeepSeek شد. جزئیات مدل‌ها و عملکرد آن‌ها را بخوانید.

مدل‌های جدید Deep Cogito منتشر شدند؛ رقیبی قدرتمند برای OpenAI و متا
مدل‌های جدید Deep Cogito منتشر شدند؛ رقیبی قدرتمند برای OpenAI و متا
کانال تلگرام آناژورنال

به گزارش رسانه تحلیلی خبری آناژورنال، استارتاپ آمریکایی Deep Cogito با انتشار نخستین مدل‌های زبانی خود به‌صورت رسمی وارد رقابت با غول‌های حوزه هوش مصنوعی مانند OpenAI، متا و DeepSeek شد.

این شرکت که در شهر سن‌فرانسیسکو مستقر است، مدل‌هایی با نام Cogito v1 معرفی کرده که بر پایه نسخه 3.2 از مدل LLaMA شرکت متا توسعه یافته‌اند.

جدیدترین اخبار هوش مصنوعی در آناژورنال دنبال کنید.

مدل‌های جدید این استارتاپ از قابلیت پیشرفته‌ای تحت عنوان استدلال ترکیبی (Hybrid Reasoning) برخوردارند؛ قابلیتی که امکان ارائه پاسخ‌های دقیق و بازبینی‌شده را مشابه مدل‌های پیشرفته OpenAI نظیر GPT-4o و DeepSeek R1 فراهم می‌سازد.

به گفته شرکت، هدف اصلی Deep Cogito دستیابی به هوش فراانسانی است، اما این مسیر را با تأکید بر متن‌باز بودن تمام مدل‌ها دنبال می‌کند.

دریشان آرورا، مدیرعامل و یکی از بنیان‌گذاران Deep Cogito، که سابقه فعالیت به‌عنوان مهندس ارشد در گوگل را دارد، اعلام کرده مدل‌های آنها در ابعاد خود قوی‌ترین نمونه‌های متن‌باز هستند و حتی در برخی تست‌ها از مدل‌های شرکت‌هایی مثل متا، DeepSeek و Qwen نیز پیشی گرفته‌اند.

نسخه اولیه مدل‌های Cogito در پنج اندازه با 3، 8، 14، 32 و 70 میلیارد پارامتر عرضه شده‌اند و هم‌اکنون از طریق پلتفرم‌های معروفی چون Hugging Face، Ollama و APIهای Fireworks و Together AI در دسترس هستند.

این مدل‌ها تحت مجوز LLaMA منتشر شده‌اند که اجازه استفاده تجاری تا سقف 700 میلیون کاربر ماهانه را می‌دهد.

جالب توجه اینکه Deep Cogito از روشی متفاوت با نام تقطیر و تقویت تکراری (IDA) برای آموزش مدل‌هایش استفاده کرده است.

این روش برخلاف RLHF، به مدل اجازه می‌دهد تفکر بهینه را خودش یاد بگیرد و پاسخ‌هایی تولید کند که صرفاً بر اساس داده‌های انسانی نباشد.

در آزمون‌های استاندارد، مدل‌های Cogito درخشان ظاهر شده‌اند. برای نمونه:

  • Cogito 3B با امتیاز 65.4 درصد در تست MMLU، از مدل LLaMA 3.2 با اختلاف 6.7 درصد پیشی گرفته و در آزمون Hellaswag نیز 18.8 درصد بهتر عمل کرده است.
  • Cogito 8B با امتیاز 80.5 درصد در MMLU، عملکردی 12.8 درصد بالاتر از LLaMA 3.1 8B داشته است.
  • در بخش Reasoning، نسخه 8B به امتیاز 92 درصد در آزمون ARC و 83.1 درصد در MMLU رسیده و از DeepSeek R1 Distill 8B جلو زده است.

با اینکه در برخی آزمون‌های خاص مانند MATH، مدل‌های رقیب هنوز برتری‌هایی دارند، اما در مجموع، عملکرد Cogito در بخش استدلال به‌مراتب قدرتمندتر بوده است.

طبق اعلام این شرکت، نسخه‌هایی با ابعاد بسیار بزرگ‌تر نیز در راه‌اند، از جمله مدل‌هایی با 109، 400 و حتی 671 میلیارد پارامتر که قرار است طی ماه‌های آینده معرفی شوند.

سوالات متداول

1. مدل‌های Cogito چیه و چه فرقی با ChatGPT دارن؟
مدل‌های Cogito نسل جدیدی از هوش مصنوعی هستن که متن‌بازن و توسط یه استارتاپ به اسم Deep Cogito ساخته شدن. اینا توی بعضی تست‌ها حتی از مدل‌های معروف مثل ChatGPT هم بهتر عمل کردن، مخصوصاً توی استدلال منطقی.

2. Deep Cogito رقیب OpenAI حساب میشه؟
آره، Deep Cogito با معرفی مدل‌های زبانی قوی و متن‌باز، وارد رقابت جدی با OpenAI، متا و DeepSeek شده. حتی ادعا کرده که مدل‌هاش در سطح خودشون از بقیه قوی‌ترن.

3. فرق آموزش مدل‌های Cogito با بقیه چیه؟
Deep Cogito از یه روش جدید به اسم IDA استفاده کرده که تمرکزش روی یادگیری عمیق‌تر و بهینه‌تره، بر خلاف روش RLHF که OpenAI استفاده می‌کنه.

4. آیا میشه از مدل‌های Cogito استفاده تجاری کرد؟
بله، ولی تا سقف 700 میلیون کاربر ماهانه. اگه استفاده‌تون از این حد بیشتر بشه، باید از متا مجوز بگیرین چون این مدل‌ها بر پایه LLaMA ساخته شدن.

5. مدل Cogito قوی‌تره یا DeepSeek R1؟
تو بعضی تست‌ها مثل ARC و MMLU مدل Cogito حتی از DeepSeek R1 هم جلو زده. البته تو تست ریاضی، DeepSeek هنوز یه مقدار برتری داره.

6. چطور می‌تونم از مدل‌های Cogito استفاده کنم؟
الان می‌تونی این مدل‌ها رو روی پلتفرم‌هایی مثل Hugging Face، Ollama یا از طریق API‌های Fireworks و Together AI استفاده کنی.

7. آیا Cogito رایگانه؟
فعلاً بله. این مدل‌ها متن‌باز هستن و استفاده اولیه ازشون رایگانه؛ ولی اگه استفاده گسترده یا تجاری بالا داشته باشی، نیاز به مجوز داری.

8. مدل Cogito چند پارامتر داره و چه سایزهایی داره؟
تا الان ۵ مدل منتشر شده: 3B، 8B، 14B، 32B و 70B. قراره نسخه‌های خیلی بزرگ‌تر مثل 109B تا حتی 671B هم به‌زودی منتشر بشن.

9. مدل Cogito به چه دردی می‌خوره؟
از تولید متن و پاسخ‌گویی گرفته تا تحلیل داده، چت‌بات‌ هوشمند، کدنویسی و حتی استفاده تو اپلیکیشن‌های کسب‌وکار. همه‌کاره‌ست!

10. Deep Cogito ساخت کجاست؟
این استارتاپ توی سن‌فرانسیسکو مستقره و یکی از بنیان‌گذارانش قبلاً توی تیم جست‌وجوی گوگل کار می‌کرده.

تبلیغ در آناژورنال بنری
آیدا رادور کارشناس تولید محتوا