شرکت چینی دیپسیک احتمالاً در ماه جاری میلادی از مدل جدید هوش مصنوعی خود موسوم به DeepSeek-R2 رونمایی خواهد کرد.
به گزارش منابع چینی، زمان دقیق رونمایی از مدل DeepSeek-R2 هنوز مشخص نشده است، اما گفته میشود که رونمایی از این مدل در نیمه دوم همین ماه صورت خواهد پذیرفت. رونمایی از DeepSeek-R2 به عنوان پیشرفتهترین مدل دیپسیک از این جهت اهمیت دارد که OpenAI نیز بهتازگی از مدل GPT-5 خود رونمایی کرده است.
انتظار میرود DeepSeek-R2 با بهکارگیری یک ساختار پیشرفتهتر از Mixture of Experts جهشی چشمگیر در معماری خود را تجربه کند. این مدل همچنین یک Gating network هوشمندتر را برای مدیریت بهتر پردازشهای سنگین در مرحله استنتاج ادغام خواهد کرد.
برخی منابع آگاه گفتهاند که این مدل میتواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند که تقریباً دو برابر نسخه قبلی با ۶۷۱ میلیارد پارامتر است. بااینحال، این عدد همچنان کمتر از ChatGPT-4/5 خواهد بود که بیش از ۱.۸ تریلیون پارامتر دارد.
همچنین در راستای برنامههای چین برای خودکفایی در عرصه هوش مصنوعی، مدل DeepSeek-R2 بهطور کامل بر روی تراشههای Ascend 910B هواوی آموزش دیده است. خوشه پردازشی هواوی با ارائه ۵۱۲ پتافلاپس توان پردازشی در دقت FP16 و با بهرهوری ۸۲ درصدی ظاهراً توانسته به ۹۱ درصد عملکرد خوشههای مبتنی بر انویدیا A100 دست یابد.
به گفته تحلیلگران، این اقدام گامی حیاتی از سوی چین در جهت کاهش وابستگی به سختافزارهای هوش مصنوعی ساخت آمریکا است. همچنین گزارشها حاکی از آن است که هزینه آموزش DeepSeek-R2 به لطف استفاده از سختافزار بومی و تکنیکهای بهینهسازی، ۹۷ درصد کمتر از GPT-4 بوده است. به همین دلیل انتظار میرود دیپسیک دسترسی API را با قیمتهای پایینتر ارائه دهد.
اخیراً گزارش شده که دولت چین شرکتهای هوش مصنوعی این کشور را از خرید تراشههای هوش مصنوعی از شرکتهای انویدیا و AMD منع کرده است. این اقدام ظاهراً به دلیل نگرانیهای امنیتی و احتمال وجود در پشتی در تراشههای این شرکتها انجام پذیرفته است. البته انویدیا پیش از این وجود هرگونه در پشتی در محصولات خود را رد کرده بود.