هوش مصنوعی همه‌کاره؛ میسترال از مدل‌های متن‌باز Mistral 3 رونمایی کرد

دیجیاتو سه شنبه 11 آذر 1404 - 20:40
استارتاپ فرانسوی Mistral AI از 10 مدل هوش مصنوعی جدید با اندازه‌های مختلف پرده برداشت که همگی متن‌باز هستند. The post هوش مصنوعی همه‌کاره؛ میسترال از مدل‌های متن‌باز Mistral 3 رونمایی کرد appeared first on دیجیاتو.

Mistral AI، مهم‌ترین استارتاپ هوش مصنوعی اروپا، از انتشار جاه‌طلبانه‌ترین بسته محصولات خود خبر داد: خانواده Mistral 3 که شامل 10 مدل متن‌باز است و می‌توانند روی هر دستگاهی از گوشی هوشمند گرفته تا پهپادهای خودران و سیستم‌های ابری اجرا شوند.

خانواده مدل‌های هوش مصنوعی Mistral 3 شامل Mistral Large 3 و مجموعه‌ای از مدل‌های کوچک‌تر موسوم به Ministral 3 است که برای کاربردهای رایانش لبه بهینه‌سازی شده‌اند. همه این مدل‌ها تحت مجوز Apache 2.0 منتشر شده‌اند که نشان‌دهنده رویکردی متفاوت و آزادتر از عرضه مدل‌ها متن‌باز توسط گوگل، OpenAI و آنتروپیک است.

معرفی مدل‌های هوش مصنوعی متن‌باز Mistral 3

مدل پرچمدار این استارتاپ با نام Mistral Large 3 از معماری «ترکیب متخصصان» (MoE) با 41 میلیارد پارامتر فعال که از استخر 675 میلیارد پارامتری این مدل برداشته می‌شود، استفاده می‌کند. این مدل می‌تواند متن و تصویر پردازش کند و پنجره زمینه آن تا 256 هزار توکن است. همچنین گفته شده که این مدل به‌طور خاص با زبان‌های غیرانگلیسی آموزش دیده که در میان مدل‌های پیشگام اتفاقی نادر است.

براساس بنچمارک‌هایی که Mistral منتشر کرده است، مدل Mistral Large 3 (675B) در تست‌های MMMLU و GPQA-Diamond از DeepSeek-3.1 (670B) و Kimi-K2 (1.2T) بهتر عمل کرده است. همچنین در تست‌های AMC و SimpleQA از مدل دیپ‌سیک بهتر ظاهر شده اما کمی ضعیف‌تر از Kimi-K2 بوده است.

بنچمارک Mistral Large 3

کوچک‌ترین مدل‌ها که Ministral 3 نام دارند روی دستگاه‌هایی با حداقل 4 گیگابایت حافظه ویدیویی قابل اجرا هستند، بنابراین می‌توانند روی لپ‌تاپ، گوشی‌های هوشمند و سیستم‌های امبد اجرا شوند و نیازی به اینترنت ندارند. 9 مدل Ministral 3 در سه اندازه (3، 8 و 14 میلیارد پارامتر) و سه نوع مختلف برای کارکردهای گوناگون ساخته شده است. این سه نوع عبارت‌اند از:

  • مدل‌های پایه برای شخصی‌سازی
  • مدل‌های تنظیم‌شده با دستورات برای چت عادی و تکمیل تسک
  • مدل‌های بهینه برای استدلال به‌منظور تفکر منطقی پیچیده و اجرای گام‌به‌گام عملیات‌ها

مدل‌های جدید Mistral 3 از امروز در سرویس‌های مختلفی ازجمله Mistral AI Studio، آمازون Bedrock، آزور Foundry و هاگینگ فیس (Large 3 و Ministral) در دسترس قرار گرفته است.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.