تازه‌های تکنولوژی:

تراشه هوش مصنوعی Positron رقبا را به چالش می‌کشد؛ قوی‌تر از انویدیا H200 با مصرف انرژی کمتر

دیجیاتو سه شنبه 07 مرداد 1404 - 18:32

«اطلس»، محصول شرکت Positron AI، رقابتی جدی با انویدیا خواهد داشت. The post تراشه هوش مصنوعی Positron رقبا را به چالش می‌کشد؛ قوی‌تر از انویدیا H200 با مصرف انرژی کمتر appeared first on دیجیاتو.

شرکت آمریکایی Positron AI ادعا کرده است که تراشه شتاب‌دهنده‌اش با نام «اطلس» در انجام عملیات استنتاج (Inference) عملکردی بهتر از انویدیا H200 دارد و ۳۳ درصد برق کمتری مصرف می‌کند.

به گزارش Tom's Hardware، شرکت Positron که در سال ۲۰۲۳ تأسیس شده، شتاب‌دهنده‌های هوش مصنوعی را با تمرکز ویژه بر عملیات استنتاج توسعه می‌دهد. برخلاف پردازشگرهای گرافیکی که برای آموزش مدل‌های هوش مصنوعی، انجام عملیات استنتاج، محاسبات فنی و انجام طیف وسیعی از وظایف طراحی شده‌اند، سخت‌افزار Positron از پایه به‌گونه‌ای ساخته شده تا وظایف استنتاج را با کارایی بالا و مصرف انرژی بسیار پایین انجام دهد.

شتاب‌دهنده Positron AI نسبت به انویدیا H200 قدرت و کارایی بالاتری دارد

راهکار نسل اول Positron برای مدل‌های ترنسفورمر در مقیاس بزرگ، اطلس نام دارد. این سامانه شامل ۸ شتاب‌دهنده به نام Archer است و با هدف شکست دادن سیستم‌های مبتنی بر معماری Hopper انویدیا طراحی شده، آن هم درحالی‌که تنها کسری از انرژی آنها را مصرف می‌کند.

طبق گزارش‌ها، سامانه اطلس شرکت Positron AI می‌تواند در مدل Llama 3.1 در محدوده مصرف ۲۰۰۰ وات، با ۸ میلیارد پارامتر و با استفاده از محاسبات BF16، حدود ۲۸۰ توکن در ثانیه برای هر کاربر تولید کند. در مقابل، یک سرور انویدیا DGX H200 با پیکربندی ۸ کارت گرافیک تنها قادر است با مصرف ۵۹۰۰ وات توان، حدود ۱۸۰ توکن در ثانیه برای هر کاربر تولید کند. البته این مقایسه توسط خود شرکت Positron AI انجام شده است.

ادعا می‌شود که شتاب‌دهنده اطلس از نظر عملکرد به‌ازای وات (performance-per-watt) و همچنین عملکرد نسبت به هزینه، در مقایسه با سیستم DGX H200 انویدیا، حدود ۳ برابر بهره‌وری بالاتری دارد. البته این ادعا باید توسط یک مرجع ثالث به اثبات برسد.

شرکت Positron AI سخت‌افزار ASIC خود را با استفاده از فناوری ساخت N4 یا N5 در کارخانه شماره ۲۱ شرکت TSMC در آریزونا تولید می‌کند و کارت‌ها نیز در داخل ایالات متحده مونتاژ می‌شوند. البته ازآنجایی‌که این تراشه‌ها با ۳۲ گیگابایت حافظه HBM ترکیب شده‌اند، از فناوری بسته‌بندی پیشرفته بهره می‌برند و به همین دلیل، احتمالاً بخشی از مونتاژ در تایوان انجام شده است.

مشاهده متن کامل خبر در "دیجیاتو"