شرکت آمریکایی Positron AI ادعا کرده است که تراشه شتابدهندهاش با نام «اطلس» در انجام عملیات استنتاج (Inference) عملکردی بهتر از انویدیا H200 دارد و ۳۳ درصد برق کمتری مصرف میکند.
به گزارش Tom's Hardware، شرکت Positron که در سال ۲۰۲۳ تأسیس شده، شتابدهندههای هوش مصنوعی را با تمرکز ویژه بر عملیات استنتاج توسعه میدهد. برخلاف پردازشگرهای گرافیکی که برای آموزش مدلهای هوش مصنوعی، انجام عملیات استنتاج، محاسبات فنی و انجام طیف وسیعی از وظایف طراحی شدهاند، سختافزار Positron از پایه بهگونهای ساخته شده تا وظایف استنتاج را با کارایی بالا و مصرف انرژی بسیار پایین انجام دهد.
راهکار نسل اول Positron برای مدلهای ترنسفورمر در مقیاس بزرگ، اطلس نام دارد. این سامانه شامل ۸ شتابدهنده به نام Archer است و با هدف شکست دادن سیستمهای مبتنی بر معماری Hopper انویدیا طراحی شده، آن هم درحالیکه تنها کسری از انرژی آنها را مصرف میکند.
طبق گزارشها، سامانه اطلس شرکت Positron AI میتواند در مدل Llama 3.1 در محدوده مصرف ۲۰۰۰ وات، با ۸ میلیارد پارامتر و با استفاده از محاسبات BF16، حدود ۲۸۰ توکن در ثانیه برای هر کاربر تولید کند. در مقابل، یک سرور انویدیا DGX H200 با پیکربندی ۸ کارت گرافیک تنها قادر است با مصرف ۵۹۰۰ وات توان، حدود ۱۸۰ توکن در ثانیه برای هر کاربر تولید کند. البته این مقایسه توسط خود شرکت Positron AI انجام شده است.
ادعا میشود که شتابدهنده اطلس از نظر عملکرد بهازای وات (performance-per-watt) و همچنین عملکرد نسبت به هزینه، در مقایسه با سیستم DGX H200 انویدیا، حدود ۳ برابر بهرهوری بالاتری دارد. البته این ادعا باید توسط یک مرجع ثالث به اثبات برسد.
شرکت Positron AI سختافزار ASIC خود را با استفاده از فناوری ساخت N4 یا N5 در کارخانه شماره ۲۱ شرکت TSMC در آریزونا تولید میکند و کارتها نیز در داخل ایالات متحده مونتاژ میشوند. البته ازآنجاییکه این تراشهها با ۳۲ گیگابایت حافظه HBM ترکیب شدهاند، از فناوری بستهبندی پیشرفته بهره میبرند و به همین دلیل، احتمالاً بخشی از مونتاژ در تایوان انجام شده است.