انویدیا از TensorTR-LLM با هدف افزایش سرعت مدل‌های زبانی برای ویندوز رونمایی کرد

دیجیاتو چهارشنبه 26 مهر 1402 - 15:01
انویدیا می‌گوید TensorRT-LLM برای توسعه‌دهندگان و کاربران عادی مفید خواهد بود. The post انویدیا از TensorTR-LLM با هدف افزایش سرعت مدل‌های زبانی برای ویندوز رونمایی کرد appeared first on دیجیاتو.

انویدیا در بازار سخت‌افزارهای هوش مصنوعی مولد حکمرانی می‌کند و سخت‌افزارهای این شرکت در دیتاسنترهای شرکت‌هایی مانند مایکروسافت و OpenAI برای چت‌بات‌هایی مانند بینگ چت و ChatGPT مورد استفاده قرار می‌گیرد. حالا انویدیا از نرم‌افزار جدیدی رونمایی کرده است که TensorRT-LLM نام دارد و عملکرد مدل‌های زبانی بزرگ (LLM) را بهبود می‌بخشد.

انویدیا در یک پست از این ابزار متن‌باز جدید رونمایی کرده است، البته باید به این موضوع اشاره کنیم که قبل از این، TensorTR-LLM برای دیتاسنترها عرضه شده بود و حالا در اختیار کاربران ویندوزی قرار گرفته است. این ابزار سرعت اجرای مدل‌های زبانی بزرگ را روی کامپیوترهای ویندوزی مجهز به گرافیک‌های جی‌فورس RTX تا 4 برابر افزایش می‌دهد.

ابزار TensorRT-LLM برای کاربران و توسعه‌دهندگان مفید خواهد بود

انویدیا در پست مربوط به معرفی این ابزار گفته است که TensorRT-LLM برای توسعه‌دهندگان و کاربران عادی مفید خواهد بود:

«در ابعاد بزرگ، این شتاب‌دهنده می‌تواند به‌طور قابل‌توجهی تجربه استفاده از مدل‌های زبانی پیچیده را بهبود ببخشد؛ مدل‌هایی مانند دستیارهای متن‌نویسی و کدنویسی که نتایج را به‌طور هم‌زمان تکمیل می‌کنند. نتیجه این رویکرد، عملکرد سریع‌تر و کیفیت بهتر می‌شود که به کاربران اجازه می‌دهد تا بهترین‌ها را انتخاب کنند.»

انویدیا TensorTR-LLM

انویدیا با انتشار تصویری نحوه عملکرد TensorRT-LLM را نشان داده است. در این مثال، مدل استاندارد LLaMa 2 جواب دقیقی نمی‌دهد، اما زمانی که با TensorRT-LLM جفت می‌شود نه‌تنها جواب دقیق‌تری می‌دهد، بلکه سریع‌تر هم پاسخ می‌دهد.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.