تازه‌های تکنولوژی:

کدام مدل هوش مصنوعی «اوپن‌ای‌آی» بهتر است؟

عصر ایران سه شنبه 28 مرداد 1404 - 09:20

از زمانی که شرکت «اوپن‌ای‌آی»(OpenAI) برای اولین بار در سال ۲۰۲۲ چت‌بات هوش مصنوعی «چت‌جی‌پی‌تی»(ChatGPT) را منتشر کرد، هر چند ماه یک بار مدل جدیدی را با مجموعه‌ای گیج‌کننده از نام‌ها عرضه کرده است.

این گزارش، مدل‌های هوش مصنوعی شرکت «اوپن‌ای‌آی» را بررسی می‌کند و تفاوت‌های میان آنها را نشان می‌دهد.

به گزارش ایسنا، از زمانی که شرکت «اوپن‌ای‌آی»(OpenAI) برای اولین بار در سال ۲۰۲۲ چت‌بات هوش مصنوعی «چت‌جی‌پی‌تی»(ChatGPT) را منتشر کرد، هر چند ماه یک بار مدل جدیدی را با مجموعه‌ای گیج‌کننده از نام‌ها عرضه کرده است.

به نقل از بیزینس اینسایدر، تعدادی از رقبای اوپن‌ای‌آی جایگزین‌های محبوبی را برای چت‌جی‌پی‌تی دارند که از جمله آنها می‌توان به «کلود»(Claude)، «جمینای»(Gemini) و «گراک»(Grok) اشاره کرد اما مدل‌های اوپن‌ای‌آی از شناخته‌شده‌ترین مدل‌های این صنعت هستند و بیشترین کاربران را به خود جذب کرده‌اند. برخی از آنها برای کارهای کمّی مانند کدنویسی مناسب هستند و برخی دیگر می‌توانند بهترین گزینه برای ایده‌پردازی‌های جدید باشند.

این گزارش، نحوه تکامل چت‌جی‌پی‌تی و تفاوت همه مدل‌هایی را که اوپن‌ای‌آی منتشر کرده است، توضیح می‌دهد.

«GPT-5»

اوپن‌ای‌آی در ماه جاری میلادی، مدل «GPT-5» را منتشر کرد که آن را پیشرفته‌ترین مدل خود تا به امروز می‌داند. اوپن‌ای‌آی گفت که این مدل، جهش قابل توجهی در هوش مصنوعی نسبت به همه مدل‌های پیشین شرکت است و عملکرد پیشرفته‌ای را در زمینه کدنویسی، ریاضی، نوشتن، سلامت، ادراک بصری و موارد دیگر ارائه می‌دهد. «سم آلتمن»(Sam Altman) مدیرعامل اوپن‌ای‌آی یک روز پیش از انتشار GPT-5 در جریان یک تله‌کنفرانس با روزنامه‌نگاران، این مدل را یک ارتقاء بزرگ و گامی مهم در مسیر هوش مصنوعی جامع دانست و گفت که پس از استفاده از GPT-5، بازگشت به GPT-4 تاسف‌بار است.

مدل GPT-5 دارای یک سیستم «روتر بلادرنگ» است که به طور خودکار مناسب‌ترین مدل را برای رسیدگی به درخواست‌های کاربر انتخاب می‌کند. این سیستم، جایگزین سیستم «انتخابگر مدل» است که در مدل‌های پیشین وجود داشت. این روتر قرار بود کارها را برای کاربران ساده کند اما با واکنش منفی کاربرانی روبه‌رو شده است که دلبستگی شدیدی به مدل‌های گوناگون هوش مصنوعی پیدا کرده‌اند.

آلتمن در حساب ایکس خود نوشت: اگر روند عرضه GPT-5 را دنبال کرده‌اید، چیزی که ممکن است متوجه آن شده باشید این است که برخی افراد چقدر به مدل‌های خاص هوش مصنوعی دلبستگی دارند. این یک حس متفاوت و قوی‌تر از دلبستگی‌هایی است که مردم به انواع پیشین این فناوری داشته‌اند.

بنابراین، اوپن‌ای‌آی مدل 4o محبوب کاربران را بازگرداند و گزینه‌های بیشتری را معرفی کرد تا کاربران نحوه‌ عملکرد چت‌جی‌پی‌تی را انتخاب کنند.

«GPT-4» و «GPT-4o»

اوپن‌ای‌آی اولین بار GPT-4 را در سال ۲۰۲۳ به عنوان مدل زبانی بزرگ پرچمدار خود عرضه کرد. آلتمن آن زمان در یک پادکست گفت که ساخت این مدل، کار صدها نفر و تقریباً همه تلاش شرکت را به خود اختصاص داده است.

پس از آن، اوپن‌ای‌آی مدل GPT-4 را به GPT-4o ارتقا داد که اولین بار در سال گذشته عرضه شد. این مدل به اندازه GPT-4 هوشمند است اما سرعت بیشتری دارد و به گفته شرکت، در قابلیت‌های خود در زمینه متن، صدا و تصویر بهبود یافته است.

مدل GPT-4o می‌تواند به سرعت گفتار را ترجمه کند و پیشرفته‌ترین قابلیت‌های بصری را دارد. تصاویر به سبک «استودیو جیبلی»(Studio Ghibli) آن، هیجان آنلاین را برانگیختند. با وجود این، GPT-4o سوالاتی را درباره حق کپی‌رایت برانگیخت زیرا استدلال منتقدان این بود که اوپن‌ای‌آی به طور ناعادلانه از محتوای تولیدشده توسط هنرمندان سود می‌برد. اوپن‌ای‌آی گفت که GPT-4o در کارهای روزمره مانند طوفان فکری، خلاصه‌سازی، نوشتن ایمیل و تصحیح گزارش‌ها عالی است.

«GPT-4.5»

آلتمن در حساب ایکس خود، مدل GPT-4.5 را به عنوان اولین مدلی توصیف کرد که حس صحبت کردن با یک شخص متفکر را القا می‌کند. «آملیا گلیز»(Amelia Glaese) عضو کادر فنی اوپن‌ای‌آی در مراسم رونمایی از GPT-4.5 در ماه فوریه گفت: این جدیدترین پیشرفت در الگوی «یادگیری بدون نظارت» شرکت است که بر افزایش مقیاس مدل‌ها براساس دانش کلامی، شهود و کاهش توهم تمرکز دارد.

بنابراین، اگر گفت‌وگوی سختی با همکار خود دارید، GPT-4.5 ممکن است به شما کمک کند تا گفت‌وگو را با لحنی حرفه‌ای‌تر و سنجیده‌تر تغییر دهید.

اوپن‌ای‌آی گفت GPT-4.5 برای کارهای خلاقانه مانند پروژه‌های مشارکتی و طوفان فکری ایده‌آل است.

«o1» و «o1-mini»

اوپن‌ای‌آی نسخه o1-mini مدل استدلالی o1 خود را در سپتامبر سال گذشته و نسخه کامل آن را در دسامبر عرضه کرد. پژوهشگران اوپن‌ای‌آی گفتند این اولین مدلی است که پیش از پاسخ دادن، برای فکر کردن آموزش دیده و برای کارهای کمّی مناسب است؛ از این رو به آن مدل استدلالی می‌گویند. این تابعی از روش آموزشی آن است که به عنوان زنجیره تفکر شناخته می‌شود و مدل‌ها را تشویق می‌کند تا با تجزیه گام‌به‌گام مسائل، آنها را استدلال کنند.

مدل GPT-5 اکنون می‌تواند به تنهایی تصمیم بگیرد که چه مدت زمانی را برای فکر کردن به چیزی نیاز دارد و o1 را برای کارهای پیچیده انتخاب خواهد کرد. اوپن‌ای‌آی در مقاله‌ای که پیرامون آموزش ایمنی o1 منتشر شده است، اعلام کرد که آموزش مدل‌ها برای گنجاندن زنجیره‌ای از افکار پیش از پاسخ دادن، پتانسیل ایجاد مزایای قابل توجهی را دارد و در عین حال، خطرات بالقوه‌ای را که ناشی از هوش بالا هستند نیز افزایش می‌دهد.

در ویدئوی منتشرشده از یک ارائه داخلی اوپن‌ای‌آی درباره بهترین موارد استفاده برای o1، «جو کاسون»(Joe Casson) مهندس راهبردی شرکت نشان داد که چگونه o1-mini می‌تواند برای تجزیه و تحلیل حداکثر سود و ارائه راهبرد معاملات مالی سودمند باشد. همچنین، کاسون نشان داد که چگونه نسخه پیش‌نمایش o1 می‌تواند به کاربر کمک کند تا درباره چگونگی ارائه یک طرح توسعه استدلال کند.

اوپن‌ای‌آی می‌گوید حالت حرفه‌ای o1 که از محاسبات بیشتری برای تفکر سخت‌تر استفاده می‌کند و پاسخ‌های بهتری را برای دشوارترین مسائل ارائه می‌دهد، بهترین گزینه برای استدلال‌های پیچیده مانند ایجاد الگوریتمی برای پیش‌بینی مالی با استفاده از مدل‌های نظری یا تولید خلاصه تحقیقات چندصفحه‌ای درباره فناوری‌های نوظهور است.

«o3» و «o3-mini»

مدل‌های کوچک مدتی است که به عنوان جایگزین سریع‌تر و مقرون‌به‌صرفه‌تر مدل‌های بزرگ‌تر و بنیادین در صنعت مورد توجه قرار گرفته‌اند. اوپن‌ای‌آی اولین مدل کوچک خود موسوم به o3 mini را در ژانویه و تنها چند هفته پس از عرضه مدل «R1» شرکت «دیپ‌سیک»(DeepSeek) عرضه کرد که سیلیکون ولی و بازارها را با قیمت مناسب خود شوکه کرده بود. اوپن‌ای‌آی گفت که 03 mini مقرون‌به‌صرفه‌ترین مدل در سری مدل‌های استدلالی آن است. این مدل برای رسیدگی به سوالات پیچیده در نظر گرفته شده و اوپن‌ای‌آی اعلام کرد که به ویژه در علوم، ریاضی و کدنویسی قوی است.

«جولیان گلدی»(Julian Goldie) یکی از اینفلوئنسرهای فعال در رسانه‌های اجتماعی که بر راهکار سئو تمرکز دارد، در یک پست نوشت که o۳ در وظایف توسعه سریع می‌درخشد و برای وظایف برنامه‌نویسی پایه در HTML و CSS، توابع ساده جاوا اسکریپت و ساخت نمونه‌های اولیه سریع ایده‌آل است. همچنین، یک نسخه «mini high» از این مدل وجود دارد که به گفته او برای کدنویسی و منطق پیچیده بهتر است؛ اگرچه چند مشکل کنترل داشت.

اوپن‌ای‌آی در ماه آوریل، نسخه کاملی را از o3 عرضه کرد که آن را قدرتمندترین مدل استدلالی شرکت با قدرت جابجایی مرزهای کدنویسی، ریاضی، علوم، ادراک بصری و موارد دیگر توصیف می‌کند. این شرکت گفت که o3 بهترین استفاده را برای وظایف پیچیده یا چندمرحله‌ای مانند برنامه‌ریزی راهبردی، کدنویسی گسترده و ریاضیات پیشرفته دارد.

«o4 mini»

شرکت اوپن‌ای‌آی در ماه آوریل مدل کوچک‌تر دیگری را به نام O4 mini عرضه کرد و گفت که این مدل برای استدلال سریع و مقرون‌به‌صرفه تنظیم شده است. این شرکت اعلام کرد که O4 mini نسبت به هزینه خود، به عملکرد قابل توجهی به ویژه در ریاضی، کدنویسی و وظایف بصری دست می‌یابد. این مدل، بهترین عملکرد را در آزمون ریاضی AIME در سال‌های ۲۰۲۴ و ۲۰۲۵ داشت.

به گفته اوپن‌ای‌آی، مدل o4 mini و نسخه mini-high آن برای استدلال سریع عالی هستند. این مدل‌ها در سرعت بخشیدن به همه وظایف استدلال کمّی که در طول روز با آنها روبه‌رو می‌شوید، خوب هستند. اگر به دنبال کار عمیق‌تر هستید، o3 را انتخاب کنید.

«اسکات سوینگل»(Scott Swingle) بنیانگذار شرکت هوش مصنوعی «Abante AI»، مدل o4 را با یک «مسئله اویلر»(Euler problem) آزمایش کرد که مجموعه‌ای از مسائل محاسباتی چالش‌برانگیز است. او در حساب ایکس خود نوشت: o4 این مسئله را در دو دقیقه و ۵۵ ثانیه حل کرد؛ یعنی بسیار سریع‌تر از انسان. فقط ۱۵ نفر توانستند آن را در کمتر از ۳۰ دقیقه حل کنند.

اوپن‌ای‌آی می‌گوید O4 mini بهترین استفاده را برای وظایف فنی سریع مانند پرس‌وجوهای سریع مرتبط با علم، فناوری، مهندسی و ریاضیات دارد. همچنین، این شرکت می‌گوید که این مدل برای استدلال بصری مانند استخراج نقاط داده کلیدی از یک فایل CSV یا ارائه خلاصه‌ سریع یک مقاله علمی، ایده‌آل است.

پربیننده ترین پست همین یک ساعت اخیر

الهام پاوه‌نژاد با استایل متفاوت اسب‌سواری؛ «دلتنگ شاینی شدم» (عکس)

خبر بعد خبر قبل

اشتراک گذاری :