این گزارش، مدلهای هوش مصنوعی شرکت «اوپنایآی» را بررسی میکند و تفاوتهای میان آنها را نشان میدهد.
به گزارش ایسنا، از زمانی که شرکت «اوپنایآی»(OpenAI) برای اولین بار در سال ۲۰۲۲ چتبات هوش مصنوعی «چتجیپیتی»(ChatGPT) را منتشر کرد، هر چند ماه یک بار مدل جدیدی را با مجموعهای گیجکننده از نامها عرضه کرده است.
به نقل از بیزینس اینسایدر، تعدادی از رقبای اوپنایآی جایگزینهای محبوبی را برای چتجیپیتی دارند که از جمله آنها میتوان به «کلود»(Claude)، «جمینای»(Gemini) و «گراک»(Grok) اشاره کرد اما مدلهای اوپنایآی از شناختهشدهترین مدلهای این صنعت هستند و بیشترین کاربران را به خود جذب کردهاند. برخی از آنها برای کارهای کمّی مانند کدنویسی مناسب هستند و برخی دیگر میتوانند بهترین گزینه برای ایدهپردازیهای جدید باشند.
این گزارش، نحوه تکامل چتجیپیتی و تفاوت همه مدلهایی را که اوپنایآی منتشر کرده است، توضیح میدهد.
اوپنایآی در ماه جاری میلادی، مدل «GPT-5» را منتشر کرد که آن را پیشرفتهترین مدل خود تا به امروز میداند. اوپنایآی گفت که این مدل، جهش قابل توجهی در هوش مصنوعی نسبت به همه مدلهای پیشین شرکت است و عملکرد پیشرفتهای را در زمینه کدنویسی، ریاضی، نوشتن، سلامت، ادراک بصری و موارد دیگر ارائه میدهد. «سم آلتمن»(Sam Altman) مدیرعامل اوپنایآی یک روز پیش از انتشار GPT-5 در جریان یک تلهکنفرانس با روزنامهنگاران، این مدل را یک ارتقاء بزرگ و گامی مهم در مسیر هوش مصنوعی جامع دانست و گفت که پس از استفاده از GPT-5، بازگشت به GPT-4 تاسفبار است.
مدل GPT-5 دارای یک سیستم «روتر بلادرنگ» است که به طور خودکار مناسبترین مدل را برای رسیدگی به درخواستهای کاربر انتخاب میکند. این سیستم، جایگزین سیستم «انتخابگر مدل» است که در مدلهای پیشین وجود داشت. این روتر قرار بود کارها را برای کاربران ساده کند اما با واکنش منفی کاربرانی روبهرو شده است که دلبستگی شدیدی به مدلهای گوناگون هوش مصنوعی پیدا کردهاند.
آلتمن در حساب ایکس خود نوشت: اگر روند عرضه GPT-5 را دنبال کردهاید، چیزی که ممکن است متوجه آن شده باشید این است که برخی افراد چقدر به مدلهای خاص هوش مصنوعی دلبستگی دارند. این یک حس متفاوت و قویتر از دلبستگیهایی است که مردم به انواع پیشین این فناوری داشتهاند.
بنابراین، اوپنایآی مدل 4o محبوب کاربران را بازگرداند و گزینههای بیشتری را معرفی کرد تا کاربران نحوه عملکرد چتجیپیتی را انتخاب کنند.
اوپنایآی اولین بار GPT-4 را در سال ۲۰۲۳ به عنوان مدل زبانی بزرگ پرچمدار خود عرضه کرد. آلتمن آن زمان در یک پادکست گفت که ساخت این مدل، کار صدها نفر و تقریباً همه تلاش شرکت را به خود اختصاص داده است.
پس از آن، اوپنایآی مدل GPT-4 را به GPT-4o ارتقا داد که اولین بار در سال گذشته عرضه شد. این مدل به اندازه GPT-4 هوشمند است اما سرعت بیشتری دارد و به گفته شرکت، در قابلیتهای خود در زمینه متن، صدا و تصویر بهبود یافته است.
مدل GPT-4o میتواند به سرعت گفتار را ترجمه کند و پیشرفتهترین قابلیتهای بصری را دارد. تصاویر به سبک «استودیو جیبلی»(Studio Ghibli) آن، هیجان آنلاین را برانگیختند. با وجود این، GPT-4o سوالاتی را درباره حق کپیرایت برانگیخت زیرا استدلال منتقدان این بود که اوپنایآی به طور ناعادلانه از محتوای تولیدشده توسط هنرمندان سود میبرد. اوپنایآی گفت که GPT-4o در کارهای روزمره مانند طوفان فکری، خلاصهسازی، نوشتن ایمیل و تصحیح گزارشها عالی است.
آلتمن در حساب ایکس خود، مدل GPT-4.5 را به عنوان اولین مدلی توصیف کرد که حس صحبت کردن با یک شخص متفکر را القا میکند. «آملیا گلیز»(Amelia Glaese) عضو کادر فنی اوپنایآی در مراسم رونمایی از GPT-4.5 در ماه فوریه گفت: این جدیدترین پیشرفت در الگوی «یادگیری بدون نظارت» شرکت است که بر افزایش مقیاس مدلها براساس دانش کلامی، شهود و کاهش توهم تمرکز دارد.
بنابراین، اگر گفتوگوی سختی با همکار خود دارید، GPT-4.5 ممکن است به شما کمک کند تا گفتوگو را با لحنی حرفهایتر و سنجیدهتر تغییر دهید.
اوپنایآی گفت GPT-4.5 برای کارهای خلاقانه مانند پروژههای مشارکتی و طوفان فکری ایدهآل است.
اوپنایآی نسخه o1-mini مدل استدلالی o1 خود را در سپتامبر سال گذشته و نسخه کامل آن را در دسامبر عرضه کرد. پژوهشگران اوپنایآی گفتند این اولین مدلی است که پیش از پاسخ دادن، برای فکر کردن آموزش دیده و برای کارهای کمّی مناسب است؛ از این رو به آن مدل استدلالی میگویند. این تابعی از روش آموزشی آن است که به عنوان زنجیره تفکر شناخته میشود و مدلها را تشویق میکند تا با تجزیه گامبهگام مسائل، آنها را استدلال کنند.
مدل GPT-5 اکنون میتواند به تنهایی تصمیم بگیرد که چه مدت زمانی را برای فکر کردن به چیزی نیاز دارد و o1 را برای کارهای پیچیده انتخاب خواهد کرد. اوپنایآی در مقالهای که پیرامون آموزش ایمنی o1 منتشر شده است، اعلام کرد که آموزش مدلها برای گنجاندن زنجیرهای از افکار پیش از پاسخ دادن، پتانسیل ایجاد مزایای قابل توجهی را دارد و در عین حال، خطرات بالقوهای را که ناشی از هوش بالا هستند نیز افزایش میدهد.
در ویدئوی منتشرشده از یک ارائه داخلی اوپنایآی درباره بهترین موارد استفاده برای o1، «جو کاسون»(Joe Casson) مهندس راهبردی شرکت نشان داد که چگونه o1-mini میتواند برای تجزیه و تحلیل حداکثر سود و ارائه راهبرد معاملات مالی سودمند باشد. همچنین، کاسون نشان داد که چگونه نسخه پیشنمایش o1 میتواند به کاربر کمک کند تا درباره چگونگی ارائه یک طرح توسعه استدلال کند.
اوپنایآی میگوید حالت حرفهای o1 که از محاسبات بیشتری برای تفکر سختتر استفاده میکند و پاسخهای بهتری را برای دشوارترین مسائل ارائه میدهد، بهترین گزینه برای استدلالهای پیچیده مانند ایجاد الگوریتمی برای پیشبینی مالی با استفاده از مدلهای نظری یا تولید خلاصه تحقیقات چندصفحهای درباره فناوریهای نوظهور است.
مدلهای کوچک مدتی است که به عنوان جایگزین سریعتر و مقرونبهصرفهتر مدلهای بزرگتر و بنیادین در صنعت مورد توجه قرار گرفتهاند. اوپنایآی اولین مدل کوچک خود موسوم به o3 mini را در ژانویه و تنها چند هفته پس از عرضه مدل «R1» شرکت «دیپسیک»(DeepSeek) عرضه کرد که سیلیکون ولی و بازارها را با قیمت مناسب خود شوکه کرده بود. اوپنایآی گفت که 03 mini مقرونبهصرفهترین مدل در سری مدلهای استدلالی آن است. این مدل برای رسیدگی به سوالات پیچیده در نظر گرفته شده و اوپنایآی اعلام کرد که به ویژه در علوم، ریاضی و کدنویسی قوی است.
«جولیان گلدی»(Julian Goldie) یکی از اینفلوئنسرهای فعال در رسانههای اجتماعی که بر راهکار سئو تمرکز دارد، در یک پست نوشت که o۳ در وظایف توسعه سریع میدرخشد و برای وظایف برنامهنویسی پایه در HTML و CSS، توابع ساده جاوا اسکریپت و ساخت نمونههای اولیه سریع ایدهآل است. همچنین، یک نسخه «mini high» از این مدل وجود دارد که به گفته او برای کدنویسی و منطق پیچیده بهتر است؛ اگرچه چند مشکل کنترل داشت.
اوپنایآی در ماه آوریل، نسخه کاملی را از o3 عرضه کرد که آن را قدرتمندترین مدل استدلالی شرکت با قدرت جابجایی مرزهای کدنویسی، ریاضی، علوم، ادراک بصری و موارد دیگر توصیف میکند. این شرکت گفت که o3 بهترین استفاده را برای وظایف پیچیده یا چندمرحلهای مانند برنامهریزی راهبردی، کدنویسی گسترده و ریاضیات پیشرفته دارد.
شرکت اوپنایآی در ماه آوریل مدل کوچکتر دیگری را به نام O4 mini عرضه کرد و گفت که این مدل برای استدلال سریع و مقرونبهصرفه تنظیم شده است. این شرکت اعلام کرد که O4 mini نسبت به هزینه خود، به عملکرد قابل توجهی به ویژه در ریاضی، کدنویسی و وظایف بصری دست مییابد. این مدل، بهترین عملکرد را در آزمون ریاضی AIME در سالهای ۲۰۲۴ و ۲۰۲۵ داشت.
به گفته اوپنایآی، مدل o4 mini و نسخه mini-high آن برای استدلال سریع عالی هستند. این مدلها در سرعت بخشیدن به همه وظایف استدلال کمّی که در طول روز با آنها روبهرو میشوید، خوب هستند. اگر به دنبال کار عمیقتر هستید، o3 را انتخاب کنید.
«اسکات سوینگل»(Scott Swingle) بنیانگذار شرکت هوش مصنوعی «Abante AI»، مدل o4 را با یک «مسئله اویلر»(Euler problem) آزمایش کرد که مجموعهای از مسائل محاسباتی چالشبرانگیز است. او در حساب ایکس خود نوشت: o4 این مسئله را در دو دقیقه و ۵۵ ثانیه حل کرد؛ یعنی بسیار سریعتر از انسان. فقط ۱۵ نفر توانستند آن را در کمتر از ۳۰ دقیقه حل کنند.
اوپنایآی میگوید O4 mini بهترین استفاده را برای وظایف فنی سریع مانند پرسوجوهای سریع مرتبط با علم، فناوری، مهندسی و ریاضیات دارد. همچنین، این شرکت میگوید که این مدل برای استدلال بصری مانند استخراج نقاط داده کلیدی از یک فایل CSV یا ارائه خلاصه سریع یک مقاله علمی، ایدهآل است.