این نتایج برای نخستین بار نشان داد که سیستمهای هوش مصنوعی از آستانه کسب مدال طلا در المپیاد بینالمللی ریاضی (IMO) برای دانشآموزان دبیرستانی عبور کردند. مدلهای هر دو شرکت، پنج مورد از شش مساله را حل کردند و با استفاده از مدلهای «استدلال» عمومی که مفاهیم ریاضی را با استفاده از زبان طبیعی پردازش میکنند، به این نتیجه دست یافتند، برخلاف رویکردهای قبلی که توسط شرکتهای هوش مصنوعی استفاده میشد.
در حالی که گوگل دیپمایند با IMO همکاری میکرد تا مدلهایش توسط کمیته درجهبندی و تایید شوند، اوپن ایآی بهطور رسمی وارد رقابت نشد. این استارتآپ روز شنبه اعلام کرد که مدلهایش در سوالات امسال، با استناد به نمرات سه مدالآور خارجی IMO، امتیازی در حد مدال طلا کسب کردهاند.
به گفته جونهیوک جونگ، استاد ریاضی دانشگاه براون و محقق میهمان در واحد هوش مصنوعی دیپمایند گوگل، این دستاورد نشان میدهد که هوش مصنوعی کمتر از یک سال دیگر توسط ریاضیدانان برای حل مسائل تحقیقاتی حل نشده در مرزهای این حوزه مورد استفاده قرار خواهد گرفت. یونگ به رویترز گفت: «فکر میکنم لحظهای که بتوانیم مسائل استدلالی دشوار را به زبان طبیعی حل کنیم، پتانسیل همکاری بین هوش مصنوعی و ریاضیدانان را افزایش خواهد یافت.»
به گفته نوام براون، محقق اوپن ایآی، این موفقیت اوپن ایآی با یک مدل آزمایشی جدید با محوریت افزایش مقیاس انبوه «محاسبات زمان آزمایش» حاصل شد. این کار با فراهم کردن امکان «تفکر» مدل برای دورههای طولانیتر و همچنین بهکارگیری قدرت محاسباتی موازی برای اجرای همزمان چندین خط استدلال انجام شد. براون از بیان میزان هزینه قدرت محاسباتی برای اوپن ایآی خودداری کرد، اما آن را «بسیار گران» خواند. برای محققان اوپن ایآی، این نشانه روشن دیگری است که مدلهای هوش مصنوعی میتوانند قابلیتهای استدلال گستردهای را در اختیار داشته باشند که میتواند به حوزههای دیگری فراتر از ریاضی گسترش یابد.
یونگ، که در سال ۲۰۰۳ به عنوان دانشآموز مدال طلای IMO را کسب کرد، گفت که این خوشبینی توسط محققان گوگل نیز به اشتراک گذاشته شده است، که معتقدند قابلیتهای مدلهای هوش مصنوعی میتواند در حل معماهای تحقیقاتی در زمینههای دیگر مانند فیزیک کاربرد داشته باشد.
واحد هوش مصنوعی دیپمایند گوگل سال گذشته با استفاده از سیستمهای هوش مصنوعی تخصصی ریاضی، مدال نقره را کسب کرد. امسال، گوگل از یک مدل همهمنظوره به نام Gemini Deep Think استفاده کرد که نسخهای از آن قبلا در کنفرانس سالانه توسعهدهندگان در ماه مه رونمایی شده بود. این شرکت در یک پست وبلاگی اعلام کرد، برخلاف تلاشهای قبلی هوش مصنوعی که به زبانهای رسمی و محاسبات طولانی متکی بودند، رویکرد امسال گوگل کاملا به زبان طبیعی عمل کرد و مسائل را در محدوده زمانی رسمی ۴.۵ ساعته حل کرد.
طبق پستی که توسط «الکساندر وِی» محقق حوزه هوش مصنوعی در پلتفرم رسانه اجتماعی ایکس منتشر شده است، اوپن ایآی که مجموعه مدلهای استدلال خاص خود را دارد، بهطور مشابه یک نسخه آزمایشی برای این رقابت ساخته است. او خاطرنشان کرد که این شرکت قصد ندارد تا چند ماه آینده چیزی با این سطح از توانایی ریاضی منتشر کند.