گزارشی تازه میگوید OpenAI درحال نمایش یک مدل هوش مصنوعی چندوجهی جدید به برخی از مشتریان خود بوده است. این مدل میتواند با شما حرف بزند و اشیا را از طریق دوربین شناسایی کند. این مدل احتمالاً در قالب یک دستیار هوش مصنوعی پرکاربرد در رویداد روز دوشنبه این شرکت معرفی میشود و حتی قادر به تشخیص گزارههای طعنهآمیز است.
وبسایت The Information به نقل از چند منبع آگاه میگوید مدل هوش مصنوعی چندوجهی جدید OpenAI در مقایسه با مدلهای فعلی این شرکت، میتواند با سرعت و دقت بالاتری تصاویر و صداها را تفسیر کند. این مدل ظاهراً قادر است به نیروهای بخش خدمات مشتریان کمک کند تا بهتر لحن صدای مخاطبان را درک کنند و حتی تشخیص بدهد که یک فرد دارد بهصورت طعنهآمیز صحبت میکند یا خیر.
افزونبراین، گزارش حاضر میگوید مدل هوش مصنوعی جدید OpenAI میتواند به دانشآموزان در حل مسائل ریاضی و ترجمه علامتهای مختلف در دنیای واقعی کمک کند. منابع وبسایت اینفورمیشن ادعا میکنند که این مدل در پاسخگویی به برخی از انواع سؤالات بهتر از GPT-4 Turbo عمل میکند، اما همچنان مستعد خطاکردن و ارائه پاسخهای اشتباه است.
مدلهای چندوجهی مدلهایی هستند که میتوانند نه فقط متن، بلکه ورودیهای گوناگون دریافت کنند. برای مثال، گفته میشود که این دستیار جدید OpenAI میتواند از دوربین استفاده کند و دنیای پیرامون کاربر را ببیند و دادههای آن را پردازش کند. بهعلاوه، این مدل میتواند درباره چیزهایی که میبینید با کاربر صحبت کند.
ChatGPT هم تا حدی میتواند این کارها را همین حالا انجام دهد، اما همه این قابلیتها از طریق یک رابط کاربری در دسترس نیست. پس اگر OpenAI فردا از دستیار دیجیتالی جدیدی با تجمیع همه این قابلیتهای پیشرفته رونمایی کند، میتواند رقیبی شایسته توجه برای دستیارهای هوش مصنوعی گوگل و حتی اپل که در آینده قرار است متحول شود، داشته باشد.
همچنین، توسعهدهندهای در شبکه اجتماعی ایکس کدهایی را پیدا کرده است که احتمالاً به قابلیتی برای برقراری تماس در اپلیکیشن ChatGPT اشاره دارد.
همانطور که «سم آلتمن»، مدیرعامل OpenAI تأیید کرده بود، در رویداد دوشنبه خبری از GPT-5 یا موتور جستجو نخواهد بود.