هوش مصنوعی ذهن شما را می‌خواند و به متن تبدیل می‌کند

به گزارش خبرگزاری مهر، دانشمندان با استفاده از هوش مصنوعی، روش جدیدی برای تبدیل افکار به متن ابداع کرده‌اند که نیازی به ساعت‌ها اسکن مغزی و آموزش طولانی‌مدت ندارد.

این فناوری با بهره‌گیری از یک اسکن مغزی سریع و الگوریتم‌های پیشرفته، قادر است افکار فرد را به‌طور تقریبی به متن تبدیل کند. این دستاورد می‌تواند به افراد مبتلا به آفازی (اختلال در تکلم) کمک کند تا به راحتی با دیگران ارتباط برقرار کرده و افکار خود را بیان کنند.

نکته جالب آن است که این سیستم حتی با استفاده از تصاویر بی‌صدا نیز قادر به رمزگشایی افکار فرد است؛ موضوعی که نشان‌دهنده وجود ارتباط عمیق بین نحوه بازنمایی ایده‌ها از طریق زبان و روایت‌های بصری در مغز است.

تیمی از پژوهشگران الگوریتمی توسعه داده‌اند که به یک «رمزگشای مغزی» مجهز به هوش مصنوعی امکان می‌دهد پس از آموزش بر روی مغز یک فرد، افکار فرد دیگری را با حداقل داده آموزشی ترجمه کند.

دانشمندان در این پیشرفت جدید، از هوش مصنوعی برای تبدیل افکار به متن استفاده کرده‌اند. الگوریتم تازه می‌تواند رمزگشای موجود را به‌سرعت برای مغز افراد دیگر سازگار و آموزش دهد. این یافته‌ها در آینده می‌تواند به افراد مبتلا به آفازی ـ نوعی اختلال مغزی که توانایی برقراری ارتباط را مختل می‌کند ـ کمک کند.

رمزگشای مغزی با بهره‌گیری از یادگیری ماشینی، افکار فرد را بر اساس پاسخ‌های مغزی او هنگام گوش دادن به داستان‌ها، به متن تبدیل می‌کند. با این حال، نسخه‌های پیشین این سامانه نیازمند آن بودند که شرکت‌کنندگان ساعت‌ها در دستگاه MRI به داستان‌ها گوش دهند و در نهایت نیز رمزگشا تنها برای همان فردی که داده‌هایش مبنای آموزش بود، کارایی داشت.

الکساندر هوث (Alexander Huth)، عصب‌شناس محاسباتی در دانشگاه تگزاس در آستین، می‌گوید: «افراد مبتلا به آفازی اغلب در درک و تولید زبان با مشکل مواجه‌اند. در چنین شرایطی ممکن است اساساً نتوانیم برای مغز آن‌ها مدلی بسازیم.»

در پژوهش جدید که ۶ فوریه در نشریه Current Biology منتشر شد، هوث و نویسنده اول مقاله، جری تانگ (Jerry Tang)، دانشجوی دکتری دانشگاه تگزاس در آستین، به دنبال راهی برای رفع این محدودیت بودند. هوث می‌گوید: «در این مطالعه می‌خواستیم بدانیم آیا می‌توانیم رویکرد متفاوتی در پیش بگیریم؟»

هوث می‌گوید: «آیا می‌توانیم رمزگشایی را که برای مغز یک فرد ساخته‌ایم، به مغز فرد دیگری منتقل کنیم؟»

پژوهشگران ابتدا رمزگشای مغزی را به روش سنتی روی چند شرکت‌کننده مرجع آموزش دادند؛ به این صورت که از آن‌ها هنگام گوش دادن به ۱۰ ساعت داستان‌های رادیویی، داده‌های fMRI جمع‌آوری شد.

سپس دو الگوریتم «مبدل» (Converter) را اجرا کردند: یکی بر اساس داده‌هایی که هنگام گوش دادن به ۷۰ دقیقه داستان صوتی ثبت شده بود و دیگری بر پایه داده‌های به‌دست‌آمده از تماشای ۷۰ دقیقه فیلم‌های بی‌صدای پیکسار ـ که ارتباطی با داستان‌های صوتی نداشتند.

با استفاده از تکنیکی به نام «تطابق عملکردی» (Functional Alignment)، پژوهشگران نقشه‌ای از نحوه پاسخ مغز شرکت‌کنندگان مرجع و هدف به یک محتوای مشابه (شنیداری یا تصویری) تهیه کردند. آن‌ها سپس بدون نیاز به جمع‌آوری ساعت‌ها داده آموزشی، از این اطلاعات برای سازگار کردن رمزگشا با مغز شرکت‌کنندگان هدف استفاده کردند.

در مرحله بعد، عملکرد رمزگشاها با داستانی آزمایش شد که هیچ‌یک از شرکت‌کنندگان پیش‌تر آن را نشنیده بودند. هرچند پیش‌بینی‌های رمزگشا برای شرکت‌کنندگان مرجع دقیق‌تر بود، اما واژه‌های پیش‌بینی‌شده بر اساس اسکن مغزی شرکت‌کنندگان هدف نیز از نظر معنایی با محتوای اصلی داستان هم‌خوانی داشت.

برای نمونه، در بخشی از داستان آزمایشی، فردی از نارضایتی خود نسبت به شغلش می‌گوید: «من پیشخدمت یک بستنی‌فروشی هستم. نمی‌دانم دقیقاً چه می‌خواهم، اما می‌دانم این درست نیست.»

رمزگشایی که با استفاده از الگوریتم مبدلِ آموزش‌دیده بر اساس فیلم تنظیم شده بود، این بخش را چنین پیش‌بینی کرد: «من شغلی داشتم که فکر می‌کردم خسته‌کننده است. باید سفارش می‌گرفتم و از آن خوشم نمی‌آمد، اما باز هم هر روز روی آن کار می‌کردم.»

هرچند رمزگشا صداهای دقیقی که فرد شنیده را تکرار نمی‌کند، اما ایده‌های کلی یکسان باقی می‌مانند. نکته جالب و شگفت‌انگیز، به گفته هوث به Elucid Science، این است که «واقعاً بدون استفاده از داده‌های زبانی هم می‌توانیم این کار را انجام دهیم. یعنی فقط با داده‌هایی که هنگام تماشای ویدیوهای بی‌صدا جمع‌آوری شده، می‌توانیم رمزگشای زبانی برای مغز فرد بسازیم.»

پژوهشگران معتقدند استفاده از مبدل‌های مبتنی بر ویدیو برای انتقال رمزگشاهای موجود به افراد مبتلا به آفازی می‌تواند به آن‌ها کمک کند تا افکار خود را بیان کنند. این تحقیق همچنین نشان می‌دهد که مغز انسان مفاهیم را صرف‌نظر از قالب ارائه (زبان یا تصویر) به شکل مشابه بازنمایی می‌کند.

یوکییاسو کامیتانی، عصب‌شناس محاسباتی در دانشگاه کیوتو، می‌گوید: «این مطالعه نشان می‌دهد که یک بازنمایی معنایی وجود دارد که اهمیتی نمی‌دهد از کدام کانال (زبان یا تصویر) آمده باشد.»

گام بعدی تیم تحقیقاتی، آزمایش این مبدل بر روی افراد مبتلا به آفازی و «ساخت یک رابط کاربری است که به آن‌ها کمک کند زبان مورد نظرشان را تولید کنند.»

هوش مصنوعی ذهن شما را می‌خواند و به متن تبدیل می‌کند

بیشتر بخوانید