به گزارش خبرگزاری مهر، دانشمندان با استفاده از هوش مصنوعی، روش جدیدی برای تبدیل افکار به متن ابداع کردهاند که نیازی به ساعتها اسکن مغزی و آموزش طولانیمدت ندارد.
این فناوری با بهرهگیری از یک اسکن مغزی سریع و الگوریتمهای پیشرفته، قادر است افکار فرد را بهطور تقریبی به متن تبدیل کند. این دستاورد میتواند به افراد مبتلا به آفازی (اختلال در تکلم) کمک کند تا به راحتی با دیگران ارتباط برقرار کرده و افکار خود را بیان کنند.
نکته جالب آن است که این سیستم حتی با استفاده از تصاویر بیصدا نیز قادر به رمزگشایی افکار فرد است؛ موضوعی که نشاندهنده وجود ارتباط عمیق بین نحوه بازنمایی ایدهها از طریق زبان و روایتهای بصری در مغز است.
تیمی از پژوهشگران الگوریتمی توسعه دادهاند که به یک «رمزگشای مغزی» مجهز به هوش مصنوعی امکان میدهد پس از آموزش بر روی مغز یک فرد، افکار فرد دیگری را با حداقل داده آموزشی ترجمه کند.
دانشمندان در این پیشرفت جدید، از هوش مصنوعی برای تبدیل افکار به متن استفاده کردهاند. الگوریتم تازه میتواند رمزگشای موجود را بهسرعت برای مغز افراد دیگر سازگار و آموزش دهد. این یافتهها در آینده میتواند به افراد مبتلا به آفازی ـ نوعی اختلال مغزی که توانایی برقراری ارتباط را مختل میکند ـ کمک کند.
رمزگشای مغزی با بهرهگیری از یادگیری ماشینی، افکار فرد را بر اساس پاسخهای مغزی او هنگام گوش دادن به داستانها، به متن تبدیل میکند. با این حال، نسخههای پیشین این سامانه نیازمند آن بودند که شرکتکنندگان ساعتها در دستگاه MRI به داستانها گوش دهند و در نهایت نیز رمزگشا تنها برای همان فردی که دادههایش مبنای آموزش بود، کارایی داشت.
الکساندر هوث (Alexander Huth)، عصبشناس محاسباتی در دانشگاه تگزاس در آستین، میگوید: «افراد مبتلا به آفازی اغلب در درک و تولید زبان با مشکل مواجهاند. در چنین شرایطی ممکن است اساساً نتوانیم برای مغز آنها مدلی بسازیم.»
در پژوهش جدید که ۶ فوریه در نشریه Current Biology منتشر شد، هوث و نویسنده اول مقاله، جری تانگ (Jerry Tang)، دانشجوی دکتری دانشگاه تگزاس در آستین، به دنبال راهی برای رفع این محدودیت بودند. هوث میگوید: «در این مطالعه میخواستیم بدانیم آیا میتوانیم رویکرد متفاوتی در پیش بگیریم؟»
هوث میگوید: «آیا میتوانیم رمزگشایی را که برای مغز یک فرد ساختهایم، به مغز فرد دیگری منتقل کنیم؟»
پژوهشگران ابتدا رمزگشای مغزی را به روش سنتی روی چند شرکتکننده مرجع آموزش دادند؛ به این صورت که از آنها هنگام گوش دادن به ۱۰ ساعت داستانهای رادیویی، دادههای fMRI جمعآوری شد.
سپس دو الگوریتم «مبدل» (Converter) را اجرا کردند: یکی بر اساس دادههایی که هنگام گوش دادن به ۷۰ دقیقه داستان صوتی ثبت شده بود و دیگری بر پایه دادههای بهدستآمده از تماشای ۷۰ دقیقه فیلمهای بیصدای پیکسار ـ که ارتباطی با داستانهای صوتی نداشتند.
با استفاده از تکنیکی به نام «تطابق عملکردی» (Functional Alignment)، پژوهشگران نقشهای از نحوه پاسخ مغز شرکتکنندگان مرجع و هدف به یک محتوای مشابه (شنیداری یا تصویری) تهیه کردند. آنها سپس بدون نیاز به جمعآوری ساعتها داده آموزشی، از این اطلاعات برای سازگار کردن رمزگشا با مغز شرکتکنندگان هدف استفاده کردند.
در مرحله بعد، عملکرد رمزگشاها با داستانی آزمایش شد که هیچیک از شرکتکنندگان پیشتر آن را نشنیده بودند. هرچند پیشبینیهای رمزگشا برای شرکتکنندگان مرجع دقیقتر بود، اما واژههای پیشبینیشده بر اساس اسکن مغزی شرکتکنندگان هدف نیز از نظر معنایی با محتوای اصلی داستان همخوانی داشت.
برای نمونه، در بخشی از داستان آزمایشی، فردی از نارضایتی خود نسبت به شغلش میگوید: «من پیشخدمت یک بستنیفروشی هستم. نمیدانم دقیقاً چه میخواهم، اما میدانم این درست نیست.»
رمزگشایی که با استفاده از الگوریتم مبدلِ آموزشدیده بر اساس فیلم تنظیم شده بود، این بخش را چنین پیشبینی کرد: «من شغلی داشتم که فکر میکردم خستهکننده است. باید سفارش میگرفتم و از آن خوشم نمیآمد، اما باز هم هر روز روی آن کار میکردم.»
هرچند رمزگشا صداهای دقیقی که فرد شنیده را تکرار نمیکند، اما ایدههای کلی یکسان باقی میمانند. نکته جالب و شگفتانگیز، به گفته هوث به Elucid Science، این است که «واقعاً بدون استفاده از دادههای زبانی هم میتوانیم این کار را انجام دهیم. یعنی فقط با دادههایی که هنگام تماشای ویدیوهای بیصدا جمعآوری شده، میتوانیم رمزگشای زبانی برای مغز فرد بسازیم.»
پژوهشگران معتقدند استفاده از مبدلهای مبتنی بر ویدیو برای انتقال رمزگشاهای موجود به افراد مبتلا به آفازی میتواند به آنها کمک کند تا افکار خود را بیان کنند. این تحقیق همچنین نشان میدهد که مغز انسان مفاهیم را صرفنظر از قالب ارائه (زبان یا تصویر) به شکل مشابه بازنمایی میکند.
یوکییاسو کامیتانی، عصبشناس محاسباتی در دانشگاه کیوتو، میگوید: «این مطالعه نشان میدهد که یک بازنمایی معنایی وجود دارد که اهمیتی نمیدهد از کدام کانال (زبان یا تصویر) آمده باشد.»
گام بعدی تیم تحقیقاتی، آزمایش این مبدل بر روی افراد مبتلا به آفازی و «ساخت یک رابط کاربری است که به آنها کمک کند زبان مورد نظرشان را تولید کنند.»












