عرضه «چشم سوم دیجیتال» ؛ هوش مصنوعی، دنیا را برای نابینایان توصیف می‌کند

همشهری آنلاین چهارشنبه 12 آذر 1404 - 19:17
در روز جهانی توان‌یابان، خبرها حاکی از جهش بزرگ فناوری برای میلیون‌ها نفر در سراسر جهان است؛ عینک‌های هوشمند مجهز به هوش مصنوعی دیداری (Computer Vision) دیگر صرفاً ابزاری برای خواندن متن نیستند، بلکه به یک "چشم سوم دیجیتال" تبدیل شده‌اند.

همشهری آنلاین - حامد فوقانی: 3دسامبر (12آذر ماه) روز جهانی توان‌یابان است. همزمان با این روز فناوری‌های تازه‌ای هم برای معلولان و توان‌یابان رونمایی می‌شود که یکی از آنها برای امسال «چشم‌های سوم دیجیتال نسل جدید» بوده است. این گجت‌های پوشیدنی سبک، قادرند محیط اطراف را نه فقط ببینند، بلکه آن‌را درک و توصیف کنند؛ از حالات چهره افراد گرفته تا تشخیص موانع متحرک در لحظه. این فناوری نوید یک استقلال بی‌سابقه را برای افراد دارای معلولیت بینایی می‌دهد و راهی برای ورود به جامعه‌ای با دسترسی‌پذیری بالاتر باز می‌کند.


فراتر از خواندن: درک عمیق محیط با AI

نسل جدید فناوری‌های کمکی، مرزهای توانمندی را جابه‌جا کرده‌اند. در حالی که سال‌ها ابزارهای صوتی برای خواندن تابلوها یا بسته‌بندی‌ها استفاده می‌شد، این عینک‌ها با تکیه بر الگوریتم‌های پیشرفته یادگیری عمیق (Deep Learning)، عملاً مانند یک مفسر بصری عمل می‌کنند. این سیستم‌ها می‌توانند:

  • ناوبری فعال و ایمن: در محیط‌های شهری شلوغ، پیاده‌روهای نامناسب یا ایستگاه‌های مترو، عینک می‌تواند مسیرهای امن را در زمان واقعی مشخص کند و در صورت وجود موانع غیرمنتظره مانند دوچرخه‌ای که ناگهان متوقف می‌شود یا گودالی در مسیر، فوراً به کاربر هشدار دهد.
  • تشخیص هویت و احساسات: این فناوری قادر است به کاربر اعلام کند که «دوست شما، [نام شخص]، با لبخند روبروی شما ایستاده است و در حال تعارف کردن یک فنجان چای است.» این قابلیت، تعاملات اجتماعی را به شکل چشمگیری بهبود می‌بخشد.
  • توصیف صحنه پیچیده: کافی است کاربر فرمان دهد: «محیط را توصیف کن.» هوش مصنوعی با استفاده از مدل‌های زبانی بزرگ (LLMs) می‌تواند یک صحنه کامل را با جزئیات جذاب توضیح دهد؛ مثلاً: «شما در یک پارک هستید. کودکی در فاصله 3متری روی یک تاب قرمز در حال بازی است. نور خورشید از سمت راست می‌تابد.»

تلاش شرکت‌های پیشرو برای تسلط بر بازار جهانی

یکی از شرکت‌های پیشرو در این عرصه، اُرکم (OrCam) است که با محصولات سری MyEye خود شناخته می‌شود. این دستگاه کوچک که به سادگی روی قاب عینک نصب می‌شود، از پیشگامان استفاده از هوش مصنوعی برای خواندن و تشخیص چهره بود.

اما جدیدترین رقابت از سوی غول‌های فناوری و شرکت‌های نوپا است که از پلتفرم‌های قوی‌تر هوش مصنوعی بهره می‌برند:

  • ایمپرشنیسم (Envision): این شرکت با توسعه نرم‌افزار خود بر روی عینک‌های هوشمند مانند گوگل گلس (Google Glass)، تمرکز ویژه‌ای بر قابلیت‌های تشخیص متون چاپی، دست‌نویس و حتی متون روی صفحه نمایش گوشی هوشمند دارد. پلتفرم Envision به خاطر دقت بالا و سرعت پردازش داده‌های بصری خود مورد توجه است.
  • پروژه‌های تحقیقاتی: گروه‌های تحقیقاتی مانند آزمایشگاه CSAIL دانشگاه MIT نیز در حال کار بر روی الگوریتم‌هایی هستند که به AI اجازه می‌دهد مقاصد اشیاء را پیش‌بینی کند. برای مثال، اگر یک خودرو با سرعت خاصی در حال نزدیک شدن به تقاطع باشد، AI می‌تواند احتمال خطر را قبل از وقوع تشخیص داده و به کاربر هشدار دهد.

چالش‌ها و افق بومی‌سازی در ایران

اگرچه این فناوری‌های جذاب، زندگی را برای توان‌یابان راحت‌تر می‌کنند، بومی‌سازی آنها برای کشورهایی مانند ایران نیازمند تلاش مضاعف است. یکی از اصلی‌ترین چالش‌های اصلی پشتیبانی از زبان فارسی است؛ چراکه الگوریتم‌ها باید برای تشخیص و خواندن دقیق خط و متون فارسی و همچنین درک دستورات صوتی به زبان فارسی بهینه شوند.

با این حال، ورود این فناوری‌ها می‌تواند فرصتی طلایی برای متخصصان هوش مصنوعی در ایران فراهم کند تا با بومی‌سازی و توسعه نرم‌افزارهای داخلی، دسترسی‌پذیری را برای جامعه توان‌یابان ایران بهبود بخشند و از این پتانسیل بی‌نظیر برای ارتقای استقلال فردی بهره ببرند.

ببیشتر بخوانید:

آزمون عدالت اجتماعی

عینک هوشمند گوگل | ۹۹۹ دلار

منبع خبر "همشهری آنلاین" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.