بهکارگیری الگوریتمهای پیشرفته دادهمحور میتواند به بهبود دقت نقشهبرداری پتانسیل معدنی و کاهش آثار زیستمحیطی عملیات اکتشافی کمک کند. به بیان دیگر، روشهای یادگیری ماشین اکنون در خدمت اکتشاف و نقشهبرداری منابع معدنی قرار گرفتهاند تا با افزایش دقت، نیاز به حفاریهای پراکنده و پرهزینه را کاهش دهند. این تحول دیجیتال در صنعت معدن، نویدبخش افزایش چشمگیر بهرهوری و سرعت در شناسایی ذخایر جدید است. با این حال، دادههای علوم زمین ذاتا پیچیده، ناهمگون و چندمقیاسی هستند. چالشهایی نظیر ناکافیبودن دادههای برچسبخورده، تفاوت شرایط زمینشناسی مناطق مختلف و نیاز به تفسیر قابل اعتماد خروجی مدلها، هنوز پابرجاست. برای غلبه بر این مشکلات، نسل جدیدی از مدلهای هوش مصنوعی با عنوان مدلهای بنیادین (Foundation Models) معرفی شدهاند. این مدلهای عظیم که بر حجم بسیار بزرگی از دادهها پیشآموزش شدهاند، قابلیت تعمیم و استدلال فراتری نسبت به مدلهای سنتی نشان میدهند. بهویژه مدلهای زبانی بزرگ (LLM) با میلیاردها پارامتر، توانایی درک و تولید متن در حد انسان را کسب کردهاند و حتی بهصورت چندرسانهای آموزش دیدهاند.
اکتشاف منابع معدنی ذاتا یک فعالیت میانرشتهای است که علوم زمین و مهندسی معدن را با علوم داده و فناوری اطلاعات پیوند میدهد. دادههای اکتشافی شامل انواع مختلفی هستند: از دادههای کمّی اندازهگیریشده در آزمایشگاههای ژئوشیمی گرفته تا دادههایبرداری و تصویری در ژئوفیزیک و سنجش از دور و همچنین مشاهدات کیفی و توصیفی زمینشناسان در گزارشها و لاگهای حفاری. ترکیب و تفسیر این دادههای چندمنظوره برای شناسایی مناطق امیدبخش معدنی اهمیت حیاتی دارد.
در گذشته، زمینشناسان عمدتا به تجربه و تفسیر دستی این دادهها اتکا میکردند؛ اما امروزه الگوریتمهای یادگیری ماشین و یادگیری عمیق به یاری آنها آمدهاند شرکتهای معدنی پیشرو دریافتهاند که با بهرهگیری از الگوریتمهای پیشرفته میتوان سیگنالهای ضعیف را در میان انبوه دادهها شناسایی کرده و اهداف امیدبخش را سریعتر و با هزینه کمتر مشخص کرد؛ برای مثال، شرکت Rio Tinto با استفاده از تحلیلهای دادهمحور موفق به کشف ذخیره بزرگ مس به نام پروژه Winu شد که یکی از اکتشافات مهم سالهای اخیر بهشمار میآید. همچنین بیاچپی (BHP)، بزرگترین شرکت معدنکاری جهان اعلام کرده است که ذخایر سطحی تا حد زیادی کشف شدهاند و دستیابی به ذخایر عمیقتر نیازمند رویکردهای نوین دادهمحور است. این شرکت با تاکید بر ترکیب دادههای تاریخی، هوش مصنوعی و تخصص زمینشناسی در تلاش است آنچه را که پیشتر پنهان بوده، کشف کند. بنابراین، پیوند عمیق میان علوم زمین و علوم داده، مسیر آینده اکتشافات معدنی را ترسیم میکند.
حوزه تقاطع هوش مصنوعی زبانمحور و علوم زمین در سالهای اخیر شاهد پیشرفتهای چشمگیری بوده است. پژوهشگران دانشگاهی مدلهای زبانی بزرگ را برای کاربردهای زمینشناسی تخصصیسازی کردهاند و موفقیتهای جالب توجهی بهدست آوردهاند. در این بخش، به چند نمونه از دستاوردهای مهم علمی اشاره میکنیم:
- مدلهای زبانی زمینشناسی تخصصی: یکی از پیشرفتهای برجسته، توسعه مدلهای زبانی عظیم مختص علوم زمین بوده است. برای مثال، در سال2023 مدلی به نام GeoGalactica معرفی شد که یک LLM با 30میلیارد پارامتر ویژه حوزه ژئوساینس است. این مدل با پردازش 65میلیارد کلمه از متون علمی زمینشناسی و همچنین روی مجموعهای از پرسشوپاسخهای تخصصی آموزش دیده است. GeoGalactica بهعنوان بزرگترین مدل زبانی زمینشناسی تاکنون شناخته میشود و بهصورت متنباز در اختیار محققان قرار گرفته است. آزمایشها نشان داده که این مدل در پاسخگویی به سوالات دشوار زمینشناسی و انجام وظایف مختلف پردازش زبان مانند استخراج دانش و طبقهبندی اسناد بهتر از مدلهای عمومی عمل میکند. این نشاندهنده پتانسیل بالای مدلهای عظیم در ادغام و بهکارگیری دانش نهفته در متون تخصصی است. بهطور مشابه، مدلOceanGPT برای علوم اقیانوسی و مدلCnGeoPLM برای متون زمینشناسی به زبان چینی توسعه یافتهاند که هر دو کارآیی چشمگیری در وظایف تخصصی نشان دادهاند.
- پردازش متون اکتشافی و پیشبینی پتانسیل معدنی: در زمینه کاربرد مستقیم NLP در اکتشاف، کار Lawley و همکاران (2023) قابل توجه است که نشان دادند با بهکارگیری مدلهای زبانی میتوان از میان انبوه دادههای متنی، به پیشبینی مناطق پتانسیلدار پرداخت. این پژوهش با تحلیل خودکار گزارشهای قدیمی اکتشاف و مقالات علمی، روابط پنهان بین حضور عناصر خاص، سنگشناسی و ساختارهای زمینشناسی را استخراج کرد و سپس برای هر منطقه امتیاز پتانسیل معدنی ارائه داد. دقت این روش در تطابق با یافتههای میدانی نشان داد که NLP میتواند بهعنوان ابزاری برای اکتشاف دانشمحور عمل کند. همچنین پژوهش دیگری در سال2024 توسط Pyo و Chiang معرفی شد که رویکردی خلاقانه برای پیونددهی خودکار سوابق معدنی ارائه میداد. در این روش، ابتدا یک مدل زبانی بزرگ (LLaMA) حجم زیادی از دادههای خام مربوط به مکانهای معدنی را برچسبگذاری میکند و ارتباط بین رکوردهای پراکنده (با نامهای متفاوت یا مختصات مبهم) را مانند یک کارشناس باتجربه تشخیص میدهد. سپس از این دادههای برچسبخورده برای آموزش یک مدل کوچکتر و سریعتر استفاده میشود تا بتوان تعداد عظیمی از رکوردها را بهصورت خودکار لینک کرد. نتیجه کار بسیار موفقیتآمیز بود. این سامانه ترکیبی دقت اتصال دادهها را 45درصد بیشتر از روشهای سنتی اعلام کرد و در عین حال بسیار سریعتر از استفاده مستقیم از یک LLM عظیم عمل کرد. به عبارتی، این رویکرد توانست سرعتبخشی به یکپارچهسازی دادههای قدیمی و جدید اکتشاف را محقق کند. برای مثال، در عمل یک شرکت معدن میتواند هزاران گزارش حفاری قدیمی را با دادههای نقشهبرداری جدید مرتبط کند و تصویر کاملتری از پتانسیل معدنی منطقه بهدست آورد.
- ترکیب مدلهای زبانی با دادههای مکانی: پروژه GeoMap-Bench و GeoMap-Agent (سال 2025) که با همکاری Microsoft Research Asia و آکادمی علوم زمین چین انجام شد، مثال خوبی از تلاش پژوهشی برای ارزیابی و ارتقای درک نقشههای زمینشناسی توسط AI است. آنها یک مجموعهداده بزرگ شامل ۷هزار نقشه زمینشناسی را گردآوری و ۳هزار پرسش استاندارد طراحی کردند تا توانایی مدلهای بینایی-زبانی در استخراج اطلاعات از نقشهها را بسنجند. سپس دستیار GeoMap-Agent بر پایه GPT-4 توسعه یافت که با راهبردهای خاص (استخراج سلسلهمراتبی اطلاعات نقشه، تزریق دانش تخصصی زمینشناسی به مدل، و بهبود پرامپتهای پرسش) توانست عملکرد بهتری در پاسخ به پرسشهای پیچیده از روی نقشه نشان دهد. این سامانه قادر است جزئیاتی نظیر عنوان، مقیاس، راهنمای نقشه، اسامی لایهها و گسلها را تشخیص داده و حتی به سوالات استنتاجی مانند «کدام بخش نقشه بیشترین خطر زمینلرزه را دارد؟» پاسخ دهد. نتایج این تحقیق مسیر را برای توسعه دستیارهای هوشمند نقشهخوان زمینشناسی هموار کرده که میتوانند بهطور بالقوه توسط شرکتهای اکتشافی برای تحلیل سریعتر نقشههای مناطق جدید بهکار گرفته شوند.
بهطور خلاصه، در محافل علمی ترکیب مدلهای زبانی بزرگ با مسائل علوم زمین بهعنوان حوزهای مهم مطرح است و مقالات متعددی در دو سال اخیر منتشر شدهاند. برخی دیگر از کارهای قابل ذکر شامل مدل GPT4GEO میشود که به بررسی اطلاعات جغرافیایی جهانی با رویکرد زبانمحور پرداخته است و نیز تحقیقات در زمینه ایجاد Embeddingهای مکانمبنای بزرگمقیاس برای تلفیق مختصات جغرافیایی در بردارهای زبانی است. این روند پژوهشی نشان میدهد که جامعه علمی در حال پایهریزی چارچوبهایی است که در آینده میتوانند بهطور مستقیم در صنعت اکتشاف معدن بهکار گرفته شوند.
* دکترای اکتشاف معدن و عضو کارگروه هوش مصنوعی موسسه یونیدرو