هوش مصنوعی قصد دارد به کارشناسان امنیت سایبری در جمع آوری اطلاعات تهدیدات سایبری کمک کند.
به گزلرش عدل البرز به نقل از analyticsinsight ، در اقدامی بی سابقه، گروهی از دانشگاهیان کره جنوبی DarkBERT را ایجاد کردند. DarkBERT یک LLM (مدل زبانی مبتنی بر یادگیری ماشین) می باشد که فقط بر روی اطلاعات دارک وب آموزش دیده است. هدف آنها توسعه ابزار هوش مصنوعی است که از مدلهای زبان موجود بهتر عمل میکند و به محققان تهدید، مجریان قانون و کارشناسان امنیت سایبری در مبارزه با تهدیدات سایبری کمک میکند.
DarKBERT چیست؟
DarkBERT یک مدل رمزگذار مبتنی بر ساختار RoBERTa است که بر پایه تبدیلدهندهها (transformers) ساخته شده است. این مدل LLM بر روی میلیون ها صفحه دارک وب از جمله داده های انجمن های هکرها، وب سایت های کلاهبرداری و سایر منابع اینترنتی مجرمانه آموزش دیده است. عبارت دارک وب به منطقهای از اینترنت اشاره دارد که با استفاده از مرورگرهای استاندارد قابل دسترسی نمی باشد. این بخش به خاطر وبسایتها و بازارهای ناشناسش و فعالیتهای جنایی مانند قاچاق دادههای سرقتی، مواد مخدر و سلاحها مشهور می باشد.
محققان از شبکه Tor برای دسترسی به دارک وب و جمع آوری داده های خام برای آموزش DarkBERT استفاده کردند. آنها به دقت این داده ها را با استفاده از تکنیک هایی مانند حذف تکراری ها، توازن داده ها بین دسته ها و پیش پردازش غربال کردند تا یک پایگاه داده دقیق از دارک وب ایجاد کنند. در مرحله بعد، این پایگاه داده برای آموزش مدل RoBERTa به مدت حدود ۱۵ روز استفاده شد. این آموزش باعث تولید مدل DarkBERT شد که یک مدل رمزگذار بر پایه تبدیلدهنده می باشد و برای پردازش دادههای دارک وب استفاده میشود.
استفاده از DarkBERT در امنیت سایبری:
DarkBERT درک عمیقی از زبان مجرمان سایبری دارد و در شناسایی خطرات احتمالی خاص عالی عمل می کند. در واقع، میتواند تحقیقات دارک وب را انجام دهد و خطرات امنیت سایبری مانند نقض دادهها و باجافزار را با موفقیت کشف و برجسته کند و آن را به یک سلاح بالقوه ارزشمند در نبرد علیه تهدیدات سایبری تبدیل نماید.
بر اساس تحقیق منتشر شده، محققان DarkBERT را با دو مدل معروف NLP(پردازش زبان طبیعی)، BERT و RoBERTa مقایسه کردند و عملکرد آنها را در سه مورد کاربرد مرتبط با امنیت سایبری تجزیه و تحلیل کردند.
موضوعات بالقوه خطرناک را بر روی انجمن های دارک وب بررسی کنید:
نظارت بر انجمنهای دارک وب برای شناسایی موضوعات بالقوه خطرناک واقعاً حیاتی می باشد. این انجمنها به طور گسترده برای تبادل اطلاعات غیرقانونی استفاده میشوند و در آنها بحثها و فعالیتهای مرتبط با فعالیتهای جنایی رخ میدهد.
بررسی دستی این انجمنها ممکن است زمانبر و نیازمند زحمت بسیاری باشد. بنابراین، اتوماسیون این فرایند میتواند به متخصصان امنیت و پژوهشگران کمک زیادی کند. با استفاده از تکنیکهای پردازش زبان طبیعی (NLP) پیشرفته و مدلهای یادگیری ماشین مانند DarkBERT، میتوان مانیتورینگ و تجزیه و تحلیل انجمنهای دارک وب را به صورت اتوماتیک انجام داد. این اتوماسیون میتواند به شناسایی پستهای بالقوه مضر، پیگیری روندهای نوظهور و افزایش کارآیی کلی در شناسایی و کاهش تهدیدات کمک کند.
وب سایت هایی را که اطلاعات حساس را ذخیره می کنند، پیدا کنید:
هکرها و گروه های باج افزار از دارک وب برای راه اندازی سایت هایی جهت افشای اطلاعات مخفی سرقتی از شرکت هایی که از پرداخت باج امتناع می کنند، استفاده می کنند. برخی از کلاهبرداران فقط مطالب حساس افشا شده، مانند رمز عبور و اطلاعات بانکی را با هدف فروش آن ها در دارک وب پست می کنند.
شناسایی کلمات کلیدی مرتبط با تهدید در دارک وب:
DarkBERT از قابلیت fill-mask، یک ویژگی مدل زبان خانواده BERT، برای شناسایی قابل اعتماد عبارات مرتبط با فعالیت های مجرمانه، مانند تراکنش های مواد مخدر در دارک وب استفاده می کند. قابلیت DarkBERT در شناسایی عبارات مرتبط با اقدامات غیرقانونی ممکن است به شناسایی و حل خطرات جدید سایبری کمک کند.
استفاده از هوش مصنوعی برای تشخیص و پیشگیری از تهدید:
DarkBERT از قبل بر روی داده های دارک وب آموزش دیده و در طول موارد مختلف استفاده در حوزه امنیت سایبری، عملکرد بهتری نسبت به مدلهای زبانی موجود داشته است و به عنوان یک ابزار حیاتی در تحقیقات دارک وب تأیید شده است. این هوش مصنوعی که بر روی دادههای دارک وب آموزش دیده، میتواند در فعالیتهای مختلف امنیت سایبری مورد استفاده قرار گیرد، مانند شناسایی وبسایتهایی که اطلاعات شخصی نشر شده را به فروش میرسانند، مانیتورینگ انجمنهای دارک وب برای تبادل اطلاعات غیرقانونی و پیدا کردن کلمات کلیدی مرتبط با خطرات سایبری. با این حال، به خاطر داشته باشید که DarkBERT همانند سایر مدلهای زبانی مبتنی بر یادگیری ماشین، قابلیت پیشرفت دارد و با ادامه آموزش و تنظیمات دقیق، عملکرد آن میتواند بهبود یابد.
پایان پیام/