روش تشخیص ناهنجاری
روش تشخیص ناهنجاری (به انگلیسی: anomaly detection) که به عنوان تشخیص دورافتاده (به انگلیسی: outlier detection) نیز شناخته شده، به تشخیص الگوهای موجود در یک مجموعه اطلاعات داده شده، که با رفتار بهنجار (نرمال) از پیش مقررشده، مطابقت ندارد، اشاره دارد. بنابراین الگوهای تشخیص داده شده، ناهنجاریها نامیده میشوند و اغلب به اطلاعات حیاتی و کارآمد، در چندین حوزهٔ کاربرد، ترجمه میشوند. همچنین ناهنجاریها به عنوان دورافتادگی، تغییر، انحراف، تعجب، نابجایی، صفات عجیب، نفوذ و غیره ارجاع میشوند.
بطور خاص، در زمینه تشخیص سوءاستفاده و نفوذ به شبکه، موارد جالب اغلب موارد نادر نیستند، اما انفجارات غیرمنتظره درکار است. این الگو به یک تعریف آماری مشترک از دورافتادگی، به عنوان به عنوان یک شیء نادر پایبند نیست؛ و بسیاری از روشهای تشخیص دورافتادگی (بویژه در روش بدون نظارت)، بر روی تعدادی دادهها ناموفق است، مگر آنکه بطور مناسب توزیع شده باشد. در عوض، یک الگوریتم تجزیه و تحلیل خوشهای ممکن است قادر به تشخیص خردخوشههای[۱] تشکیل شده توسط این الگوها، باشد.
سه دستهٔ گسترده از فنون تشخیص ناهنجاری وجود دارد. فنون تشخیص نابهنجاری بدون ناظر، ناهنجاریها را در یک مجموعهٔ دادهٔ تست بدون برچسب، تحت این فرض که اکثریت موارد در مجموعه دادهها بهنجار هستند و با گشتن به دنبال مواردی که حداقل تناسب را با بقیه مجموعه داده هادارند، تشخیص میدهند. فنون تشخیص نابهنجاری باناظر، نیاز به یک مجموعهٔ دادهها دارند که که با عنوان بهنجار و نابهنجار نشان دار شده و شامل آموزش طبقه بندی شده(تفاوت کلیدی بسیاری از مسایل طبقه بندی آماری، ماهیت نامتعادل ذاتی، ناشی ازتشخیص دورافتادگی است) باشند. فنون تشخیص نابهنجاری نیمهنظارتی یک مدل که نشان دهنده رفتار طبیعی با توجه به یک مجموعه دادهاست، میسازند و سپس، احتمال یک مورد تست تولیدی بوسیلهٔ مدل آموخته شده را میسنجند.
محتویات |
[ویرایش] کاربرد
تشخیص ناهنجاری، در حوزههای مختلف، مانند سامانه تشخیص نفوذ[۲]، تشخیص تقلب، عیب یابی، نظارت بر سلامت سامانه، تشخیص رویداد در شبکههای حسگر، و تشخیص اختلالات سیستم سازگار با محیط زیست قابل اجرا است. این روش اغلب در پردازش بمنظور حذف دادههای غیرعادی از مجموعه دادهها، بکار میرود. در یادگیری تحت نظارت، حذف دادههای غیرعادی از مجموعه داده، اغلب منجر به افزاش معنی دار آماری در دقت میشود.
[ویرایش] روشهای رایج
چندین روش تشخیص ناهنجاری در متون ارایه شدهاست. بعضی از روشهای رایج عبارت اند از:
- روشهای مبتنی بر فاصله
- یک کلاس پشتیبانی ماشینهای بردار
- تکرارگر شبکههای عصبی
- تجزیه و تحلیل خوشه برپایه تشخیص دورافتادگی
- تاکید بر سوابق انحراف از قوانین انجمن
- مفهوم ناهنجاری مشروط
[ویرایش] کاربرد در امنیت داده
تشخیص ناهنجاری برای سامانههای تشخیص نفوذ (IDS) درسال ۱۹۸۶ توسط دوروتی دنینگ[۳] ارایه شد. پیش از آن، تشخیص ناهنجاری برای IDSها به طور معمول با آستانهها و آمار انجام می شدهاست. اما با محاسبات نرمافزاری و یادگیری استقرایی نیز می تواندانجام شود. انواع آمار ارایه شده در ۱۹۹۹، شامل پروفایلهای کاربران، ایستگاههای کاری، شبکهها، میزبانهای کنترل شده از راه دور، گروههای کاربران و برنامههای بر اساس فرکانس، میانگین، واریانس، کووراریانس (همبستگی) و انحراف استاندارد بود. همتای دیگر روش تشخیص ناهنجاری در تشخیص نفوذ، تشخیص سوءاستفاده است.
[ویرایش] منابع و پانویسها
- مشارکتکنندگان ویکیپدیا، «Anomaly detection»، ویکیپدیای انگلیسی، دانشنامهٔ آزاد.