الگوریتم آلفا

از ویکی‌پدیا، دانشنامهٔ آزاد

الگوریتم α یا α-miner الگوریتمی است که در کاوش فرایند (فرآیندکاوی) استفاده می‌شود و هدف آن بازسازی علت با استفاده از مجموعه‌ای از زنجیره اتفاقات است که اولین بار توسط van der Aalst , Weijters و Măruşter مطرح شد.[۱] هدف آلفا ماینر تبدیل گزارش رویداد، که بر اساس ارتباطات میان فعالیت‌های متفاوت انجام می‌پذیرد، به یک گردش کار شبکه محور در گزارش رویداد است. گزارش رویداد مجموعه ای از چندین ردیابی است و یک ردیابی، دنباله ای از اسم‌های هر فعالیت است. از آن زمان تا به حال تعدادی افزونه یا اصلاحاتی ارائه شده‌است که در زیر فهرست می‌شود.

آلفا ماینر اولین الگوریتم کشف فرایند (process discovery) بود که مطرح شد.

و همچنین یک نمای مناسبی از هدف کشف فرایند و اینکه چگونه فعالیت‌های مختلف داخل این فرایند اجرا می‌شوند، ارائه می‌دهد. آلفا ماینر همچنین اساس و پایه توسعه بسیاری از تکنیک‌های کاوش فرایند از جمله heuristic miner و genetic mining است که بر اساس ایده آلفا ماینر ساخته و توسعه داده شده‌است.

توضیح کوتاه[ویرایش]

این الگوریتم به عنوان ورودی، یک گزارش گردش کار می‌گیرد () که منجر به ایجاد یک شبکه گردش کار می‌شود.

این کار را با بررسی روابط علت و معلولی مشاهده شده در بین کارها انجام می‌دهد. به عنوان نمونه، در هر ردیابی اجرا، یک کار خاص ممکن است همیشه مقدم بر کار خاص دیگری باشد که این، اطلاعات مفیدی را ارائه خواهد داد.

تعاریف استفاده شده[ویرایش]

  • ردیابی گردش کار یا ردیابی اجرا، رشته ای است بر روی الفبایی از وظایف ()
  • گزارش گردش کار مجموعه ای از ردیابی گردش کار است.

گزارش[ویرایش]

گزارش رویداد از الزامات اولیه برای به کار بردن هر الگوریتم کشف فرایند است. هر گزارش رویداد متشکل از یک شناسه یکتا برای یک حالت و یک اسم فعالیت (که عمل رخ داده در فرایند و برچسب زمان آن عمل را توصیف می‌کند) است. یک گزارش رویداد را می‌توان به عنوان مجموعه ای از فعالیت‌ها نشان داد.

در مثال زیر برای سادگی، برای نشان دادن یک فعالیت از حروف الفبا استفاده می‌شود. یک نمونه گزارش رویداد را که در شکل زیر نشان داده شده‌است را در نظر بگیرید:

نمونه گزارش رویداد
شناسه مورد فعالیت برچسب زمان
۱ A ۲۰۱۹/۱۰/۰۹ ۱۴:۵۰:۱۷٫۰۰۰
۱ B ۲۰۱۹/۱۰/۰۹ ۱۵:۵۰:۱۷٫۰۰۰
۱ C ۲۰۱۹/۱۰/۰۹ ۱۵:۵۶:۱۷٫۰۰۰
۱ D ۲۰۱۹/۱۰/۱۰ ۱۳:۵۰:۱۷٫۰۰۰
۲ A ۲۰۱۹/۱۰/۱۰ ۱۴:۳۰:۱۷٫۰۰۰
۲ C ۲۰۱۹/۱۰/۱۰ ۱۴:۵۰:۱۴٫۰۰۰
۲ B ۲۰۱۹/۱۰/۱۱ ۰۹:۵۰:۱۷٫۰۰۰
۲ D ۲۰۱۹/۱۰/۱۱ ۱۰:۵۰:۱۷٫۰۰۰
۳ A ۲۰۱۹/۱۰/۱۱ ۱۲:۵۰:۱۷٫۰۰۰
۳ E ۲۰۱۹/۱۰/۲۱ ۱۴:۵۰:۱۷٫۰۰۰
۳ D ۲۰۱۹/۱۰/۲۱ ۱۵:۵۰:۱۷٫۰۰۰

یک گزارش رویداد مجموعه ای از چندین ردیابی است و هر ردیابی شامل دنباله ای از فعالیت‌ها است. در نتیجه، یک گزارش رویداد مانند مثال بالا را می‌توان با استفاده از نماد زیر نشان داد:

هر گزارش رویداد را می‌توان در مجموعه‌ای از ردیابی‌ها خلاصه کرد، و از چنین ردیابی‌هایی می‌توان برای تقسیم‌بندی روابط بین فعالیت‌های مختلف در فرایند استفاده کرد. بر اساس قوانین آلفا ماینر، فعالیت‌های مربوط به حالت‌های مختلف، می‌توانند ۴ نوع رابطه بینشان داشته باشند:

  • جانشینی مستقیم: x > y اگر و تنها اگر رابطه x مستقیماً توسط y دنبال شود. در مثال می‌توانیم در نظر بگیریم که A > B، A > E.
  • علیت: x → y اگر و تنها اگر x > y باشد و y > x نباشد. در مثال می‌توانیم A → E را در نظر بگیریم.
  • موازی: x || y اگر و تنها اگر x > y و y > x. در مثال داریم B ||C .
  • انتخاب: x # y اگر و تنها اگر x > y نباشد و y > x نباشد. در مثال داریم A # D.

الگوها[ویرایش]

Sequence Pattern

الگوی توالی: A → B

XOR-split Pattern

الگوی تقسیم XOR:

A → B A → C و B # C

AND-split Pattern

الگوی تقسیم AND:

A → B, A → C و B || C

شرح[ویرایش]

آلفا ماینر برای ایجاد شبکه پتری که مدل فرایند را توصیف می‌کند، شروع به تبدیل یک گزارش رویداد به روابط مستقیم، دنباله ای، انتخابی و موازی می‌کند. در ابتدا الگوریتم یک ماتریس ردپا را می‌سازد. با استفاده از ماتریس ردپا و الگوی نشان داده شده در بالا، می‌توان یک مدل فرایند ساخت. بر اساس چهار رابطه ایی که قبلاً توضیح داده شد، در ابتدا یک ماتریس مبتنی بر ردپا یافت می‌شود. با استفاده از ماتریس مبتنی بر ردپا، جایگاه‌ها نیز کشف می‌شوند که هر جایگاه برای اینکه تعداد جایگاه‌ها تا حد امکان کم باشد با یک جفت مجموعه وظایف شناسایی می‌شود.

ماتریس رد پای برای لاگ L1
a b c d e
a # #
b # || #
c || # #
d # #
e # # #
  • مجموعه تمام جفت‌ها است از حداکثر مجموعه وظایف به گونه ای که:
    • هیچ‌کدام از و شامل هر عضوی از > نباشند.
    • زیر مجموعه ای از است.
  • شامل یک مکان برای هر عضو ، به علاوه محل ورودی و محل خروجی .

رابطه جریان اجتماع موارد زیر است:

نتیجه این است:

  • ساختار شبکه پتری
  • با یک محل ورودی و یک محل خروجی
  • به خاطر اینکه هر گذار از ، روی مسیر از به است، در واقع یک شبکه گردش کار است.

برای مثال داده شده در بالا، شبکه پتری زیر حاصل کاربرد آلفا ماینر است.

Petri net for alpha miner example

خواص[ویرایش]

می‌توان نشان داد که شبکه تولیدکننده یک گزارش گردش کار کامل که توسط یک شبکه SWF صدا تولید می‌شود، می‌تواند بازسازی شود. کامل در اینجا به این معنی است که رابطه حداکثر است. لازم نیست که همه ردیابی‌های ممکن نمایش داده شود (که برای یک شبکه با یک حلقه بی‌نهایت خواهد بود).

محدودیت‌ها[ویرایش]

  • مکان‌های ضمنی: آلفا ماینر نمی‌تواند بین مکان‌های ضمنی و مکان‌های مورد نیاز تمایز قائل شود و در نتیجه ممکن است مکان‌های غیر ضروری اضافی را در شبکه پتری به وجود آمده ایجاد کند.
  • حلقه‌ها: آلفا ماینر نمی‌تواند حلقه‌هایی به طول ۱ و ۲ را در مدل فرایند کشف کند.
  • وابستگی‌های محلی اغلب در آلفا ماینر نادیده گرفته می‌شوند.
  • سوگیری بازنمایی: آلفا ماینر فقط می‌تواند شبکه پتری را کشف کند، بنابراین برای هر انتقال سوگیری بازنمایی را (مانند نیاز به برچسب‌های قابل مشاهده یکتا) را اضافه می‌کند.

منابع[ویرایش]

  1. van der Aalst, W M P and Weijters, A J M M and Maruster, L (2004). "Workflow Mining: Discovering process models from event logs", IEEE Transactions on Knowledge and Data Engineering, vol 16