فرایندکاوی
فرایندکاوی یا کاوش فرایند (به انگلیسی: Process mining) موضوع نسبتاً جوانی میباشد که بین هوش محاسباتی و دادهکاوی از یک سو و مدلسازی فرایندهای سازمان و آنالیز از دیگر سو قرار میگیرد. هدف کاوش فرایند کشف، مانیتورینگ و ارتقای فرایندهای واقعی از طریق استخراج دانش از دادههای ذخیره شده قابل خوانش از سیستمهای اطلاعاتی امروزه میباشد. کاوش فرایند یا Process Mining بیشتر به آنالیز فرایندها با استفاده از دادههای رویداد (EventLogs) میپردازد. تکنیکهای کلاسیک دادهکاوی نظیر خوشه بندی، طبقهبندی، کاوش قانون و ... بر روی مدلهای فرایندی کسب و کار تمرکز ندارند و فقط برای آنالیز گام مشخصی در فرایند کلی استفاده میشوند. کاوش فرایند بر روی فرایندهای انتها به انتها تمرکز دارد. تکنیکهای فرایندکاوی از دادههای وقایع ثبت شده برای کشف و آنالیز و ارتقای فرایندهای کسب و کار استفاده میکنند. فرایندکاوی، به معنای کشف و مانیتورینگ و ارتقای فرایندهای واقعی با استفاده از دانش استخراج شده از نگارههای رویداد (Event Log) موجود در سیستمهای اطلاعاتی امروزه میباشد. هر رویداد ثبت شده به یک فعالیت اشاره دارد و مرتبط با یک مورد (نظیر یک نمونه فرایند) میباشد. مرجع اصلی فرایندکاوی سایت processmining.org میباشد. در این سایت آخرین اطلاعات در ارتباط با این حوزه نوظهور آورده شدهاست.
محتویات
انواع روشهای فرایندکاوی[ویرایش]
تکنیکهای فرایندکاوی، براساس دادههای ثبت شده رویداد، به سه دسته کلی تقسیمبندی میشوند:
- الف) تکنیکهای کشف فرایند (process discovery)
- ب) تکنیکهای چک کردن متابعت(conformance checking)
- ج) تکنیکهای کاوش سازمانی (organizational mining)
دسته اول یا همان تکنیکهای کشف فرایند، به عنوان ورودی، دادههای ثبتشده رویداد را دریافت کرده و یک مدل بدون استفاده از هیچ اطلاعات پیشینی تولید مینمایند. تکنیکهای چک کردن متابعت بررسی میکنند که آیا فرایند واقعی ایی که در حال اجرا در سازمان بوده و اطلاعات آن در فایل رویداد ثبت شدهاست منطبق با یک مدل هدف اولیه مدنظر میباشد و بلعکس. تکنیکهای دسته سوم هم به این موضوع میپردازند که آیا میشود با استفاده از دادههای رویداد ثبت شده یک فرایندرا ارتقا یا توسعه داد. به عنوان مثال با استفاده از برچسب زمانی در دادههای ثبت شده میتوان مدل را طوری توسعه داد که گلوگاهها، لایههای سرویس و زمان توان عملیاتی را نشان دهد. برخلاف روشهای آنالیز موجود، کاوش فرایند، فرایند محور میباشد و نه داده محور، کاملاً هوشمند و مبتنی بر حقایق. همچنین مرتبط با دادهکاوی میباشد. البته روشهای سنتی دادهکاوی مبتنی بر داده هستند ولی کاوش فرایند مبتنی بر فرایند میباشد.
یک مثال ساده از کاوش فرایند در سیستم آموزش[ویرایش]
به منظور آشنایی بیشتر با بحث کاوش فرایند، سیستم آموزش را در نظر بگیرید. اکثر دانشگاهها دارای سیستم آموزشی میباشند. دادههای سیستم آموزش حاوی اطلاعاتی از قبیل انتخاب واحدهای دانشجویان بهمراه درسی که انتخاب کردهاند و زمان و تعداد انتخابها در طول ترمهای مختلف میباشد. با استفاده از یک سیستم کاوش فرایند میتوان از روی این دادهها، چارت درسی که به نوعی فرایند تحصیلی یک دانشجو میباشد (کشف فرایند) را استخراج نمود. از طرف دیگر میتوان با استفاده از تکنیکهای چک کردن متابعت، میزان پیروی دانشجویان جدید از سرفصلهای از پیش تعیین شده را مشخص نمود و مشخص نمود که آیا دانشجو در انتخاب درسها، پیش نیازها و هم نیازهای آن درس را رعایت کردهاست یا خیر. همچنین با استفاده از تکنیکهای کاوش سازمانی میتوان گلوگاههای سیستم را شناسایی نموده و فرایند را ارتقا داد. مثلاً اینکه دانشجویان که در ترم خاصی درس مهندسی نرمافزار را پاس میکنند موفق تر هستند و بر مینای همین اطلاعات بدست آمده، چارت درسی را تغییر داد. همچنین میتوان با استفاده از تکنیکها برخی از رویدادها را پیشبینی نموده و بر مبنای آن اقداماتی انجام داد. مثلاً پیشبینی کرد که آیا این دانشجوی جدید الورود قادر هست که درس خود را به پایان برساند یا چند ترمه به پایان خواهد رساند و سپس بر مینای این اطلاعات، مشاورههایی را به بعضی از دانشجویان داد.
مقایسه فرایندکاوی با دادهکاوی[ویرایش]
در حقیقت تکنولوژی کاوش فرایند قدرت دادهکاوی و مدلسازی فرایند را ترکیب میکند؛ با تولید خودکار مدل فرایندها بر مبنای دادههای وقایع ثبت شده، کاوش فرایند منجر به ایجاد مدلهای زنده با قابلیت به روز رسانی بالا میشود.
- حجم عظیمی از دادهها
کاوش فرآند مشترکات زیادی با دادهکاوی دارد. دقیقاً مشابه دادهکاوی فرایندکاوی هم با چالش پردازش حجم بزرگ دادهها، که نمیتوان با دست انجام داد، مواجه است. سیستمهای فناوری اطلاعات دادههای زیادی دربارهٔ فرایندهای تجاری مورد پشتیبانی خود جمعآوری میکنند. این دادهها به خوبی بیانگر آنچه در دنیای واقعی اتفاق افتاده هستند و قابلیت استفاده برای درک و بهبود تجارت را دارند.
- دیدگاه فرایندی
بر خلاف دادهکاوی، فرایندکاوی بر دیدگاه فرایندی تمرکز میکند؛ یعنی شامل جنبههای موقتی و نگاه به یک اجرای فرایند از منظر تعدادی فعالیت اجرا شده میباشد. بیشتر تکنیکهای دادهکاویکاوی الگوهای انتزاعی را در قالبی مانند قوانین یا درخت تصمیم استخراج میکنند. اما فرایندکاوی مدل فرایندهای کاملی ایجاد میکند و سپس از آنها برای شناسایی گلوگاه استفاده میکند.
- استثناءها نیز مهم هستند
در دادهکاوی عمومیسازی به منظور جلوگیری از سرریز شدن دادهها امری بسیار مهم است. این یعنی میخواهیم تمام دادههایی را که با قانون کلی سازگاری ندارند دور بیندازیم. در فرایندکاوی نیز عمومیسازی کار کردن با فرایندهای پیچیده و درک جریان فرایندهای اصلی لازم است. همچنین در بیشتر موارد درک استثناءها به منظور کشف نقاط ناکارآمدی و نیازمند بهبود ضروری به نظر میرسد.
- تمرکز بر روی اکتشاف
در دادهکاوی معمولاً مدلها برای پیشبینی نمونههای مشابه در آینده استفاده میشوند. در واقع روشهای دادهکاوی و یادگیری ماشین کمی وجود دارند که مانند یک جعبه سیاه پیشبینیهایی تولید میکنند بدون اینکه امکان برگشت به عقب یا بیان علت آنها را داشته باشند. از آنجا که فرایندهای تجاری کنونی خیلی پیچیده هستند پیشبینیهای دقیق معمولاً غیر واقعی هستند. دانش بدست آمده و بینش عمیقتر نسبت به الگوهای و فرایندهای کشف شده به رفع پیچیدگی کمک خواهد کرد؛ بنابراین اگرچه دادهکاوی و فرایندکاوی مشترکات زیادی دارند اما تفاوتهای پایهای بین آنها در کاری که انجام میدهند و جایی که مورد استفاده قرار میگیرند وجود دارد.
چالشهای فرایندکاوی[ویرایش]
کاوش فرایند مهمترین ابزار برای سازمانهای مدرنی است که نیاز به مدیریت مناسب فرایندهای عملیاتی دارند. از یک سو با رشد باورنکردنی حجم داده روبرو هستیم و از دیگر سو فرایندها و اطلاعات باید بطور مناسبی جمعآوری شوند تا نیازمندیهای مربوط به کارایی، انطباق و سرویسهای مشتری پاسخ داده شود. علیرغم کاربردی بودن کاوش فرایند، هنوز چالشهای عمدهای پیش رو میباشد که باید مورد توجه قرار گیرد. در ذیل به این چالشها اشاره شدهاست.
- چالش اول: یافتن، ادغام کردن و تمیز کردن دادههای رویداد
در سیستمهای فعلی نیز انرژی زیادی باید صرف استخراج دادههای رویداد مناسب برای کاوش فرایند صورت گیرد. بهطور معمول، در این زمنیه چند مشکل وجود دارد که باید مرتفع گردد. برخی از این مشکلات عبارتند از:
- ممکن است دادهها بر روی چندین منبع توزیع شده باشد. این اطلاعات باید ادغام گردند. این مشکل زمانی حادتر میشود که از چندین شناسه برای منابع مختلف استفاده شود. مثلاً یک سیستم از نام و تاریخ تولد برای شناسایی افراد استفاده کند و سیستم دیگر از شماره امنیتی اجتماعی فرد.
- دادههای سازمانی غالباً object محور میباشند و نه فرایند محور. به عنوان مثال محصولات و ظرفها میتواند تگهای RFID ایی داشته باشند که خودکار منجر به ثبت رکورد گردند. برای رصد کردن سفارش یک مشتری، این اطلاعات شی محور باید ادغام و پیش پردازش شوند.
- دادههای رویداد ممکن است ناکامل باشند. یکی از رایجترین مشکلات این است که رویدادها به صورت صریح به نمونههای فرایند اشاره نمیکنند.
- دادههای رویداد ممکن است حاوی اطلاعات پرت باشد. منظور از دادههای پرت نمونههایی است که از الگوی عمومی پیروی نکرده و به ندرت اتفاق میافتند.
- لاگ ممکن است حاوی اطلاعاتی با سطوح مختلف دانهدانه شدن باشد. دادههای لاگ بیمارستانی ممکن است به یک تست خون ساده اشاره کند یا اینکه به یک رویه پیچیده جراحی اشاره نماید. همچنین برچسب زمانی هم میتواند از دقت میلی ثانیه (28-9-2011:h11m28s32ms342) تا اطلاعات درشتتر نظیر روز (۲۸-۹-۲۰۱۱) را شامل شود.
برای حل این مشکل نیاز به ابزارهای بهتر و متدولوژیهای مناسب تر میباشد. علاوه بر آن، همانطور که پیش تر نیز به آن اشاره شد، سازمانها باید با دادههای لاگ همانند شهروندان درجه یک برخورد کنند و نه به عنوان یک محصول جانبی.
- چالش دوم: استفاده از دادههای رویداد پیچیدهای که ویژگیهای گوناگونی دارند
دادههای لاگ ممکن است که ویژگیهای خیلی متنوعی داشته باشند. بعضی از دادههای لاگ ممکن است که آنچنان بزرگ باشند که رسیدگی به آنها دشوار باشد و بعضی از آنها ممکن است آنقدر کوچک باشند که نتوان نتایج قابل اطمینانی از آنها استحصال کرد. ابزارهای موجود در مواجه با دادههای با ابعاد پتابایت دشواریهایی دارند. در کنار تعداد رکوردهای رویدادهای ذخیره شده ویژگیهای دیگری نظیر متوسط تعداد رویدادها در هر حالت، شباهت میان حالتها، تعداد رویدادهای منحصر به فرد و تعداد مسیرهای واحد نیز هستند که باید مورد توجه قرار گیرند. به عنوان مثال فایل لاگ داده L1 با مشخصات ذیل را در نظر بگیرید: ۱۰۰۰ حالت، بهطور متوسط ۱۰ رویداد به ازای هر حالت. فرض کنید فایل لاگ L2 حاوی تنها ۱۰۰ حالت باشد اما هر حالت حاوی ۱۰۰ رویداد باشد و همه رویدادها از یک مسیر واحد تبعیت کنند. پر واضح است که آنالیز L2 بمراتب دشوارتر از آنالیز L1 میباشد، علیرغم اینکه هر دو فایل سایز برابر و یکسانی دارند. از آنجایی که دادههای لاگ تنها حاوی نمونههای مثال میباشند، بنابراین نباید اینطور فرض شود که آنها کامل هستند. تکنیکهای کاوش متن باید با استفاده از «فرض جهان باز» با این عدم کامل بودن کنار بیایند: این واقعیت که اگر پدیدهای اتفاق نمیافتد به معنای عدم امکان رخداد آن نیست. این موضوع تعامل با دادههای لاگ با سایز کم و حاوی تغییرات زیاد را دشوار میکند. همانطور که پیشتر هم اشاره شد، بعضی از فایلهای لاگ ممکن است حاوی رکوردهایی با سطح انتزاع بسیار پایین باشند. دادههای با سطح پایین چندان مطلوب ذی نفعان نمیباشند؛ بنابراین عموماً سعی میشود تا دادههای سطح پایین با همدیگر تجمیع شوند تا دادههای با سطح بالاتر تولید گردد. به عنوان مثال، زمانی که فرایند تشخیص و درمان گروهی از بیماران آنالیز میشود، احتمالاً دیگر علاقهمند به دانستن نتایج آزمایشها انفرادی افراد نیستیم. در این گونه از موارد، سازمانها لازم است که از روش سعی و خطا استفاده نمایند تا دریابند که آیا دادهها مناسب برای کاوش فرایند میباشند؛ بنابراین ابزارها باید سرویس آزمایش امکانسنجی سریع برای یک پایگاه داده مشخص را فراهم نمایند.
- چالش سوم: ایجاد شاخصههای ارزیابی
کاوش فرایند تکنولوژی نوظهوری میباشد. همین امر نشان میدهد که چرا نیاز به شاخصههای ارزیابی میباشد. به عنوان مثال تاکنون دهها تکنیک کشف فرایند ارائه شدهاست اما گزارش دقیقی از کیفیت این روشها در دسترس نمیباشد. علیرغم اینکه تفاوتهای زیادی در کارایی و عملکرد این تکنیکها وجود دارد، ارزیابیشان کار دشوار و پیچیدهای میباشد؛ بنابراین نیاز به دادههای استاندارد و همچنین معیارهای کیفیت مناسب به شدت احساس میشود. البته در این زمینه کارهای محدودی انجام شدهاست. از جمله معیارهای ارزیابی ارائه شده به چهار معیار سازگاری، سادگی، دقت و عمومیت میتوان اشاره نمود. همچنین دادههای رویداد ثبت شده هم در سایت فرایندکاوی موجود میباشد. از یک طرف باید شاخصها براساس دادههای واقعی باشد. از طرف دیگر نیاز به تولید پایگاه داده ترکیبی ایی میباشد که ویژگیهای خاصی داشته باشد.
- چالش چهارم: مواجه با رانش مفهومی (Concept Drift)
عبارت رانش مفهومی در حوزه کاوش فرایند به موقعیتی اشاره میکند که در آن فرایند در عین حال که در حال آنالیز شدن میباشد، تغییر نیز میکند. به عنوان مثال در ابتدای یک فایل لاگ، ممکن است که دو فعالیت همزمان باشند در حالیکه در ادامه در لاگ این دو فعالیت ترتیبی شوند. فرایندها به دلایل مختلفی ممکن است تغییر کنند. بعضی از این تغییرات بنابه دلایل تغییرهای دورهای میباشد (مثلاً در ماه مهر و اسفند خریدها بیشتر است یا اینکه بعد از ظهر جمعه کارمندان کمتری در دسترس هستند). بعضی از تغییرات هم به واسط تغییر شرایط رخ میدهند (مثلاً بازار رقابتی تر میشود). این تغییرات بر روی فرایند تأثیر میگذارند و ضرورت دارد که به آنها توجه شود. پدیده رانش مفهومی با استفاده از شکستن فایل لاگ به قطعات کوچکتر و آنالیز رد پای(footprint) این قطعات قابل شناسایی میباشد. این آنالیز مرتبه دوم (second order) نیازمند دادههای رویداد بیشتر میباشد. با این حال تعداد کمی از فرایندها در حالت ثابت میباشند و فهم رانش مفهومی دارای اولویت بالایی در مدیریت فرایندها میباشد؛ بنابراین ابزارها و تحقیقات بیشتری برای آنالیز مناسب رانش مفهومی مورد نیاز میباشد.
- چالش پنجم: ارتقای پیش فرضهای نمایشی که در کشف فرایند استفاده میشوند(Representational Bias)
یک تکنیک کشف فرایند، با استفاده از یک زبان مشخص (BPMN، Petri Net و ...) یک مدل فرایند تولید مینماید. به هر حال مهم است که تجسم نتایج، مجزای از نمایی باشد که در کشف فرایند مورد استفاده قرار میگیرد. انتخاب یک زبان هدف غالباً تعدادی فرض ضمنی را هم دربر میگیرد. این فرضیات فضای جستجو را محدود کرده و فرایندهایی که نمیتوانند با استفاده از زبان مقصد نمایش داده شوند، کشف نخواهند شد. این به اصطلاح پیش فرضهای نمایشی که در کشف فرایند استفاده میشوند باید با انتخاب آگاهانه همراه گردند و نباید (فقط) بر مبنای اولویتهای نمایشی گرافیکی انتخاب شوند. مثلاً شکل ذیل را در نظر بگیرید. بسته به آنکه زبان مقصد اجازه همزمانی را بدهد یا ندهد، میتواند بر روی نمایش مدل کشف شده و کلاس مدلهایی که توسط الگوریتم استفاده میشود تأثیر داشته باشد. اگر پیشفرضهای نمایشی اجازه همزمانی را ندهند (بخش a تصویر) و اجازه استفاده همزمان چند فعالیت از یک برچسب را ندهند (بخش c از تصویر)، آنگاه شکل b تصویر که دارای مشکلات هم باشد تنها امکانپذیر خواهد بود.
- چالش ششم: برقراری تعادل بین معیارهای کیفیت نظیر سازگاری، سادگی، دقت و عمومیت
غالباً دادههای ثبت شده کامل نیستند. مدلهای فرایندی معمولاً محدودیتی برای تعداد نامحدود نمونه فرایند (درحالت وجود حلقهها) ندارند. از طرفی، بعضی از نمونهها هم نسبت به سایرین رخداد بمراتب کمتری دارند؛ بنابراین اینکه فکر کنیم هر نمونه فرایند قابل رخدادی در فایل وقایع ثبت شده موجود میباشد، تصور نادرستی میباشد. برای اینکه نشان داده شود که تصور داشتن دادههای کامل، در عمل امکانپذیر نمیباشد، فرایندی را در نظر بگیرید که شامل ۱۰ فعالیت بوده و این فعالیتها بتوانند به صورت موازی اجرا شوند. همچنین فرض کنید که فایل رویدادهای ثبت شده حاوی ۱۰٬۰۰۰ نمونه فرایند باشد. تعداد حالتهای کلی (جایگشتها) در یک مدل با ۱۰ فعالیت همزمان، ۳٬۶۲۸٬۰۰۰=!۱۰ میباشد؛ بنابراین امکانپذیر نمیباشد که تمامی این نمونهها در فایل رویدادهای ثبت شده (تنها حاوی ۱۰٬۰۰۰) وجود داشته باشد. وجود دادههای نویز (دادههای با رخداد کم) بر پیچیدگیها میافزاید. ساخت مدل برای رفتارهایی که به ندرت رخ میدهند (دادههای نویز) کار بسیار دشواری میباشد. در این گونه موارد، برای پردازش این دسته از رفتارها بهتر است که از چک کردن مطابعت استفاده شود. نویز و ناکامل بودن، کشف فرایند را به یکی از پرچالشترین مسائل تبدیل کردهاست. تعادل برقرار کردن بین معیارهای سادگی، سازگاری، دقت و عمومیت داشتن کار پرچالشی میباشد. به همین دلیل اکثر تکنیکهای قدرتمند کاوش فرایند پارامترهای متنوعی را فراهم میسازند. الگوریتمهای جدیدی برای تعادل برقرار کردن بین این معیارها نیاز میباشد.
- چالش هفتم: کاوش بین سازمانی
بهطور سنتی، کاوش فرایند در یک سازمان اجرا میگردد. اما با گسترش تکنولوژی وب سرویس، یکپارچگی زنجیره تأمین و محاسبات ابری، سناریوهایی پیش میآید که در آن دادههای چند سازمان برای آنالیز در دسترس میباشد. در حقیقت دو مشخصه برای کاوش فرایندهای بین سازمانی موجود میباشد. در سناریوی همکارانه، سازمانهای مختلف همگی باهم در جهت رسیدن به اهداف مشخصی همکاری داشته و نمونه فرایندها بین این سازمانها در جریان میباشد. در این مدل سازمانها همانند قطعات یک پازل میباشند. فرایند کلی به قطعاتی شکسته شده و بین سازمانها توزیع میشود تا هر سازمان وظیفه مربوط به خود را انجام دهد. آنالیز رویدادهای ثبت شده در تنها یکی از این سازمانها کافی نمیباشد. به منظور کشف فرایندهای انتها به انتها، رویدادهای ثبت شده سازمانهای مختلف باید بایکدیگر ادغام گردد که کار سادهای نمیباشد. سناریوی دوم این است که سازمانهای مختلف در عین حال که از زیرساختهای مشترکی استفاده مینمایند، فرایند یکسانی را اجرا نمایند. به عنوان مثال Saleforce.com را میتوانید در نظر بگیرید. این شرکت فرایند فروش شرکتهای دیگر را بر عهده دارد و مدیریت میکند. از یک طرف شرکتها از زیر ساخت این سایت استفاده میکنند و از طرف دیگر مجبور نیستند که دقیقاً یک فرایند قطعی را دنبال کنند (چراکه سیستم امکان تنظیمات اختصاصی در دنبال کردن فرایند به آنها میدهد. واضح است که آنالیز این تغییرات بین سازمانهای مختلف کار جذاب و جالبی میباشد. این سازمانها میتوانند از همدیگر یاد بگیرند و فراهم کنندگان سرویس ممکن است که سرویس هایشان را ارتقا بخشند و سرویسهای ارزش افزودهای را برمبنای نتیجه کاوشهای بین سازمانی ارائه نمایند.
- چالش هشتم: ارائه پشتیانی عملیاتی
در ابتدا، تمرکز کاوش فرایند بر روی دادههای قدیمی (که در پایگاه داده سیستمهای اطلاعاتی موجود میباشد) بود. اما امروزه با گسترش تکنولوژی و افزایش پردازشهای روی خط، کاوش فرایند نباید محدود به پردازشهای برون خطی باشد. سه نوع پشتیبانی عملیاتی تعریف شدهاست: شناسایی، پیشبینی، توصیه. زمانی که نمونهای از فرایند مورد انتظار تخطی میکند، میتواند شناسایی گردد و سیستم میتواند یک اخطار دهد. دادههای قدیمی میتواند به منظور تولید مدل پیش گوی استفاده گردد. مثلاً میتوان زمان به اتمام رسیدن یک نمونه را پیشگویی کرده و براساس آن تصمیماتی اخذ کرد. استفاده از روشهای کاوش فرایند در مدل برون خطی، چالشهای جدیدی را برحسب قدرت محاسباتی و کیفیت داده ایجاد میکند.
- چالش نهم: ترکیب کاوش فرایند با سایر روشهای آنالیز
یکی از چالشها نحوه ترکیب روشهای آنالیز نظیر دادهکاوی یا تحقیقات عملیاتی با کاوش فرایند میباشد. به عنوان مثال شبیهدکاویسازی را در نظر بگیرید. کاوش فرایند برای یادگیری یک مدل شبیهسازی بر مبنای دادههای قدیمی میتواند استفاده شود. متعاقباً، مدل شبیهسازی برای پردازشهای روی خط میتواند استفاده شود. همچنین خیلی مطلوبست که روشهای کاوش فرایند را با آنالیزهای تصویری ترکیب نماییم. در پردازش دادههای بزرگ، آنالیزهای بصری میتواند از توانایی انسان برای شناسایی الگوها در دادههای بدون ساختار استفاده نماید.
ابزارهای فرایندکاوی[ویرایش]
- ابزار تجاری لانا LANA Process Mining
- ابزار متن باز ProM
- ابزار تجاری Disco
- ابزار تجاری Celonis
پیوند به بیرون[ویرایش]
- سایت فرایندکاوی processmining.org
- مانیفست (بیانیه) فرایند کاوی [۱]
- صفحهٔ شخصی پروفسور آلست
- آزمایشگاه فناوری وب دانشگاه فردوسی مشهد
- لانالابس Lana Labs
- گروه تحقیقاتی Fluxicon