دقت و بازیابی

دقت و بازیابی (انگلیسی: Precision and recall) یا دقت و بازیافت در بازشناخت الگو، بازیابی اطلاعات و طبقه‌بندی آماری کاربرد دارند. در حوزه یادگیری ماشینی، Precision به معنای درصدی از پیش‌بینی‌های مدل که مرتبط هستند ولی recall اشاره به درصدی از کل پیش‌بینی‌هایی که توسط مدل درست دسته‌بندی‌شده‌اند. به بیان ساده‌تر، «دقت» به این سؤال پاسخ می‌دهد که «چه مقدار از مواردی که شناسایی کردیم، درست بودند؟» و «بازیابی» به این سؤال پاسخ می‌دهد که «چه مقدار از مواردی که باید شناسایی می‌کردیم را شناسایی کردیم؟»^[۱].

Recall برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص داده‌اند شده بر تعداد کل مواردی که توسط مدل ایجاد شده‌اند و Precision برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص داده شده‌است بر تعداد مواردی که واقعاً درست هستند، درست تشخیص داده شده‌اند.

به عنوان مثال یک الگوریتم یادگیری ماشینی از میان ۱۲ تصویر سگ و گربه ۸ مورد سگ را تشخیص می‌دهد. از ۸ سگ ۵ مورد واقعاً سگ هستند (مثبت درست یا true positives) و ۳ مورد دیگر گربه هستند؛ که مثبت نادرست یا false positives هستند. مقدار precision برابر با ۵/۸ است و مقدار recall برابر با ۵/۱۲ هست.

وقتی موتور جستجو ۳۰ صفحه را بازمی‌گرداند و فقط ۲۰ موردش مرتبط هستند و به اشتباهاً ۴۰ مورد دیگر که مرتبط بودند را بازنمی‌گرداند. مقدار precision برابر با ۲۰/۳۰ = ۲/۳ و مقدار recall برابر با ۲۰/۶۰ = ۱/۳ است.

در نتیجه در این مورد precision نشان می‌دهد که چقدر موتور جستجو به درد بخور است و recall نشان می‌دهد که چه مقدار پاسخش کامل و جامع هست.

فرمول[ویرایش]

{\text{precision}}={\frac {|\{{\text{relevant documents}}\}\cap \{{\text{retrieved documents}}\}|}{|\{{\text{retrieved documents}}\}|}}

{\text{recall}}={\frac {|\{{\text{relevant documents}}\}\cap \{{\text{retrieved documents}}\}|}{|\{{\text{relevant documents}}\}|}}

تفاوت Accuracy, Precision, Recall و Specificity[ویرایش]

به عنوان مثال قصد داریم طی یک روند یادگیری نظارت‌شده مدلی برای پیش‌بینی بیماری سرطان ایجاد کنیم. برای آموزش مدل یک جامعه آماری تهیه می‌کنیم که تعدادی بیمار واقعاً سرطان درند و تعدادی هم ندارند و مدل را به کمک بخش آموزش، ایجاد می‌کنیم و بر روی بخش آزمون یا شاهد آن را اجرا می‌کنیم تا میزان خطا یا دقت مدل را بررسی کنیم.

specificity عبارت است از کسری از جواب‌های منفی که به درستی تشخیص داده شده‌است مثلاً درصد افرادی که طبق پیش‌بینی مدل سرطان ندارند و در دنیای واقعی هم سرطان ندارند.
recall یا sensitivity یا بازیابی عبارتست از کسری از جوابهای مثبت که درست تشخیص داده شده‌اند مثلاً درصد افرادی که طبق پیش‌بینی مدل سرطان دارند و در دنیای واقعی هم سرطان دارند.
accuracy یا صحت یعنی مقدار اندازه‌گیری شده چقدر به مقدار واقعی نزدیک است برای accuracy باید precision بالا باشد ولی برعکسش لزوماً برقرار نیست. بالا بودن بایاس و واریانس به معنای accuracy کم است.
precision یا دقت برای اندازه‌گیری‌های متوالی از یک مقدار میزان نزدیک بودن مقدارهای اندازه‌گیری را نشان می‌دهد. مثلاً اگر یک ساعت هر روز فقط ۲ ساعت جلو رود مقدار accuracy یا صحتش پایین است ولی مقدار precision آن بالاست.

		واقعیت
	جامعه آماری	در واقعیت مثبت	در واقعیت منفی	شیوع = Σ Condition positive/Σ Total population	صحت (ACC) = Σ True positive + Σ True negative/Σ Total population
پیش‌بینی	پیش‌بینی مثبت	مثبت صادق	مثبت کاذب خطای نوع اول	Positive predictive value (PPV), دقت و بازیابی = Σ True positive/Σ Predicted condition positive	میزان کشف اشتباه (FDR) = Σ False positive/Σ Predicted condition positive
	پیش‌بینی منفی	منفی کاذب خطای نوع دوم	منفی صادق	False omission rate (FOR) = Σ False negative/Σ Predicted condition negative	Negative predictive value (NPV) = Σ True negative/Σ Predicted condition negative
		حساسیت و ویژگی (TPR), دقت و بازیابی، حساسیت و ویژگی، probability of detection, توان آماری = Σ True positive/Σ Condition positive	False positive rate (FPR), بازیابی اطلاعات، probability of false alarm = Σ False positive/Σ Condition negative	Positive likelihood ratio (LR+) = TPR/FPR	Diagnostic odds ratio (DOR) = LR+/LR−	امتیاز اف ۱ = 2 · Precision · Recall/Precision + Recall
		False negative rate (FNR), Miss rate = Σ False negative/Σ Condition positive	حساسیت و ویژگی (SPC), Selectivity, حساسیت و ویژگی (TNR) = Σ True negative/Σ Condition negative	Negative likelihood ratio (LR−) = FNR/TNR

واژگان و مشتقات
ماتریس درهم‌ریختگی

در واقعیت درست یا (P): تعداد موارد واقعاً مثبت در داده
در واقعیت منفی یا (N): تعداد موارد واقعاً منفی در داده

مثبت صادق یا (TP): مانند آژیر درست
منفی صادق یا (TN): مانند سکوت درت
مثبت کاذب یا (FP): معادل با آژیر کاذب، خطای نوع اول (هواپیمای دشمن نبوده ولی آژیر زده شده)
منفی کاذب یا (FN): معادل با سکوت اشتباه خطای نوع دوم (هواپیمای دشمن بوده ولی آژیر زده نشده)

recall، sensitivity، hit rate، یا true positive rate یا (TPR): $\mathrm {TPR} ={\frac {\mathrm {TP} }{\mathrm {P} }}={\frac {\mathrm {TP} }{\mathrm {TP} +\mathrm {FN} }}=1-\mathrm {FNR}$
specificity، selectivity یا true negative rate یا (TNR): $\mathrm {TNR} ={\frac {\mathrm {TN} }{\mathrm {N} }}={\frac {\mathrm {TN} }{\mathrm {TN} +\mathrm {FP} }}=1-\mathrm {FPR}$
precision یا positive predictive value یا (PPV): $\mathrm {PPV} ={\frac {\mathrm {TP} }{\mathrm {TP} +\mathrm {FP} }}=1-\mathrm {FDR}$
negative predictive value یا (NPV): $\mathrm {NPV} ={\frac {\mathrm {TN} }{\mathrm {TN} +\mathrm {FN} }}=1-\mathrm {FOR}$
رتبه ناموجود یا false negative rate یا (FNR): $\mathrm {FNR} ={\frac {\mathrm {FN} }{\mathrm {P} }}={\frac {\mathrm {FN} }{\mathrm {FN} +\mathrm {TP} }}=1-\mathrm {TPR}$
fall-out یا false positive rate یا (FPR): $\mathrm {FPR} ={\frac {\mathrm {FP} }{\mathrm {N} }}={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {TN} }}=1-\mathrm {TNR}$
میزان کشف اشتباه (FDR): $\mathrm {FDR} ={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {TP} }}=1-\mathrm {PPV}$
false omission rate (FOR): $\mathrm {FOR} ={\frac {\mathrm {FN} }{\mathrm {FN} +\mathrm {TN} }}=1-\mathrm {NPV}$
Threat score (TS) یا Critical Success Index (CSI): $\mathrm {TS} ={\frac {\mathrm {TP} }{\mathrm {TP} +\mathrm {FN} +\mathrm {FP} }}$

صحت و دقت (ACC): $\mathrm {ACC} ={\frac {\mathrm {TP} +\mathrm {TN} }{\mathrm {P} +\mathrm {N} }}={\frac {\mathrm {TP} +\mathrm {TN} }{\mathrm {TP} +\mathrm {TN} +\mathrm {FP} +\mathrm {FN} }}$
امتیاز اف ۱: is the میانگین همساز بازیابی اطلاعات and حساسیت و ویژگی; $\mathrm {F} _{1}=2\cdot {\frac {\mathrm {PPV} \cdot \mathrm {TPR} }{\mathrm {PPV} +\mathrm {TPR} }}={\frac {2\mathrm {TP} }{2\mathrm {TP} +\mathrm {FP} +\mathrm {FN} }}$
Matthews correlation coefficient (MCC): $\mathrm {MCC} ={\frac {\mathrm {TP} \times \mathrm {TN} -\mathrm {FP} \times \mathrm {FN} }{\sqrt {(\mathrm {TP} +\mathrm {FP} )(\mathrm {TP} +\mathrm {FN} )(\mathrm {TN} +\mathrm {FP} )(\mathrm {TN} +\mathrm {FN} )}}}$
Informedness یا Bookmaker Informedness (BM): $\mathrm {BM} =\mathrm {TPR} +\mathrm {TNR} -1$
Markedness (MK): $\mathrm {MK} =\mathrm {PPV} +\mathrm {NPV} -1$

منبع: Fawcett (2006),^[۲] Powers (2011),^[۳] Ting (2011),^[۴] and CAWCR^[۵]

جستارهای وابسته[ویرایش]

حساسیت و ویژگی

منابع[ویرایش]

↑ https://developers.google.com/machine-learning/crash-course/classification/precision-and-recall
↑ Fawcett, Tom (2006). "An Introduction to ROC Analysis" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
↑ Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.
↑ Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.
↑ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research. World Meteorological Organisation. Retrieved 2019-07-17.

مشارکت‌کنندگان ویکی‌پدیا. «Precision and recall». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۱۲ نوامبر ۲۰۱۹.

[1] ttps://developers.google.com/machine-learning/crash-course/classification/precision-and-recall

[Fawcett2006-2] Fawcett, Tom (2006). "An Introduction to ROC Analysis" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.

[Powers2011-3] Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.

[ting2011precision-4] Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.

[cawcr-5] Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research. World Meteorological Organisation. Retrieved 2019-07-17.

[۱]

[۲]

[۳]

[۴]

[۵]

ن ب و شاخص‌های ارزشیابی یادگیری ماشینی
رگرسیون	MSE · MAE · sMAPE · MAPE · MASE · MSPE · RMS · RMSE/RMSD · R2 · MDA · MAD
طبقه‌بندی	امتیاز اف ۱ · Accuracy · Precision · Recall · Kappa · MCC · AUC · ROC · حساسیت و ویژگی · Logarithmic Loss
خوشه‌بندی	Silhouette · Calinski-Harabasz · Davies-Bouldin · Dunn index · Hopkins statistic · اندیس ژاکار · Rand index · Similarity measure · SMC · SimHash
رتبه‌بندی	MRR · DCG · NDCG · AP
بینایی رایانه‌ای	PSNR · SSIM · IoU
NLP	سرگشتگی · جایگزین ارزشیابی دوزبانه
شاخص‌های مرتبط با یادگیری عمیق	Inception score · FID
سامانه توصیه‌گر	Coverage · Personalization · Intra-list Similarity
تشابه	Cosine similarity · فاصله اقلیدسی · ضریب همبستگی پیرسون
ماتریس درهم‌ریختگی