تناقض صحت
تناقض صحت (انگلیسی: Accuracy paradox) یک پارادوکس است که صحت (Accuracy) معیار خوبی برای مدلهای پیشگویانه در هنگام طبقهبندی در تجزیه و تحلیل پیشبینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.[۱][۲]
به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت میشود، اگر مدل پیشگویانه پیشبینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.
در مواردی که دستهبندیها به شدت نامتعادل هستند دقت و به یاد آوردن (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.[۳]
احتمالات پیش از این کلاسها باید در آنالیز خطا محاسبه شوند.
همچنین باید توجه داشت که دستهبندی بسیار نامتعادل در مجموعهٔ تست، باعث میشود که دقت (Precision) نیز سوگیری (bias) داشته باشد.
منابع[ویرایش]
- ↑ Abma, B. J. M. (10 September 2009), Evaluation of requirements management tools with support for traceability-based change impact analysis (PDF), University of Twente, pp. 86–87, archived from the original (PDF) on 25 November 2018, retrieved 25 March 2019
- ↑ Valverde-Albacete; Carillo-de-Albornoz; Peláez-Moreno (2013), "A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks", Information Access Evaluation. Multilinguality, Multimodality, and Visualization, Springer, ISBN 978-3-642-40802-1
- ↑ Afonja, Tejumade (2017-12-08). "Accuracy Paradox". Towards Data Science. Retrieved 2019-03-15.
- مشارکتکنندگان ویکیپدیا. «Accuracy paradox». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۲۵ مارس ۲۰۱۹.