تناقض صحت

از ویکی‌پدیا، دانشنامهٔ آزاد

تناقض صحت (انگلیسی: Accuracy paradox) یک پارادوکس است که صحت (Accuracy) معیار خوبی برای مدل‌های پیشگویانه در هنگام طبقه‌بندی در تجزیه و تحلیل پیش‌بینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.[۱][۲]

به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت می‌شود، اگر مدل پیشگویانه پیش‌بینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.

در مواردی که دسته‌بندی‌ها به شدت نامتعادل هستند دقت و به یاد آوردن (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.[۳]

احتمالات پیش از این کلاس‌ها باید در آنالیز خطا محاسبه شوند.

همچنین باید توجه داشت که دسته‌بندی بسیار نامتعادل در مجموعهٔ تست، باعث می‌شود که دقت (Precision) نیز سوگیری (bias) داشته باشد.

منابع[ویرایش]

  1. Abma, B. J. M. (10 September 2009), Evaluation of requirements management tools with support for traceability-based change impact analysis (PDF), University of Twente, pp. 86–87, archived from the original (PDF) on 25 November 2018, retrieved 25 March 2019
  2. Valverde-Albacete; Carillo-de-Albornoz; Peláez-Moreno (2013), "A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks", Information Access Evaluation. Multilinguality, Multimodality, and Visualization, Springer, ISBN 978-3-642-40802-1
  3. Afonja, Tejumade (2017-12-08). "Accuracy Paradox". Towards Data Science. Retrieved 2019-03-15.