تناقض صحت: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
جزبدون خلاصۀ ویرایش
ابرابزار
خط ۱: خط ۱:
'''تناقض صحت''' ({{lang-en|Accuracy paradox}}) یک پارادوکس است که [[صحت و دقت|صحت]] (Accuracy) معیار خوبی برای [[مدل‌های پیشگویانه]] در هنگام طبقه‌بندی در تجزیه و تحلیل پیش‌بینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.
'''تناقض صحت''' ({{lang-en|Accuracy paradox}}) یک پارادوکس است که [[صحت و دقت|صحت]] (Accuracy) معیار خوبی برای [[مدل‌های پیشگویانه]] در هنگام طبقه‌بندی در تجزیه و تحلیل پیش‌بینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.<ref name=Abma /><ref name=PNEM />


به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت می‌شود، اگر مدل پیشگویانه پیش‌بینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.
به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت می‌شود، اگر مدل پیشگویانه پیش‌بینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.


در مواردی که دسته‌بندی‌ها به شدت نامتعادل هستند [[دقت و به یاد آوردن]] (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.
در مواردی که دسته‌بندی‌ها به شدت نامتعادل هستند [[دقت و به یاد آوردن]] (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.<ref>{{Cite web|url=https://towardsdatascience.com/accuracy-paradox-897a69e2dd9b|title=Accuracy Paradox|last=Afonja|first=Tejumade|date=2017-12-08|website=Towards Data Science|access-date=2019-03-15}}</ref>


احتمالات پیش از این کلاس‌ها باید در آنالیز خطا محاسبه شوند.
احتمالات پیش از این کلاس‌ها باید در آنالیز خطا محاسبه شوند.
خط ۱۰: خط ۱۰:


== منابع ==
== منابع ==
{{reflist |refs=
{{پانویس|چپ‌چین=بله}}
<ref name=Abma>{{citation |last=Abma |first=B. J. M. |date=10 September 2009 |title=Evaluation of requirements management tools with support for traceability-based change impact analysis |publisher=University of Twente |pages=86–87 |url=https://www.utwente.nl/en/eemcs/trese/graduation_projects/2009/Abma.pdf}}</ref><ref name=PNEM>{{citation |work=Information Access Evaluation. Multilinguality, Multimodality, and Visualization |year=2013 |publisher=Springer |isbn=978-3-642-40802-1 |last1=Valverde-Albacete |last2=Carillo-de-Albornoz |last3=Peláez-Moreno |title=A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks}}</ref>
}}
* {{یادکرد-ویکی|پیوند =//en.wikipedia.org/w/index.php?title=Accuracy_paradox&oldid=887868751|عنوان = Accuracy paradox|زبان =انگلیسی|بازیابی =۲۵ مارس ۲۰۱۹}}
* {{یادکرد-ویکی|پیوند =//en.wikipedia.org/w/index.php?title=Accuracy_paradox&oldid=887868751|عنوان = Accuracy paradox|زبان =انگلیسی|بازیابی =۲۵ مارس ۲۰۱۹}}



نسخهٔ ‏۲۵ مارس ۲۰۱۹، ساعت ۱۴:۴۹

تناقض صحت (انگلیسی: Accuracy paradox) یک پارادوکس است که صحت (Accuracy) معیار خوبی برای مدل‌های پیشگویانه در هنگام طبقه‌بندی در تجزیه و تحلیل پیش‌بینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.[۱][۲]

به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت می‌شود، اگر مدل پیشگویانه پیش‌بینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.

در مواردی که دسته‌بندی‌ها به شدت نامتعادل هستند دقت و به یاد آوردن (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.[۳]

احتمالات پیش از این کلاس‌ها باید در آنالیز خطا محاسبه شوند.

همچنین باید توجه داشت که دسته‌بندی بسیار نامتعادل در مجموعهٔ تست، باعث می‌شود که دقت (Precision) نیز سوگیری (bias) داشته باشد.

منابع

  1. Abma, B. J. M. (10 September 2009), Evaluation of requirements management tools with support for traceability-based change impact analysis (PDF), University of Twente, pp. 86–87
  2. Valverde-Albacete; Carillo-de-Albornoz; Peláez-Moreno (2013), "A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks", Information Access Evaluation. Multilinguality, Multimodality, and Visualization, Springer, ISBN 978-3-642-40802-1
  3. Afonja, Tejumade (2017-12-08). "Accuracy Paradox". Towards Data Science. Retrieved 2019-03-15.