تناقض صحت: تفاوت میان نسخهها
جزبدون خلاصۀ ویرایش |
ابرابزار |
||
خط ۱: | خط ۱: | ||
'''تناقض صحت''' ({{lang-en|Accuracy paradox}}) یک پارادوکس است که [[صحت و دقت|صحت]] (Accuracy) معیار خوبی برای [[مدلهای پیشگویانه]] در هنگام طبقهبندی در تجزیه و تحلیل پیشبینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد. |
'''تناقض صحت''' ({{lang-en|Accuracy paradox}}) یک پارادوکس است که [[صحت و دقت|صحت]] (Accuracy) معیار خوبی برای [[مدلهای پیشگویانه]] در هنگام طبقهبندی در تجزیه و تحلیل پیشبینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.<ref name=Abma /><ref name=PNEM /> |
||
به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت میشود، اگر مدل پیشگویانه پیشبینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست. |
به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت میشود، اگر مدل پیشگویانه پیشبینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست. |
||
در مواردی که دستهبندیها به شدت نامتعادل هستند [[دقت و به یاد آوردن]] (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد. |
در مواردی که دستهبندیها به شدت نامتعادل هستند [[دقت و به یاد آوردن]] (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.<ref>{{Cite web|url=https://towardsdatascience.com/accuracy-paradox-897a69e2dd9b|title=Accuracy Paradox|last=Afonja|first=Tejumade|date=2017-12-08|website=Towards Data Science|access-date=2019-03-15}}</ref> |
||
احتمالات پیش از این کلاسها باید در آنالیز خطا محاسبه شوند. |
احتمالات پیش از این کلاسها باید در آنالیز خطا محاسبه شوند. |
||
خط ۱۰: | خط ۱۰: | ||
== منابع == |
== منابع == |
||
{{reflist |refs= |
|||
{{پانویس|چپچین=بله}} |
|||
<ref name=Abma>{{citation |last=Abma |first=B. J. M. |date=10 September 2009 |title=Evaluation of requirements management tools with support for traceability-based change impact analysis |publisher=University of Twente |pages=86–87 |url=https://www.utwente.nl/en/eemcs/trese/graduation_projects/2009/Abma.pdf}}</ref><ref name=PNEM>{{citation |work=Information Access Evaluation. Multilinguality, Multimodality, and Visualization |year=2013 |publisher=Springer |isbn=978-3-642-40802-1 |last1=Valverde-Albacete |last2=Carillo-de-Albornoz |last3=Peláez-Moreno |title=A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks}}</ref> |
|||
}} |
|||
* {{یادکرد-ویکی|پیوند =//en.wikipedia.org/w/index.php?title=Accuracy_paradox&oldid=887868751|عنوان = Accuracy paradox|زبان =انگلیسی|بازیابی =۲۵ مارس ۲۰۱۹}} |
* {{یادکرد-ویکی|پیوند =//en.wikipedia.org/w/index.php?title=Accuracy_paradox&oldid=887868751|عنوان = Accuracy paradox|زبان =انگلیسی|بازیابی =۲۵ مارس ۲۰۱۹}} |
||
نسخهٔ ۲۵ مارس ۲۰۱۹، ساعت ۱۴:۴۹
تناقض صحت (انگلیسی: Accuracy paradox) یک پارادوکس است که صحت (Accuracy) معیار خوبی برای مدلهای پیشگویانه در هنگام طبقهبندی در تجزیه و تحلیل پیشبینی نیست. این به این دلیل است که یک مدل ساده ممکن است دارای سطح بالایی از دقت باشد اما بسیار خام باشد تا مفید باشد.[۱][۲]
به عنوان مثال، اگر رخداد دسته A غالب باشد، در ۹۹٪ موارد یافت میشود، اگر مدل پیشگویانه پیشبینی کند که همهٔ موارد متعلق به دسته A هستند باز هم ۹۹٪ صحت خواهد داشت که درست نیست.
در مواردی که دستهبندیها به شدت نامتعادل هستند دقت و به یاد آوردن (Precision and recall) معیارهای بهتر برای ارزشیابی مدل هستند. مسئله اساسی این است که عدم تعادل طبقاتی بین طبقه مثبت و طبقه منفی وجود دارد.[۳]
احتمالات پیش از این کلاسها باید در آنالیز خطا محاسبه شوند.
همچنین باید توجه داشت که دستهبندی بسیار نامتعادل در مجموعهٔ تست، باعث میشود که دقت (Precision) نیز سوگیری (bias) داشته باشد.
منابع
- ↑ Abma, B. J. M. (10 September 2009), Evaluation of requirements management tools with support for traceability-based change impact analysis (PDF), University of Twente, pp. 86–87
- ↑ Valverde-Albacete; Carillo-de-Albornoz; Peláez-Moreno (2013), "A Proposal for New Evaluation Metrics and Result Vizualization Technique for Sentiment Analysis Tasks", Information Access Evaluation. Multilinguality, Multimodality, and Visualization, Springer, ISBN 978-3-642-40802-1
- ↑ Afonja, Tejumade (2017-12-08). "Accuracy Paradox". Towards Data Science. Retrieved 2019-03-15.
- مشارکتکنندگان ویکیپدیا. «Accuracy paradox». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۲۵ مارس ۲۰۱۹.