سوگیری انتخاب

از ویکی‌پدیا، دانشنامهٔ آزاد
نمونه ای از داده آماری که نمودار سوگیری با قرمز در آن نشان داده شده‌است.

سوگیری انتخاب (به انگلیسی: Selection bias) نوعی سوگیری است که هنگام انتخاب افراد، گروه‌ها یا داده‌ها برای تجزیه و تحلیل به وجود می‌آید، به گونه‌ای که تصادفی‌سازی انتخابی مناسبی حاصل نمی‌شود و عدم اطمینان به نتایج یک آزمایش که قرار است نماینده جامعه مورد نظر برای تجزیه و تحلیل باشد، شکل می‌گیرد.[۱] گاهی از آن به عنوان اثر انتخاب یاد می‌شود. عبارت «سوگیری انتخاب» اغلب به تحریف یک تجزیه و تحلیل آماری، ناشی از روش جمع‌آوری نمونه‌ها اشاره دارد. اگر بر طرف کردن سوگیری انتخاب در یک نمونه اتفاق نیافتد، ممکن است برخی از نتایج مطالعه نادرست باشد.

انواع[ویرایش]

از انواع سوگیری که ممکن است هنگام انتخاب نمونه‌ها در یک بررسی آماری ایجاد شود می‌توان به موارد زیر اشاره کرد:

سوگیری نمونه‌گیری[ویرایش]

سوگیری نمونه‌گیری خطای سیستماتیک ناشی از یک نمونه غیرتصادفی از یک جامعه است،[۲] که باعث می‌شود برخی از اعضای جامعه (یا عوامل غیرانسانی) کمتر از سایرین در آن گنجانده شوند این اتفاق باعث می‌شود یک نمونه مغرضانه، به عنوان نمونه آماری از یک جامعه آماری تعریف شود که در آن همه شرکت کنندگان به‌طور مساوی، تعادل یا عینی مورد بررسی قرار نگرفته‌اند.[۳] این سوگیری عمدتاً به عنوان یک نوع فرعی از سوگیری انتخاب طبقه‌بندی[۴] و گاهی به‌طور خاص، سوگیری انتخاب نمونه در نظر گرفته می‌شود.[۵][۶] برخی از محققین نیز آن را به عنوان یک نوع سوگیری جداگانه دسته‌بندی می‌کنند.[۷]

نمونه‌هایی از سوگیری نمونه‌گیری شامل خود انتخابی، پیش غربالگری شرکت‌کنندگان در کارآزمایی، اتمام آزمون‌های آزمایشی که تکمیل نشدند، سوگیری مهاجرت (با کنار گذاشتن افرادی که اخیراً به منطقه مورد مطالعه رفته یا از آن خارج شده‌اند)،[۸] سوگیری طولانی مدت (که در آن بیماری به آهستگی با پیش‌آگهی بهتر تشخیص داده می‌شود) و سوگیری زمان (که در آن بیماری زودتر از جمعیت‌های مقایسه شده تشخیص داده می‌شود) می‌شود.[۹]

فاصله زمانی[ویرایش]

  • خاتمه زودهنگام کارآزمایی در زمانی که آزمایش نتیجه مطلوب را تأیید می‌کند.
  • یک آزمایش ممکن است زودتر از موقع مقرر خود به خاطر یک ارزش یا یک تفکر خاتمه یابد (اغلب به دلایل اخلاقی)، اما به احتمال زیاد مقدار مفرط، توسط متغیری با بیشترین واریانس به دست می‌آید، حتی اگر همه متغیرها میانگین مشابهی داشته باشند.[۱۰]

در معرض گذاری[ویرایش]

  • سوگیری حساسیت
    • سوگیری حساسیت بالینی: زمانی که یک بیماری، مستعد ابتلا به بیماری دوم باشد و درمانی که برای بیماری اش صورت می‌گیرد سبب این تفکر شود که فرد به بیماری دوم مبتلا شده، سوگیری حساسیت بالینی رخ داده‌است. (اکثر عوارض جانبی) به عنوان مثال، افراد دارای سندرم پس از یائسگی احتمال بیشتری برای ابتلا به سرطان آندومتر دارد، بنابراین استروژنهایی که برای درمان سندرم یائسگی داده می‌شوند ممکن است به ایجاد سرطان آندومتر کمک کنند.[۱۱]
    • سوگیری پروتوپاتیک: زمانی که یک درمان برای اولین علائم یک بیماری که هنوز در مرحله تشخیص افتراقی بوده (زمانی که تشخیص قطعی نیست) باعث نتیجه شود و درمان را بدون تشخیص قطعی ادامه دهند، سوگیریپروتوپاتیک به وجود می‌آید.[۱۱] می‌توان این سوگیری را با تأخیر کاهش داد، یعنی حذف مواجهه‌هایی که در یک دوره زمانی خاص قبل از تشخیص رخ داده‌است.[۱۲]
    • سوگیری اندیکاسیون: اختلاط بالقوه بین علت و معلول زمانی که در معرض گذاشتن، به نشانه وابسته است. به عنوان مثال، درمانی برای افرادی که در معرض خطر بالای ابتلا به بیماری هستند داده شود که سبب غلبه افراد تحت درمان در بین مبتلایان به بیماری می‌شود. این سوگیری ممکن است باعث ایجاد ظاهر اشتباهی از درمان به عنوان علت بیماری شود.[۱۳]

داده‌ها[ویرایش]

  • پارتیشن‌بندی (تقسیم) داده‌ها با آگاهی از محتویات آن‌ها و سپس تجزیه و تحلیل با آزمون‌هایی که برای پارتیشن‌های انتخاب شده کورکورانه طراحی شده‌اند.
  • تحلیل پست‌هاک تغییر گنجاندن داده‌ها بر اساس دلایل خودسرانه و ذهنی، از جمله:
    • گلچین‌کردن، که در واقع سوگیری انتخاب نیست، بلکه سوگیری تأییدی است، زمانی که زیرمجموعه‌های خاصی از داده‌ها برای حمایت از یک نتیجه‌گیری انتخاب می‌شوند (مثلاً ذکر نمونه‌هایی از سقوط هواپیما به عنوان شواهدی مبنی بر ناامن بودن پرواز هواپیمایی، در حالی که نمونه بسیار رایج‌تر پروازها را نادیده می‌گیرند. (راه حل دم دست)
    • رد داده‌های بد، بر اساس دلایل خودسرانه، به جای معیارهای قبلاً اعلام شده و مورد توافق عمومی، کنار گذاشتن «داده پرت» به دلایل آماری که اطلاعات مهمی را که می‌تواند از مشاهدات غیراصولی به دست آورد را در نظر نگیرد.[۱۴]

مطالعات[ویرایش]

  • انتخاب مطالعات به خصوصی برای گنجاندن در یک متاآنالیز
  • انجام آزمایش‌های مکرر و ثبت گزارش از مطلوب‌ترین نتایج و برچسب‌گذاری مجدد سوابق آزمایشگاهی آزمایش‌های دیگر به‌عنوان «تست‌های کالیبراسیون»، «خطاهای ابزار دقیق» یا «بررسی‌های اولیه».
  • ارائه مهم‌ترین نتیجه از لایروبی داده‌ها به گونه ای که گویی یک آزمایش منفرد است (که از نظر منطقی مشابه مورد قبلی است، اما بسیار کمتر نادرست به نظر می‌رسد).

سوگیری فرسایشی[ویرایش]

سوگیری فرسایشی نوعی سوگیری انتخابی است که ناشی از فرسایش (از دست دادن شرکت‌کنندگان) باشد،[۱۵] این موضوع ارتباط نزدیکی با سوگیری بازماندگی دارد که در آن فقط نمونه‌هایی که از یک فرایند «پیروز شده‌اند» در تجزیه و تحلیل حساب می‌شوند. نمونه شبیه سوگیری بازماندگی، سوگیری شکست است، که در آن تنها موضوعاتی که در یک فرایند «شکست خورده‌اند» گنجانده می‌شوند. این سوگیری شامل ترک آزمایش، عدم پاسخ (میزان پاسخگویی کمتر)، خروج و انحراف پروتکل است. در آزمایش‌هایی که نتیجه نابرابر باشد، نتایج مغرضانه ای به دست می‌دهد. به عنوان مثال، آزمایشی برای یک برنامه رژیم غذایی صورت می‌گیرد و برخی افراد در ابتدا از آن خارج می‌شوند، در این بین نباید محقق اثر بخشی آزمایش را برای گروهی که آن برنامه را ادامه داده‌اند بررسی کند، بلکه باید خارج شدگان از آن را هم به حساب آورد. از دست دادن تفاوت آزمودنی‌ها در گروه مستقل و گروه شاهد ممکن است ویژگی‌ها و پیامدهای این گروه‌ها را بدون توجه به مداخله مورد مطالعه، تغییر دهد.[۱۵]

از دست دادن پیگیر کننده، شکل دیگری از سوگیری فرسایشی است که عمدتاً در مطالعات پزشکی در یک دوره زمانی طولانی رخ می‌دهد. سوگیری عدم پیگیر کننده آزمایش، می‌تواند تحت تأثیر عوامل محسوس و نامشهود مانند: ثروت، تحصیلات، نوع دوستی، درک اولیه مطالعه و الزامات آن و بسیاری از موارد دیگر صورت پذیرد.[۱۶] همچنین محققین ممکن است توانایی برقراری تماس بعدی با فرد آزمایش‌شونده را نداشته باشند که ناشی از اطلاعات شناسایی ناکافی و جزئیات تماس جمع‌آوری‌شده در مرحله استخدام اولیه و تحقیق است.[۱۷]

منابع[ویرایش]

  1. Dictionary of Cancer Terms → selection bias. Retrieved on September 23, 2009.
  2. Medical Dictionary - 'Sampling Bias' بایگانی‌شده در ۱۰ مارس ۲۰۱۶ توسط Wayback Machine Retrieved on September 23, 2009
  3. TheFreeDictionary → biased sample. Retrieved on 2009-09-23. Site in turn cites: Mosby's Medical Dictionary, 8th edition.
  4. Dictionary of Cancer Terms → Selection Bias بایگانی‌شده در ۹ ژوئن ۲۰۰۹ توسط Wayback Machine. Retrieved on September 23, 2009.
  5. Ards, S.; Chung, C.; Myers, S. L. (February 1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/s0145-2134(97)00131-2. ISSN 0145-2134. PMID 9504213.
  6. Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). Sample Selection Bias Correction Theory (PDF). Algorithmic Learning Theory. Lecture Notes in Computer Science. Vol. 5254. pp. 38–53. arXiv:0805.2775. CiteSeerX 10.1.1.144.4478. doi:10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2. S2CID 842488.
  7. Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. CiteSeerX 10.1.1.367.6899. doi:10.1016/j.tcs.2013.09.027.
  8. "Sampling Bias". A Dictionary of Biases in Medical Science. Retrieved 14 January 2022. slipperyscience.com
  9. Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. CiteSeerX 10.1.1.367.6899. doi:10.1016/j.tcs.2013.09.027.
  10. Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
  11. ۱۱٫۰ ۱۱٫۱ "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer research (به انگلیسی). 38 (11 Pt 2). November 1978. ISSN 0008-5472.
  12. Tamim, H.; Monfared, A. A. Tahami; LeLorier, J. (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiology and Drug Safety. 16 (3): 250–258. doi:10.1002/pds.1360. ISSN 1053-8569. PMID 17245804.
  13. Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 978-1-930513-58-7.
  14. Kruskal, William H. (1960-02-01). "Some Remarks on Wild Observations". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875. ISSN 0040-1706.
  15. ۱۵٫۰ ۱۵٫۱ Jüni, Peter; Egger, Matthias (February 2005). "Commentary: Empirical evidence of attrition bias in clinical trials". International Journal of Epidemiology. 34 (1): 87–88. doi:10.1093/ije/dyh406. ISSN 0300-5771. PMID 15649954.
  16. Jordan, Sue; Watkins, Alan; Storey, Mel; Allen, Steven J.; Brooks, Caroline J.; Garaiova, Iveta; Heaven, Martin L.; Jones, Ruth; Plummer, Sue F. (2013-07-09). "Volunteer Bias in Recruitment, Retention, and Blood Sample Donation in a Randomised Controlled Trial Involving Mothers and Their Children at Six Months and Two Years: A Longitudinal Analysis". PLOS ONE. 8 (7): e67912. Bibcode:2013PLoSO...867912J. doi:10.1371/journal.pone.0067912. ISSN 1932-6203. PMC 3706448. PMID 23874465.
  17. Small, W. P. (1967-05-06). "Lost to Follow-Up". The Lancet. Originally published as Volume 1, Issue 7497 (به انگلیسی). 289 (7497): 997–999. doi:10.1016/S0140-6736(67)92377-X. ISSN 0140-6736. PMID 4164620.