استنباط علیت

از ویکی‌پدیا، دانشنامهٔ آزاد

استنباط علیت، فرایند رسیدن به یک نتیجه دربارهٔ یک ارتباط علی و مبتنی بر شرایط وقوع یک اثر است. تفاوت اصلی بین استنباط علی و استنباط ارتباطی در این است که استنباط ارتباطی هنگام تغییر علت، پاسخ متغیر اثر را تحلیل می‌کند.[۱][۲] دانش بررسی دلیل وقایع را سبب‌شناسی می‌گویند. استنباط علّی، نمونه ای از استدلال علی است.

تعریف[ویرایش]

استنباط علت مربوط به یک چیز عبارت است از:

«دلیل آوردن برای گرفتن این نتیجه که یک چیز علتِ یک چیز دیگر است یا بسیار محتمل است که باشد».[۳] «شناسایی علت یا علت‌های یک پدیده، با مشخص‌سازی ارتباط و همبستگی میان علت و معلول، یک رابطهٔ ترتیب زمانی که علت پیش از معلول می‌آید با حذف علت‌های قابل باور دیگر»[۴]

روش‌ها[ویرایش]

مطالعات همه‌گیری‌شناسانه، از روش‌های مختلف اپیدمیولوژیک برای جمع‌آوری و سنجش شواه موجود در ارتباط با عوامل خطر و اثر آن بر روشهای مختلف اندازه‌گیری ارتباط بین این دو استفاده می‌کند. ابتدا یک فرضیه تدوین می‌شود و سپس با روش‌های آماری مورد آزمایش قرار می‌گیرد. این استنباط آماری است که کمک می‌کند تا مشخص شود که آیا داده‌ها بر اساس تصادف و شانس به وجود آمده‌اند -که به آن تغییرات تصادفی نیز گفته می‌شود- یا در واقع با یکدیگر همبستگی دارند و این همبستگی چقدر شدت دارد و در واقع چقدر می‌توان روی آن حساب کرد. در هر صورت، همبستگی به معنای علیت نیست و درک تفاوت این دو بسیار اهمیت دارد؛ بنابراین برای استنباط علیت باید از روش‌های بعدی استفاده کرد. [نیازمند منبع]

چهارچوب‌های متداول برای استنباط علّی مدل‌سازی معادلات ساختاری و مدل علیت روبین هستند. [نیازمند منبع]

در همه‌گیری‌شناسی[ویرایش]

مطالعات اپیدمیولوژی به منظور استنباط علت‌ها و معلول‌ها، الگوهای سلامت و بیماری در جمعیت‌های تعریف شده میان موجودات زنده را بررسی می‌کند. ارتباط بین قرار گرفتن در معرض یک عامل ابتلا به بیماری و بیماری ممکن است در نظر گرفته شود، اما این ارتباط معادل علیت نیست. زیرا همبستگی به معنای علیت نیست. از نظر تاریخی، فرضیه‌های کوچ از قرن نوزدهم این کاربرد را داشته‌اند که مشخص کنند آیا یک ریزجانداز علت یک بیماری است یا خیر. در قرن بیستم از سنجه‌های بردفورد هیل، که در سال ۱۹۶۵ شرح داده شده‌است،[۵] برای ارزیابی علیت متغیرهای بیرون از دانش میکروبیولوژی استفاده شده‌است، اگرچه حتی این سنجه‌ها، روش‌های منحصر به فرد برای تعیین علیت نیستند.

در همه‌گیری‌شناسی مولکولی پدیده‌های مورد مطالعه در سطح زیست‌شناسی مولکولی از جمله ژنتیک قرار دارند، جایی که نشانگرهای زیستی شواهدی از علت یا معلول هستند.

یک روند اخیر می‌خواهد شواهدی را برای نشان دادن اثر قرار گرفتن در معرض تشعشعات پاتولوژی مولکولی در بافت یا سلول‌های بیمار، در زمینهٔ میان‌رشته‌ای نوظهورِ همه‌گیری‌شناسی پاتولوژیک مولکولی (MPE) نشان دهد.

وصل کردن دو موضوعِ قرار گرفتن در معرض تشعشعات و امضاهای پاتولوژیک مولکولی بیماری و ارزیابی همزمان آن‌ها، می‌تواند به ارزیابی علیت کمک کند.

با توجه به ماهیت ذاتی ناهمگونی یک بیماری خاص، اصل بیماری منحصر به فرد، بیماری فنوتایپی و زیرگروه‌سازی روندهایی در علوم پزشکی و بهداشت عمومی هستند که نمونه ای از آن به عنوان پزشکی شخصی و پزشکی دقیق قابل ذکر است.

در دانش رایانه[ویرایش]

تعیین علت و معلول با توجه به داده‌های مشاهده‌شده به صورت مشترک برای دو متغیر مستقل از زمان، به عنوان مثال X و Y، با استفاده از عدم تقارن بین شواهد برای برخی از مدل‌ها در جهت‌های X → Y و Y → X تفسیر شده‌است. رویکردهای اولیه مبتنی بر مدل‌های تئوری اطلاعات و مدل‌های نویز در نظریهٔ الگوریتمی اطلاعات است. [نیازمند منبع]

مدل‌های الگوریتمی اطلاعات[ویرایش]

دو برنامه را مقایسه کنید، که هر دو خروجی X و Y را دارند.

  • Y و یک فرم فشرده شده از X که توسط فرم‌های فشرده‌نشدهٔ Y بیان شده‌است را ذخیره کنید.
  • X و یک فرم فشرده شده از Y که توسط فرم‌های فشرده‌نشدهٔ X بیان شده‌است را ذخیره کنید.

کوتاهترین برنامه حاکی از آن است که متغیر ذخیره شده فشرده نشده احتمال بیشتری دارد که روی نتیجهٔ محاسبه‌شده اثر گذاشته باشد.[۶][۷]

مدل‌های نویز[ویرایش]

یک ترم مستقل نویز را در مدل خود وارد کنید تا بتوانید شواهد موجود در دو جهت را با یکدیگر مقایسه کنید.

در اینجا برخی از مدل‌های نویز برای فرضیه Y → X با فرض کردن نویز E آورده شده‌است:

  • نویز افزایشی:[۸]
  • نویز خطی:[۹]
  • نویز غیر خطی:[۱۰]
  • نویز نامتعارف:
  • نویز عملکردی:[۱۱]

فروض مشترک میان این مدل‌ها عبارتند از:

  • Y علت دیگری ندارد.
  • X و Eعلت مشترکی ندارند.
  • توزیع این علت مستقل از روندهای علی است.

در یک سطح شهودی و با یک نگاه کلی، این ایده وجود دارد که تجریهٔ توزیع مشترک به صورت به‌طور معمول مدل‌هایی با پیچیدگی کلِ پایین‌تر ایجاد می‌کند؛ نسبت به زمانی که تجزیه به صورت انجام شود.

گرچه مفهوم «پیچیدگی» به‌طور شهودی بسیار جذاب است، اما چگونگی تعریف دقیق آن مشخص نیست.[۱۱] گسترهٔ متفاوتی از روش‌ها سعی دارند «ردپاهای علی» را با کمک مقادیر زیادی از داده‌های برچسب‌دار کشف کنند و پیش‌بینی روابط علی انعطاف‌پذیرتری را امکان‌پذیر سازند.[۱۲]

در آمار و اقتصاد[ویرایش]

در آمار و اقتصاد، علیت اغلب با استفاده از تحلیل رگرسیون مورد آزمایش قرار می‌گیرد. روش‌های مختلفی را می‌توان برای تمایز علیت واقعی از نشانه‌های علنی علیت استفاده کرد.

پیش از هر چیز، متغیر توضیحی می‌تواند متغیری باشد که از نظر مفهومی نمی‌تواند ناشی از متغیر وابسته باشد، به این ترتیب، احتمال گمراه شدن با درک وارونهٔ رابطهٔ علیت از بین می‌رود. به عنوان مثال، اگر متغیر مستقل باران باشد و متغیر وابسته قیمت آتی برخی از محصولات کشاورزی باشد.

دوم، ممکن است از تکنیک متغیرهای ابزاری استفاده شود تا با ایجاد نقش برای سایر متغیرها (ابزارها) که توسط متغیر وابسته تحت تأثیر قرار نمی‌گیرند، هرگونه علت وارونه حذف شود.

سوم، این اصل که معلول نمی‌تواند مقدم بر علت باشد، قابل استفاده است. از جمله آن‌که در سمت راست رگرسیون فقط متغیرهایی نشان داده می‌شود که در طول زمان پیش از متغیر وابسته آمده‌اند.

چهارم، رگرسورهای دیگری گنجانده شده‌اند تا اطمینان حاصل شود که متغیرهای مخدوش کننده نمی‌توانند باعث شوند که یک رگرسور به صورت فجیعی قابل توجه به نظر بیاید.

همبستگی تصادفی، بر خلاف همبستگی‌ای که علیت واقعی را نمایش می‌دهد، می‌تواند با استفاده از تعداد بسیار زیاد نمونه‌ها و با انجام اعتبارسنجی متقابل رد شود تا مشخص شود که همبستگی بر روی داده‌هایی که در رگرسیون استفاده نشده‌اند، حفظ شده‌است یا خیر. [نیازمند منبع]

در علوم اجتماعی[ویرایش]

علوم اجتماعی به‌طور فزاینده‌ای به سمت چارچوب کمّی برای ارزیابی علیت حرکت کرده‌است. بخش عمده‌ای از این موارد به عنوان ابزاری برای ارائهٔ دقت بیشتر به روش‌شناسی علوم اجتماعی توصیف شده‌است. علوم سیاسی تحت تأثیر انتشار طرح طراحی پرسشنامه اجتماعی، توسط گری کینگ، رابرت کوهان، و سیدنی وربا، در سال ۱۹۹۴ قرار گرفت. کینگ، کوهان، و وربا (که اغلب به اختصار KKV نامیده می‌شوند) توصیه کردند که محققان از هر دو روش کمی و کیفی زبان استنباط آماری درمورد موضوعات مورد علاقه استفاده کنند تا تحلیل آنها واضح‌تر باشد.[۱۳][۱۴] طرفداران روش‌های کمی نیز به‌طور فزاینده چارچوب نتایج احتمالی -توسعه یافته توسط دونالد روبین- را به عنوان استانداردی برای استنباط علیت تصویب کرده‌اند. [نیازمند منبع]

بحث‌های مربوط به کاربرد مناسب روشهای کمی برای استنباط علیت منجر به توجه بیشتر به تکرارپذیری مطالعات شد. منتقدین روش‌های متداول ادعا می‌کنند که محققان برای انتشار مقالات براساس همبستگی‌های فریبنده به داده‌کاوی مشغول اند.[۱۵] برای جلوگیری از این امر، بعضی از افراد مدعی اند که محققان می‌بایست قبل از انجام مطالعات خود از طرح‌های تحقیق خود استفاده کنند، بنابراین آنها ناخواسته بیش از حد بر یک یافته غیرقابل تجویز تأکید نکردند که البته موضوع اصلی تحقیق نبود، اما از نظر آماری در هنگام تحلیل داده‌ها قابل توجه بود.[۱۶] مباحث داخلی در مورد روش‌شناسی و تولید مثل در علوم اجتماعی در بعضی مواقع متضرر بوده‌است. [نیازمند منبع]

در حالی که بیشترین تأکیدات در مورد استنباط آماری در چارچوب نتایج احتمالی باقی مانده‌است، متدولوژیستهای علوم اجتماعی ابزارهای جدیدی را برای انجام استنتاج علی با هر دو روش کیفی و کمی تهیه کرده‌اند، که گاه به آن روش‌ها «روش‌های مختلط» گفته می‌شود.[۱۷][۱۸]

طرفداران رویکردهای روش‌شناسی متنوع استدلال می‌کنند که روش‌های مختلف برای موضوعات مختلف مطالعه مناسب‌تر هستند. جامعه‌شناس هربرت اسمیت و دانشمندان علوم سیاسی جیمز ماهونی و گری گورتز با اشاره به مشاهدات پاول هولند، آماردان و نویسنده مقاله «آمار و استنباط علّی» در ۱۹۸۶، اشاره کردند که استنباط آماری برای ارزیابی «معلول‌های علت‌ها» در مقایسه با «علت‌های معلول‌ها» مناسب‌تر است.[۱۹][۲۰]

روش شناسان کیفی استدلال کرده‌اند که مدل‌های رسمی علیت، از جمله ردیابی فرایند و نظریه مجموعه فازی، فرصت‌هایی را برای استنباط علیت از طریق شناسایی عوامل مهم در مطالعات موردی یا از طریق فرایند مقایسه بین چندین مطالعه موردی فراهم آورده‌اند.[۱۴] این روش‌شناسی همچنین برای موضوعاتی ارزشمند است که در آن تعداد محدودی از مشاهدات بالقوه یا حضور متغیرهای مخدوش کننده باعث می‌شود کاربرد استنتاج آماری محدود شود. [نیازمند منبع]

آموزش[ویرایش]

دوره‌های تحصیلات تکمیلی استنباط علی به برنامه درسی بسیاری از دانشگاه‌ها اضافه شده‌است.

برای مطالعهٔ بیشتر[ویرایش]

منابع[ویرایش]

  1. Pearl, Judea (1 January 2009). "Causal inference in statistics: An overview" (PDF). Statistics Surveys. 3: 96–146. doi:10.1214/09-SS057.
  2. Morgan, Stephen; Winship, Chris (2007). Counterfactuals and Causal inference. Cambridge University Press. ISBN 978-0-521-67193-4.
  3. "causal inference". Encyclopædia Britannica, Inc. Retrieved 24 August 2014.
  4. John Shaughnessy; Eugene Zechmeister; Jeanne Zechmeister (2000). Research Methods in Psychology. McGraw-Hill Humanities/Social Sciences/Languages. pp. Chapter 1: Introduction. ISBN 978-0-07-782536-2. Archived from the original on 15 October 2014. Retrieved 24 August 2014.
  5. Hill, Austin Bradford (1965). "The Environment and Disease: Association or Causation?". Proceedings of the Royal Society of Medicine. 58 (5): 295–300. PMC 1898525. PMID 14283879.
  6. Kailash Budhathoki and Jilles Vreeken "Causal Inference by Compression" 2016 IEEE 16th International Conference on Data Mining (ICDM)
  7. Marx, Alexander; Vreeken, Jilles (2018). "Telling cause from effect by local and global regression". Knowledge and Information Systems. doi:10.1007/s10115-018-1286-7.
  8. Hoyer, Patrik O. , et al. "Nonlinear causal discovery with additive noise models." NIPS. Vol. 21. 2008.
  9. Shimizu, Shohei, et al. "DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model." The Journal of Machine Learning Research 12 (2011): 1225-1248.
  10. Zhang, Kun, and Aapo Hyvärinen. "On the identifiability of the post-nonlinear causal model." Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. AUAI Press, 2009.
  11. ۱۱٫۰ ۱۱٫۱ Mooij, Joris M. , et al. "Probabilistic latent variable models for distinguishing between cause and effect." NIPS. 2010.
  12. Lopez-Paz, David, et al. "Towards a learning theory of cause-effect inference" ICML. 2015
  13. King, Gary (2012). Designing social inquiry: scientific inference in qualitative research. Princeton Univ. Press. ISBN 978-0-691-03471-3. OCLC 754613241.
  14. ۱۴٫۰ ۱۴٫۱ Mahoney, James (January 2010). "After KKV". World Politics. 62 (1): 120–147. doi:10.1017/S0043887109990220. JSTOR 40646193.
  15. Dominus, Susan (18 October 2017). "When the Revolution Came for Amy Cuddy". The New York Times (به انگلیسی). ISSN 0362-4331. Retrieved 2019-03-02.
  16. "The Statistical Crisis in Science". American Scientist (به انگلیسی). 6 February 2017. Retrieved 2019-04-18.
  17. Creswell, John W.; Clark, Vicki L. Plano (2011). Designing and Conducting Mixed Methods Research (به انگلیسی). SAGE Publications. ISBN 978-1-4129-7517-9.
  18. Seawright, Jason (September 2016). Multi-Method Social Science by Jason Seawright. Cambridge Core (به انگلیسی). doi:10.1017/CBO9781316160831. ISBN 978-1-316-16083-1. Retrieved 2019-04-18.
  19. Smith, Herbert L. (10 February 2014). "Effects of Causes and Causes of Effects: Some Remarks from the Sociological Side". Sociological Methods and Research. 43 (3): 406–415. doi:10.1177/0049124114521149. PMC 4251584. PMID 25477697.
  20. Goertz, Gary; Mahoney, James (2006). "A Tale of Two Cultures: Contrasting Quantitative and Qualitative Research". Political Analysis (به انگلیسی). 14 (3): 227–249. doi:10.1093/pan/mpj017. ISSN 1047-1987.
  21. "GOVT 6069: Causal Inference". Government (به انگلیسی). 2019-02-27. Retrieved 2018-02-27.
  22. "Introduction to Causal Inference". Political Science (به انگلیسی). 2015-05-21. Archived from the original on 1 February 2019. Retrieved 2018-08-26.
  23. https://education.utexas.edu/departments/educational-psychology/graduate-programs/quantitative-methods/required-courses-doctoral[پیوند مرده]
  24. "Samantha Kleinberg: Fall 2015 Causal Inference".
  25. "Bios 776". Archived from the original on 22 July 2017. Retrieved 26 July 2019.
  26. "Statistics 265 - Spring 2018".

پیوند به بیرون[ویرایش]