دوراهی زندانی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

دوراهی زندانی یک مسئلهٔ پایه‌ای در نظریه بازی‌ها به شمار می‌آید و نشان می‌دهد که چطور دو نفر در همکاری برای این که خود به سود بیشتری برسند به خودشان ضرر وارد می‌کنند. این موضوع اولین بار توسط مریل فلود و ملوین درشر در سال ۱۹۵۰ مطرح شد. بعدها آلبرت دابلیوتاکر این مسئله را به عنوان یک معضل رسمی در اقتصاد با عنوان معمای زندانی‌ها (۱۹۹۲، poundstone) به چاپ رساند.

یک مثال کلاسیک که از دوراهی زندانی بیان می‌شود، به شرح زیر است:

دو مظنون توسط پلیس دستگیر شده‌اند پلیس باید شواهد کافی برای محکومیت مظنونین جمع آوری کند و برای این کار به صورت جداگانه از مظنونین باز جویی می‌کند. اگر یکی از مظنونین علیه دیگری شهادت دهد و مظنون دیگر سکوت را ترجیح دهد، در این حالت مظنون اول آزاد و دیگری به یک سال حبس محکوم می‌شود. اگر هر دو سکوت در بازجویی را انتخاب کنند هر دو زندانی در زندان تنها برای یک ماه حبس خواهند کشید و اما اگر هر دو علیه دیگری شهادت دهند باید به مدت ۳ ماه هر زندانی حبس بکشد. هر زندانی باید بین خیانت و سکوت یکی را انتخاب کند و هر کدام از آنها نمی‌داند که دیگری کدام راه را انتخاب می‌کند.

انتخاب زندانیان چگونه خواهد بود؟

اگر ما فرض کنیم هر زندانی برای حداقل رساندن مدت حبس خود یکی از این دو راه را انتخاب می‌کند، می‌توانیم در نظر بگیریم که این بازی یک بازی با مجموع غیر صفر است که هر دو ممکن است از دو گزینه همکاری یا خیانت انتخاب کنند. در این بازی، مانند دیگر حالت‌های نظریه بازی ها نگرانی هر فرد تنها حداکثر کردن بازده خود است، بدون هیچ گونه نگرانی نسبت به نتیجه نهایی بازیکن دیگر تعادل منحصربه‌فرد این بازی، راه حل بهینه پارتو است، که در آن انتخاب منطقی هر بازیکن خیانت به دیگری است، هر چند پاداش فردی هر بازیکن در صورتی که همکاری را انتخاب کنند بیشتر خواهد بود.

در فرم کلاسیک این بازی، همکاری دو بازیکن به صورتی است که تعادل تنها راه ممکن برای حداکثر کردن بازده‌است، البته در بعضی از کالاها دولت با اعمال ممنوعیت‌ها و محدودیت‌هایی اجازه همکاری دو بنگاه یا چند بنگاه را برای حداکثر کردن بازده و بالا بردن قیمت می‌گیرد. از آنجا که در هر وضعیت به نظر هر بازیکن خیانت بازی سودمندتر است پس هر بازیکن بدون در نظر گرفتن انتخاب بازیکن دیگر دست به خیانت می‌زند. سرانجام همکاری بین آنها به مرگ منجر می شود.

در استفاده گاه گاه، معمای زندانی‌ها ممکن است مطابق معیارهای رسمی کلاسیک نباشد به عنوان مثال: کسانی که دو نهاد فعالیت می‌کنند، می‌توانند مزایای مهم از همکاری بدست آورند و با بالا بردن قیمت و در نهایت حداکثر کردن بازده قصد تشکیل کارتل را دارند، یا ممکن است با سیاست‌های محدود کنندهٔ دولت مواجه شود و یا ممکن است با خیانت هر یک از بازیکنان منجر به عدم تشکیل کارتل شود.

استراژی کلاسیک برای معمای زندانی‌ها[ویرایش]

زندانی ۲ سکوت می‌کند زندانی ۲ خیانت می‌کند
زندانی ۱ سکوت می‌کند هر کدام یک ماه زندانی زندانی ۱ یک سال حبس
زندانی ۲ آزاد می‌شود
زندانی ۱ خیانت می‌کند زندانی۱ آزاد می‌شود
زندانی ۲ یک سال حبس
هر کدام ۳ ماه زندانی

تصور کنید شما جای بازیکن۱ هستید، اگر بازیکن ۲ تصمیم بگیرد که در مورد ارتکاب جرم سکوت کند، بنابراین بهتر است که شما خیانت کنید زیرا شما آزاد می‌شوید و او به یک سال حبس محکوم می‌شود و همین طور اگر بازیکن ۲ تصمیم بگیرد که خیانت کند، باز هم تصمیم منطقی برای شما خیانت کردن در مورد ارتکاب جرم است زیرا شما در این حالت به ۳ ماه و در حالت سکوت به یک سال حبس محکوم خواهید شد. پس استراژی غالب در مورد تصمیم گیری برای شما خیانت کردن است.

به عنوان زندانی شما بدون شک می‌توانید بگویید که 'مهم نیست که زندانی ۲ چه انتخابی کند، برای من بهتر است که خیانت کنم با این حال، اگر بازیکن دیگر نیز به همین ترتیب عمل کند، سپس شما هر دو خیانت می‌کنید و هر دو در بدترین حالت ممکن به ۳ ماه حبس محکوم می‌شوید. بنابراین این تصمیم گیری به ظاهر منطقی منجر به انتخاب احکام بدتر می‌شود. این مسئله نشان می‌دهد که در تئوری بازی‌ها در یک بازی با مجموع غیر صفر نیازمند تعادل نش، بهینه پارتو نمی‌شود.

اگر زندانی‌ها اجازه برقراری ارتباط را با همدیگر داشته باشند، با اعتماد به یکدیگر، هر دو انتخاب عقلانی را سکوت می‌دانند و سپس منجر به کاهش مجازات هر دو می‌شود.

حالت تعمیم یافته[ویرایش]

در این مرحله ما می‌توانیم چارچوب معضل زندانی‌ها را به تئوری بازی‌ها تعمیم دهیم. این وضعیت از تئوری بازی‌ها در آزمایش‌های اقتصاد تجربی مورد استفاده قرار می‌گیرد. قوانین زیر وضعیت واقعی از بازی را محقق می‌کند. فرض کنید دو بازیکن و یک بانکدار وجود دارد هر بازیکن دارای مجموعه‌ای از دو کارت است که روی یکی از کارت‌ها کلمه همکاری چاپ شده و روی دیگری کلمه نقض همکاری چاپ شده‌است.

هر بازیکن یک کارت را به صورت بر عکس جلوی بانکدار می‌گذارد البته این در حالتی است که هر بازیکن نمی‌داند دیگری چه کارتی را انتخاب می‌کند. دو بازیکن داریم، قرمز و آبی اگر بازیکن قرمز همکاری و بازیکن آبی نقض همکاری را انتخاب کند، امتیاز بازیکن قرمز ۵ و بازیکن آبی ۰ خواهد بود. اگر هر دو همکاری را انتخاب کنند هر دو امتیاز ۳ را بدست می‌آورند و اگر هر دو نقض همکاری را انتخاب کنند به امتیاز ۱ خواهند رسید.

ماتریس نشان دهنده انتخاب‌های این دو بازیکن به شرح زیر است.

نتیجه نهایی ماتریس نمونه:

همکاری نقض همکاری
همکاری ۳ و ۳ ۰و ۵
نقض همکاری ۵ و ۰ ۱ و ۱

در حالت برد و باخت ماتریس اینگونه‌است:

همکاری نقض همکاری
همکاری برد - برد باخت بیشتر- برد بیشتر
نقض همکاری برد بیشتر – باخت بیشتر باخت – باخت

نتیجه نهایی ماتریس کنونیکال:

همکاری نقض همکاری
همکاری R،R T، S
نقض همکاری S، T P، P
  • T نتیجه برد در انتخاب نقض همکاری
  • R نتیجه برد در انتخاب همکاری متقابل
  • P نتیجه باخت در انتخاب نقض همکاری توسط هر دو بازیکن
  • S نتیجه باخت در انتخاب همکاری

T>R>P>S[ویرایش]

برای تعریف معمای زندانی‌ها به نامعادلهٔ زیر توجه فرمایید: این شرایط تضمین می‌کند که نتیجه تعادل ارتداد است، اما این همکاری بهینه پارتو به حساب نمی‌آید.

رفتارهای انسانی در معمای زندانی‌ها[ویرایش]

در یک آزمایش تجربی بر اساس معمای زندانی‌ها فقط ۴۰٪ شرکت کنندگان در بازی همکاری را انتخاب کردند. ( به عبارتی سکوت را ترجیح دادند)

نمونه‌هایی از دنیای واقعی[ویرایش]

این نمونه‌های خاص مربوط به زندانی‌ها و جعبه انتخاب‌های آنها می‌شود و به این ترتیب ممکن است ساختگی به نظر برسد اما در واقعیت نمونه‌های بسیاری در تعادل انسان و فعل و انفعالات در طبیعت وجود دارد که نتیجه نهایی آن همان ماتریس می‌شود. معمای زندانی‌ها علاوه بر علوم اجتماعی مانند اقتصاد، سیاست و جامعه شناسی در علوم تجربی مانند علوم زمین شناسی، زیست شناسی و... مورد استفاده قرار می‌گیرد. بسیاری از فرایندهای طبیعی مشتق شده از مدل‌هایی که در آن موجودات زنده در بازی‌ها بی پایان از جمله معمای زندانی‌ها درگیر هستند، می‌باشد.

این کاربرد گسترده از معمای زندانی‌ها نشان می‌دهد که این بازی اهمیت قابل توجهی دارد.

در سیاست[ویرایش]

در علوم سیاسی، به عنوان سناریوی معمای زندانی‌ها اغلب برای نشان دادن مشکل دو کشور درگیر مسابقه تسلیحاتی مورد استفاده قرار می‌گیرد. به این دلیل که هر ۲ انتخاب دارند که یکی افزایش هزینه‌های نظامی و دیگری توافق برای کاهش سلاح است. هر کدام از دولت‌ها از توسعه نظامی سود می‌برند، صرف نظر از آنچه که دولت‌های دیگر انجام می‌دهند، بنابراین آنها هر دو با سرعت به سمت گسترش نظامی می‌روند. پارادوکس این است که همه دولت‌ها اقدامات خود را منطقی می‌دانند، اما در نتیجه متوجه می‌شوند که غیر منطقی عمل کرده‌اند. و این ممکن است منجر به نظریه باز دارندگی شود.

در علوم زیستی[ویرایش]

در مطالعات زیست محیطی، معمای زندانی‌ها در بحران‌ها از جمله تغییرات آب و هوایی جهانی آشکار است. همه کشورها از آب و هوای پایدار سود می‌برند، اما یک کشور مستقل با تردید برای محدود کردن انتشار گاز co۲ تصمیم می‌گیرد.

سود فوری برای کشوری است که به صورت فردی به حفظ رفتار فعلی اقدام می‌کنند و سود احتمالی به همه کشورهایی که اگر رفتارشان را تغییر دهند می‌رسد.

در برنامه مدیریت و توسعه فناوری، معمای زندانی‌ها شامل رابطه بین مشتری و توسعه دهنده می‌شود مورد بررسی کاپیتان دن وارد افسر نیروی هوایی آمریکا، معضل مدیریت برنامه در مقاله‌ای در مجله Defence AT&L مورد بررسی قرارداد.

در علوم اجتماعی[ویرایش]

در جامعه شناسی و جرم شناسی، این معضل ممکن است به معضل واقعی روی دو زندانی کاربرد داشته باشد نظریه پرداز مارک کمینسکی، زندانی سیاسی سابق، تجزیه و تحلیل عوامل موثر در نتیجه نهایی معمای زندانی‌ها در بازی دادستان ممکن است عوامل دیگری وجود داشته باشد که بازی را به صورت معمای زندانی‌ها هدایت نکند، در واقع خواص بالقوه معمای زندانی‌ها را مورد بررسی قرار داد.

در اقتصاد[ویرایش]

در بازاریابی و تبلیغات در بعضی از مواقع با معمای زندانی‌ها روبرو می‌شویم. فرض کنید دو تولید کننده سیگار برای جلب مشتری تبلیغات خود را بیشتر کنند. شرکت ۱ برای تبلیغات و اثر بخشی بیشتر تبلیغات هزینه‌های تبلیغات خود را بیشتر می‌کند، در جواب شرکت ۲ نیز هزینه‌های خود را بیشتر می‌کنند، به همین ترتیب این دو شرکت در رقابت با هم به همدیگر ضرر می‌رسانند. اگر این دو شرکت با توافق تبلیغات خود را کاهش دهند هزینه‌های آنها کمتر می‌شود و به نقطه مطلوبتری از منافع می‌رسند. حال فرض کنید تولید کنندگان سیگار در بازار بیش از دو شرکت باشند وضعیت بازار از حالت قبل نیز بدتر خواهد شد. بهترین استراژی برای رسیدن به حداکثر بازده تشکیل اتحادیه و کارتل است، اتحادیه‌ای که به طور مثال قوانینی وضع کند که تولید کنندگان را در تبلیغات یا هر مورد دیگری با محدودیت روبرو سازد. البته سیاست‌های دولت نیز می‌تواند به نوعی نقش قوانین کارتل را بازی کند.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا، «Prisoner's dilemma»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد.

منابع بیشتر[ویرایش]

ویدیوهای آموزشی نظریه‌ی بازی‌ها به زبان فارسی: http://xonomics.com