استراتژی ماشه

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو

در نظریه بازی، استراتژی ماشه یکی از استراتژی‌های پرکاربرد در بازی‌های تکرارشونده است. بازیکنی که استراتژی ماشه را به کار میبرد، در ابتدا همکاری می‌کند، اما به محض این که بازیکن دیگر استراتژی دیگری در پیش گرفت، بازیکنی که استراتژی ماشه را به کار بسته است، تا انتهای بازی روشی غیر از حالت اولیه در پیش می‌گیرد. از آن که کوچکترین عدم همکاری از سوی بازیکن رقیب، موجب کنار گذاشتن همکاری تا ابد می‌شود، استراتژی ماشه بیشترین بی تفاوتی را برای بازیکنی که آن را در پیش گرفته، منعکس می‌سازد.

دوراهی زندانی بی نهایت تکرارشونده[ویرایش]

معمای دوراهی زندانی بی نهایت تکرارشونده، مثالی خوب برای بررسی استراتژی ماشه است. شکل استاندارد بازی برای دو بازیکن، به صورت جدول زیر است:

زندانی ۲ سکوت می‌کند زندانی ۲ خیانت می‌کند
زندانی ۱ سکوت می‌کند هر کدام یک ماه زندانی زندانی ۱ یک سال حبس
زندانی ۲ آزاد می‌شود
زندانی ۱ خیانت می‌کند زندانی۱ آزاد می‌شود
زندانی ۲ یک سال حبس
هر کدام ۳ ماه زندانی

در این بازی، در هر مرحله دو انتخاب برای هر یک از دو بازیکن وجود دارد:

  1. همکاری
  2. تخطی برای یک منفعت فوری

اگر یک بازیکن تخطی کند، او در بقیه بازی تنبیه خواهد شد. در واقع، برای هر دو بازیکن بهتر است که همکاری کنند، تا این که یکی به دیگری خیانت کند. لذا انتخاب ترکیب استراتژی (سکوت، سکوت) نسبت به (خیانت، خیانت) برای هر دو بازیکن بهتر است. همچنین تنها تعادل نش بازی، ترکیب ترک همکاری و تنبیه یکدیگر است.

در استراتژی ماشه، یک بازیکن در دور اول و دورهای بعدی، همکاری می‌کند و این روند را تا زمانی که حریفش نسبت به توافقشان خیانت نکرده‌است، ادامه می‌دهد. هر گاه یکی از بازیکنان متوجه شود که حریفش به او خیانت کرده‌است، از مرحله بعد تا ابد او را تنبیه خواهد کرد.

به منظور محاسبه تعادل نش زیر بازی کامل برای استراتژی ماشه زیر که برای بازی در نظر گرفته شده، استراتژی برای بازیکنان i و j به صورت زیر است:

  • در پیش گرفتن سکوت، تا زمانی که هیچ کس در دوره‌های قبلی خیانت نکرده‌است.
  • در صورت خیانت یک نفر در دوره قبل، در پیش گرفتن خیانت برای همیشه...

این استراتژی در صورتی که ضریب تنزیل باشد، تعادل نش زیربازی کامل است. به عبارت دیگر، اگر ضریب تنزیل کمتر از نیم باشد، هیچ یک از دو بازیکن انگیزه ای برای خیانت و خروج از توافق ندارند.

برای اثبات این که این استراتژی تعادل نش زیربازی کامل است، نشان می‌دهیم که همکاری بهترین پاسخ به همکاری بازیکن دیگر است و ترک توافق نیز بهترین پاسخ به ترک توافق از سوی بازیکنِ حریف.

مرحله 1: فرض می‌کنیم تاکنون خیانتی نشده‌است:

  • آوردهٔ بازیکن i از همکاری برابر است با:
  • آوردهٔ بازیکن i از خیانت برابر است با:

در این حالت، همکاری تا زمانی که باشد بهتر از خیانت است. این نشان می‌دهد که اگر باشد، همکاری بهینه پارتو است.

مرحله 2: فرض کنید که تاکنون یک نفر خیانت کرده‌است. در این صورت:

  • آوردهٔ بازیکن i از همکاری برابر است با:
  • آوردهٔ بازیکن i از ترک توافق و خیانت برابر است با:

در این حالت نیز به ازای مقادیر مختلف دلتا، خیانت بهترین پاسخ است.

استدلال اخیر نشان می‌دهد که اگر دلتا از نیم بزرگتر باشد، انگیزه ای برای تخطی از همکاری وجود ندارد.

استراتژی ماشه در روابط بین‌الملل[ویرایش]

در روابط بین‌الملل، یک کشور تحت استراتژی ماشه تنها در صورتی با کشور شریکش همکاری می‌کند که هیچگاه از سوی آن کشور استثمار نشده و آن کشور به توافق‌هایش پایبند بوده باشد. از آن که در صورت تخطی یک کشور از توافق، کشور دیگر تا ابد خلاف آن توافق را عمل خواهد کرد، استراتژی ماشه می‌تواند تبدیل به یک حالت محدودکننده شود، حالتی که همه اعضا در آن به شدیدترین شکل رفتار می‌کنند. قضیه عامیانه بیان می‌کند که اگر دو کشور صبور باشند، می‌توان به یک تعادل کامل دست یافت.

مقایسه با سایر استراتژی ها[ویرایش]

این به آن در و استراتژی ماشه، استراتژی‌هایی هستند که تا حدی به هم شبیه‌اند. در هر دو استراتژی در صورتی که بازیکن توان ترک توافقش را داشته باشد، در ابتدا از آن امتناع می‌کند. تفاوت در این است که استراتژی ماشه به شکل سختگیرانه ای شدیدترین تنبیه ممکن را برای بازیکنی که تخطی کرده‌است در نظر می‌گرد، اما این به آن در (tit-for-tat) سخاوتمندانه تر است.

منابع[ویرایش]

https://en.wikipedia.org/wiki/Grim_trigger