بازی هم‌دستی

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از بازی‌های تعاونی)

نظریه بازی‌ها به دو شاخه تقسیم می‌شود: بازی‌های هم‌دستی (با همکاری، تعاونی) و بازی‌های بدون همکاری. تفاوت این دو شاخه در وابستگی متقابل بازیکنان است. بازی‌های بدون همکاری مدلی با جزئیات بسیار است که حرکات مجاز برای بازیکنان، استراتژی و سود و هزینه آن‌ها را تحلیل می‌کند. در این نوع بازی، بازیکنان امکان اتحاد و رفتار مشترک ندارند یا این امکان را دارند اما به شرطی که این رفتار مشترک و معاهده منعقد شده بین آن‌ها اثر خارجی بر بازیگران ثالث نداشته باشد.[۱] در حالی که در بازی‌های هم‌دستی این سطح از جزئیات وجود ندارد و بازی‌هایی هستند میان گروهی از بازیکنان که در آن به اثرات خارجی رفتار مشترکی که آن‌ها در نظر دارند و رویدادی که منجر به این رفتار مشترک شده توجه می‌شود.

در نظریه بازی‌های هم‌دستی، به کلیت استراتژی‌های انتخاب هر بازیکن دقت می‌شود و بیشتر تمرکز معطوف به تحلیل ائتلاف‌هایی که بازیکنان باهم به وجود می‌آورند استراتژی‌های آنان در این ائتلاف است. به این صورت که سود به‌دست آمده پس از ایجاد هر ائتلاف و تأثیر آن بررسی می‌شود و با توجه به نتایج به‌دست آمده در مورد امکان ایجاد یا عدم ایجاد این ائتلاف‌ها تصمیم گرفته می‌شود. در این بازی‌ها آنچه به‌صورت دقیق مشخص نمی‌شود این موضوع است که در فرایند تشکیل این ائتلاف‌ها چه کنش‌هایی میان بازیکنان مختلف رخ می‌دهد.[۲][۳] برای مثال، فرض کنید که بازیکنان ما احزاب مختلف راه‌یافته به مجلس نمایندگان هستند و هر یک از این احزاب قدرت مشخصی دارد. این قدرت با توجه به تعداد صندلی اشغال شده توسط آن‌ها در مجلس نمایندگان بررسی می‌شود. در نظریه بازی‌های هم‌دستی ائتلاف‌های مختلف و چگونگی در اختیار گرفتن اکثریت توسط آن‌ها مشخص می‌شود، اما به فرایند تشکیل این ائتلاف‌ها و بحث‌ها و مذاکرات لازم توجه نمی‌شود و در اندازه‌گیری‌های ما این مقادیر دخیل نیستند.[۴]

مفاهیم ریاضی[ویرایش]

نشان‌دهنده مجموعه بازیکنان است. هر زیرمجموعه ناتهی از یک ائتلاف یا اتحاد نامیده می‌شود. برای مثال اعضای مشغول در یک تیم کاری می‌تواند یک ائتلاف باشد. به کل مجموعه نیز ائتلاف بزرگ گفته می‌شود. همچنین ائتلاف تهی با علامت ∅ نشان داده می‌شود و مجموعه تمام ائتلاف‌ها با مجموعه توانی برابر است که آن را با نمایش می‌دهیم. هر ائتلاف را می‌توان یکی از اجزای این مجموعه برشمرد.

تابع مشخصه[ویرایش]

تابع مشخصه یک بازی نفره تابعی است که یک مقدار را به هر زیرمجموعه از بازیکن‌ها نسبت می‌دهد.

مقدار میزان بیشینه سود زیرمجموعه از بازیکنان را نشان می‌دهد در صورتی که این بازیکنان یک ائتلاف را تشکیل دهند. این میزان با صفر در نظر گرفتن اثر خارجی احتمالی ائتلاف‌های دیگر روی این ائتلاف بررسی می‌شود. در بعضی‌اوقات این مقدار، ماکسمین هزینه در نظر گرفته می‌شود به این صورت که همه بازیکن دیگر هم به عنوان یک ائتلاف در نظر گرفته می‌شوند. ().[۵]

به ، ارزش ائتلاف نیز گفته می‌شود.[۶] همچنین برابر صفر در نظر گرفته می‌شود.

ویژگی‌ها[ویرایش]

زبرجمعی[ویرایش]

توابع مشخصه در این قسمت غالباً به صورت توابع زبرجمع در نظر گرفته می‌شوند. یک تابع زبرجمع است اگر شرط زیر روی آن برقرار باشد. (v(S ∪ T) ≥ v(S) + v(T

البته این تعریف زمانی برقرار است که S ∩ T = ∅ هم برقرار باشد. یعنی عبارت دوم شرط عبارت اول است.

تقسیم پذیری پایان ناپذیر[ویرایش]

میزان سود ناشی از هر بازی را تقسیم پذیر پایان ناپذیر می‌نامیم اگر بتوان این میزان را بین بازیکنان مشخص به هر صورت ممکن تقسیم نمود.

نسبت[ویرایش]

یک نسبت به میزان سهمی گفته می‌شود که یک بازیگر مشخص از سود کلی بدست آمده از آن خود می‌کند. برای یک بازی با n بازیگر مجموعه نسبت‌ها به این صورت نوشته می‌شود.

غلبه[ویرایش]

نسبت x به نسبت y، روی فضای s غلبه دارد اگر و تنها اگر دو شرط زیر برقرار باشد[۵]

ارتباط با بازی‌های بدون همکاری[ویرایش]

فرض کنیم یک بازی بدون همکاری است، حال فرض می‌کنیم که بازیکنان توانایی ایجاد ائتلاف‌های مختلف با توانایی اعمال رفتار مشترک را داشته باشند. چند بازی هم‌دستی با در ارتباط خواهندبود. این بازی‌ها را تمثال‌های می‌نامیم. دو نمونه معروف از این تمثال‌ها در زیر آمده‌اند.

  • بازی‌های مؤثر آلفا (α-effective game) بازی‌هایی هستند که در آن به ازای هر ائتلاف مجموع سود بازیکنان با پیوستن به آن‌ها ضمانت شده‌است. ضمانت به این معنا است که این میزان، بیشینه کمینه هاست. یعنی بیشینه میزان سود کمینه در صورت انتخاب سایر استراتژی‌ها.
  • بازی‌های مؤثر بتا (β-effective game) بازی‌هایی هستند که در آن به ازای هر ائتلاف مجموع سود بازیکنان با پیوستن به آن‌ها ضمانت استراتژیک شده‌است. ضمانت استراتژیک به‌این معنا است که این میزان، کمینه بیشینه هاست. یعنی کمینه میزان سود بیشینه در صورت انتخاب سایر استراتژی‌ها.[۷]

راه حل یا نتیجه یک بازی باهمکاری[ویرایش]

شامل:

۱- تجزیه به ائتلاف هاست که این تجزیه، ساختار ائتلاف نامیده می‌شود. ساختار ائتلاف در مجموعه یک مجموعه‌ای ناتهی از زیر مجموعه‌های ناتهی از که شرایط زیر را داشته باشد:

برابراست با .

۲- یک بردار سود یا هزینه است که ارزش هر ائتلاف را بین بازیکنانش تقسیم می‌کند.[۶] بردار بردار سود یا هزینه برای یک ساختار ائتلاف روی است اگر:

نتیجه یک زوج است که سود یا هزینه ائتلاف تحت بردار است. در کارآمد است اگر : این بردار برای ساختار ائتلاف یک نسبت دادن است اگر کارآمد و تک به تک عاقلانه باشد.

انواع مختلف بازی[ویرایش]

بازی یکنواخت[۶]

بازی یکنواخت است اگر

بیشتر بازی‌ها یکنواخت هستند. غیریکنواختی در مواقعی به وجود می‌آید که بعضی از بازیکنان به شدت از هم بدشان بیاید یا هزینه‌های برقراری ارتباط به صورت غیرخطی به نسبت اندازه اتحاد افزایش یابد.

بازی افزایشی[۶]

بازی افزایشی است اگر برقرار باشد.

بازی محدب[۶]

یک بازی محدب است اگر برقرار باشد. یک بازی محدب، افزایشی است.

بازی جمع ثابت[۶] یک بازی جمع ثابت است اگر

بازی ساده

یک بازی ائتلافی ساده است اگر ارزش‌ها در تابع مشخصه ۰ یا ۱ باشند. (۰ به معنای باخت و ۱ به معنای برد است) یک بازی ساده را می‌توان با نشان داد که مجموعه از ائتلاف‌های بازی است که برنده‌اند و باقی ائتلاف‌ها بازنده هستند. به بازی‌های ساده ابرگراف یا تابع‌های منطقی نیز گفته می‌شود.

  • یک بازی ساده یکنواخت است اگر هر ائتلافی که شامل یک ائتلاف برنده است خود برنده باشد. و نتیجه دهد .
  • یک بازی ساده مناسب است اگر مکمل هر ائتلاف برنده، بازنده باشد. نتیجه دهد .
  • یک بازی ساده، قوی است اگر مکمل هر ائتلاف بازنده، برنده باشد. نتیجه دهد .
    • اگر یک بازی ساده، مناسب و قوی باشد، یک ائتلاف برنده است اگر و تنها اگر مکمل آن بازنده باشد.
  • در یک بازی ساده، بازیکن وتو بازیکنی است که در همه ائتلاف‌های برنده حضور دارد؛ بنابراین اگر چنین بازیکنی وجود داشته باشد، ائتلاف‌هایی که شامل این بازیکن نیستند ائتلاف‌های بازنده‌اند.
    • یک بازی ساده ضعیف است اگر بازیکن وتو داشته باشد.
    • دیکتاتور در بازی ساده بازیکن وتو است.
  • حامل یک بازی ساده ، مجموعه است به این صورت که به ازای هر ائتلاف داریم اگر و تنها اگر برقرار باشد.
    • اگر یک بازی ساده حامل داشته باشد، از بازیکنانی که جز آن نباشند صرف نظر می‌شود. بعضی‌اوقات به بازی ساده‌ای که متناهی حامل داشته باشد بازی متناهی گفته می‌شود. (حتی اگر تعداد بازیکنان آن نامتناهی باشد)
  • عدد ناکامورا در یک بازی ساده برابر با کمینه تعداد ائتلاف‌های برنده است که باهم هیچ اشتراکی نداشته باشند. طبق قضیه ناکامورا این عدد میزان عقلانیت بازی را اندازه می‌گیرد.

بین تعاریف بالا در بازی ساده روابطی وجود دارد.[۸] برای مثال:

  • اگر یک بازی ساده، ضعیف باشد، مناسب هم هست.
  • یک بازی ساده دیکتاتوری است اگر و تنها اگر قوی و ضعیف باشد.

راه حل‌های عادلانه[۳][ویرایش]

فرض اولیه در بازی‌های باهمکاری این است که ائتلاف بزرگ شکل می‌گیرد. چالش این است که هزینه را بین بازیکنان عادلانه تقسیم کنیم. یک راه حل یک بردار است که نشان دهنده تخصیص به بازیکنان است. راه حل‌ها براساس تعریف‌های متفاوتی از عادلانه بودن تعریف می‌شوند. تعاریف:

  • کارآمد بودن: بردار هزینه دقیقاً مقدار کل را تقسیم می‌کند.
  • تک به تک عاقلانه: هیج بازیکنی کمتر از چیزی که به تنهایی می‌توانست بدست‌آورد، به‌دست نیاورد.
  • وجود داشتن: این راه حل برای همه بازی‌ها وجود داشته باشد.
  • منحصر به فرد بودن: این راه حل برای هر بازی منحصربه‌فرد باشد.
  • تقارن: راه حل به بازیکن‌های قرینه مقدار یکسان تخصیص دهد. دو بازیکن و قرینه هستند اگر
  • افزایشی: تخصیص دادن به یک بازیکن در مجموع دو بازی برابر باشد با مجموع تخصیص دادن به همان بازیکن در دو بازی به صورت تکی.
  • صفر تخصیص دادن به بازیکنان پوچ یا مصنوعی: بازیکن پوچ یا مصنوعی این شرط را دارد: در واقع بازیکن پوچ یا مصنوعی به بازیکنی گفته می‌شود که در فرایند تولید سود هیچ مشارکتی ندارد.
  • یک بردار هزینه کارآمد و تک به تک عاقلانه یک نسبت دادن نامیده می‌شود.

چانه زنی نش

در حالتی که ۲ بازیکن داریم استفاده می‌شود.

مجموعه پایدار

مجموعه پایدار یک بازی اولین راه حلی بود که برای بازی‌های با بیشتر از ۲ بازیکن پیشنهاد شد. اگر یک بازی باشد و و دو نسبت دادن به ، در این صورت بر غلبه می‌کند اگر اتحاد وجود داشته باشد که و . به عبارتی دیگر بازیکنان در هزینه‌های را به ترجیح می‌دهند و اگر انتخاب شود می‌توانند تهدید به ترک اتحاد بزرگ کنند زیرا وقتی به تنهایی عمل کنند حداقل به اندازه کسب می‌کنند که از بیشتر است. مجموعه پایدار مجموعه‌ای از نسبت دادن هاست که دو شرط زیر را دارند:

  • پایداری درونی: هیچ برداری در آن توسط بردار دیگری در مجموعه مغلوب نمی‌شود.
  • پایداری بیرونی: همه بردارهای خارج مجموعه توسط بردارهای داخل آن مغلوب می‌شوند.

فون نیومن و مرگانسترن مجموعه پایدار را به عنوان مجموعه‌ای از رفتارهای قابل قبول در جامعه توصیف می‌کنند؛ زیرا به ازای هر رفتار نامطلوب یک جایگزین قابل قبول وجود دارد و خود رفتارهای قابل قبول برهم برتری ندارند.

  • مجموعه پایدار لزوماً وجود ندارد و اگر وجود داشته باشد، معمولاً یکتا نیست. پیدا کردن آن‌ها هم بسیار دشوار است. دشواری‌های پیدا کردن این راه حل باعث به وجود آمدن راه حل‌های دیگر شده‌است.

هسته

یکی از ایده‌های اصلی حل این مسئله هسته است. هسته بر مبنای پایداری هر ائتلاف ایجاد شده‌است. این ایده بر این مبنا است که شرط الزامی برای ایجاد یک ائتلاف، آن است که هیچ زیرمجموعه ای از بازیکنان انگیزه خروج از آن را نداشته باشند. به عبارتی ائتلاف پایدار باشد.

برای بررسی بیشتر این موضوع یک بردار سود را در نظر بگیرید، به صورتی که سود بازیکن ام باشداگر مجموع توابع مشخصه‌های تک تک بازیکنان حاضر در یک ائتلاف بیشتر از مجموع میزان سود تخصیص یافته به آن‌ها در بردار سود باشد، این ائتلاف حاضر به پذیرش این بردار نخواهد بود این شیوه ناپایدار است. در واقع برای پایداری دو شرط زیر باید برقرار باشند:

اول دوم اینکه مجموعه از بازیکنان حداقل به اندازه وقتی که ائتلاف را تشکیل می‌دادند دریافت کنند. به عبارتی دیگر :

اگر اندازه هسته بازی برابر ۰ باشد یا به عبارتی این مجموعه تهی باشد به‌این معناست که هیچ شیوه تقسیم پایداری برای این بازی وجود ندارد و اگر اندازه این هسته بیشتر از ۰ باشد و مجموعه تهی نباشد به‌این معناست که چند شیوه برای تقسیم پایدار بین ائتلاف‌های موجود وجود دارند.

  • هسته یک بازی می‌تواند تهی باشد. بازی‌هایی که هسته ناتهی دارند بازی‌های متعادل نامیده می‌شوند.
  • هسته بازی لزوماً شامل یک بردار منحصر به فرد نیست.
  • هسته، درون هر مجموعه پایداری وجود دارد.

پس جواب داشتن یا نداشتن یک مسئله بازی هم‌دستی به اندازه هسته بستگی دارد. پس بیشتر بحث‌های مربوط به پاسخ این مسئله پیرامون دو سؤال خواهد بود، آیا اندازه هسته این بازی هم‌دستی برابر ۰ است یا خیر؟ آیا بردار تقسیم سود عضو هسته این بازی هم‌دستی یا خیر؟

مقدار شپلی[۹]

راه حل‌های کلی علاوه بر چگونگی تقسیم کلی سود به تقسیم سود بین اعضای مختلف یک ائتلاف هم می‌پردازند. فرض کنید ائتلاف شکل گرفته و از شکل‌گیری آن سود نصیب این ائتلاف خواهد شد. مقدار شپلی، بردار هزینه یکتایی است که اصولی برای این تقسیم تعیین می‌کند. فرض کنید که به هر بازیکن میزان سود خواهد رسید. این توزیع باید ویژگی‌های کارآمد بودن، تقارن و افزایشی را داشته باشد و همچنین در این توزیع بازیگر پوچ یا مصنوعی نباید از سود سهمی ببرد. مقدار شپلی یک بازی افزایشی، تک به تک عاقلانه است ولی در کل این حکم درست نیست.

جستارهای وابسته[ویرایش]

بازی هماهنگی تعادل نش

منابع[ویرایش]

  1. http://www.gametheory.net/dictionary/Non-CooperativeGame.html
  2. "Cooperative Game Theory: Charactristic Functions, Allocations, Marginal Contribution" (PDF).[پیوند مرده]
  3. ۳٫۰ ۳٫۱ Chandrasekaran, R. "Cooperative Game Theory" (PDF).
  4. http://www.cdam.lse.ac.uk/Reports/Files/cdam-2001-09.pdf
  5. ۵٫۰ ۵٫۱ http://www.math.cornell.edu/~erin/undergrad/121/121review.pdf
  6. ۶٫۰ ۶٫۱ ۶٫۲ ۶٫۳ ۶٫۴ ۶٫۵ "Cooperative Game Theory" (PDF).
  7. Aumann, Robert J. "The core of a cooperative game without side payments." Transactions of the American Mathematical Society (1961): 539-552.
  8. Peleg, B. (2002). "Chapter 8 Game-theoretic analysis of voting in committees". Handbook of Social Choice and Welfare Volume 1. Handbook of Social Choice and Welfare. Vol. 1. pp. 195–201. doi:10.1016/S1574-0110(02)80012-1. ISBN 978-0-444-82914-6.
  9. http://www.cs.ox.ac.uk/people/michael.wooldridge/pubs/ieeeis2012d.pdf