بازی مجموع-صفر

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در نظریه بازیها و علم اقتصاد، یک بازی مجموع-صفر، یک مدل ریاضی از وضعیتی است که سود (یا زیان) یک شرکت کننده، دقیقاً متعادل با زیان های (یا سودهای) شرکت کننده (های) دیگر است. اگر مجموع سودهای شرکت کننده ها با هم جمع شود و مجموع زیان ها از آن کم شود، حاصل برابر صفر خواهد بود. در نتیجه، بریدن یک کیک (که برداشتن یک قطعه بزرگتر مقدارِ کیک موجود برای بقیه را کم می کند) اگر همه ی شرکت کننده ها ارزش مساوی برای هر واحد از کیک قائل باشند، یک بازی مجموع-صفر است (مطلوبیت نهایی را ببینید.) در مقابل، مجموع-ناصفر وضعیتی را توصیف می کند که مجموع سودها و زیان های طرف های درگیر، کمتر یا بیشتر از صفر باشد. یک بازی مجموع-صفر، یک بازی به رقابتی اکید هم نامیده می شود؛ در حالی که بازی های مجموع-ناصفر می توانند رقابتی یا غیر رقابتی باشند. بازی های مجموع-صفر بیشتر مواقع با نظریه مینیماکس که رابطه تنگاتنگی با دوگانگی برنامه‌ریزی خطی یا تعادل نش دارد.

تعریف[ویرایش]

خاصیت مجموع صفر (اگر در یک بازی، فردی چیزی به دست آورد، دیگری چیزی از دست می دهد) به این معنی است که نتیجه هر موقعیت مجموع صفر، بهینه پارتو است؛ مفهوم کارایی یا بهینگی در یک سیستم اقتصادی، به وضعیت رفاهی حاصل از این سیستم اقتصادی اشاره دارد؛ به نحوی که تخصیص منابع در فرایندهای تولید و مصرف در این سیستم اقتصادی به گونه‌ای است که نمی‌توان هیچ‌نوع تخصیص مجددی از منابع را یافت به نحوی که وضعیت رفاهی حداقل یک نفر بهبود یابد، بدون اینکه وضعیت رفاهی فردی در سیستم اقتصادی بدتر شود. این مفهوم کارایی در نظریه اقتصاد رفاه به وضعیت بهینه پارتو موسوم است. به طور کلی، هر بازی ای که همه ی استراتژی ها در آن بهینه ی پارتو باشند ، بازی کشمکشی نامیده می شود.[۱] بازی های مجموع-صفر، مثال خاصی از بازی های مجموع-ثابت هستند. در بازی های مجموع-صفر ، مجموع هر برآمد همیشه صفر است. چنین بازی هایی توزیعی هستند؛ نه یکپارچه. یعنی سهم کل که در ابتدای بازی وجود دارد (که اصطلاحاً به آن کیک می گویند) نمی‌تواند بزرگ شود. موقعیت هایی که در آن همه ی شرکت کنندگان می توانند با هم چیزی به دست آورند یا همه با هم می توانند چیزی از دست بدهند، بازی های مجموع-ناصفر نامیده می شوند. بنابراین، اگر کشوری که مقداری موز اضافی دارد با کشوری که مقداری سیب اضافی دارد وارد تجارت شود و هر دو از این مبادله سود کنند، در واقع در موقعیت مجموع-ناصفر هستند. بازی های مجموع-ناصفر دیگر، بازی هایی هستند که مجموع سودها و ضررها (مجموع چیزهایی که افراد به دست آورده اند و از دست داده اند) در برخی موارد زیادتر یا کمتر از سهم کل (یا کیکی) است که بازی با آن شروع شده است.

راهکار[ویرایش]

در یک بازی دونفره مجموع-صفر متناهی راه حل های متفاوت تعادل نش، مینیماکس و ماکسیمین راه حل یکسان به دست می دهند. در همه راه حل ها، بازیکنان بر اساس یک استراتژی ترکیبی بازی می کنند.

مثال[ویرایش]

یک بازی مجموع-صفر
A B C
1 30, -30 -10, 10 20, -20
2 10, -10 20, -20 -20, 20

ماتریس نتایج یک بازی، یک نمایش به درد بخور است. به عنوان مثال، بازی دونفره مجموع صفر نمایش داده شده را در نظر بگیرید. ترتیب بازی به این شکل است: بازیکن اول (قرمز) یکی از دو حرکت 1 یا 2 را به صورت پنهانی انتخاب می کند. بازیکن دوم (آبی) بدون اطلاع از انتخاب بازیکن اول، یکی از سه حرکت A، B یا C را به صورت مخفیانه انتخاب می کند. سپس انتخاب ها فاش می شوند و مجموع امتیازات هرکدام از بازیکن ها بر اساس حرکت هایی که انتخاب کرده بودند امتیازاتشان تغییر می کند.

مثال: قرمز حرکت 2 را انتخاب می کند و آبی حرکت B را انتخاب می کند. وقتی امتیازها اختصاص داده می شوند، قرمز 20 امتیاز و آبی 20 امتیاز کسب می کند.

در این مثال، هر دو بازیکن ماتریس نتایج را می دانند وتلاش می کنند امتیاز خود را بیشینه کنند. بازیکن ها باید چه کنند؟ قرمز می تواند این گونه استدلال کند: «با حرکت 2، تا 20 امتیاز از دست می دهم و فقط می توانم 20 امتیاز بگیرم؛ در حالی که با حرکت 1، فقط 10 امتیاز ممکن است از دست بدهم ولی می توانم تا 30 امتیاز به دست آورم. در نتیجه حرکت 1 بهتر به نظر می رسد.» با استدلالی مشابه، آبی حرکت C را انتخاب خواهد کرد. اگر هر دو بازیکن این حرکت ها را انتخاب کنند، قرمز 20 امتیاز کسب خواهد کرد. اما اگر آبی استدلال قرمز را پیش بینی کند که او حرکت 1 را انتخاب می کند، خودش حرکت B را انتخاب خواهد کرد تا 10 امتیاز کسب کند؟ یا اگر در عوض، قرمز این ترفند را پیش بینی کند حرکت 2 را انتخاب می کند تا 20 امتیاز کسب کند؟

امیل بورل و جان فون نویمان به این بینش اساسی معتقد بودند که احتمالات راهی برای برون رفت از این مسئله بغرنج به دست می دهد. دو بازیکن، به جای اتخاذ یک تصمیم قطعی برای انتخاب حرکت، احتمالی را به حرکت هایشان نسبت می دهند. سپس از یک ابزار تصادفی استفاده می کنند که با توجه به احتمالات نسبت داده شده یک حرکت برای آن ها انتخاب می کند. هر بازیکن، احتمالات را به منظور کمینه کردن بیشینه امید ریاضیِ از دست دادن امتیاز، به طور مستقل از استراتژی حریف محاسبه می کند. این روش، منجر به یک مسئله برنامه ریزی خطی با استراتژی های بهینه برای هر بازیکن می شود. این روش مینیماکس تقریباً می تواند برای هر بازی مجموع-صفر دونفره، استراتژی های بهینه را محاسبه کند.

برای مثال گفته شده در بالا، معلوم می شود که قرمز باید حرکت 1 را با احتمال {4 \over 7} و حرکت 2 را با احتمال {3 \over 7} انتخاب کند و آبی باید احتمالات صفر، {4 \over 7} و {3 \over 7} را به سه حرکت A، B و C نسبت دهد. با این روش، قرمز {20 \over 7} امتیازات را به طور میانگین در هر بازی از آن خود خواهد کرد.

روش حل[ویرایش]

تعادل نش برای یک بازی مجموع-صفر دونفره، با حل یک مسئله برنامه ریزی خطی به دست می آید. فرض کنید M ماتریس نتایج یک بازی مجموع-صفر است که در آن عنصر M_{i,j} نتیجه حاصل از حالتی است که بازیکن کمینه کننده از استراتژی i و بازیکن بیشینه کننده از استراتژی j استفاده کند (به عبارت دیگر بازیکنی که تلاش می کند نتیجه نهایی کمینه شود سطر را انتخاب می کند و بازیکنی که تلاش می کند نتیجه نهایی بیشینه شود ستون را انتخاب می کند.) فرض کنید هر عنصر M مثبت باشد. بازی، حداقل یک تعادل نش دارد. تعادل نش با حل کردن برنامه خطی زیر برای یافتن بردار u به دست می آید:

عبارت \sum_{i} u_i را با در نظر گرفتن محدودیت های u>=0 و M u>=1 کمینه کنید.

محدودیت اول می گوید هر عنصر بردار u باید نامنفی باشد و محدودیت دوم می گوید هر عنصر بردار  M u باید حداقل 1 باشد. برای بردار u حاصل معکوس مجموع عناصر آن ارزش بازی است. حاصل ضرب u در ارزش بازی، یک بردار احتمال به دست می دهد که شامل احتمال این است که بازیکن بیشینه کننده هر کدام از استراتژی های ممکن را برگزیند. اگر در ماتریس بازی، همه عناصر مثبت نباشند، باید یک عدد ثابت به هر کدام از عناصر افزود؛ به طوری که آن قدر بزرگ باشد که همه عناصر مثبت شوند. این کار ارزش بازی را به اندازه آن مقدار ثابت افزایش خواهد داد و تاثیری روی استراتژی های ترکیبی تعادل نخواهد داشت. استراتژی ترکیبی تعادل برای بازیکن کمینه کننده را با حل دوگان برنامه خطی داده شده می توان یافت. یا می توان از روش بالا استفاده کرد و با حل ماتریس نتایجِ اصلاح شده (ترانهاده و منفی کردن ماتریس M و افزودن یک عدد ثابت برای مثبت کردن مقادیر) یک بازی جدید به دست آورد و آن را حل کرد. اگر همه جواب های برنامه خطی پیدا شوند، شامل همه تعادل های نش برای بازی خواهند بود. بالعکس، هر برنامه خطی می تواند با استفاده از تغییر متغیری که فرمِ آن را شبیه معادلات بالا کند، تبدیل به یک بازی مجموع-صفر دونفره کرد. در نتیجه چنین بازی هایی به طور کلی معادل برنامه های خطی هستند.

مجموع-ناصفر[ویرایش]

اقتصاد[ویرایش]

بسیاری از موقعیت های اقتصادی مجموع غیر صفر هستند. به این دلیل که کالاهای ارزشمند و خدمات می توانند تولید شوند، نابود شوند یا به نحو نامناسبی تخصیص یابند و همه ی این موارد سود یا ضرری به تعداد زیادی سرمایه گذار وارد می کند. مخصوصا اینکه تجارت، با سود مثبت تعریف می شود؛ زیرا هنگامی که دو طرف وارد معامله می شوند هر کدام باید این موضوع را در نظر بگیرند که کالایی که دریافت می کنند باید ارزشمندتر از کالایی که از دست می دهند باشد. در واقع همه ی معاملات اقتصادی باید به هر دو طرف معامله به حدی سود برساند که از هزینه تراکنش بیشتر باشد یا اینکه اصلاً تراکنشی صورت نگیرد یا انجام معامله، هزینه ای مانند انتقال کالا ها نداشته باشد. برخی اوقات یک درک غلط درباره ی معاملاتی که با اجبار انجام می شوند وجود دارد. اگر فرض کنیم که معامله ی X، که در آن آدام کالای A را با برایان در ازای کالای B معامله می کند، به اندازه ی کافی به آدام سود نرساند، آدام از انجام معامله صرف نظر می کند (و کالای خود را با چیز دیگری که سود بیشتری دارد معامله می کند یا آن را پیش خود نگه می دارد.) اما اگر برایان از زور استفاده کند تا آدام را مجبور به معامله کند، معامله ی اخیر هیچ ربطی به معامله X ندارد. معامله ی X دارای مجموع مثبت نبوده و نیست (در واقع، این معامله ای که اتفاق نمی‌افتد، ممکن است مجموع-صفر باشد در حالتی که سود خالص برایان به صورت اتفاقی برابر ضرر خالص آدام باشد.) چیزی که در واقع اتفاق می افتد، این hست که یک معامله ی جدید مطرح شده است. معامله ی Y که در آن آدام، کالای A را با دو چیز مبادله می کند؛ کالای B و فرار از مجازاتی که از جانب برایان او را تهدید می کند. معامله ی Y، مجموع-مثبت است، زیرا آدام این گزینه را داشت که معامله ی Y را نپذیرد (البته در این مرحله، نپذیرفتن این معامله، گزینه ی بدتری نسبت به پذیرفتن آن است.) اما او به این نتیجه رسیده است که اگر حداقل به صورت موقت، این معامله ی اجباری را بپذیرد، موقعیت بهتری را نسبت به حالتی که این معامله را نپذیرد خواهد داشت. در زیر اجبار، طرفی از معامله که مورد اجبار قرار گرفته است، همچنان بهترین کاری که می تواند را انجام می دهد و هر مبادله ای که طرفین معامله انجام دهند، مجموع مثبت است.

با داشتن اطلاعات نامتقارن اشتباهات دیگری نیز رخ می دهد. بسیاری از تئوری های اقتصادی، حالت اطلاعات کامل را در نظر می گیرند. یعنی برای مبادله، فردی که مبادله می کند، تمام اطلاعات لازم که در مبادله تاثیرگذار هستند را در اختیار دارد. اما در عمل اینگونه نیست، طرفین مبادله، با داشتن اطلاعات ناقص یا حتی نداشتن اطلاعات، همیشه می توانند از انجام مبادلاتی که به نظرشان بهترین مبادله نیست خودداری کنند. همچنین با درنظرگرفتن هزینه های جانبی مبادلات، در عمل هیچ گاه مبادله ی مجموع-صفر رخ نمی‌دهد. هرچند اطلاعات نامتقارن می توانند تعداد مبادلات مجموع مثبت را کاهش دهند. همانگونه که در بازار لیمو (عنوان یک مقاله) چنین اتفاقی رخ می دهد.

همچنین ببینید:

روانشناسی[ویرایش]

رایج ترین و ساده ترین مثال در زمینه ی روان‌شناسی اجتماعی، مفهوم تله های اجتماعی است. برخی اوقات، افراد با دنبال کردن منافع شخصی خود، رفاه شخصیشان را افزایش می دهند. اما این اعمال در مورد منافع دیگران، رفتاری مخرب محسوب می گردد؛ یعنی در واقع با افزایش رفاه یک شخص، رفاه فرد دیگر کم می شود.

پیچیدگی[ویرایش]

رابرت رایت در کتاب Nonzero:_The_Logic_of_Human_Destiny این تئوری را مطرح کرده که هر چه یک جامعه پیچیدگی و مهارت بیشتری داشته باشد و استقلال جامعه کم شود (یعنی برای تامین نیازهای خود، با دیگران به تجارت بپردازد و صرفاً متکی به خود نباشد)، بیشتر به سمت مجموع مثبت پیش می رود. در واقع این تئوری بیان می کند که مهارت، پیچیدگی و تجارت، باعث افزایش سطح رفاه جامعه می شود.

بسط و تعمیم[ویرایش]

در سال 1994، جان فون نویمان و اسکار مورگنشترن ثابت کردند که هر بازی مجموع-صفر با n بازیکن، حالت کلی تر یک بازی مجموع-صفر با 2 بازیکن است و همچنین هر بازی مجموع-ناصفر برای n بازیکن می تواند به یک بازی مجموع-صفر برای n+1 بازیکن تبدیل شود.[۲]

اشتباهات مفهومی[ویرایش]

بازی های مجموع-صفر و راه حل های آنها معمولاً توسط کارشناسان نظریه بازی ها اشتباه برداشت می شود. اکثر این اشتباهات نیز با توجه به مفاهیمی مانند استقلال و رفتار عقلایی بازیکنان رخ می دهند. همچنین کلمه ی بازی به این معنی نیست که مدل ارائه شده فقط برای بازی های تفریحی مورد استفاده قرار می گیرد.

منابع[ویرایش]

  1. Bowles, Samuel (2004). Microeconomics: Behavior, Institutions, and Evolution. Princeton University Press. pp. 33–36. ISBN 0-691-09163-3. 
  2. "Theory of Games and Economic Behavior". Princeton University Press (1953). (Digital publication date)2005-06-25. Retrieved 2010-11-11. 

مطالعه بیشتر[ویرایش]

  • Misstating the Concept of Zero-Sum Games within the Context of Professional Sports Trading Strategies, series Pardon the Interruption (2010-09-23) ESPN, created by Tony Kornheiser and Michael Wilbon, performance by Bill Simmons
  • Handbook of Game Theory - volume 2, chapter Zero-sum two-person games, (1994) الزویر Amsterdam, by Raghavan, T. E. S., Edited by Aumann and Hart, pages=735–759, isbn=0-444-89427-6
  • Power:Its Forms, Bases and Uses (1997) Transaction Publishers, by Dennis Wrong

پیوند به بیرون[ویرایش]