هزینه پایداری

از ویکی‌پدیا، دانشنامهٔ آزاد

در نظریه بازی‌ها، هزینه پایداری (به انگلیسی: price of stability یا PoS) یک بازی به نسبت "بهترین هزینه اجتماعی تعادل‌های نش بازی" به "هزینهٔ اجتماعی حالت بهینه اجتماعی" گفته می‌شود. هدف از تعریف این نسبت پی بردن به این موضوع است که در یک بازی دخالت یک قدرت سوم برای خارج کردن رفتار بازیکنان از "خودخواه محض" بودن، به چه اندازه سودمند است. در کتاب دنیای جدید شجاع اثر آلدوس هاکسلی (Aldous Huxley) نیز اشاره‌ای به این مفهوم شده‌است.[۱] همچنین هنگامی که ما می‌خواهیم خوب و مؤثر بودن یک تعادل نش را در یک بازی خاص اندازه بگیریم، غالباً دربارهٔ هزینه آشوب (PoA) حرف می‌زنیم.

تعاریف اولیه[ویرایش]

در یک بازی مفروض G با مجموعهٔ بازیکنان P و مجموعهٔ استراتژی‌های S، اگر {E:S^|P| -> {0,1 یک تابع تعادل بوده و f یک تابع هدف باشد که معمولاً سودمحور (به صورت جمع سودهای بازیکنان) یا بیشینه‌محور (به صورت بیشترین مقدار سود یک بازیکن) تعریف می‌شود، آنگاه اگر S1 تا Sn مجموعهٔ همهٔ استراتژی پروفایل‌های تعادل باشند، منظور از هزینهٔ پایداری نسبت ((f(S_i))/(f(S) است که در آن S_i تعادلی است که مقدار f را در میان سایر S_jها بیشینه می‌کند و S استراتژی پروفایلی است که مقدار f را بین همهٔ استراتژی پروفایل‌ها بیشینه می‌کند.

در کنار هزینهٔ پایداری، معیار دیگری نیز با عنوان هزینهٔ آشوب تعریف می‌شود که به معنی نسبت بدترین تعادل به حالت بهینهٔ تابع است.

به عبارتی هزینهٔ پایداری و هزینهٔ آشوب به همراه هم نشان می‌دهند اگر یک قدرت خارج از بازیکنان، آن‌ها را با قرار دادن سیاست‌هایی مجبور به انجام یکی دیگر از تعادلها کند، مقدار سود چقدر خواهد بود و اگر این کار را نکنند مقدار ضرر چقدر خواهد شد و در نهایت مشخص می‌شود که آیا این کار به صرفه هست یا نه. به‌طور خاص، هزینهٔ پایداری وقتی کاربردی است که بازیکنان برای دستیابی به یک حالت بهینه حاضر به همکاری هستند و مثالی خوب از هزینهٔ آشوب در اینترنت است که هر شرکت بدون در نظر گرفتن نفع جهانی در پی بیشینه کردن سود خود است.

مثال‌ها[ویرایش]

همانگونه که گفته‌شد هزینه پایداری برابر است با بیشترین مقدار هزینهٔ اجتماعی تعادل‌های نش بازی تقسیم بر هزینهٔ اجتماعی در حالت بهینهٔ اجتماعی.

برای مثال در بازی معمای زندانی‌های زیر، تنها یک تعادل نش وجود دارد که عبارت است از (عدم‌همکاری، عدم‌همکاری) بنابراین داریم: هزینه پایداری = هزینه بی‌نظمی = ۱/۲.

استراتژی‌ها همکاری عدم‌همکاری
همکاری ۲، ۲ ۰، ۳
عدم‌همکاری ۳، ۰ ۱، ۱

اما در مثال زیر که در واقع نسخه‌ای از بازی نبرد دو جنس است، دو تعادل وجود دارد: (A,A) و (R,R) با هزینهٔ اجتماعی ۳ و ۱۵. بنابراین در این بازی مقدار سود اجماعی حالت بهینهٔ اجتماعی ۱۵. بنابراین مقدار هزینه پایداری ۱ خواهد بود و هزینه بی‌نظمی ۱/۱۵.

استراتژی‌ها A R
A ۲، ۱ ۰، ۰
R ۰، ۰ ۵، ۱۰

پیشینه و تاریخ‌شمار[ویرایش]

هزینه پایداری نخستین بار توسط آ. شولتزان و م. موزز مورد مطالعه‌ای قرار گرفت که به مطالعات اِ. آنشلویچ مشهور است. آنها نشان دادند که همواره یک تعادل نش خالص در یک بازی وجود دارد و هزینه پایداری یک بازی حداکثر برابر n-اُمین عدد هارمونیک در یک گراف جهتدار است. برای یک گراف بدون جهت آنشلویچ و دیگران نشان دادند یک کران بالای ۴/۳ برای هزینه پایداری در یک گراف با یک منبع و با دو بازیکن وجود دارد. ژیان لی ثابت‌کرده‌است که برای یک گراف بدون‌جهت با یک مقصد مشخص که همهٔ بازیکنان باید به آن متصل شوند، هزینه پایداری این شبکهٔ بازی است که n تعداد بازیکنان است.[۲] از طرفی دیگر هزینه بی‌نظمی نیز در این بازی حدود n است.

همچنین در تحقیقی دیگر که توسط آنشلویچ و جمعی دیگر از اعضای دپارتمان علوم کامپیوتر دانشگاه کرنل صورت پذیرفته‌است، نشان داده می‌شود که در یک طراحی شبکه‌ای با تخصیص هزینه عادلانه مقدار هزینه پایداری می‌باشد.[۳]

بازی‌های طراحی شبکه[ویرایش]

مدل شبکه‌ای ساده پیگو

میزان غیربهینگی تعادل‌ها در بازیها در حالت کلی قابل تخمین زدن نیست، این امر در بازی‌های ساده‌ای نظیر معمای زندانی‌ها هم قابل رویت است که تعادل در آن می‌تواند تا حد دلخواه غیر بهینه اجتماعی باشد. به همین منظور این فکر ایجاد شد تا به دنبال دسته‌هایی از بازیها بگردیم که در آنها تعادل بهینه به مقدار بهینه اجتماعی تا حد قابل قبولی نزدیک باشد. بازی‌های طراحی شبکه از این دسته اند.

مثال روبرو که با عنوان مثال پیگو (Pigou) به نام اقتصاددان پیگو در سال ۱۹۲۰ بیان شد، نشانگر یک مدل شبکه‌ای ساده است. در این مدل تعداد n بازیکن قصد رفتن از مبدأ s به مقصد t را دارند و برای این کار اگر مسیر بالایی را برگزینند یک واحد زمانی هزینه می‌کنند و اگر مسیر پایینی را برگزینند، به ازای هر واحد ترافیکی که از پایین می‌گذرد (که ممکن است نسبتی از کل جمعیت بازیکنان مثلاً ۰٫۱ آن باشد) یک واحد زمانی برای رسیدن به مقصد هزینه خواهند کرد. در این مثال اگر یک واحد ترافیک را کل افراد ایجاد کنند، حالت بهینهٔ اجتماعی زمانی اتفاق می‌افتد که نصف افراد از مسیر بالا و نصف دیگر از مسیر پایین عبور کنند و یک تعادل زمانی است که همهٔ افراد مسیر دوم را انتخاب کنند. در این مثال هم مقدار هزینهٔ آشوب و هم پایداری برابر با ۴/۳ خواهد بود. همچنین اگر شبکه به صورت گرافی جهت دار بزرگ شود اما همچنان تابع هزینهٔ هر مسیر به صورت ax+b باقی بماند، مقدار هزینه پایداری و آشوب حداکثر همین ۴/۳ خواهد بود.

این مثالی بسیار ساده از بازی‌های طراحی شبکه بود، در مثال‌های کلی‌تر به عنوان نمونه افراد این قابلیت را دارند که مبدأ و مقصدهای گوناگون داشته باشند. اما ویژگی‌ای ثابت در تمام چنین بازی‌هایی وجود دارد و آن این است که در تمام این بازی‌ها مقدار هزینهٔ آشوب با مقدار هزینهٔ پایداری یکسان است. این موضوع با استفاده از مفهوم تابع پتانسیل قابل اثبات است.

یک طراحی شبکه‌ای بازی باهزینه بی‌نظمی

مثال دیگری از چنین بازی‌هایی، بازی طراحی شبکهٔ شپلی (Shapley) است. در این بازی یک گراف جهتدار وجود دارد که هر یال e آن دارای هزینهٔ ثابت 𝑐𝑒 می‌باشد. n بازیکن هر یک دارای مقصد و مبدأ خاص خود است و هدفش رسیدن از مقصد به مبدأ می‌باشد. مجموعهٔ استراتژی‌های هر فرد همهٔ مسیرهایی می‌باشد که آن فرد می‌تواند با آنها به مقصد برسد. در نهایت هزینهٔ هر فرد به این صورت مشخص می‌شود که به ازای هر یالی از گراف که در مسیر طی شده توسط او وجود دارد، هزینهٔ آن یال بین تمام کسانی که در استراتژیشان از آن مسیر عبور می‌کنند، به صورت مساوی تقسیم می‌شود. حال می‌خواهیم در این بازی میزان بهینگی تعادل نش را بسنجیم. به این منظور حالت ساده شده‌ای از این بازی مانند زیر را در نظر می‌گیریم.

در اینجا n بازیکن با مبدأ و مقصد یکسان s و t داریم و n و 1+e به ترتیب میزان هزینهٔ هریک از مسیرها هستند که در آن: e> 0. در این بازی حالتی که همهٔ افراد مسیر پایینی را انتخاب کنند، یک تعادل و حالتی که همگی مسیر بالایی را انتخاب کنند هم یک تعادل است و حالت بهینهٔ اجتماعی در حالت اول اتفاق می‌افتد. پس در اینجا میزان هزینهٔ پایداری برابر ۱ و میزان هزینهی آشوب برابر n است. البته در همهٔ بازی‌های شیپلی مقدار هزینهٔ پایداری برابر ۱ باقی نمی‌ماند.[۴]

آماده‌سازی[ویرایش]

طراحی شبکه‌ای بازی‌ها بسیار برای هزینه پایداری مفید است. در این بازی‌ها، هزینه بی‌نظمی می‌تواند بدتر از هزینه پایداری باشد.

بازی زیر را در نظر بگیرید.

  • n بازیکن؛
  • هر بازیکن i قصد دارد که را به در یک گراف جهتدار وصل کند؛
  • استراتژی‌های برای یک بازیکن عبارت‌اند از تمام مسیرهای از به در ؛
  • هر یال یک هزینهٔ ؛
  • "تخصیص هزینه عادلانه": هنگامی که بازیکن یال را انتخاب می‌کنند، هزینهٔ به‌طور مساوی بین آنها تقسیم می‌شود؛
  • هزینه هر بازیکن برابر است با:
  • هزینه اجتماعی عبارت است از مجموع سودهای بازیکنان: .

هزینه بی‌نظمی[ویرایش]

هزینه بی‌نظمی می‌تواند باشد. طراحی شبکه‌ای بازی شیپلی را که در بالا گفته شد، در نظر بگیرید: دو تعادل متفاوت در این بازی وجود دارد؛ اگر همه یال به اشتراک بگذارند، هزینهٔ اجتماعی برابر خواهد بود. این تعادل در واقع یک هزینهٔ اجتماعی بهینه است. دقت کنید این که همه یال را به اشتراک بگذارند، نیز، یک تعادل نش است و تغییر به یال دیگر، هزینهٔ فرد موردنظر را افزایش می‌دهد.

بازی آسیب‌شناختی هزینه پایداری

کران پایین هزینه پایداری[ویرایش]

در اینجا یک بازی آسیب‌شناختی با محتوای مشابه برای هزینه پایداری داریم. در نظر بگیرید بازیکن، هر کدام از شروع می‌کنند و سعی در متصل شدن به دارند. هزینه یال برچسب‌گذاری‌نشده صفر در نظر گرفته می‌شود.

استراتژی بهینهٔ اجتماعی برای هر کس این است که یال را به اشتراک بگذارد تا هزینهٔ اجتماعی به دست آید. هرچند، تنها یک تعادل نش برای این بازی وجود دارد. باید توجه شود که در حالت بهینهٔ اجتماعی، هر بازیکن هزینهٔ می‌پردازد و بازیکن ۱ می‌تواند هزینه‌اش را با تغییر مسیر به یال کاهش‌دهد. وقتی این اتفاق بیفتد، بازیکن ۲ نیز تمایل دارد یال تغییر مسیر دهد و این روند به این شکل ادامه پیدا خواهد کرد. نهایتاً بازیکنان به تعادل نش برای یال خودشان خواهند رسید. این تخصیص هزینهٔ اجتماعی خواهد داشت که ، اُمین عدد هارمونیک خواهد بود؛ که برابر است با: . بناباین با این که کران نخواهد داشت، هزینه پایداری در این بازی به‌طور نمایی بهتر از هزینه بی‌نظمی است.

کران بالای هزینه پایداری[ویرایش]

باید دقت شود که بازی‌های طراحی شبکه‌ای، بازی‌های تراکمی هستند. در نتیجه آنها یک تابع پتانسیل دارند:

قضیه. [قضیه ۱۹٫۱۳ از مرجع ۱][۵] فرض کنید ثابت‌های و ای برای هر استراتژی وجود دارد و . در این صورت هزینه پایداری کوچک‌تر از خواهد بود.

اثبات. مقدار کمینهٔ ِ یک تعادل نش است؛ بنابراین: .

حال چون هزینهٔ اجتماعی مجموع هزینه‌های یال‌هاست، در نتیجه: .

ما معمولاً در نظر می‌گیریم و محاسبات بالا به‌دست می‌دهد؛ پس ما توانستیم قضیه را ثابت کنیم.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. https://somaweb.org/w/sub/BNW_CostOfStability.html
  2. Jian Li. An upper bound on the price of stability for undirected Shapely network design games. Information Processing Letters 109 (15), 876-878, 2009.
  3. https://www.cs.cornell.edu/home/kleinber/focs04-game.pdf
  4. http://theory.stanford.edu/~tim/papers/pos.pdf
  5. Vazirani, Vijay V.; Nisan, Noam; Roughgarden, Tim; Tardos, Éva (2007). Algorithmic Game Theory (PDF). Cambridge, UK: Cambridge University Press. ISBN 0-521-87282-0.
  1. L. Agussurja and H. C. Lau. The Price of Stability in Selfish Scheduling Games. Web Intelligence and Agent Systems: An International Journal, 9:4, 2009.