استراتژی (نظریه بازی‌ها)

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در نظریه بازی‌ها استراتژی یا راهبرد یک بازیکن در یک بازی یک مجموعه کامل از اعمالی است که در هر موقعیت انجام می‌دهد. استراتژی به طور کامل رفتار بازیکن را بیان می‌کند. استراتژی یک بازیکن بیان کننده اعمالی است که بازیکن در هر مرحله از بازی، برای هر مجموعه از اعمالی که بازیکن قبل از این مرحله انجام داده، انتخاب می‌کند.

یک نمایه استراتژی (گاهی آن را ترکیب استراتژی نیز می‌نامند) مجموعه‌ای از استراتژی‌ها برای هر بازیکن است که به طور کامل همه اعمال در یک بازی را بیان می‌کند. یک نمایه استراتژی باید شامل یک و فقط یک استراتژی برای هر بازیکن باشد.

مفهوم استراتژی گاهی به غلط با حرکت اشتباه گرفته می‌شود. یک حرکت عملی است که توسط یک بازیکن در نقطه‌ای از بازی انتخاب می‌شود (مثلاً در شطرنج حرکت فیل سفید از نقطهٔ a۲ به نقطهٔ b۳). در حالی که یک استراتژی یک الگوریتم کامل برای انجام بازی است که به بازیکن می‌گوید در هر موقعیت ممکن در طول بازی چه کار کند.

مجموعه استراتژی[ویرایش]

مجموعه استراتژی یک بازیکن تعیین می‌کند که برای این بازیکن، بازی کردن کدام استراتژی‌ها ممکن است. اگر برای یک بازیکن تعدادی استراتژی گسسته وجود داشته باشد، مجموعه استراتژی این بازیکن متناهی است. به عنوان نمونه در بازی سنگ، کاغذ، قیچی، هر بازیکن مجموعه استراتژی متناهی {سنگ، کاغذ، قیچی} را دارد.

در غیر این صورت یک مجموعه استراتژی نامتناهی است. به عنوان مثال، در یک مزایده که میزان افزایش قیمت طبق یک قانون است، استراتژی‌ها گسسته هستند و مجموعه استراتژی نامتناهی است {۱۰ هزار تومان، ۲۰ هزار تومان، ۳۰ هزار تومان و...}. همچنین، بازی بریدن کیک دارای استراتژی‌های کراندار و پیوسته در مجموعه استراتژی‌ها است {بریدن هر جا بین ۰٪ تا ۱۰۰٪ از کیک}.

در یک بازی پویا مجموعه استراتژی شامل قوانین ممکن است که یک بازیکن می‌تواند به یک ربات یا یک عامل نرم‌افزاری بدهد تا بفهمد که چطور بازی کند. برای مثال در بازی اولتیماتوم، مجموعه استراتژی برای بازیکن دوم شامل همه قوانین ممکن است که برای آن‌ها پیشنهاد می‌شود فرد بپذیرد یا رد کند. در یک بازی بایزی (Bayesian game) مجموعه استراتژی شبیه بازی پویا است. مجموعه استراتژی شامل قوانینی است که بیان می‌کند برای هر اطلاعات خصوصی ممکن چه عملی انجام شود.

انتخاب یک مجموعه استراتژی[ویرایش]

در نظریه بازی‌های کاربردی، تعریف مجموعه‌های استراتژی بخش مهمی از هنر به صورت همزمان معنادار و قابل حل کردن یک بازی است. نظریه پرداز بازی می‌تواند از دانش سراسر مسئله به منظور محدود کردن فضای استراتژی و ساده‌تر کردن راه حل استفاده کند.

به عنوان مثال، اگر بخواهیم در مورد بازی اولتیماتوم دقیق صحبت کنیم، یک بازیکن می‌تواند استراتژی‌هایی مثل رد کردن پیشنهاد (۱ تومان، ۲ تومان، ...، ۱۹ تومان) و پذیرفتن پیشنهاد (۰ تومان، ۱ تومان، ...، ۲۰ تومان) را داشته باشد. به حساب آوردن همهٔ این استراتژی‌ها، فضای استراتژی بسیار بزرگی را به وجود می‌آورد و مسئله را دشوار می‌کند. یک نظریه‌پرداز بازی در عوض می‌تواند مجموعه استراتژی‌ها را به این صورت بسازد: {رد کردن هر پیشنهاد کمتر یا مساوی x و پذیرفتن هر پیشنهاد بزرگتر از x، برای x در (۰ تومان، ۱ تومان، ...، ۲۰ تومان)}.

استراتژی خالص و استراتژی مختلط[ویرایش]

یک استراتژی خالص تعریف کاملی از این که یک بازیکن چگونه بازی خواهد کرد ارائه می‌دهد. این استراتژی حرکتی را که یک بازیکن برای هر موقعیتی که با آن روبه‌رو خواهد شد باید انجام دهد، تعریف می‌کند. مجموعه استراتژی یک بازیکن مجموعه‌ای است از استراتژی‌های خاصی که برای آن بازیکن ممکن است.

یک استراتژی مختلط انتصاب یک احتمال به هر استراتژی خالص است. این استراتژی به یک بازیکن اجازه می‌دهد به صورت تصادفی یک استراتژی خالص را برگزیند. چون احتمال‌ها پیوسته هستند استراتژی‌های مختلط نامتناهی برای یک بازیکن وجود دارد، حتی اگر مجموعه استراتژی‌های آن متناهی باشد.
البته می‌توان یک استراتژی خالص را نوع خاصی از استراتژی مختلط دانست که در آن یک استراتژی خالص خاص با احتمال ۱ و بقیه استراتژی‌ها با احتمال ۰ انتخاب می‌شوند.

یک استراتژی کاملاً مختلط، استراتژی مختلطی است که در آن بازیکن یک احتمال اکیداً مثبت به هر استراتژی خالص می‌دهد.

استراتژی ترکیبی[ویرایش]

مثال[ویرایش]

ماتریس بازدهی که در شکل زیر نشان داده شده را در نظر بگیرید (بازی تشریک مساعی). در اینجا یک بازیکن ردیف و بازیکن دیگر ستون را انتخاب می‌کند. بازیکن ردیف اولین بازده را دریافت می‌کند و بازیکن ستون دومی را. اگر بازیکن ردیف ترجیح دهد که A را با احتمال ۱ انتخاب کند، در این‌صورت می‌گوییم او یک استراتژی خالص را بازی می‌کند. اگر بازیکن ستون یک سکه بیندازد و اگر شیر آمد A و اگر خط آمد B را بازی کند، در این صورت او یک استراتژی مختلط را بازی کرده و نه یک استراتژی خالص.

A B
A ۱٬۱ ۰٬۰
B ۰٬۰ ۱٬۱

اهمیت[ویرایش]

جان فوربز نش، در مقاله معروف خود اثبات کرد که برای هر بازی متناهی یک تعادل وجود دارد. تعادل نش بر دو قسم است: تعادل‌های نش استراتژی خالص تعادل‌هایی هستند کهدر آن‌ها همه بازیکنان با استراتژی خالص بازی می‌کنند. تعادل‌های نش استراتژی مختلط تعادل‌هایی هستند که در آن‌ها حداقل یک بازیکن با استراتژی مختلط بازی می‌کند. نش اثبات کرد که هر بازی متناهی یک تعادل نش دارد، نه این که هر بازی متناهی یک تعادل نش خالص دارد. بازی‌ها می‌توانند هم تعادل خالص و هم تعادل مختلط داشته باشند.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

ویکی‌پدیای انگلیسی