שיווי משקל משוכלל לצורה הרחבה

מתוך ויקיפדיה, האנציקלופדיה החופשית

שיווי המשקל המשוכלל לצורה הרחבה הוא עידון של מושג שיווי המשקל התת-משחקי המשוכלל בתורת המשחקים. במשחקים מסוימים יכולים להתקבל שיוויי משקל תת-משחקיים משוכללים שלא נראים כמתקבלים על הדעת למתבונן הנאיבי, בהנחה שהשחקנים המשחקים את המשחק רציונליים.

דוגמה[עריכת קוד מקור | עריכה]

במשחק המתואר משמאל ישנו תת-משחק יחיד (המשחק עצמו), ולכן כל שיווי משקל נאש הוא גם שיווי משקל תת-משחקי משוכלל. שני שיוויי המשקל נאש במשחק זה הם: ו- . אבל, אם נשים את עצמנו בנעליו של שחקן 1, הבחירה בפעולה נראית לא סבירה, שכן אם שחקן 1 ישחק את הפעולה לא סביר להניח כי שחקן 2 יעדיף את הפעולה על-פני הפעולה הנשלטת על ידה. שיווי המשקל נראה לכן תוצאה סבירה יותר של המשחק.

הגדרה פורמלית[עריכת קוד מקור | עריכה]

משחק בצורה רחבה עם הפרעות הוא משחק בצורה רחבה בו בכל קבוצת ידיעה של שחקן עליו לבחור בכל פעולה בהסתברות חיובית החסומה מלמטה. כלומר כל פעולה בכל קבוצת ידיעה מבוצעת בהסתברות חיובית ממש.

פורמלית: נסמן ב- את קבוצת הפעולות האפשריות בכל קבוצת ידיעה של שחקן . וקטור הפרעות של שחקן הוא וקטור המתאים מספר חיובי לכל פעולה של שחקן , כך שלכל קבוצת ידיעה שלו מתקיים .

שיווי משקל משוכלל לצורה הרחבה: יהי משחק בצורה רחבה, נסמן ב- את המשחק עם ההפרעות שבו על כל שחקן i, בכל קבוצת ידיעה שלו, לבחור כל פעולה אפשרית לו באותה קבוצת ידיעה בהסתברות גדולה מ- או שווה ל-. לווקטור נקרא וקטור הפרעות, ואת הקואורדינטה המקסימלית שלו נסמן ב-.

וקטור אסטרטגיות התנהגות במשחק בצורה הרחבה יהווה שיווי משקל משוכלל לצורה הרחבה אם קיימת סדרה של וקטורי הפרעות המקיימת ולכל קיימת נקודת שיווי משקל (באסטרטגיות התנהגות) במשחק כך שמתקיים .

שיווי משקל משוכלל לצורה הרחבה ואסטרטגיות התנהגות[עריכת קוד מקור | עריכה]

בניגוד לשיווי משקל משוכלל לצורה האסטרטגית בו ההפרעות מותאמות לכל אסטרטגיה טהורה של כל שחקן, בהגדרת שיווי המשקל לצורה הרחבה ההפרעות מותאמות לכל פעולה שלו. לכן למעשה מדובר בשיווי משקל המתקבל על ידי אסטרטגיות התנהגות בהן השחקן מחליט על פעולותיו בכל קבוצת ידיעה בנפרד ולא על ידי אסטרטגיה שנקבעה מראש.

קיום שיווי משקל משוכלל לצורה הרחבה[עריכת קוד מקור | עריכה]

משפט: בכל משחק עם זיכרון שלם קיים שיווי משקל משוכלל לצורה הרחבה.

הוכחה: יהי משחק בצורה רחבה עם זיכרון שלם ותהי סדרה של וקטורי הפרעות המקיימת . נסתכל על המשחק המופרע . כיוון שלכל השחקנים זיכרון שלם, כל אסטרטגיה מעורבת שקולה לאסטרטגיית התנהגות כלשהי. לכן ממשפט נאש (קיום שיווי משקל לאסטרטגיות מעורבות) קיים גם שיווי משקל באסטרטגיות התנהגות ב- . מכיוון שמרחב וקטורי אסטרטגיית ההתנהגות הוא מרחב קומפקטי, לסדרה קיימת תת-סדרה מתכנסת. בלי הגבלת הכלליות נניח כי זו הסדרה עצמה. נסמן את גבול סדרה זו ב-. אזי שיווי משקל משוכלל לצורה הרחבה.

המשך הדוגמה[עריכת קוד מקור | עריכה]

נראה כי במשחק המתואר למעלה רק הוא שיווי משקל משוכלל לצורה הרחבה. יהי המשחק המופרע המתאים למשחק זה, בו כל אחת מהפעולות: חייבת להיות משוחקת בהסתברות לפחות.

מכיוון שהפעולה שולטת על הפעולה , בכל שיווי משקל במשחק עם ההפרעות שחקן 2 ישחק את אסטרטגיית ההתנהגות . נניח כי קטן מספיק - כלומר במידה כזו ש:. צרוף האסטרטגיה הקודמת של שחקן 2 עם האסטרטגיה של שחקן 1 מהוות שיווי משקל. נסמנו . מתקיים: . כמו כן, כיוון שראינו כי בתנאים אלו שחקן 2 משחק את האסטרטגיה בהסתברות מינימלית לא ייתכן כי יהווה גם כן שיווי משקל משוכלל לצורה הרחבה.

ראו גם[עריכת קוד מקור | עריכה]

לקריאה נוספת[עריכת קוד מקור | עריכה]