שיווי משקל בייסיאני מושלם

מתוך ויקיפדיה, האנציקלופדיה החופשית
יש לערוך ערך זה. הסיבה היא: ויקיזציה, בהירות.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית. ייתכן שתמצאו פירוט בדף השיחה.
יש לערוך ערך זה. הסיבה היא: ויקיזציה, בהירות.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית. ייתכן שתמצאו פירוט בדף השיחה.

בתורת המשחקים, שיווי משקל בייסיאני מושלם מתקבל על הדעת במשחקים דינמיים, כאשר שחקנים מתחלפים ברצף ולא במקביל.

באופן דומה, שווי משקל בלתי סביר יכול להתקיים באותה דרך ששיווי משקל נאש מתקיים במשחקים בעלי מידע שלם ומושלם. שווי משקל כזה עשוי להיות במידע שלם ומושלם על ידי יישום של שווי משקל נאש מושלם עבור תת-משחק. לעומת זאת, לא תמיד אפשרי לקבל תועלת מפתרון זה במשחקים בבעלי מידע לא שלם משום שמשחקים כאלו מכילים קבוצות מידע לא סינגולריות, אך תת-משחק חייב להכיל קבוצות בעלות מידע מושלם לכן לעיתים יש רק תת-משחק יחיד - המשחק עצמו, לכן כל שיווי משקל נאש הוא תת-משחק-מושלם באופן טריוויאלי.

על מנת לטהר את שיווי המשקל שמתקבל מפתרון השיווי משקל הבייסיאני, רעיון שלמות תת-המשחק, נוכל ליישם את "שיווי משקל בייסיאני המושלם". שיווי משקל בייסיאני מושלם דומה לרעיון שלמות תת-המשחק בכך שהוא דורש שכל תת-משחק הוא אופטימלי. לעומת זאת, זה מציב את השחקן בפני החלטות שיכולות לגרום לו לנוע באופן לא סינגולרי.

עד שלב זה, הנחנו כי המידע הוא מושלם, אך בתכנון משחקים דינמיים הכרחי שיהיו את האמצעים לפתור גם את המקרים של מידע בלתי מושלם. פתרון שיווי משקל בייסיאני מושלם מספק פתרון לכך, שחקנים מאמינים בכל שלב במשחק בכל קבוצות המידע שלהם, כלומר קבוצות המידע יכולות להיווצר כך על ידי הטבע (במקרה של מידע בלתי שלם), או על ידי שחקנים אחרים (במקרה של מידע בלתי מושלם).

מערכות האמונה[עריכת קוד מקור | עריכה]

ניתן לגשת אל האמונות שבהם מחזיקים השחקנים באופן קשוח יותר במשחקים בייסיאנים. מערכת אמונה היא השמה של הסתברויות בכל צומת, שלב, במשחק כך שסכום ההסתברויות בכל קבוצת מידע קטן שווה ל-1. אמונות השחקן הן הסתברויות אלו של הצמתים בכל קבוצות המידע של תזוזת השחקן. ניתן להגדיר זאת כפונקציה מקבוצת איחוד כל קבוצות המידע של השחקן לקבוצה [0,1].

מערכת אמונה היא קונסיסטנטית עבור אסטרטגיה מעורבת נתונה אם ורק אם ההסתברות שהושמה על ידי המערכת לכל צומת במשחק מחושבת כהסתברות של הגעה אל הצומת הזה על ידי האסטרטגיה המעורבת הנתונה, כלומר על פי חוק בייס.

רציונליות רציפה[עריכת קוד מקור | עריכה]

הרעיון של הרציונליות הרציפה הוא מה שקובע את האופטימליות של תת-משחק בשיווי משקל בייסיאני מושלם. אסטרטגיה מעורבת במשחק היא רציונלית ברציפות, לקבוצת מידע נתונה במערכת אמונה נתונה, אם ורק אם הרווח הצפוי של השחקן שמחזיק בקבוצת המידע הזו (כלומר, השחקן שמשחק בקבוצת המידע הזו) הוא מקסימלי בהינתן האסטרטגיות המעורבות של שאר השחקנים.

אסטרטגיה מעורבת היא רציונלית ברציפות בהינתן מערכת אמונה אם היא מספקת את הנ"ל עבור כל קבוצת מידע.

הגדרה[עריכת קוד מקור | עריכה]

שיווי משקל בייסיאני מושלם הוא אסטרטגיה מעורבת ומערכת אמונות כך שהאסטרטגיות הן רציונליות ברציפות בהינתן מערכת האמונות, ומערכת האמונות היא קונסיסטנטית, במידת האפשר, בהינתן אסטרטגיה מעורבת.

נגדיר את "במידת האפשר" הנ"ל משום שחלק מקבוצות המידע אינו ניתן להגעה עם הסתברות אי שלילית בהינתן אסטרטגיה מעורבת לכן לא נוכל להפעיל את חוק בייס לחישוב ההסתברות בצמתים של הקבוצות. לקבוצות מידע אלו נקרא "מחוץ למסלול השיווי משקל" וכל אמונה ניתן להשים להם.

דוגמה[עריכת קוד מקור | עריכה]

משחק בייסיאני בעל מידע בלתי מושלם

המידע במשחק שבתמונה הוא בלתי מושלם משום ששחקן 2 אינו יודע מה שחקן 1 עושה כאשר התור שלו. אם שני השחקנים רציונליים והשחקנים יודעים את אותו מידע, תור במשחק יהיה כמתואר על פי שווי משקל בייסיאני מושלם.

שחקן 2 אינו רואה את הצעד של שחקן 1 במשחק. שחקן 1 ירצה להטעות את שחקן 2 לחשוב שהוא שיחק U כאשר בפועל שיחק D כדי ששחקן 2 ישחק D' ושחקן 1 יקבל 3.

למעשה, ישנו שיווי משקל בייסיאני מושלם בו שחקן 1 משחק D ושחקן 2 משחק U' ושחקן 2 מחזיק באמונה כי שחקן 1 בוודאות ישחק D (כלומר, שחקן 2 שם הסתברות 1 על הצומת שמגיעים אליו אם שחקן 1 משחק D). בשיווי משקל זה כל אסטרטגיה היא רציונלית בהינתן האמונות, וכל אמונה היא קונסיסטנטית באסטרטגיות של המשחק. במקרה זה, שיווי משקל בייסיאני מושלם הוא השיווי משקל נאש היחיד.