ערך המקסמין

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

בתורת המשחקים הלא-שיתופיים, ערך המקסמין (Maxmin value) הוא התשלום המקסימלי, ששחקן יכול להבטיח לעצמו במשחק, בצורה אסטרטגית. נקיטה באסטרטגיה המבטיחה ערך זה, הנקראת אסטרטגית מקסמין, משקפת שחקן שהתנהגותו מתאפיינת בביטחון ותעוזה.

ערך המקסמין הוא מושג פתרון - כלומר, תחזית לגבי תוצאה של משחק, בהנחת התנהגות מסוימת מצד השחקנים. וקטור בו כל שחקן נוקט באסטרטגית מקסמין שלו נקרא וקטור אסטרטגיות מקסמין.

ניסוח פורמלי[עריכת קוד מקור | עריכה]

עבור קבוצה סופית כלשהי, ווקטור , נסמן את הווקטור המתקבל מהשמטת הקואורדינטה ה-: . כמו כן, עבור קבוצה , נסמן: .

עבור שחקן במשחק לא שיתופי בצורה אסטרטגית, נקרא ערך המקסמין של שחקן (מכאן מקור השם "מקסמין"). כאן, היא פונקציית התועלת של השחקן ה-, ו- קבוצת האסטרטגיות שלו. אסטרטגיה הממקסמת את הביטוי נקראת אסטרטגית מקסמין, וקטור מהצורה , שבו כל היא אסטרטגית מקסמין, נקרא וקטור אסטרטגיות מקסמין.

ניתן להכליל את מושג המקסמין למשחק אינסופי, על ידי החלפת המקסימום והמינימום באינפימום ובסופרמום. ערך מקסמין של שחקן תמיד קיים; אסטרטגית מקסמין קיימת אף היא, כאשר שהמשחק סופי (אחרת, הסופרמום והאינפימום בהגדרה לאו דווקא מתקבלים). אסטרטגית מקסמין לא חייבת להיות יחידה, אפילו אם המשחק סופי: למשל בדוגמה הבאה, שחקן 2 יכול להבטיח לעצמו רווח של 7 על ידי אסטרטגיה c או d.

דוגמה[עריכת קוד מקור | עריכה]

נתבונן במשחק המתואר בטבלה: במשחק זה יש שני שחקנים, כל משבצת בטבלה מתארת תוצאה אפשרית של המשחק: זוג מספרים המתארים את הרווחים של שחקן 1 ו-2 בהתאמה. לכל אחד מהשחקנים יש 2 אסטרטגיות. בכל תא, התשלום לשחקן הראשון, שחקן השורה מופיע בצד ימין, והתשלום לשחקן השני, שחקן העמודה מופיע בצד שמאל.

שחקן 2 בוחר באסטרטגיה c שחקן 2 בוחר באסטרטגיה d
שחקן 1 בוחר באסטרטגיה A 10, 40 1000-, 7
שחקן 1 בוחר באסטרטגיה B 2, 7 5, 8

כל שחקן לא יודע באיזו אסטרטגיה יריבו ינקוט. אם השחקן הראשון יבחר באסטרטגיה A, קיימת סבירות שיצא בהפסד גדול של 1000-, וסבירות זו עשויה לגרום לו להחליט להימנע מאסטרטגיה זו (אף כי היא מאפשרת את הרווח הגדול ביותר). אם יבחר באסטרטגיה B, לעומת זאת, הרווח הקטן ביותר שישיג הוא 2. רווח זה גדול מהרווח הקטן ביותר במקרה שיבחר את אסטרטגיה אחת, ולכן זהו ערך המקסמין של שחקן 1. אסטרטגיה B היא אסטרטגית מקסמין, ונראה "סביר" כי שחקן חסר ביטחון ינקוט בה.

קשר עם אסטרטגיות נשלטות[עריכת קוד מקור | עריכה]

משפט: אסטרטגיה של שחקן השולטת על כל האסטרטגיות האחרות היא אסטרטגית מקסמין של השחקן הזה.

הוכחה: נניח כי אסטרטגיה שולטת של שחקן , כלומר לכל אסטרטגיה אחרת . נקח מינימום על שני האגפים ונקבל לכל אסטרטגיה אחרת . כלומר, האסטרטגיה ממקסמת את הביטוי ולכן היא אסטרטגית מקסמין.

השוואה מול שיווי משקל נאש[עריכת קוד מקור | עריכה]

שיווי משקל נאש הוא מושג פתרון נוסף המייצג תכונות התנהגות אחרות של השחקנים: כל אסטרטגיה מהווה את התשובה הטובה ביותר לשאר האסטרטגיות.

במשחק המתואר בדוגמה, (40,10) הוא שיווי משקל נאש אך לא אסטרטגית מקסמין, ואסטרטגית מקסמין היא לא שיווי משקל נאש. בדוגמה זו נראה כי יותר "סביר" לנקוט באסטרטגית המקסמין על פני עקרון שיווי משקל נאש.

עם זאת, קיים קשר בין שני מושגי הפתרון: במשחק בו לכל שחקן יש אסטרטגיה השולטת על שאר האסטרטגיות, מהווה וקטור האסטרטגיות הנ"ל שיווי משקל נאש וגם וקטור אסטרטגיות מקסמין. ואכן, מהאמור מקודם - אסטרטגיה כזו היא אסטרטגית מקסמין, והיא גם התגובה הטובה ביותר לכל אסטרטגיה אחרת, כי היא שולטת חלש עליה, ולכן מהווה שיווי משקל נאש. למעשה ניתן לחזק את הטענה: אם נדרוש כי האסטרטגיות שולטות חזק, הווקטור הנ"ל מהווה וקטור אסטרטגיות מקסמין וגם וקטור שיווי משקל נאש יחיד, כלומר, במצב זה, שני הפתרונות המבטאים התנהגויות שונות - ערך המקסמין ושיווי משקל נאש - מתלכדים.

במשחק סכום אפס, המושג של פתרון ש"מ נאש באסטרטגיות מעורבות, והמושג של אסטרטגית מקסמין של שני השחקנים (הנקראת ערך המשחק) באסטרטגיות מעורבות (כלומר אסטרטגית מקסמין בהרחבה של משחק לאסטרטגיות מעורבות), מתלכדים.

ראו גם[עריכת קוד מקור | עריכה]

לקריאה נוספת[עריכת קוד מקור | עריכה]