משפט המינימקס

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

בתורת המשחקים, משפט המינימקס העוסק במשחק סכום אפס סופי לשני שחקנים, אומר כי לכל משחק מסוג זה קיימת דרך פעולה אופטימלית לשחק מבחינת שני השחקנים, כך שהרווח המינימלי של כל אחד אינו תלוי במעשי השני. המשפט הוכח בשנת 1928 על ידי ג'ון פון נוימן. משפט המינימקס נקרא כך כיוון שכל שחקן שואף למקסם את התשלום המינימלי שהוא יכול לקבל מהמשחק, או למזער את ההפסד המקסימלי.

ניסוח יותר מדויק במונחי תורת המשחקים של משפט המינימקס הוא כי לכל משחק סכום אפס סופי לשני שחקנים קיים ערך. כל שחקן יכול להבטיח לעצמו לזכות לפחות בערך המשחק, כנגד כל אסטרטגיה של השחקן השני. ניתן לחשוב כי תוצאה זו היא טריוויאלית, כיוון שממילא כל שחקן יכול להבטיח לקבל לפחות את התשלום המינימלי האפשרי, אך משפט המינימקס טוען יותר מכך: אחת התוצאות המפתיעות של משפט המינימקס הוא כי ערך המשחק שווה לשני השחקנים. כלומר, קיים ערך v, כך ששחקן 1 יכול להבטיח לעצמו להרוויח לפחות v, כנגד כל אסטרטגיה של שחקן 2, ושחקן 2 יכול להבטיח לעצמו לא להפסיד יותר מ v, כנגד כל אסטרטגיה של שחקן 1.

חשוב להבין כי דרך הפעולה האופטימלית לכל אחד מהשחקנים אינה בהכרח בחירה באחת האסטרטגיות שלו (הנקראות לעיתים תכסיסים), אלא ביצוע הגרלה בין מספר אסטרטגיות, כאשר החשיבות היא על המשקל שנותנים לכל אחת מהבחירות בהגרלה זו. אם לא מאפשרים לשחקנים לבצע הגרלות המשפט לא תקף, והערך שכל שחקן יכול להבטיח לעצמו שונה. למשל, במשחק "זוג או פרט", אין לאף שחקן דרך אופטימלית לשחק שאינה כוללת הגרלה - שכן השאלה מה עדיף לו לבחור, זוג או פרט, תלויה לחלוטין בבחירה של היריב. לעומת זאת התכסיס האופטימלי של כל שחקן הוא זה שבו הוא נותן הסתברות שווה לכל אחת מהאפשרויות. במצב זה תוחלת הרווח של כל שחקן מהמשחק תהיה 0 - כי הוא יפסיד בחצי מהפעמים, וינצח בחצי מהפעמים (כאשר משחקים משחק רב של פעמים). על כן המשחק הוא כזה שבו אף שחקן לא יכול להרוויח, בטווח הרחוק. ניתן להראות שכל משחק סימטרי באופיו (מבחינה זו שאם יחליפו את מקומות השחקנים, הסיכויים שלהם לזכות יישארו זהים) הוא בעל ערך 0.

  • תכסיס/אסטרטגיה הכוללת הגרלה בין מספר תכסיסים נקרא תכסיס מעורב.
  • תכסיס/אסטרטגיה ללא הגרלות נקרא גם תכסיס טהור.

ניסוח מתמטי[עריכת קוד מקור | עריכה]

תהי מטריצה מסדר המייצגת את התשלומים של שחקן העמודות לשחקן השורות במשחק סכום אפס. אזי קיים קבוע , ושני וקטורי הסתברות כך ש:

  • לכל מתקיים (כששחקן השורות משחק , לכל אסטרטגיה טהורה של שחקן העמודות, התשלום גדול או שווה לערך)
  • לכל מתקיים (כששחקן העמודות משחק , לכל אסטרטגיה טהורה של שחקן השורות, התשלום קטן או שווה לערך)

הנקרא הערך של המשחק, והווקטורים נקראים אסטרטגיות אופטימליות.

המשפט אומר כי כאשר אחד השחקנים משחק באסטרטגיה אופטימלית, הוא מבטיח לעצמו את ערך המשחק נגד כל אסטרטגיה טהורה של היריב. עם זאת, קל להכליל את המשפט לכך שכאשר שחקן משחק באסטרטגיה אופטימלית, הוא מבטיח לעצמו את ערך המשחק גם נגד אסטרטגיות מעורבות של היריב.

ניסוח שקול[עריכת קוד מקור | עריכה]

קיים למשפט ניסוח חשוב נוסף, המתווה אלגוריתם למציאת האסטרטגיות האופטימליות. נסמן ב את הסימפלקס ה n ממדי, שהוא קבוצת האסטרטגיות של שחקן העמודות, ובאופן דומה את הסימפלקס ה m ממדי שהוא קבוצת האסטרטגיות של שחקן השורות. בנוסף, נסמן את פונקציית התשלום על ידי . אזי

ניסוח זה של המשפט הוא שהקנה לו את השם "משפט המינימקס". ניסוח זה הוא אף יותר שימושי, כיוון שהוא מאפשר למצוא את ערך המשחק. הערך מתקבל על ידי כך ששחקן השורות ממקסם את הרווח המינימלי שהוא יכול לקבל מכל אחת מהאסטרטגיות של שחקן העמודות (האגף השמאלי בשיווין). המשפט אומר כי אותו הערך מתקבל כאשר שחקן העמודות ממזער את הערך המקסימלי שהוא מפסיד על כל אחת מהאסטרטגיות של שחקן השורות.

הוכחה[עריכת קוד מקור | עריכה]

בהוכחת המשפט יהיה שימוש במשפט ההפרדה שלקוח מתחום הטופולוגיה:

תהיינה קבוצות קמורות, סגורות, לא ריקות וזרות. נניח ש- חסומה, אז קיים על-מישור שמשוואתו כאשר:
המפריד בין ל . כלומר לכל: מתקיים: ולכל מתקיים: .

נניח בשלילה כי עבור:

מתקיים האי-שוויון הבא: . עבור הייצוג של בצורה הבאה:

תוגדרנה שתי הקבוצות הבאות: הקמור של הווקטורים והקבוצה

לפי ההנחה, שחקן השורות יכול להבטיח לעצמו לכל היותר על ידי כל תכסיס מעורב שלו, ולכן לפי האי-שוויון , לא יכולות להיות ל K ו- L נקודות משותפות במרחב , כלומר מתקיים: . כל שאר תנאי משפט ההפרדה מתקיימים גם כן, ולכן קיים על-מישור כפי שהוגדר במשפט. כלומר קיים וקטור וסקלר המקיימים לכל ולכל :

מתקיים כי אם היה הגבול של המכפלה של: עם כאשר היה מקיים:

וזו סתירה לנאמר לעיל.

כמו כן מתקיים ולכן נוכל לכפול את ואת בסקלר כך ש: וההפרדה תישאר ללא שינוי.

מצד אחד: הווקטור מראה ש: .
מצד שני: עבור כל מתקיים: .

כל תכסיס טהור של שחקן השורות הוא בעצם אחת השורות במטריצה A, וכל אחת מהשורות נמצאת בתוך הקבוצה K, ולכן לכל אחד מהתכסיסים הטהורים של שחקן השורות מתקיים: . המשמעות היא שאם מתייחסים לוקטור בתור תכסיס של שחקן העמודות, תכסיס זה מבטיח לו שישלם פחות מ על כל תכסיס טהור של שחקן השורות, אבל אם זה נכון, אז זה מבטיח לשחקן העמודות לשלם פחות גם עבור כל תכסיס מעורב של שחקן השורות, וזו סתירה להגדרה של . לכן ההנחה שממנה יצאנו איננה נכונה, ולכן .