פון נוימן פוקר

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

פון נוימן פוקר הוא גרסה מופשטת של משחק הפוקר שהוצגה לראשונה על ידי ג'ון פון נוימן בספרו Theory of Games and Economic Behavior שיצא בשנת 1944. המשחק הוא "משחק שני שחקנים סכום אפס". במשחק זה, כל שחקן מקבל באופן אקראי קלף אחד שנלקח מהתפלגות אחידה על הקטע [0,1] באופן בלתי תלוי אחד בשני. כל שחקן יודע את ערכו של הקלף שלו אך לא את ערכו של הקלף של השחקן השני.

שלבי המשחק[עריכת קוד מקור | עריכה]

  1. לפני קבלת הקלפים כל שחקן מהמר על סכום של (P/2 (ex ante כך שישנו סכום התחלתי של P בקופה.
  2. לאחר שקיבל את הקלף שלו שחקן 1 מחליט אם להמר (bet) על סכום נוסף a או לקרוא (check).
  3. אם שחקן 1 קורא אז משווים את הקלפים והשחקן עם הקלף הגבוה יותר מקבל את הכסף שנמצא בקופה.
  4. שחקן 1 מהמר, אז בפני שחקן 2 עומדות שתי אפשרויות:
    • להשוות את ההימור (call) ולהוסיף סכום a של כסף
    • או לצאת (fold).
  5. אם שחקן 2 יוצא אז שחקן 1 לוקח את הקופה.
  6. אם שחקן 2 משווה אז עורכים השוואה בין הקלפים והשחקן בעל הקלף הגבוה יותר מקבל את הכסף שנמצא בקופה.

ניתוח המשחק[עריכת קוד מקור | עריכה]

(על מנת לפשט את הניתוח, נניח ש: P =a=1)

  • תוחלת הרווח של שחקן 1 אם הוא קורא ללא תלות בקלף שבידו היא 0 (שהוא גם הערך המינמקס של המשחק).
  • ערך המינמקס של שחקן 1 אינו גבוה מ-P/2 (כלומר, מ-1/2) משום ששחקן 2 יכול לצאת ואז שחקן 1 ירוויח רק את ההימור ההתחלתי P/2 של שחקן 2.

דוגמה לזוג אסטרטגיות אפשריות[עריכת קוד מקור | עריכה]

נתבונן בזוג האסטרטגיות הבאות:

  • שחקן 1 יקרא אם הקלף שלו קטן מ-1/2 ויהמר אם הקלף שלו גדול מ-1/2.
  • שחקן 2 יוצא אם הקלף שלו קטן מ-2/3 וישווה אם הקלף שלו גדול מ-2/3.

תוחלת הרווח של שחקן 1 היא:

מכאן שהאסטרטגיה המצוינת לשחקן 1 אינה אסטרטגיה אופטימלית עבורו, שכן היא אינה מבטיחה לו את ערך המינמקס, שהוא גדול או שווה ל-0.

פתרון של פון נוימן[עריכת קוד מקור | עריכה]

ננסה למצוא שיווי משקל במשחק באמצעות עקרון האדישות. כלומר, נמצא שיווי משקל שבו הרווח של שחקן 1 זהה כאשר הוא מהמר וכאשר הוא קורא והרווח של שחקן 2 זהה כאשר הוא משווה וכאשר הוא יוצא:

עבור שחקן 1 צריך להתקיים:

באופן דומה, עבור שחקן 2 צריך להתקיים:

פתרון עבור (P=a=1)

במילים אחרות, שחקן 1 מהמר כאשר הקלף שלו קטן מ- או גדול מ- הוא קורא אחרת, ושחקן 2 יוצא כאשר הקלף שלו קטן מ- ומשווה אחרת.

זוג אסטרטגיות זה הוא שווי משקל.

תוחלת התשלום של שחקן 1 היא ולכן זהו גם ערך המשחק.

זאת אומרת, פון נוימן מצא זוג אסטרטגיות שיווי משקל: האסטרטגיה של שחקן 2 היא התשובה הטובה ביותר כנגד האסטרטגיה של שחקן 1, והאסטרטגיה של שחקן 1 היא התשובה הטובה ביותר כנגד האסטרטגיה של שחקן 2.

פון ניומן מסיק שעל מנת לצאת עם רווח מקסימלי, על השחקן לרמות (bluff) כאשר היד שלו גרועה במיוחד.