אסטרטגיה אופטימלית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

בתורת המשחקים, אסטרטגיה אופטימלית היא אסטרטגיה (תכסיס) במשחק סכום אפס, שמבטיחה לשחקן המשחק בה לפחות את ערך המשחק כנגד כל אסטרטגיה של היריב. לפי משפט המינימקס, בכל משחק שני שחקנים סכום אפס, קיימת לכל שחקן לפחות אסטרטגיה אחת כזו.

הגדרה פורמלית[עריכת קוד מקור | עריכה]

נסמן את הגדלים הרלוונטיים: הן אסטרטגיות של שחקן 1 ו-2, ו היא פונקציית התשלום ששחקן 1 משלם לשחקן 2. , יקראו אסטרטגיות אופטימליות, אם הן מקיימות את התנאי:

הערך נקרא הערך של המשחק. מכיוון ש היא ליניארית בכל רכיב, קל להוכיח כי קבוצת כל האסטרטגיות האופטימליות של כל שחקן היא קבוצה קמורה.

מציאת אסטרטגיה אופטימלית[עריכת קוד מקור | עריכה]

נמשיך להשתמש במוסכמה כי היא פונקציית התשלום ששחקן 1 משלם לשחקן 2. מציאת האסטרטגיה האופטימלית מתבצעת לפי אלגוריתם המינימקס - שחקן 1 שואף למקסם את הרווח המינימלי שלו, ושחקן 2 שואף למזער את ההפסד המקסימלי שלו.

כלומר, שחקן 1 יבדוק את כל האסטרטגיות שלו, כך שלכל אסטרטגיה יבדוק מהו הרווח המינימלי שלו על פני האסטרטגיות האפשריות של , ואז יבחר אסטרטגיה כזו שהרווח המינימלי עליה היה גדול (או שווה) מכל הרווחים המינימליים של כל האסטרטגיות האחרות. בסימון מתמטי, נאמר כי שחקן 1 יבדוק לכל אסטרטגיה את , ואז יחפש את המקסימום מתוך קבוצה זו, כלומר את . אסטרטגיה שעליה מתקבל המקסימום תהייה אופטימלית לשחקן 1. כאן יש לציין נקודה עדינה: מבחינה פורמלית, צריך היה לחפש את הסופרמום והאינפימום, במקום את המינימום והמקסימום. אך מכיוון שקבוצת האסטרטגיות היא קומפקטית ופונקציית התשלום היא רציפה, המקסימום והמינימום חייבים להתקבל בתוך הקבוצה.

באופן שקול לגמרי, שחקן 2 יבדוק לכל אסטרגטיה את , ואז יבחר אסטרטגיה שנותנת מינימום על קבוצה זו, כלומר אסטרטגיה שנותנת מינימום על .

לפי משפט המינימקס, מתקיים שוויון .

כמו כן, מקמירות ניתן להראות כי די לשחקן 1 [שחקן 2] לבדוק עבור אסטרטגיה מוצעת שלו את מינימום [מקסימום] הרווחים רק על פני האסטרטגיות הטהורות של שחקן 2 [שחקן 1].