משחק אינסופי

מתוך ויקיפדיה, האנציקלופדיה החופשית

בתורת המשחקים, משחק חוזר אינסופי הוא מודל פשוט של משחקים בו השחקנים משחקים פעם אחר פעם אותו משחק חד שלבי. בדומה למשחק חוזר T שלבי, הפעולות האפשריות לשחקנים, כמו גם פונקציית התשלומים שלהם, אינן משתנות עם הזמן, ואינן תלויות במהלך המשחק. לעומת משחקים חד-שלביים, הממדלים מצבים שבהם האינטראקציה בין השחקנים היא חד-פעמית, ולאחר שהיא מסתיימת, אין לה כל השפעה על אינטראקציות נוספות בין השחקנים, במקרים רבים האינטראקציה בין השחקנים מתמשכת לאורך זמן, ומכיוון שהשחקנים חוזרים ומשחקים אחד עם השני פעם אחר פעם, עולות תופעות התנהגותיות שונות במשחק חוזר.

המוטיבציות לבחינת משחקים אינסופיים הן:
א. נוחות מתמטית.
ב. לעיתים קשה לאמוד את מספר השלבים במשחק חוזר, או שמספר השלבים אינו ידוע. במקרים אלו, ניתן לקרב משחק בעל מספר גדול אך לא ידוע של שלבים כמשחק בעל אינסוף שלבים.
ג. לעיתים, לסופיות של משחק חוזר ארוך לא משפיעה על שיקולים אסטרטגיים, על כן ניתן לבחון אותו כמשחק חוזר אינסופי.

תכונות[עריכת קוד מקור | עריכה]

• אורך המשחק אינו ידוע מראש: בעל חנות טניס אינו יודע אם ומתי ימכור את חנותו, ושחקני טניס אינם יודעים מתי יפסיקו לשחק טניס, או מתי יעברו לגור בעיר אחרת.
• בניגוד למשחק חד שלבי, היסטוריית הפעולות של שחקן משפיעה על התנהגות שאר השחקנים בכל שלב במשחק.

היסטוריות[עריכת קוד מקור | עריכה]

מכיוון שבמשחק חוזר השחקנים נפגשים פעם אחר פעם, הם צוברים אינפורמציה אחד על השני ככל שהמשחק מתקדם. המידע העומד לרשותו של כל שחקן בשלב הוא הפעולות ששיחקו כל השחקנים ב- השלבים הראשונים של המשחק. לכן נגדיר לכל את אוסף ההיסטוריות ה- שלביות כ: .

עבור אנו מזהים , כאשר היא ההיסטוריה בתחילת המשחק, שאינה מכילה אף פעולה. היסטוריה ב- תסומן לעיתים ב- ולעיתים ב- , כאשר הוא וקטור הפעולות ששוחק בשלב .

אסטרטגיות במשחק אינסופי[עריכת קוד מקור | עריכה]

אסטרטגיית התנהגות במשחק חוזר אינסופי עבור שחקן היא פונקציה המתאימה פעולה מעורבת לכל היסטוריה סופית:
אסטרטגיה טהורה מתאימה לכל היסטוריה פעולה של שחקן .

אוסף כל האסטרטגיות של שחקן i במשחק אינסופי יסומן ב- .

המודל[עריכת קוד מקור | עריכה]

משחק חוזר מבוסס על משחק חד שלבי שאותו השחקנים משחקים שוב ושוב. נניח שמשחק זה נתון בצורה אסטרטגית על די כאשר היא קבוצת השחקנים, היא קבוצת הפעולות של שחקן , ו- היא פונקציית התשלומים החד-שלבית של שחקן , כאשר היא קבוצת וקטורי הפעולות, אזי המשחק החוזר האינסופי המתאים ל הוא משחק מעל קבוצת השחקנים , שבו קבוצת האסט' לשחקן היא .
נסמן ב את אוסף כל מהלכי המשחק האפשריים במשחק האינסופי:
איבר כללי בקבוצה זו הוא סדרה אינסופית של וקטורי פעולות, כאשר הוא וקטור הפעולות של השחקנים בשלב . וקטור האסטרטגיות של השחקנים משרה התפלגות על אוסף מהלכי המשחק האפשריים. ה- -אלגברה על המרחב היא ה- -אלגברה הנפרשת על ידי הקבוצות הגליליות, שהן הקבוצות מהצורה הבאה:

כלומר, קבוצת כל הסדרות האינסופיות בעלות אותן קואורדינטות ראשונות.
נסמן ב את אופרטור התוחלת המתאים להסתברות .
לכל שלב ולכל שחקן נסמן ב את התשלום של שחקן בשלב .

שיווי משקל[עריכת קוד מקור | עריכה]

וקטור אסטרטגיות נקרא שיווי משקל (במשחק האינסופי ) והווקטור נקרא תשלום שיווי משקל אם בהסתברות 1 לפי לכל שחקן הגבול:

קיים ושווה ל , ולכל אסטרטגיה של שחקן מתקיים
במילים, וקטור אסטרטגיות הוא שיווי משקל עם תשלום אם ממוצע התשלומים תחת שואף ל- בהסתברות 1, ואף שחקן אינו יכול להרוויח על ידי סטייה.

המשפט העממי[עריכת קוד מקור | עריכה]

המשפט העממי עבור משחק אינסופי קובע: אוסף תשלומי שיווי המשקל ב- הוא הקבוצה , כאשר הוא הקמור של כל התשלומים החד-שלביים האפשריים, ו- קבוצת התשלומים הסבירים פרטית.

ראו גם[עריכת קוד מקור | עריכה]

לקריאה נוספת[עריכת קוד מקור | עריכה]