מידה כנגד מידה (תורת המשחקים)

מתוך ויקיפדיה, האנציקלופדיה החופשית

מידה כנגד מידה (באנגלית Tit for Tat) היא תכסיס כלומר גישת התנהגות סדרתית (אסטרטגיה) שבה טובה גוררת טובה ובגידה גוררת בגידה. במשחק לא שיתופי בו שני השחקנים בוחרים תכסיס זה, לאורך זמן הם יוצאים מורווחים, והיא מנצחת את הגישות האחרות במקרה של בעיית דילמת אסיר נמשכת. גישה זו רווחת בהתנהגות עולם החי, כפי שנצפה הן במדעי ההתנהגות והן בחקר ההתפתחות במדעי החיים.

מידה כנגד מידה היא גישה לפיה התנהגות טובה אליי נענית בטוב, והימנעות מטובה אלי, תמנע ממני להשיב בטוב. בגישת מידה כנגד מידה מגיבים להתנהגות האחר. אם האחר פועל לטובתנו, בפעם הבאה גם אנו נמשיך התנהגות משתפת פעולה (או התנהגות לטובתו) אך אם נחוש שתגובתו הייתה לרעתנו, או שהוא לא נקט בפעולה לטובתנו, אנו נימנע מהטבה לו, או אף נפעל לרעתו.

בניסויי דילמת אסיר נמשכת (איטרטיבית), בו בדקו אנטול רפפורט ורוברט אקסלרוד גישות ושיטות אפשריות להשבה על סדרת שאלות שבהן התנאים הם תנאי בעיית האסיר (אם נאמין זה בזה נצליח שנינו במידה מעטה, אם שננו נבגוד זה בזה נפסיד במידת מה, אך אם האחד יבגוד והשני יאמין, הפתי ייענש קשות, והבוגד יזוכה כליל), נמצא שגישת הגמול, ("כאשר עשה כן יֵעָשֶׂה לו" - כמאמר המקרא) היא גישה פשוטה לזיכרון ולביצוע, וגם הגישה המנצחת לאחר מספר חזרות.

בשנת 1971 רוברט טריברס טבע את המונח התחשבות הדדית - אלטרואיזם רסיפרוקלי (נקראת גם באופן מסורבל "זולתנות מוּשֶׁבֶת") המסביר את השתלשלות ההתפתחות והאבולוציה של התנהגות שיתוף הפעולה בבעלי חיים המגיע אף למצבי הקרבה עצמית, למרות שלכאורה היצור המתנהג כך מפסיד כתוצאה מפעולתו (כאשר אין מצב של "זה נהנה וזה לא חסר"). לפי טריברס, היצור מפסיד אמנם כרגע, אך בהמשך יקבל את התמורה, וכך לטווח הארוך ההתנהגות הזו כדאית.[1]

המדענים שבדקו את גישת "מידה כנגד מידה" בתורת המשחקים וגילו שנקיטת עמדה על פיה מביאה בטווח הארוך לתוצאה של שיתוף פעולה, הסבירו באמצעותה את התנהגות ההתחשבות ההדדית (אלטרואיזם רסיפרוקלי) בטבע, וכיצד לאורך זמן ולטווח הארוך, פעולה שנראית כהקרבה עצמית, בסופו של דבר מטיבה עם המטיבים, שהרי היא בהכרח תביא להטבה חוזרת מצד מקבל ההטבה, הנמנה גם הוא עם הנוקטים בדרך זו.

זהו הסבר סביר הן במדעי ההתנהגות והן במדעי ההתפתחות (האבולוציה), להתהוות תרבות של שיתוף פעולה בחברה, ולהתהוות רקמות חיות ויצורים חיים - כשיתוף פעולה בין-תאי, וכן לקיום חברות חי בשיתוף פעולה בין-מיני, פורץ גבולות. דוגמה לשיתוף פעולה פורץ גבול הוא שילובם של אברוני המיטוכונדריה הנושמים את האוויר עבור תאי החי נושמי האוויר כולם. דוגמאות נוספות הן שיתוף הפעולה של חיידקי אי קולי המעכלים את המזון במעיהם של בעלי-החוליות, וכמו הסימביוזה - ההיצמדות ההדדית החיונית הקיימת בין סוגים שונים של חי, כמו האצה והפטריה שחברו יחד ליצירת חזזית על סלע.[2]

השפעות[עריכת קוד מקור | עריכה]

בתחום תורת המשחקים[עריכת קוד מקור | עריכה]

העדפת גישת התנהגות זו של "מידה כנגד מידה" הן בידי בני אדם והן נפוצותה בהתנהגות בעלי חיים הפתיעה תחילה את החוקרים, שסברו שהיא תוביל להינעלות במעגל של בגידה ונקמה. אך דווקא נמצא שלעיתים קרובות היא דווקא מובילה לכר נרחב של שיתופי פעולה. הפתרון נמצא בדמות הגישה הסלחנית של השיטה, לפיה במהלך ההחלטות החוזרות ונשנות, ניתן חלון הזדמנות להוכחת נאמנות ואי בגידה, או "חזרה בתשובה", והנקמה מושהית לטובת "הזדמנות שנייה". סלחנות כזו מחזירה את המערכת למצב של שיתוף פעולה, והסלחנות עצמה הופכת למשתלמת לאורך זמן. במדעי הדת ובפילוסופיה, גישה זו נדונה במושגים של "מידת הרחמים" בתוך מצב של "שכר ועונש", אך עתה היא עברה לתחום המחקר האמפירי והמדעי המכומת.

זוהי שיטה טובה ונכונה, כל עוד נמצאים במצב בו הצדדים אינם יודעים את הגישה של הצד השני, ואין להם הטיה או ידע כלשהו שיכול להשפיע על ידיעת הפעולה של השני. אם שני הצדדים בוחרים את שיטת "מידה כנגד מידה" התוצאה תהיה שיתוף פעולה, אך אם צד אחד יודע את שיטת האחר ושיטה זו אינה "מידה כנגד מידה" ניתן אולי לנצל ידע זה ולהשיג תוצאות טובות יותר לפרט, דווקא בלי התחשבות בו, או (במקרה של הטיה של הצד השני לבוגדנות) אפילו מנקיטת עמדה עוינת.[3]

בתחום מדעי הנפש[עריכת קוד מקור | עריכה]

בטיפול הנפשי ובפסיכולוגיה חברתית נמצאה גישה אסטרטגית זו בצורתה הסלחנית, כשיטה טובה למניעת מחלוקות ומריבות (קונפליקט).

למרות שבכל סבב שבו יש תנאים של בעיית האסיר, ההסתברות הבלתי מחושבת היא שלש מתוך ארבע לאי שיתוף פעולה, וההחלטה המחושבת נגד שיתוף הפעולה גדולה הרבה יותר, ולמרות שלאורך זמן, בנקיטת מידה כנגד מידה שלש מתוך כל ארבע מקרים יובילו להינעלות של אי שיתוף פעולה, ובמצב של אפשרות שגיאה הסיכוי לשיתוף פעולה קטן עוד בהרבה, הרי שהעמדה הסלחנית מובילה כמעט תמיד לשיתוף פעולה, ושיתוף פעולה הדוק מוביל גם לנעילת אפשרויות בגידה, ולביטחונות וערבות הדדית, המגבירים את המשכיות שיתוף הפעולה ומורידים את המניע והעידוד לבגידה.[2]

לשיטה כמה יתרונות הגורמים לאימוצה:[1]

  • היא קלה להבנה - הן הוראות הפעלתה והן הבנת התוצאות לאורה קלות להשגה. ולכן קל לאמץ את הגישה ברגע שהצלחתה נראית.
  • תוצאת אימוצה מחזק את המשך קיום הקבוצה המאמצת אותה, ובה בעת מחזק את המשך השימוש בשיטה הזו.
  • משנוצר שיתוף פעולה ארוך טווח, ניתן לחזק את קשרי שיתוף הפעולה ולהבטיח שלא ייפרצו, באופן המונע עוד את הבגידה, כמו שיתוף פעולה להכחדת בוגדים והתמחות בהכחדתם או בהמרתם לטובת הקבוצה.

בתחום מדעי החיים[עריכת קוד מקור | עריכה]

בבדיקות חוזרות ונשנות, נמצאו עוד ועוד בעלי חיים ומערכות חיים המקיימים עקרון זה, והוסברו שיתופי פעולה בטבע על פי עקרון זה. על פי ספרו "התפתחות שיתוף הפעולה" The Evolution of Cooperation של רוברט אקסלרוד, הגישה הזו של מידה כנגד מידה (בצורתה הסלחנית, הכוללת חלון הזדמנות לשיתוף פעולה כאמור) פתרה את השאלה כיצד נוצרת חברה מפרטים שאמורים לפעול כל אחד לטובת עצמו בלבד כשיטת ההוגה תומאס הובס.[4]

חישובי כדאיות כלכלית[עריכת קוד מקור | עריכה]

במקרה של סדרה חוזרת ונשנית של החלטות, שכל אחת מהן היא לפי תנאי בעיית האסיר (אמון שניהם מוביל למעט טוב, בגידת שניהם למעט רע, אמון האחד ובגידת השני, מובילים להצלחה רבה של הבוגד ופגיעה אנושה בתמים שנתן אמון):

א ב
א 6, 6 2, 9
ב 9, 2 3, 3

בגישת מידה כנגד מידה, מעתיקים את הבחירה של השחקן הקודם. אם השחקנים משתפים פעולה בתיתם אמון זה בזה, כלומר מהלך של משחק (א, א) הם ימשיכו לשתף פעולה לנצח.

1 2 3 4 ...
p1 א א א א ...
p2 א א א א ...

שיתוף הפעולה משתלם באופן הבא (כאשר הוא מקדם ההנחה הניתנת):

סדרה הנדסית (טור גאומטרי) המסתכם בחישוב

אם שחקן משנה את התנהגותו ובוחר לבגוד (ב), אזי בסיבוב הבא הוא יענש. התוצאה היא חילופים חוזרים ונשנים בין מצב שבו שחקן מספר 1 נאמן ושחק מספר 2 בוגד, ולמצב ההפוך בו שחקן א' בוגד, והפעם שחקן ב' נאמן.

1 2 3 4 ...
ש1 א ב א ב ...
ש2 ב א ב א ...

הפניה משיתוף פעולה כך משתלם באופן הבא:

סכום שתי הסדרות ההנדסיות:

נצפה לראות שיתוף פעולה אם לא משתלם יותר לפנות מהאימון אל הבגידה.

המשך לסמוך אם:

המשך לבגוד אם:

ביקורת[עריכת קוד מקור | עריכה]

בעוד אקסלרוד הראה באופן נסיוני שגישה זו היא היעילה ביותר והאופטימלית במקרים מסוימים של תחרות ישירה, עדיין שני הסוכנים הנוקטים בגישת מידה כנגד מידה עלולים להיפגע ומצבם אינו מיטבי. שגיאה חד פעמית אחת (של סיבית יחידה) בתרגום הפעולה של האחד בעיני השני, עלול להכניס את המשחק לנפילה אל תוך "מעגל מוות", ואם אחד בוחר לבגוד, הם נכנסים למעגל חוזר ונשנה של בגידה בידי אחד הצדדים, אשר בטווח הארוך מביא תוצאה פחות טובה מאשר שיתוף הפעולה. מצב זה מתעורר במחלוקות במציאות, בעולם האמיתי, ממריבות בכיתה ובבית הספר, בלמלחמות אזרחים, ובקרבות בין מדינות. הסיבה לכך היא שגישת מידה כנגד מידה איננה משוואה מושלמת של תת משחק אלא אם כן מדובר במקרים על "חודו של תער" בחישובי תועלת כלכלית.[5]

כדי להיות משוואה מושלמת על כל תת-משחק להיות בשווי משקל נאש.

הכנסת מעט רעש לתת המשחק תוציא אותו באופן מסתבר מכלל סכנה של היתקעות במעגל של בגידה. תת משחק שהוא אכן משוואה מושלמת הוא מידה כנגד מידה של תשובה, בה המגיב מעדיף באופן מובנה את שיתוף הפעולה בבחנו את המצב הכללי של שני הצדדים שיבוא לאחר פעולתו, ולא רק את מעשיו הקודמים של השני.[6] "שיווי משקל על חודו של תער" מוגדר כשיווי משקל הקיים רק בערכים חיצוניים (אקסוגניים) מסוימים ומעטים. כל שינוי בערכים אלו, אפילו הקטן ביותר, יבטל את שיווי המשקל.[7]

לדוגמה:

נ שמאלה ימינה
עלה (X, X) (0, 0)
רד! (0, 0) (−X, −X)

במקרה של X = 0, אין שינוי רווחי השונה מ (רד, שמאלה) או (עלה, ימינה). אבל עם ערך X משתנה ולו במידה הקלה ביותר, זעיר ככל שיהיה, אזי המשוואה כבר אינה בשיווי משקל. הופך רווחי לעלות, אם ל-X יש ערך של 0.000001 במקום אפס. כך משוואה זו "בלתי יציבה".

כדי להתגבר על כך אפשר להשתמש בתכסיס מידה כנגד שתי מידות בו נוקמים רק אחרי שתי בגידות, ובשאר שומרים על אמון.[3][8]

מידה כנגד מידה סלחנית - הוא תכסיס שבו מוכנסים "רחמים" כדי למנוע את "מעגל האימה" של אי-שיתוף הפעולה. כאשר הצד השני בוחר לבגוד, הצד האוחז בתכסיס נותן מדי פעם חלון הזדמנות, ולא נוקם, אלא ממשיך לבחור באימון. ההסתברות הנדרשת של הסלחנות המוֹחלת כדי להשיג תוצאה של שיתוף פעולה תלויה בתכסיס הננקט בידי הצד השני, הקובע למעשה את "מידת בוגדנותו".

מידה כנגד מידה מתאימה רק במצב תחרותי, אבל אם במצב של משימה קבוצתית, או התנהגות בין חברים, נדרשת סלחנות חוזרת ונשנית וייתכן שכדאי לנקות בגישה אחרת לחלוטין. מקרים רבים של מצבי ההחלטה במציאות, כלומר בעולם האמיתי, אינם מצבים של תחרות מוחלטת, ולכן לא מתאימים לגישת מידה כנגד מידה.

מידה כנגד מידה, גם בצורתה הלא סלחנית, גוררת אחריה מצב של אמון חלק מהזמן ואצל חלק מהצדדים, אלא אם (בהסתברות של אחד מתוך שאר ארבעת המצבים) שני הצדדים מחליטים על בגידה. התכסיס בכל זאת סלחני יותר מאשר גישת "ההדק העגום" על פיו ברגע שיש בגידה על ידי הצד השני, לעולם נמשיך לנקום.[9] (תכסיס ההדק העגום נקרא בספרו של אקסלרוד "פרידמן", על שם חיים זאב (ג'יימס וולף) פרידמן אשר כתב מאמר עליה.[10]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ 1 2 (באנגלית) תורת המשחקים, ההשערה וישומיה ספר מקוון מאת קורטיס יוהנסון, 2016 (אתר משרד המדע של ארצות הברית)
  2. ^ 1 2 (באנגלית) הספר דינמיקה קבוצתית מאת דונלסון ר' פורסית, מסת"ב ISBN 9781133956532 הוצאת לימודי וודסוורת קנגייג', 2014, (אתר הלימוד המקוון של אוניברסיטת ריצ'מונד, וירג'יניה, ארצות הברית)
  3. ^ 1 2 סדרת המשחקים ("הטורניר") של אקסלרוד, (מצגת של רוברטס באוניברסיטת סטנפורד)
  4. ^ (באנגלית) התפתחות שיתוף הפעולה רוברט אקסלרוד (בכרטסת הספרייה הבינלאומית)
  5. ^ 2000, (באנגלית) תורת המשחקים המתפתחת (Game Theory Evolving), הרברט גינטיס, פרינסטון, מסת"ב ISBN 978-0-691-00943-8
  6. ^ (באנגלית) טעויות מאפשרות יציבות אבולוציונית בבעיית אסיר חוזרת ונשנית, רוברט בויד, בתוך ירחון לביולוגיה תאורטית, כרך 136, 1989, עמודים 47-56
  7. ^ (באנגלית) חודו של תער באתר לימודי תורת המשחקים 101 (gametheory101.com)
  8. ^ הגן האנוכי, ריצ'רד דוקינס, ISBN 978-0-19-929115-1 הוצאת אוקספורד
  9. ^ (באנגלית) על שישה חידושים בתורת שיתוף הפעולה בתוך הירחון ניתוח וביקורת (Analyze & Kritik) כרך 22, יולי 2000 (המאמר, באתרו האישי של אקסלרוד באוניברסיטת מישיגן)
  10. ^ (באנגלית) שיווי משקל בחוסר שיתוף פעולה עבור משחקי על פורסם בירחון המדעי למחקרים כלכליים The Review of Economic Studies, כרך 38 מספר 1 (ינואר 1971, עמודים 1-12), הוצאת אוניברסיטת אוקספורד