משפט פון נוימן-מורגנשטרן

משפט פון נוימן-מורגנשטרן בתורת ההחלטות הוא משפט האפיון של פונקציית התועלת, והוא קובע שאם לשחקן יחס ההעדפות שלם וטרנזיטיבי, ואם יחס ההעדפות מקיים ארבע אקסיומות מסוימות, אז ניתן לתאר את יחס ההעדפות של השחקן באמצעות פונקציית תועלת ליניארית. פונקציה פשוטה כזו נוחה מאוד בניתוח משחקים בעלי תוצאות לא ודאיות, מכיוון שהתועלת של כל הגרלה L תהיה שווה לתוחלת התועלת של התוצאות לפי L.

המודל

מרחב הפעולה

תחילה אנו מניחים שמקבל ההחלטות עומד בפני מצב עם מספר סופי של תוצאות אפשריות: $O=\{A_{1},\cdots ,A_{K}\}$ .

כדי לנתח סיטואציות שבהן תוצאת המשחק אינה ודאית, כלומר היא הגרלה על קבוצת התוצאות, יש להרחיב את יחס ההעדפות של השחקן להתפלגויות על O. הגרלה $\,L$ שבה כל תוצאה אפשרית $\,A_{k}$ יכולה להתקבל בהסתברות $\,p_{k}$ תסומן על ידי $L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]$ , וקבוצת ההגרלות על $\,O$ :

${\mathcal {L}}(O)=\{[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]:{\vec {p}}\in \Delta ^{K}\}$

כאשר השתמשנו בסימון של הסימפלקס ה-K ממדי: $\Delta ^{K}=\{{\vec {p}}\in [0,1]^{K}:\sum \nolimits _{k=1}^{K}{p_{k}}=1\}$ .

מתברר שכדי להוכיח את המשפט עלינו להרחיב את יחס ההעדפות של השחקן להגרלות על הגרלות. הגרלה מורכבת ${\hat {L}}$ שבה כל הגרלה $\,L_{j}$ יכולה להתקבל בהסתברות $\,q_{j}$ תסומן על ידי ${\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]$ , וקבוצת ההגרלות המורכבות על $\,O$ :

${\hat {\mathcal {L}}}(O)=\{[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]:J\in \mathbb {N} ,\ L_{j}\in {\mathcal {L}}(O),\ {\vec {q}}\in \Delta ^{J}\}$

יחס ההעדפות ופונקציית התועלת

כעת נגדיר את העדפותיו של השחקן. יחס העדפות $\succsim _{i}$ הוא יחס בינארי על ${\hat {\mathcal {L}}}(O)$ המייצג את העדפותיו של השחקן $\,i$ . תהיינה ${\hat {L}}_{1},{\hat {L}}_{2}$ שתי הגרלות מורכבות. במידה והשחקן $\,i$ מעדיף את הגרלה ${\hat {L}}_{1}$ על פני הגרלה ${\hat {L}}_{2}$ , נסמן ${\hat {L}}_{1}\succsim _{i}{\hat {L}}_{2}$ . אם השחקן אדיש בין שתי ההגרלות, נסמן ${\hat {L}}_{1}\approx _{i}{\hat {L}}_{2}$ .

ברור שכדי לנתח משחק בצורה מתמטית עלינו לדרוש שיחס ההעדפות יהיה שלם, כלומר שהשחקן יכול להשוות בין כל שתי הגרלות מורכבות, ובנוסף יחס ההעדפות צריך להיות טרנזיטיבי, שהרי אם יחס ההעדפות אינו טרנזיטיבי אנו עלולים לקבל מצבים שיש בהם סתירה לוגית כמו למשל: "השחקן מעדיף במבה על פני בייגלה, ומעדיף בייגלה על פני ביסלי, אך הוא מעדיף ביסלי על פני במבה". יהי אם כן $\succsim _{i}$ יחס העדפות שלם וטרנזיטיבי על ${\hat {\mathcal {L}}}(O)$ , המייצג את העדפותיו של השחקן $\,i$ .

נפנה להגדרת פונקציית התועלת. העתקה $u:{\hat {\mathcal {L}}}(O)\rightarrow \mathbb {R}$ נקראת פונקציית תועלת המייצגת את יחס ההעדפות $\succsim _{i}$ אם לכל הגרלה מורכבת ${\hat {L}}_{1},{\hat {L}}_{2}\in {\hat {\mathcal {L}}}(O)$ מתקיים:

${\hat {L}}_{1}\succsim _{i}{\hat {L}}_{2}\quad \iff \quad u({\hat {L}}_{1})\geq u({\hat {L}}_{2})$

יש לשים לב שלפי הגדרה זו ניתן לייצג יחס העדפות על ידי פונקציות שונות ורבות. למעשה, u היא פונקציית תועלת אורדינלית, כלומר מייצגת רק את סדר ההעדפות על התוצאות ואין בה שום חשיבות למידת ההעדפה של תוצאה כזו או אחרת. פונקציית תועלת $u:{\hat {\mathcal {L}}}(O)\rightarrow \mathbb {R}$ נקראת ליניארית אם לכל הגרלה ${\hat {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),\ldots ,q_{J}(L_{J})]$ מתקיים:

$u({\hat {L}})=q_{1}u(L_{1})+q_{2}u(L_{2})+\ldots +q_{J}u(L_{J})$

כלומר ה"ליניאריות" היא בהסתברויות על ההגרלות הפשוטות.

ארבע האקסיומות של פון נוימן ומורגנשטרן

הנחות יסוד:

קיימת קבוצה סופית של פרסים $A=\{A_{1},\cdots ,A_{n}\}$ בה יכול השחקן לזכות.
לשחקן יש יחס ההעדפות על הגרלות מורכבות.

הגרלה $L$ , הגרלה בה נקבל תוצאה $A_{i}$ בהסתברות $p_{i}$ . נסמן: $L=[p_{1}(A_{1}),p_{2}(A_{2}),\cdots ,p_{n}(A_{n})]$ .
כאשר נגדיר הגרלה מורכבת באופן הבא:

${\overline {L}}=[q_{1}(L_{1}),...,q_{j-1}(L_{j-1}),q_{j}(M),q_{j+1}(L_{j+1}),...,q_{J}(L_{J})]$ היא הגרלה שבה: $1\leq \forall i\leq j$ מתקיים ש $L_{i}$ הגרלה, $\sum q_{i}=1,q_{i}\geq 0$

תחת ההנחות הללו, ארבע האקסיומות בתועלת פון נוימן-מורגנשטרן הן רציפות, מונוטוניות, פישוט והצבה.

רציפות

עבור שחקן $i$ מתקיים : לכל שלושה פרסים $A\preceq _{i}B\preceq _{i}C$ קיים $0\leq \theta _{i}\leq 1$ כך ש: $B\approx _{i}[\theta _{i}(A),(1-\theta _{i})C]$

כלומר,עבור יחס ההעדפות שלעיל לגבי שלושה פרסים $A,B,C$ ,קיים מספר $0\leq \theta _{i}\leq 1$ עבורו ניתן ליצור הגרלה חדשה בה השחקן יזכה בפרס $C$ בסיכוי $1-\theta _{i}$ ובפרס $A$ בסיכוי $\theta _{i}$ , והשחקן יוותר אדיש בין הגרלה זו לבין זכייה בפרס $B$ .

מונוטוניות

יהיו $0\leq \alpha ,\beta \leq 1$ ונניח כי $A\succ _{i}B$ אזי: $[\alpha (A),(1-\alpha )(B)]\succeq _{i}[\beta (A),(1-\beta )(B)]$ אם ורק אם $\alpha \geq \beta$

כלומר, אם שחקן מעדיף את פרס $A$ על פני פרס $B$ , אזי הוא יעדיף כל הגרלה הנותנת לו את פרס $A$ בסיכוי $\alpha$ , על פני הגרלה הנותנת לו את $A$ בסיכוי נמוך יותר.

אקסיומת הפישוט

לכל $j=1,2...,J$ תהי $L_{j}$ ההגרלה הפשוטה:

$L_{j}=[p_{1}^{j}(A_{1}),p_{2}^{j}(A_{2}),...,p_{K}^{j}(A_{K})]$

ותהי ההגרלה המורכבת: ${\overline {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),...,q_{j}(L_{j})]$

לכל $k=1...K$

נגדיר:

$r_{k}=[(q_{1})p_{k}^{1}+(q_{2})p_{k}^{2}+...+(q_{j})p_{k}^{J}]$

(כלומר,בהסתברות $q_{j}$ נזכה בתוצאה $L_{j}$ , ואז בסיכוי $p_{k}^{j}$ נזכה בפרס $A_{k}$ . כאשר נסכום לכל $j$ נקבל את ההסתברות ל $A_{k}$ ) כך נוצרת ההגרלה הפשוטה:

$L=[r_{1}(A_{1}),r_{2}(A_{2}),...,r_{K}(A_{K})]$

אזי:

$L\approx _{i}{\overline {L}}$

כלומר, בהינתן הגרלה המגדירה את ההסתברויות לזכות באוסף פרסים, כל הגרלה שתגדיר את אותן הסתברויות, גם אם היא בעלת יותר או פחות שלבים מההגרלה המקורית, שקולה להגרלה המקורית מבחינת יחס ההעדפות של השחקן.

הצבה

תהי ${\overline {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),...,q_{J}(L_{J})]$ הגרלה מורכבת ו $M$ הגרלה פשוטה.

אם $L_{j}\approx _{i}M$ אזי: ${\overline {L}}\approx _{i}[q_{1}(L_{1}),...,q_{j-1}(L_{j-1}),q_{j}(M),q_{j+1}(L_{j+1}),...,q_{J}(L_{J})]$

האקסיומה דורשת כי אם בתוך הגרלה מורכבת נחליף הגרלה פשוטה בהגרלה השקולה לה, אזי השחקן יישאר אדיש בין ההגרלה המורכבת הראשונית לבין זו שבה החליפו את ההגרלות הפשוטות.

משפט פון נוימן-מורגנשטרן

אם יחס ההעדפות $\succsim _{i}$ על ${\hat {\mathcal {L}}}(O)$ של שחקן $\,i$ הוא שלם וטרנזיטיבי ומקיים את ארבע האקסיומות של פון נוימן ומורגנשטרן, אזי יחס ההעדפות ניתן לייצוג על ידי פונקציית תועלת ליניארית.

הוכחה

טענת עזר. אם יחס ההעדפות של שחקן מקיים את אקסיומות הרציפות והמונוטוניות, ואם $A\succsim _{i}B\succsim _{i}C$ ו- $A\succ _{i}C$ , אזי הגודל $\,\theta _{i}$ המוגדר באקסיומת הרציפות יחיד.

הוכחת הטענה. יהי

\succsim _{i}

יחס העדפות על

\{A_{1},\ldots ,A_{K}\}

שמקיים את אקסיומות הרציפות והמונוטוניות, כאשר

A_{K}\succ _{i}A_{1}

.

לפי רציפות לכל

k\in \{1,\ldots ,K\}

קיים

\theta _{i}^{k}\in [0,1]

כך ש-

A_{k}\approx _{i}[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]

.

אם

\varphi _{i}^{k}\in [0,1]

מקיים

A_{k}\approx _{i}[\varphi _{i}^{k}(A_{K}),(1-\varphi _{i}^{k})(A_{1})]

, אז לפי מונוטוניות

\varphi _{i}^{k}=\theta _{i}^{k}

.

הוכחת המשפט. יהי $\succsim _{i}$ יחס העדפות המקיים את תנאי המשפט. נטפל במקרה שבו $A_{K}\succ _{i}A_{1}$ .

שלב ראשון: הגדרת פונקציה $\,u_{i}$ על קבוצת ההגרלות.

לפי טענת עזר, לכל $k\in \{1,\ldots ,K\}$ קיים מספר ממשי יחיד $\theta _{i}^{k}\in [0,1]$ המקיים:

$A_{k}\approx _{i}[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]\$

כעת נגדיר פונקציה $\,u_{i}$ על קבוצת ההגרלות המורכבות ${\hat {\mathcal {L}}}(O)$ . תהי נתונה הגרלה מורכבת ${\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]$ , שבה ${\vec {q}}\in \Delta ^{J}$ , ו- $L_{1},\ldots ,L_{J}$ הן הגרלות פשוטות הנתונות על ידי $L_{j}=[p_{1}^{j}(A_{1}),\ldots ,p_{K}^{j}(A_{K})]$ .

לכל $k\in \{1,\ldots ,K\}$ נגדיר:

$r_{k}=q_{1}p_{k}^{1}+q_{2}p_{k}^{2}+\ldots +q_{J}p_{k}^{J}$

זוהי ההסתברות שתוצאת ההגרלה תהיה $\,A_{k}$ . נגדיר פונקציה $\,u_{i}$ על קבוצת ההגרלות המורכבות באופן הבא:

$u_{i}({\hat {L}})=r_{1}\theta _{i}^{1}+r_{2}\theta _{i}^{2}+\ldots +r_{K}\theta _{i}^{K}$

מכאן נובע בפרט שלכל הגרלה פשוטה $L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]$ מתקיים:

$u_{i}(L)=\sum \limits _{k=1}^{K}{p_{k}\theta _{i}^{k}}$

שלב שני: $u_{i}(A_{k})=\theta _{i}^{k}$ לכל $k\in \{1,\ldots ,K\}$ .

הפרס $\,A_{k}$ שקול להגרלה $\,L=[1(A_{k})]$ , השקולה להגרלה המורכבת ${\hat {L}}=[1(L)]$ . תוצאת ההגרלה ${\hat {L}}$ היא $\,A_{k}$ בהסתברות $\,1$ , ולכן במקרה זה:

$r_{l}=\left\{{\begin{array}{*{35}{l}}1\quad \quad \quad l=k\\0\quad \quad \quad l\neq k\\\end{array}}\right.$

מכאן נקבל כי:

$u_{i}(A_{k})=\theta _{i}^{k}\quad \forall k\in \{1,\ldots ,K\}$

מכיוון ש- $\theta _{i}^{1}=0$ ו- $\theta _{i}^{K}=1$ , נקבל כי $\,u_{i}(A_{1})=0$ ו- $\,u_{i}(A_{K})=1$ .

שלב שלישי: $\,u_{i}$ ליניארית.

כדי להראות ש- $\,u_{i}$ ליניארית, נראה כי לכל הגרלה פשוטה $L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]$ מתקיים:

$u_{i}(L)=\sum \limits _{k=1}^{K}{p_{k}u_{i}(A_{k})}$

אך משוואה זו מתקיימת, שכן משלב ראשון אגף שמאל שווה ל- $\sum \nolimits _{k=1}^{K}{p_{k}\theta _{i}^{k}}$ , ומשלב שני אגף ימין שווה אף הוא לגודל זה.

שלב רביעי: $\,u_{i}$ היא פונקציית תועלת.

כדי להראות כי $\,u_{i}$ היא פונקציית תועלת המייצגת את יחס ההעדפות $\succsim _{i}$ יש להראות כי לכל שתי הגרלות מורכבות ${\hat {L}}$ ו- ${\hat {L}}'$ מתקיים:

${\hat {L}}\succsim _{i}{\hat {L}}'\quad \iff \quad u_{i}({\hat {L}})\geq u_{i}({\hat {L}}')$

תהיינה, אם כן, ${\hat {L}}$ ו- ${\hat {L}}'$ שתי הגרלות מורכבות. נסמן:

${\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]\quad ,\quad {\hat {L}}'=[q'_{1}(L'_{1}),\ldots ,q'_{J'}(L'_{J'})]$

כאשר

$L_{j}=[p_{1}^{j}(A_{1}),\ldots ,p_{K}^{j}(A_{K})]\quad ,\quad L'_{j}=[{p'}_{1}^{j}(A_{1}),\ldots ,{p'}_{K}^{j}(A_{K})]$

לכל $k\in \{1,\ldots ,K\}$ נסמן:

$r_{k}=\sum \limits _{j=1}^{J}{q_{j}p_{k}^{j}}\quad ,\quad r'_{k}=\sum \limits _{j=1}^{J'}{q'_{j}{p'}_{k}^{j}}$

אלו ההסתברויות לקבלת התוצאה $\,A_{k}$ בשתי ההגרלות המורכבות ${\hat {L}}$ ו- ${\hat {L}}'$ . מהגדרת פונקציית התועלת,

$u_{i}({\hat {L}})=\sum \limits _{k=1}^{K}{r_{k}\theta _{i}^{k}}\quad ,\quad u_{i}({\hat {L}}')=\sum \limits _{k=1}^{K}{r'_{k}\theta _{i}^{k}}$

לכן,

$u_{i}({\hat {L}})\geq u_{i}({\hat {L}}')\quad \iff \quad \sum \limits _{k=1}^{K}{r_{k}\theta _{i}^{k}}\geq \sum \limits _{k=1}^{K}{r'_{k}\theta _{i}^{k}}$

מצד שני, מאקסיומת הפישוט,

${\hat {L}}\approx _{i}[r_{1}(A_{1}),r_{2}(A_{2}),\ldots ,r_{K}(A_{K})]\quad ,\quad {\hat {L}}'\approx _{i}[r'_{1}(A_{1}),r_{2}(A_{2}),\ldots ,r'_{K}(A_{K})]$

נסמן $L_{k}=[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]$ . אזי על פי הגדרת $\theta _{i}^{k}$ מתקיים $A_{k}\approx _{i}L_{k}$ לכל $k\in \{1,\ldots ,K\}$ . מאקסיומת ההצבה המופעלת $\,K$ פעמים, הן עבור ${\hat {L}}$ והן עבור ${\hat {L}}'$ , מתקיים:

${\hat {L}}\approx _{i}[r_{1}(L_{1}),r_{2}(L_{2}),\ldots ,r_{K}(L_{K})]\quad ,\quad {\hat {L}}'\approx _{i}[r'_{1}(L_{1}),r'_{2}(L_{2}),\ldots ,r'_{K}(L_{K})]$

כיוון שכל ההגרלות $\,L_{k}$ הן הגרלות על $\,A_{1},A_{K}$ ההגרלות באגף ימין של שתי המשוואות לעיל אף הן על שתי תוצאות אלו בלבד. לכן אם נסמן ב- $\,r$ ו- $\,r'$ את ההסתברות הכוללת של $\,A_{K}$ בהגרלות ${\hat {L}}$ ו- ${\hat {L}}'$ בהתאמה, אזי