נתבונן במדגם בגודל מתוך אוכלוסייה כלשהי, ונסמן ב- את מספר הפרטים במדגם עבורם ו-. נאמר כי היא השכיחות של התצפיות במדגם עבורן ו-. הטבלה שבה יש שורות ו- עמודות, ובהצטלבות השורה ה- והעמודה ה- נמצא המספר נקראת לוח השכיחות של המשתנים ו-. מכיוון שלטבלה יש שני ממדים (אורך ורוחב) לוח השכיחות הוא דו-ממדי. לוח השכיחות הוא למעשה הנתונים שיש לנתח.
כן נסמן ב- את מספר הפרטים במדגם עבורם , וב- נסמן את מספר הפרטים במדגם עבורם .
אם אין לנו שום ידיעה על ההתפלגות המשותפת של ושל -, אז , תוחלת מספר הפרטים במדגם שעבורם ו- היא .
אם לעומת זאת נניח כי ו- הם משתנים מקריים בלתי תלויים, אז לכל ולכל , ולכן .
אמדים להסתברויות אלה הם ו-, ולכן, תחת הנחת אי התלות:
באגף ימין יש שלושה מחוברים, אחד מהם תלוי ב- וב-, השני תלוי ב- וב-, והשלישי אינו תלוי במשתנים או בערכים אלא רק בגודל המדגם.
לכן, מודל מתקבל על הדעת עבור אי התלות בין ו- (בהנחה כי היא מתקיימת) הוא:
לכל ולכל .
אם לעומת זאת המשתנים אינם בלתי תלויים אז השוויון האחרון אינו נכון, והמודל המתאים הוא
כאשר לפחות עבור זוג אחד. מודל זה מכונה "המודל הרווי", מכיוון שהוא תמיד מתאים לנתונים התאמה מלאה. הביטוי מבטא את האינטראקציה (יחסי הגומלין) בין ו-.
קל לראות כי כפי שהמודל הרווי הוגדר עבור לוח השכיחות הדו־ממדי, מספר הפרמטרים גדול באופן משמעותי ממספר הנתונים. יתרה מזו, הערכים הנאמדים של אינם יכולים לקבל כל ערך אפשרי מכיוון שניתן לבטא בעזרתם את ההסתברויות והסתברויות אלה חייבות להסתכם ל-1. גם ההסתברויות חייבות להסתכם ל-1 וכן ההסתברויות .
לכן יש להשית אילוצים מתאימים על הערכים של ה--ות.
מערכת אילוצים אפשרית עבור מודל אי תלות ללוח שכיחות דו־ממדי היא: ו- . אילוצים אלה הם אנלוגיים לאילוצים ו-. בהינתן אילוצים אלו, למודל יש דרגות חופש.
כדי לאמוד את הפרמטרים של המודל הרווי יש צורף באילוצים נוספים: לכל
ו- לכל . בהינתן אילוצים אלה, למודל הרווי יש 0 דרגות חופש. מאילוצים אלה נובע כי השערת אי התלות בין המשתנים ניתנת לניסוח כ-.
באופן דומה להגדרת לוח השכיחות הדו־ממדי, נוכל להגדיר את לוח השכיחות התלת־ממדי על ידי האוסף , כאשר זהו מספר התצפיות במדגם עבורן , , וכאשר הם משתנים מקריים המקבלים ערכים בהתאמה.
המודל הרווי ללוח שכיחות תלת־ממדי הוא:
ניתן לגזור מודלים שונים עבור ההתפלגות המשותפת של , ו- על ידי איפוס גורמי אינטראקציה.
קיימת חפיפה בין המודל הלוג ליניארי ומודל הרגרסיה הלוגיסטית במובן שבמקרים מסוימים שני המודלים שקולים. נדגים זאת בעזרת לוח שכיחות דו־ממדי מסדר , כלומר המשתנה מקבל שני ערכים והמשתנה מקבל ערכים.
בהנחה כי ו- בלתי תלויים, מתקיים כי לכל ולכל , ובפרט יחס הסיכויים של בהינתן הוא קבוע, כלומר .
על פי המודל הלוג ליניארי לאי תלות:
ואכן, קיבלנו כי לוג יחס הסיכויים אינו תלוי ב-. יתרה מזאת, מצאנו כי ניתן לבטא את פרמטר הרגרסיה הלוגיסטית בעזרת הפרמטרים של המודל הלוג ליניארי: .
כאשר ו- אינם בלתי תלויים, מודל הרגרסיה הלוגיסטית הוא כלומר לוג יחס הסיכויים תלוי ב-.
באופן דומה לפיתוח שנעשה עבור מודל אי התלות, נוכל למצוא כי עבור המודל הרווי:
כלומר לוג יחס הסיכויים הוא סכום של שני מחוברים, אחד מהם אינו תלוי ב- והשני תלוי ב-.
Bishop, Y. M. M.; Fienberg, S. E.; Holland, P. W. (1975). Discrete Multivariate Analysis: Theory and Practice. MIT Press. ISBN978-0-262-02113-5. MR0381130.
Agresti, Alan (2007). An introduction to categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN978-0-471-22618-5.
Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN0-471-36093-7.