שיטת הריבועים הפחותים
מתוך ויקיפדיה, האנציקלופדיה החופשית
| ערך זה זקוק לעריכה, על מנת שיתאים לסגנון המקובל בוויקיפדיה. הסיבה לכך היא: משלב נמוך. אם אתם סבורים כי אין בדף בעיה, ניתן לציין זאת בדף השיחה שלו. |
שיטת הריבועים הפחותים היא שיטת אומדן סטטיסטית, שבה משערכים גודל לא ידוע מתוך קבוצת תוצאות מדודות כלשהן. הראשון שתיאר את השיטה הוא קרל פרידריך גאוס, בתחילת המאה ה-19. אומדן זה מאפשר השוואה בין ההתאמה של מודלים סטטיסטיים שונים לבין המדידות שהם מנסים להסביר, כל זמן שהמודלים השונים מציעים נוסחאות מתמטיות שונות מאותו סוג (כגון פולינומים בני אותה מעלה).
תוכן עניינים |
[עריכה] מדוע צריך אומדן כזה?
כאשר רוצים להבין את הקשר בין שני משתנים מדידים, על פי רוב המדידות לא מראות קשר זה באופן ברור ויש להשתמש באמצעים סטטיסטיים כדי להבין את הקשר. הסיבה היא שעבור כל ערך של משתנה אחד, נמדד טווח ערכים של המשתנה השני ולא ערך בודד של המשתנה השני. זאת בגין מגוון גורמים בלתי נשלטים: המשתנה הראשון עצמו עשוי להיות לא קבוע אלא משתנה בתחום מסוים, הוא אינו המשתנה היחיד המשפיע על המשתנה השני ויש במגבלות בציוד המדידה (למשל, במקרה של מדידת גודל פיזיקלי כלשהו, עשויה להיות תלות בטמפרטורה או בלחץ אטמוספירי).
[עריכה] דוגמה א'
כאשר אנו מניחים שיש קשר בין משתנה מסוים (X) לבין משתנה אחר (Y), אולם אנו מעריכים שבנוסף לX גם משתנים אחרים משפיעים על Y ושלא כל המשתנים האלה ידועים. עלינו למצוא מודל סטטיסטי המאפשר הערכה מראש מיטבית של ערכו של Y על פי ערכו של X. דוגמה למשתנים כאלה היא X = גילו של ילד בשנים ו-Y= גובהו בסנטימטרים. למציאת מודל כזה, אנו מודדים את המשתנים (מודדים את גובהם של ילדים רבים ושואלים את גילם) ורושמים את התוצאות (בטבלאות ובגרף). המודל הסטטיסטי שאנו מחפשים הוא נוסחה המקשרת את X ל-Y. אנו (או המחשב) משווים את הנוסחאות המוצעות השונות, שיש להן אותה מעלה חזקתית בעזרת שיטת הריבועים הפחותים. הנוסחה שנותנת את ערך סכום הריבועים הנמוך ביותר היא זו שמייצגת את הקשר בין המשתנים באופן המיטבי. (השוואה של נוסחאות מסוגים שונים נעשית על ידי מדדים אחרים ולוקחת בחשבון לא רק את דיוק הצפי אלא גם את פשטות הנוסחה. ההנחה היא שאנו מעוניינים באומדן פשוט ומדויק ושפשטות ודיוק עשויים לבוא זה על חשבון זה).
המחשב משתמש במדד שקרואי R2 להערכת דיוק האומדן שהוא אחת מינוס מנת סכום ריבועי שגיאות האמידה בסכום ריבועי הפרשי ערכי המדידה מהממוצע שלהם [1]. היתרון של השימוש במדד זה על מדד הריבועים הפחותים הוא שניתן לתת הערכה לאיכות האומדן המיטבי על פיו. אם האומדן הטוב ביותר שמצאנו נותן R2 = 1 אזי לא ייתכן בכלל אומדן טוב ממנו. אם R2 = 0 אזי לא ייתכן אומדן רע ממנו.
[עריכה] דוגמה ב'
כאשר מנסים לאמוד גודל מסוים
על פי
תוצאות מדידה כלשהן,
, גורס עקרון הריבועים הפחותים כי האומדן הטוב ביותר, x, הוא הערך שעבורו סכום ריבועי הסטיות של המדידות מ-x יהיה מינימלי. במקרה כללי יותר, מנסים להתאים פונקציה מסוימת
לסדרה של מדידות
. כאן
הוא אוסף של פרמטרים. כך למשל, אם רוצים למצוא את הקשר בין הזרם החשמלי והמתח על נגד, מבצעים סדרה של מדידות, שנותנות אוסף נקודות שבכל אחת מתח מסוים וזרם מסוים:
. אם מניחים שהקשר בין המתח והזרם הוא לפי חוק אוהם,
, הבעיה היא מציאת הערך של
שייתן את ההתאמה המיטבית לאוסף המדידות.
בניסוח מתמטי, נדרש למצוא את
שיביא את הסכום
לערכו המינימלי.
[עריכה] ראו גם

