סטטיסטיקה

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

סטטיסטיקה היא תחום ידע העוסק באיסוף, ניתוח והצגת מסקנות מנתונים כמותיים. הסטטיסטיקה נשענת על תורת ההסתברות ובמקרים רבים גם על הנחות פרקטיות. בשל הישענותה על הנחות פרקטיות, יש מחלוקת בין הסטטיסטיקאים לגבי סיווגה של הסטטיסטיקה כענף של המתמטיקה או כענף של מדעי הטבע והחברה. המדעים הבולטים בהישענותם על הסטטיסטיקה הם פיזיקה סטטיסטית, כימיה סטטיסטית, חלק מתחומי הביולוגיה וחלק נכבד מתחומי הרפואה, מדעי החברה והמחקר הטכנולוגי. היכולת להבין נתונים סטטיסטיים, נקראת אוריינות סטטיסטית.

רקע[עריכת קוד מקור | עריכה]

במקרים רבים קשה לנתח את האיברים בקבוצה באופן פרטני בשל מספרם הרב, ואז אפשר להתייחס אל הנתונים כמכלול, ולנתחם ככאלה. כאשר מסתכלים על משתנה מסוים (למשל מידת גובה) והופעתו באוכלוסייה מסוימת (למשל ילדי כתה ג' בישראל), מתקבלת התפלגות של משתנה מקרי (הגובה). במקרים רבים ניתן לדגום מדגם שייצג את האוכלוסייה לצורך הסקה סטטיסטית.

הסטטיסטיקה מתחלקת לסטטיסטיקה תיאורית, שמטרתה תיאור של הנתונים על ידי אפיון ממדים שונים בהם, וסטטיסטיקה היסקית, שמטרתה הסקת מסקנות מהמדגם עליו נאספו הנתונים הסטטיסטיים לכל האוכלוסייה.

מדע או מתמטיקה?[עריכת קוד מקור | עריכה]

הסטטיסטיקה לא מכילה כמעט כל ניסויים שהם כשלעצמה (למעט סימולציות מחשב כגון "שיטת מונטה קרלו"). אולם, היא מסיקה על יעילות שיטות המחקר שלה מהצלחת הניסויים להם היא מסייעת בתחומי מדע מגוונים. על כן הסטטיסטיקה יכולה להיחשב למדע.

הכללתה של הסטטיסטיקה בין ענפי המתמטיקה שנויה במחלוקת בין הסטטיסטיקאים. אי הכללת הסטטיסטיקה בין ענפי המתמטיקה נשענת על טיעונים פילוסופיים. הפילוסופים מציינים שיש שלוש דרכים לנתח נתונים ולהגיע למסקנות: לוגיקה, מטא-פיזיקה והשכל הישר (Common sense). הטוענים שסטטיסטיקה אינה מתמטיקה גורסים כי מתמטיקה מכילה ניתוחים לוגיים בלבד ואילו הסטטיסטיקה, כמו המדעים, מכילה ניתוחים על פי השכל הישר לצד ניתוחים לוגיים.

לעומתם, אלה הטוענים שהסטטיסטיקה היא כן ענף במתמטיקה מביאים טעונים מתחום הסוציולוגיה של המדע. הם טוענים שסטטיסטיקאים לומדים בעיקר מתמטיקה ושהפיתוחים המרכזיים בה נעשים בעיקר על ידי מתמטיקאים. מעבר לזאת, אנשים אלה טוענים שהצורך של הסטטיסטיקאים להישען על הנחות השכל הישר במקום על הסקים לוגיים הולך ונחלש עם התפתחות הסטטיסטיקה ובעיקר עם התפתחות הענף הסטטיסטי הקרוי סטטיסטיקה לא פרמטרית.

סטטיסטיקה תיאורית[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – סטטיסטיקה תאורית

סטטיסטיקה תאורית היא הענף הסטטיסטי העוסק בתיאור תמציתי ומייצג של מדגמי נתונים גדולים. בבעיה אופיינית מתחום זה יש לתאר את המאפיינים הבסיסיים של מדגם בן 1000 ציונים במבחן בתנ"ך. במקום למנות אחד לאחד את כל 1000 הציונים, אפשר כמובן להציג היסטוגרמה. תיאור קצר אף יותר מתקבל אם מוסרים את מדד האמצע ומדד הפיזור הנפוצים: הממוצע וסטיית התקן.

סטטיסטיקה היסקית[עריכת קוד מקור | עריכה]

סטטיסטיקה היסקית עוסקת בניסיון להגיע למסקנות לגבי האוכלוסייה מתוך נתוני המדגם.

מודלים סטטיסטיים
מודלים סטטיסטיים הם שיטות מתמטיות המאפשרות לגזור מתוך נתוני המדגם נוסחה המאפשרת לנבא את ערכו של המשתנה התלוי בהינתן המשתנים הבלתי-תלויים. מספר המודלים הוא רב מאוד, ותלוי בסולם המדידה של כל אחד מהמשתנים, בקשרים אותם מעוניינים לחקור ובאופי הקשר המשוער בין המשתנים. המודל הפשוט ביותר, וזה הנמצא בשימוש הנרחב ביותר, הוא רגרסיה לינארית (חד-ממדית) - מודל המאפשר ניבוי של משתנה רציף אחד מתוך משתנה רציף נוסף אחד.

מבחנים סטטיסטיים
מבחן הוא כלי מתמטי המאפשר לבחון הנחות מסוימות לגבי משתנה אחד או לגבי הקשר בין מספר משתנים. קיים מגוון רב של מבחנים, המותאמים לבדיקת הנחות שונות.

ראו גם תורת האמידה.

חישוב סטטיסטי[עריכת קוד מקור | עריכה]

לגידול המהיר והמתמשך בכוח החישוב, שהתחיל במחצית השנייה של המאה ה-20, הייתה השפעה משמעותית על שימושי מדע הסטטיסטיקה. מודלים סטטיסטיים מוקדמים היו כמעט תמיד מהסוג של מודלים לינאריים (כגון אלו המשמשים ברגרסיה קלאסית), אך מחשבים חזקים בשילוב עם אלגוריתמים נומריים מתאימים גרמו לעניין מוגבר במודלים לא לינאריים ( כגון רשתות עצביות), כמו גם יצירת סוגים חדשים, כגון מודלים לינאריים מוכללים ומודלים רב-שכבתיים. כוח החישוב הגדל הוביל גם לפופולריות ההולכת והגדלה של שיטות אינטנסיביות חישובית המבוססות על דגימה חוזרת כגון מבחני פרמוטציות ו-Bootstrapping, ואילו טכניקות כמו דגימת גיבס הפכו את השימוש במודלים בייסיאנים ליותר מעשיים. למהפכת המחשב היו השלכות על עתיד הסטטיסטיקה, עם דגש חדש על סטטיסטיקה "ניסויית" ו"אמפירית". מספר רב של תוכנות סטטיסטיות (כלליות, וייעודיות), זמינות כיום לשימוש.

דוגמאות ליישומים[עריכת קוד מקור | עריכה]

  • מדינות משתמשות בסטטיסטיקה על מנת לאמוד את מספר תושביהן, מצבם, גידולן הדמוגרפי וכדומה, (כחלק מהמגמה הכללית של המדינה המודרנית לבקר את המתרחש בתחומיה על מנת להיטיב לשלוט ולהתערב בו). בישראל עוסקת בכך הלשכה המרכזית לסטטיסטיקה.
  • הכלכלה נעזרת בסטטיסטיקה כדי לאפיין מגמות כלכליות.
  • המדע נעזר רבות בסטטיסטיקה במחקרים תצפיתיים שונים.
  • במדעי החברה נעשה שימוש רב בסטטיסטיקה לצורך מחקר שיטות מחקר כמותיות.
  • ארגונים נעזרים בסטטיסטיקה לצורך שיפור ביצועים וקבלת החלטות על-סמך נתונים ועובדות. (מה שאף מכונה "מודיעין עיסקי" BI).
  • הרפואה משתמשת בסטטיסטיקה לחקר אפידמיולוגי של היבטים שונים של מחלות כמו סיכון יחסי.

ראו גם[עריכת קוד מקור | עריכה]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]