מדע הנתונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

מדע הנתוניםאנגלית: Data Science), הידוע גם כ"מדע מבוסס נתונים", הוא תחום בינתחומי של שיטות מדעיות, תהליכים, אלגוריתמים ומערכות לחלוקת ידע או תובנות מנתונים בצורות שונות, מובנות או בלתי מובנות, בדומה לכריית נתונים וללמידת מכונה.

מדע הנתונים הוא "הרעיון לאחד נתונים סטטיסטיים, ניתוח נתונים, למידה של מכונה ושיטות קשורות שלהם "כדי "להבין ולנתח תופעות בפועל" עם נתונים. מדע זה משתמש בטכניקות ובתאוריות הנמשכות מתחומים רבים בתחומי המתמטיקה, הסטטיסטיקה, מדעי המידע ומדעי המחשב, במיוחד מתת-התחומים של כריית נתונים, למידת מכונה, מאגרי מידע, ויזואליזציה.

הזוכה בפרס טיורינג, ג'ים גריי, תיאר את מדע הנתונים כ"פרדיגמה רביעית של המדע" (אמפירי, תאורטי, חישובי וכעת מונע נתונים) וטען כי "כל מה שקשור למדע משתנה עכשיו בגלל השפעת טכנולוגיית המידע".

כאשר המגזין "הרווארד ביזנס רוויו" (Harvard Business Review) כינה את מדע הנתונים כ"עבודה הכי סקסית של המאה ה-21", הפך המונח למילת מפתח ומאז, הוא מוחל לעיתים קרובות על ניתוח עסקי, על שימוש שרירותי בנתונים, או משמש כמונח המראה באור חיובי את עבודת הניתוח הסטטיסטי. בעוד שתוכניות אוניברסיטאיות רבות מציעות כיום תואר במדעי הנתונים, אין הסכמה על הגדרה או תוכני לימודים. בגלל הפופולריות הנוכחית של המונח הזה, יש הרבה "מאמצי הסברה" המקיפים אותו.

היסטוריה[עריכת קוד מקור | עריכה]

במאמר שפורסם ב-2012, "מדעני נתונים: העבודה הכי סקסית של המאה ה-21", דיג'יי פאטיל (DJ Patil) טוען כי טבע את המונח הזה ב -2008 עם ג'ף המרבאכר (Jeff Hammerbacher) כדי להגדיר את עבודתם בלינקדין ובפייסבוק, בהתאמה. הוא טוען כי מדען הנתונים הוא "זן חדש", וכי "מחסור של מדענים נתונים הופך מגבלה רצינית בחלק מגזרים".

הקשר לסטטיסטיקה[עריכת קוד מקור | עריכה]

הפופולריות של המונח "מדע נתונים" התפוצצה בסביבות עסקיות ובאקדמיה, כפי שצוין על ידי קפיצה בפתיחת מקומות עבודה. עם זאת, אקדמאים רבים ועיתונאים לא רואים שום הבחנה בין מדע הנתונים לסטטיסטיקה. בכתבה במגזין "פורבס", נכתב[1] כי מדע הנתונים הוא מילה ללא הגדרה ברורה והיא פשוט החליפה את המונח "ניתוח עסקי" בהקשרים כגון תוכניות תואר שני. בחלק השאלות והתשובות של הנאום המרכזי שלו במפגשים הסטטיסטיים המשותפים של האגודה האמריקנית לסטטיסטיקה, אמר הסטטיסטיקאי נייט סילבר: "אני חושב שמדען הנתונים הוא מונח מיושן לסטטיסטיקן ... סטטיסטיקה היא ענף המדע. מדען הנתונים הוא מיותר במקצת, ואנשים לא צריכים לגזול את המונח סטטיסטיקן". כמו כן, במגזר העסקי, חוקרים ואנליסטים רבים קובעים כי מדעני נתונים לבדם רחוקים מלספק יתרון תחרותי אמיתי וטוענים כי יש לשקול לסווג את מדעני הנתונים תחת אחת מארבע המשרות (אנליסטים עסקיים, מדעני נתונים, מפתחי Big Data גדולים ומהנדסי Big Data) הדרושות למנף ביעילות ארגון או חברה עסקית כלשהי לעבר שימוש ב-"Big Data".

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא מדע הנתונים בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]