מדע הנתונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

מדע הנתוניםאנגלית: Data Science), הידוע גם כ"מדע מבוסס נתונים", הוא תחום בינתחומי של שיטות מדעיות, תהליכים, אלגוריתמים ומערכות לחלוקת ידע או תובנות מנתונים בצורות שונות, מובנות או בלתי מובנות, בדומה לכריית נתונים וללמידת מכונה.

מדע הנתונים הוא "הרעיון לאחד נתונים סטטיסטיים, ניתוח נתונים, למידה של מכונה ושיטות קשורות שלהם" כדי "להבין ולנתח תופעות בפועל" עם נתונים. מדע זה משתמש בטכניקות ובתאוריות הנמשכות מתחומים רבים בתחומי המתמטיקה, הסטטיסטיקה, מדעי המידע ומדעי המחשב, במיוחד מתת-התחומים של כריית נתונים, למידת מכונה, מאגרי מידע, ויזואליזציה.

הזוכה בפרס טיורינג, ג'ים גריי, תיאר את מדע הנתונים כ"פרדיגמה רביעית של המדע" (אמפירי, תאורטי, חישובי וכעת מונע נתונים) וטען כי "כל מה שקשור למדע משתנה עכשיו בזכות השפעת טכנולוגיית המידע".

כאשר המגזין "הרווארד ביזנס רוויו" (Harvard Business Review) כינה את מדע הנתונים כ"עבודה הסקסית ביותר של המאה ה-21", הפך המונח "מדע נתונים" מילת מפתח ומאז, הוא מוחל לעיתים קרובות על ניתוח עסקי, על שימוש שרירותי בנתונים, או משמש כמונח המציג באור חיובי את עבודת הניתוח הסטטיסטי.

בעוד שתוכניות אוניברסיטאיות רבות מציעות כיום תואר במדעי הנתונים, אין הסכמה על הגדרה או תוכני לימודים אחידים.

בזכות הפופולריות הרבה שקנה לעצמו מונח זה בימינו אלה, מושקעים מאמצי הסברה רבים כדי לקדמו.

היסטוריה[עריכת קוד מקור | עריכה]

במאמר שפורסם ב-2012, "מדעני נתונים: העבודה הסקסית ביותר של המאה ה-21"[1], דיג'יי פאטיל (DJ Patil) טוען כי טבע את המונח הזה ב-2008, בצוותא עם ג'ף המרבאכר (Jeff Hammerbacher), כדי להגדיר את עבודתם בלינקדין ובפייסבוק, בהתאמה. במאמר זה טען פאטיל, כי מדען הנתונים הוא "זן חדש", וכי "מחסור של מדעני נתונים הופך מגבלה רצינית בחלק מהמגזרים".

מדען נתונים[עריכת קוד מקור | עריכה]

מדען נתוניםאנגלית: Data scientist) הוא אדם העוסק במדע הנתונים (Data Science).

לרוב מדובר בתפקיד הדורש ידע והבנה בתחומים הבאים: מתמטיקה, ניתוחים סטטיסטים, שפות פיתוח, בסיסי נתונים רלציונים, טכנולוגיות ומערכות מחשוב, כריית מידע, וויזואליזציה. התפקיד מצריך יצירתיות וחדשנות, הבנה עסקית והשכלה אקדמאית.

תורת המידע אינה תחום חדש, אך עם עידן ה-Big Data החלה התעוררות ודרישה לתפקיד מדען נתונים. הסיבה היא שלמרות הטכנולוגיות המתקדמות והמידע הזמין ישנו קושי ליישם Big Data, הן בגלל מורכבות הפתרון והן בגלל מציאת השאלות הנכונות. האתגר האמיתי הוא לא איסוף המידע אלא ניתוחו בזמן מהיר שיאפשר לחברות להיות פרואקטיביות, יעילות ורווחיות. מכאן נולד הביקוש לתפקיד מדען נתונים: מישהו עם כישורים מיוחדים בסטטיסטיקה ותכנות כדי שיוכל לשאול את השאלות הנכונות על מנת להפיק תועלת מהמידע.

תחומי ידע נחוצים לצורך התמקצעות במדע הנתונים[עריכת קוד מקור | עריכה]

ב-2010, הציע מדען הנתונים דרו קונווי (אנ') דיאגרמת ון, המתארת את תחומי הידע והכישורים, הנחוצים לשם התמקצעות במדע הנתונים[2].

מנקודת מבטו של קונווי, על מדען מידע להיות בעל הכישורים ותחומי הידע הבאים:

הסבר משמעות המושג האחרון:

על פי אתר "Quora", "מומחיות מעמיקה בתחום" הנה ידע שאינו נרכש אך ורק באמצעות תהליך לימוד טכני.
מיומנויות האקינג עשויות להעניק את היכולת לפתח בתבונה קוד מ"אפס"[7] - על מנת לפתור בעיות; מתמטיקה וסטטיסטיקה יסייעו בעיבוד מתמטי וסטטיסטי של הנתונים; אך "מומחיות מעמיקה בתחום" תאפשר, לדוגמה, להשתמש בידע בביולוגיה שיש לאדם כלשהו - כדי ליישמו על מנת לפתח תרופות המטפלות במחלות תורשתיות. אם אין לאדם כלשהו "מומחיות מעמיקה בתחום", והוא מתעתד להפוך למקצוען בתחום מדע הנתונים - אדם זה לא יידע כיצד לתעל את המיומנויות הטכניות שברשותו (או אילו מהן חשובה ואילו פחות) לצורך ההתמקצעות בתחום, אפילו אם יש ברשותו מיומנויות טכניות שכאלו.

  • דוגמה נוספת מאותו האתר, הקשורה לידע בתחום דעת ספציפי: מומחה משחקי וידאו.

מהי ה"מומחיות המעמיקה בתחום" של מומחה משחקי הווידאו?

הכרת המוצר, הכרת מבנה המערכת ואופן העבודה (פיתוח המשחקים), הכרת החברה והכרת מבנה התעשייה של תחום המשחקים, שבו מומחה משחקי הווידאו ירצה להתמקצע[8].

הקשר לסטטיסטיקה[עריכת קוד מקור | עריכה]

הפופולריות של המונח "מדע נתונים" התפוצצה בסביבות עסקיות ובאקדמיה, כפי שצוין על ידי קפיצה בפתיחת מקומות עבודה. עם זאת, אקדמאים רבים ועיתונאים לא רואים שום הבחנה בין מדע הנתונים לסטטיסטיקה. בכתבה במגזין "פורבס", נכתב[9] כי מדע הנתונים הוא מילה ללא הגדרה ברורה והיא פשוט החליפה את המונח "ניתוח עסקי" בהקשרים כגון תוכניות תואר שני. בחלק השאלות והתשובות של הנאום המרכזי שלו במפגשים הסטטיסטיים המשותפים של האגודה האמריקנית לסטטיסטיקה, אמר הסטטיסטיקאי נייט סילבר: "אני חושב שמדען הנתונים הוא מונח מיושן לסטטיסטיקן ... סטטיסטיקה היא ענף המדע. מדען הנתונים הוא מיותר במקצת, ואנשים לא צריכים לגזול את המונח סטטיסטיקן". כמו כן, במגזר העסקי, חוקרים ואנליסטים רבים קובעים כי מדעני נתונים לבדם רחוקים מלספק יתרון תחרותי אמיתי וטוענים כי יש לשקול לסווג את מדעני הנתונים תחת אחת מארבע המשרות (אנליסטים עסקיים, מדעני נתונים, מפתחי Big Data גדולים ומהנדסי Big Data) הדרושות למנף ביעילות ארגון או חברה עסקית כלשהי לעבר שימוש ב-"Big Data".

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא מדע הנתונים בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ המאמר המלא, מתוך הרווארד ביזנס רוויו (אנ').
  2. ^ דיאגרמת דרו קונווי, הסבר אודות הדיאגרמה (ההסבר אודות הדיאגרמה נמצא באמצע העמוד, לא בתחילתו; יש לגלול את הדף כדי לראותו): פרק מספר 1 מתוך הספר: "Learning to Love Data Science" (בעברית: "ללמוד לאהוב את מדע הנתונים"). מחבר: Mike Barlow, הוצאה: O'Reilly Media, תאריך הוצאה: נובמבר 2015. מידע אודות הספר: [1].
  3. ^ באנגלית: "Computational Abilities".
  4. ^ באנגלית: "Substantive Expertise".
  5. ^ בניגוד לידע כללי.
  6. ^ באנגלית: "Hands-on Experience".
  7. ^ באנגלית: "From Scratch".
  8. ^ מהי "מומחיות מעמיקה בתחום" בהקשר של מדע הנתונים ("Substantive Expertise")?, אתר "Quora".
  9. ^ "מדע נתונים: מילת באזוורד?", במגזין פורבס, אוגוסט 2013