לדלג לתוכן

שיחה:עיסוי נתונים

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית
תגובה אחרונה: לפני 12 שנים מאת Nachy

מה זה לעזאזל "עיסוי נתונים"? מאיפה הגיע הביטוי הזה? גוגל בעברית לא מכיר אותו, וגם הביטוי "Data massage" באנגלית מניב יבול דל. Nachy שיחה 19:28, 28 בפברואר 2012 (IST)תגובה

במה עוסק הערך? אורח פורח - שיחה - בהגיגי כבר ביקרתם? 22:28, 28 בפברואר 2012 (IST)תגובה
למה לא מכיר? (הוא לא מוזכר רק בויקיפדיה, למרות שזה המופעים הראשונים) TZivyAאהמ?מרבין בשמחה22:57, 28 בפברואר 2012 (IST)תגובה
למען היושרה התחקירנית, הלינק שלך מוביל לעמוד התוצאות השלישי. לא די בכך, אלא שגם בעמוד זה רוב מוחלט של התוצאות הן מראות מויקיפדיה, ועוד אחת שמצאתי שהיא טוקבק. Nachy שיחה 23:13, 28 בפברואר 2012 (IST)תגובה
כתבתי לפני התנגשות עריכה: גוגל באנגלית טוען ל-140,000 תוצאות, זה ממש לא "יבול דל". גם בעברית יש תוצאות אחדות שמחוץ לוויקיפדיה (למשל באתר נסיכת המדעים).
לגופו של עניין: הערך מציג טכניקה מועילה (למשתמש בה) למניפולציה של נתונים למטרות שכנוע. חשיבותו מובנת מתוך תוכנו. דוד שי - שיחה 23:04, 28 בפברואר 2012 (IST)תגובה
מספר התוצאות אינו קובע את איכותו של היבול. איכות היבול בגוגל באנגלית דלה ביותר. שום אזכור ממאמר מדעי, מניתוח של חברה חשובה או ממאמר של בר סמכא כלשהו (ממה שאני הצלחתי לראות). האזכור שהבאת מנסיכת המדעים הוא טוקבק (!)
לגופו של עניין: ויקיפדיה אינה שימושון, ולכן גם אם זה מועיל אין לזה מקום כערך, אם אין לזה חשיבות שמיוחסת לזה על ידי גורמים שמקובלים כסיבות לחשיבות. השאלה היא לא האם הערך נכון ומועיל - הוא אכן נכון ומועיל - אלא האם הוא מציג את הנושא מזווית אובייקטיבית, רצוי מדעית. במקרה זה התשובה שלילית ככל הנראה, כי כותב הערך אמנם מצא ביטוי עסיסי כדי לתאר תופעה רווחת שרצוי לבער, אבל לא זו המסגרת בה צריך לתאר את התופעה, גם אם זה ביטוי נורא סקסי. Nachy שיחה 23:13, 28 בפברואר 2012 (IST)תגובה
"האזכור שהבאת מנסיכת המדעים הוא טוקבק (!)" - אתה כל כך נחפז להגיב. אכן, זהו טוקבק, אלא שכתב אותו ד"ר יוסי לוי, ביוסטטיסטיקאי בכיר וראש צוות ביוסטטיסטיקה בחטיבת המחקר והפיתוח של חברת התרופות "טבע" ובעל האתר "נסיכת המדעים", ולכן טוב תעשה אם לא תזלזל בו.
ושוב, מדובר במושג חשוב, שראוי להציגו באנציקלופדיה, גם אם בעיניך אינו "מדעי" מספיק. להשׂבעת תשוקתך למקור מדעי, הנה Data massage ב-Google Scholar. דוד שי - שיחה 23:40, 28 בפברואר 2012 (IST)תגובה
תשוקתי למקור מדעי אינה יודעת שובעה, דוד שי, שתשוקתו להתייחס לגופם של משתמשים אחרים - ובכך ליפול בכשל אחר המופיע בתבנית הכשלים הלוגיים והמסקנות הלא-רלוונטיות שמופיעות בערך - אינה יודעת שובעה.
אני מכיר מתמטיקאים שפלטו שנינויות מתמטיות חסרות משמעות ומשפטנים חשובים שהתבדחו על חשבון עמיתיהם המלומדים. אז מה? כל מה שהם פולטים הופך למונח באנציקלופדיה?! אם ד"ר יוסי לוי היה כותב את המונח במאמר מדעי או בניתוח רציני של נתונים כמונח בעל חשיבות שאפשר להתייחס אליו במישור המקצועי, היה אפשר לראות בזה חשיבות (וגם אז, התייחסות אחת? נו, לא אייאייאיי), אבל הוא התייחס באופן חופשי לביטוי משעשע וזה לא מהווה אינדיקציה לחשיבות.
היבול גם בגוגל סקולר נראה לי דל בכמות ובאיכות. נדמה לי שהתוצאה הראשונה לדוגמה, שאכן נראית כלקוחה ממגזין רציני, כלל לא עוסקת בעניין הזה. אבל את זה אשאיר לקוראי אנגלית טוב ממני.
הפואנטה היא שאפשר להעניק חשיבות לערך בשני אופנים: אם הוא ביטוי מקובל בשפה או אם הוא ביטוי מקצועי בעל משמעות. המונח הזה ככל הנראה לא נמצא בשימוש שוטף בשפה, ואין שום אינדיקציה לכך שהוא מונח מדעי שמיש ומוגדר. Nachy שיחה 00:08, 29 בפברואר 2012 (IST)תגובה
שמתי לב רק אחרי ששמרתי שזה מופיע בעמוד השלישי, אך תש כוחי מלשנות את זה. בכל מקרה, אני בעד השארתו של הערך. גם בגלל שתחקיר קצר מראה שהוא כן מופיע, וגם בגלל שהמונח התחבב עלי, ואני יודעת שזה לא טיעון. ואגב, מחצית או יותר מהכשלים הלוגים (שכולם חביבים עלי) אינם נמצאים בשימוש שוטף בשפה. אני אישית הייתי פונה ליוצר כל הערכים האלה לקבל קצת הבהרות. TZivyAאהמ?מרבין בשמחה10:40, 29 בפברואר 2012 (IST)תגובה

התופעה חשובה ללא ספק, השאלה היא כיצד נקראת בקרב העוסקים בתחום. אם אין בויקיפדיה באנגלית ערך מקביל - אני מניח שהשם המקובל הוא פשוט אחר. האם יש אצלנו מומחים לסטטיסטיקה? נרו יאירשיחה • ו' באדר ה'תשע"ב • 13:22, 29 בפברואר 2012 (IST)תגובה

ודאי. אפשר אולי שקר סטטיסטי. Nachy שיחה 14:00, 29 בפברואר 2012 (IST)תגובה


אני יוצר הערך. הביטוי "עיסוי נתונים" מוכר ומקובל (באנגלית data massaging או number massaging). יש לו פירוש מסוים בתחום גליונות הנתונים או בתכנות (שינוי או מניפולציה של נתונים, כך ש'יוחלקו'). בתחום הכשלים הלוגיים הוא מציין אותו דבר בדיוק, רק בניתוח של ממצאים: "פירוש לסטטיסטיקה רלוונטית העובר 'עיסוי' באמצעות חיפוש אחר דרכים לסווג מחדש או לכמת מחדש נתונים בחלק מסויים של התוצאות, בלי לבצע פעולה דומה בקטגוריות אחרות." ההצעה לשם שקר סטטיסטי בעייתית, שכן שם זה מתאים גם לכל אחד מכשלי הדגימה כאן (וכנראה גם לרבים אחרים). הצעתי היא לנסות לבצע משהו בדומה למה שביצעתי כאן - כלומר, למחוק את כל ערכי המשנה הקטנים ולאחדם תחת יריעה רלוונטית אחת, שערך זה הוא רק סעיף בה. ההגיון שהצדיק ערך נפרד בזמנו אינו תקף עוד, אני סבור. הייתשלהדוס - שיחה 02:44, 1 במרץ 2012 (IST)תגובה
הצעה זו נאה בעיני. מובן שיישארו הפניות משמות המושגים (הערכים הקטנים) לערך המאוחד. דוד שי - שיחה 03:10, 1 במרץ 2012 (IST)תגובה
גם אני חושב שזו הצעה טובה. תודה אורי. Nachy שיחה 12:47, 1 במרץ 2012 (IST)תגובה