שיחת ויקיפדיה:אמינות/כתבה מעוררת מחשבה ב"הארץ"

כתבה מעוררת מחשבה ב"הארץ"[עריכת קוד מקור]

היום מופיעה כתבה העוסקת בויקיפדיה ונפתחת בדוגמה מהערך הומו הביליס. עיקר התהייה שם היא על עריכה מלפני כשנה בה הוסיף Mort תוכן עם ההערה "(תרומת סטודנטית ממיזם 2)" וכולל את הקביעה, כנראה מהגיגי אותה סטודנטית תורמת: חליפין של מוצרים ושירותים היו מצויים ביסודה של להקת הביליס. הייתה כריתת בריתות בין שכנים באמצעות חליפין של סחורות ומוצרים יקרי ערך. עסקי החליפין בין הומו הביליס ובין להקת אפארנסיס היה נפוץ. הם החליפו ביניהם נכסים יקרים כמו בנים ובנות, אחים ואחיות. כל קבוצה שאפה להשאיר מירב של אנשים בקבוצתה, משום שבני אדם היו כה יקרי ערך וניתן היה ליהנות משירותיהם הכלכליים, הרגשיים והמיניים. הסלידה והכעס הכרוכים בגילוי עריות שיקפו את הסכנות שחברי הקבוצה נחשפים אליהן עקב התמוטטות החליפין במידה שהייתה תקלה. הבעיה כאן אינה עם העברית (וגם זו בעיה) אלא עם התוכן. מה שמעניין יותר הוא ההמשך. החוקרת עליה מדווח בכתבה ראיינה 64 "משתמשים" שדירגו איכות של ערכים לפי קריטריונים מסוימים, שלדעתם היו מדד יעיל לקביעת האמינות של הערך: מספר הקישורים החיצוניים, אורכו ומספר השינויים שבו.

אחר־כך, בדקה יערי 2,224 מוויקיפדיה העברית, ומצאה כי "המדדים אכן מאפשרים זיהוי יעיל של ערכים איכותיים, בהם כאלה שזכו להיכלל בקטגוריית הערכים המומלצים מטעם ויקיפדיה."

בדיקה מקיפה של ערך, כך אומר לי הגיוני, צריכה להמשך כמה שעות. כדי לעמוד על איכותו, יש לבחון היטב את המידע בפתיח, את ארגון הערך, את סוג הקישורים, איכותם ותקפותם. גם העובדות והניסוחים בערך עצמו צריך להבדק. לכל הפחות, נניח, יש להקדיש לכל ערך בדיקה של כשעתיים. כלומר, אם החוקרת השקיעה כשעתיים בכל ערך, היא הייתה יכולה לבחון את כל הערכים אותם בדקה במהלך כשנתיים. אם היא זריזה, אולי אפילו תוך שנה.

אלא מאי, שהשינוי בו היא משתמשת כדוגמה הוכנס רק לפני כ-11 חודשים, ומשמעות הדבר — בהתחשב בעבודת הדוקטורט כולה ובדינמיות של השינויים בויקיפדיה (מה שהיה לפני שנתיים הוא כבר פרהיסטוריה), שהחוקרת הייתה יכולה להשקיע בבדיקה לכל היותר עשר עד עשרים דקות לערך.

המסקנות מכך הן עניין של דעה או תפישה. ניתן לנחש, לדוגמה, ולדעתי לניחוש זה סבירות גבוהה למדי, כי החוקרת לא בדקה את הערכים הנבדקים לעומקם אלא יישמה ביחס אליהם שיטת בדיקה הדומה לזו שיישמו המרואיינים שלה. כלומר, היא בדקה את אורך הערך, את מספר הקישורים, ואת מספר השינויים, וייחסה חשיבות מרכזית לשיוך לקטגוריית הערכים המומלצים.

אם אכן כך הדבר, הרי שהמסקנות הן בעלות חשיבות צנועה בהרבה, שכן מה שהחוקרת גילתה הוא שגם הנשאלים שלה וגם הויקיפדים (ובעצם, גם היא) משתמשים בקריטריונים דומים לאיכות. גם הם מתרשמים מהרבה קישורים ומערך ארוך. ממצאים דומים העלה מחקר אליו מפנה הטילדה הרביעית בגליונה האחרון: חוקר מברקלי שבקליפורניה "גילה מתאם סטטיסטי גבוה בין אורך הערכים בוויקיפדיה האנגלית ובין סיכוייהם לזכות בתואר 'ערך מומלץ'" (מחקר מעניין למדי, אגב. כדאי להעיף בו מבט).

החוקרת, אגב, גורסת שבמקום להסתמך על הקביעות של עורכי ויקיפדיה בנוגע לאיכות באופן עיוור, כדאי להשתמש ב"רובוט שיבדוק את המידע בשבילם" ואנו מתבשרים כי "באחרונה קיבל צוות המחקר מענק מאיגוד האינטרנט הישראלי, כדי לפתח [רובוט] כזה."

ארתור צווינגלי 14:36, 20 במאי 2008 (IDT)[תגובה]

1. קיומו של הקטע הזה בערך מדעי הוא תקלה חמורה. כל כותב צריך לדעת להבדיל בין ממצא עובדתי, תאוריה שלטת, תאוריה חדשה, דעה מקובלת, דעה של חוקר זה או אחר, וכן הלאה. ולא רק להבדיל בעצמו, אלא גם לוודא שאפשר יהיה לזהות את ההבחנה הזו מהערך. גם אם כל אנתרופולוגי העולם מאוחדים בדעתם לגבי חיי המסחר של ההומו האביליס, צריך להודות שאין לנו אף ממצא רלוונטי. חזקה על האנתרופולוגים המקצועיים שהם יודעים את ההבדל בין "X" לבין "מקובל לחשוב ש-X".

2. למיטב הבנתי, הסטודנטית ל"לימודי מידע" לא בדקה באופן ישיר את אמינות המאמרים. לפי המאמר, היא "בדקה 2,224 ערכים, והעריכה אותם על סמך המדדים של משתתפי המחקר" - כלומר, ספרה קישורים חיצוניים, קישורים פנימיים, עריכות וכו'. מדדים סטטיסטיים. אם יש במחקר שלה תיקוף של המושג "אמינות" שאותו היא חוקרת, המרכיב הזה לא מוזכר במאמר אפילו ברמז. מחוץ לחשבון - שיחה 15:01, 20 במאי 2008 (IDT)[תגובה]

קראתי את הידיעה ב"הארץ", והרושם שלי הוא שיש פה פוטנציאל לפיתוח כלי-עזר שיוכל לסייע במיון ערכים בוויקיפדיה, או טקסטים מסוג זה באופן כללי, לפי כמה קריטריונים המעידים באופן כללי ולא-לגמרי-מחייב על איכותם. אני אשמח אם יעמוד לרשותי כלי כזה, אבל ברור שלא מדובר בתחליף לעין אנושית שתשזוף את הטקסטים ותקבע את איכותם הלכה למעשה. ‏DrorK‏ • ‏שיחה‏ 16:43, 20 במאי 2008 (IDT)[תגובה]

אפשר, אני חושב, לבצע זאת באמצעות אלגוריתם מאוד פשוט. נאמר שמייחסים משקל של 35 אחוז לאורך הערך, 25 אחוז למספר העריכות על־ידי אנשים שונים, 15 אחוז למספר ההפניות להערות שוליים 15 אחוז למספר הקישורים הפנימיים ו-10 אחוז למספר המקורות החיצוניים, הרי שאחרי הגדרת סיפים שונים אפשר לבנות את האלגוריתם בלי הרבה בעיות (וגם בלי מענק מיוחד). ארתור צווינגלי 17:23, 20 במאי 2008 (IDT)[תגובה]

אם כבר אפשר לחשוב על שיטה בייסיאנית לדירוג ערכים, שתדרג לפי צירופים של עריכות (תורם/גודל השינוי). ערן - שיחה 17:34, 20 במאי 2008 (IDT)[תגובה]

המקור לדבריה של הסטודנטית הוא מרווין האריס. אפשר להביא כמקור נוסף גם את קלוד לוי-שטראוס, מרסל מוס ועוד רבים שעסקו בחליפין. Mort - שיחה 18:11, 20 במאי 2008 (IDT)[תגובה]

השארתי טוקבק בנושא בכתבה באתר "הארץ", עם קישור לדף השיחה של הערך. אני מקווה שיפורסם בזמן הקרוב. ערןב - שיחה 18:40, 20 במאי 2008 (IDT)[תגובה]

מנין יודעים האנתרופולוגים האלה את מה שאתה אומר שהם יודעים? לא הוכחה מפורטת, אלא ממש תמצית בראשי פרקים. מה הרעיון המרכזי? עוזי ו. - שיחה 20:40, 20 במאי 2008 (IDT)[תגובה]

שימו לב לטוקבקים. דניאל ב. 21:33, 20 במאי 2008 (IDT)[תגובה]

כדי להעמיד את נושא הזמנים בפרופורציה - אתי יערי פנתה אלי לפני כמעט שנתיים בבקשת עזרה טכנית בשליפת נתונים כאלו ואחרים על ערכים שונים בוויקיפדיה, סייעתי לה כמיטב יכולתי והעברתי לה נתונים שונים על מספר קבוצות ערכים (ערכים מומלצים, ערכים לשכתוב וכו'...) לקראת סוף שנת 2006 (כלומר לפני כשנה וחצי). עד כמה שאני יודע המחקר התבסס על הנתונים והפילוח שביצענו אז, אבל ייתכן שהיא דגמה נתונים גם מאוחר יותר. אני מניח שהדוגמא בתחילת הכתבה היא משהו שזוהה מאוחר יותר ומשמש כסוג של "טיזר" כדי להבהיר מדוע לא כדאי לסמוך על מקור יחיד, בכל מקרה - אני אנסה ליצור איתה קשר ולהפנות אותה גם אל הדיון הזה. ‏ costello • ‏ שיחה 22:50, 20 במאי 2008 (IDT)[תגובה]

היא כבר הגיבה בדף השיחה, שם הבהירה שהפתיחה של הכתבה לא קשורה למחקר שלה. ‏DGtal‏ 22:53, 20 במאי 2008 (IDT)[תגובה]

אז כתבו עלינו בעיתון הרבה דברים[עריכת קוד מקור]

לאור הבהלה שאחזה בנו (וניכרת בערך עצמו ובדף השיחה שלו), אני רוצה לשוב ולחזור על כך שאנחנו לא צריכים לעבור לדום ולאבד עשתונות בכל פעם שמישהו כותב עלינו משהו בעיתון. הייתי נגד ההיסטריה כשמאיר שליו התלונן עלינו, ועל אחת כמה וכמה אני נגד ההיסטריה כשביקורת היא בכתבה של כתב שתחת ידו יצאה הכתבה הבאמת מביכה על הגלעין הקובייתי של כדור הארץ.

ואפילו אם הפעם הוא ייצג נאמנה את דבריה של החוקרת הנ"ל, אני לא רואה סיבה לקפוץ לדום, ולסמוך עליה, שאין לנו שום מושג מיהי ומהי, יותר מאשר על מורט. במיוחד כשמתברר שהסברה שהועלתה שזה סתם היה מידע חסר בסיס מתבררת כלא נכונה, ושמדובר במשהו בהחלט מבוסס. אז יש בהחלט מקום לקחת ביקורת או הערות לתושמת ליבנו ולבדוק אותם, ואפילו יש מקום לדון על האם הפסקה הזו רלוונטית לערך, או מייצגת מספיק טוב קונסנזוס מחקרי.

אבל לא בהיסטריה. eman • שיחה • ♥ 21:36, 20 במאי 2008 (IDT)[תגובה]

אני מציע, כתרגיל לכולם, להמנע באופן מוחלט משימוש בזהות הכותבים כראיה, לחיוב או לשלילה. עוזי ו. - שיחה 21:42, 20 במאי 2008 (IDT)[תגובה]

אני מצטרף. בדיון על העריכה אין מקום לדיון בזהות הכותבים. מעשיהם ומחדליהם ראויים לדיון נפרד. אלגוריתמיקאי - שיחה 21:57, 20 במאי 2008 (IDT)[תגובה]

אני מציע לכולם, שכשמבקשים לקיים דיון על עריכה במצד אחד, לא לשחזר ולאכוף בכוח עמדות פרטיות ביד השנייה. או אז הקריאות במזנון שלא לעשות שימוש בטיעונים כאלו או אחרים יהיו קצת יותר אמינות. אורי • שיחה 22:14, 20 במאי 2008 (IDT)[תגובה]

זוהי דוגמא מצויינת. "הצעתך שלא לתקוף אד הומינם אינה מוצלחת, משום שבמקום אחר מנעת הכנסת פסקה לערך באמצע דיון". הייתי הולך על משהו יותר זורם, כמו "הצעתך שלא לתקוף אד הומינם אינה מוצלחת כי התרגלנו". עוזי ו. - שיחה 22:19, 20 במאי 2008 (IDT)[תגובה]

ואולי עוד יותר טוב: "צפיתך שעוזי יקיים דיון בלי להפעיל כוח כדי לאכוף את דעתו אינה מוצלחת, כי התרגלנו". לפעמים ממש תענוג להיות כאן. אורי • שיחה 22:30, 20 במאי 2008 (IDT)[תגובה]

עד עכשיו נמנעתי מהדיון הזה, הנה כי אני מכיר את החוקרת והן כי הייתי אחד הנחקרים (הלכה האנונימיות), אז אני אומר רק משפטים בודדים המתבסס על ההיכרות השטחית שלי עם הדוקטורט שלה: הכתבה בהארץ מתייחסת לנקודות מעטות בלבד מהמחקר. שיטות התיקוף הסטטיסטיות שלה מאוד רציניות (היא גם מעבירה קורס בנושא) והן לוו בלפחות עוד שתי שיטות מחקר (אחד מהם - ראיונות עומק). אני ממליץ למי שבאמת מתעניין לקרוא את הדוקטורט שכותרתו "הערכה ממוכנת של איכות המידע במערכות וויקי" (כרגע בשלבי קיטלוג, אז קצת סבלנות). ‏DGtal‏ 22:32, 20 במאי 2008 (IDT)[תגובה]

סוף סוף תגובה לעניין. נראה לי שהדברים חרגו כבר מזמן מתחום הדיון במחקר ו/או בכתבה, וחבל שנקלעה לכך אותה חוקרת. אורי • שיחה 22:35, 20 במאי 2008 (IDT)[תגובה]

אני כלל לא רוצה להתייחס לערך הספציפי, אלא לציין שהכתבת הספציפית הזאת שהיא, כנראה, כתבת לענייני חידושים במדע, כבר הוכיחה בעבר שהיא אינה מבינה בתחומים שעליהם היא מדווחת. הארץ כבר אינו עיתון רציני כבעבר. זיגמונד פרויד - שיחה 23:43, 20 במאי 2008 (IDT)[תגובה]

למיטב ידיעתי, עופרי אילני הוא כתב ולא כתבת. דוד שי - שיחה 07:25, 21 במאי 2008 (IDT)[תגובה]

כן, אתי כבר הבהירה לי זאת. היום נותנים שמות ניו-אייג' לילדים ואחר כך גם ההורים וגם הילד נעלבים כשמישהו שוגה לגבי מינו של הילד בגלל שמו. אם אתם רוצים לתת שם עם סטייטמנט קחו אחריות על הסטייטמנט. יאללה, לעבודה. זיגמונד פרויד - שיחה 07:35, 21 במאי 2008 (IDT)[תגובה]

התגובה המתבקשת[עריכת קוד מקור]

הגבתי גם בדף השיחה של הערך אבל כנראה שכאן זהו מקום הולם יותר לומר את דבריי.
ראשית, אני רוצה לחזור ולומר שוב שאין לי קשר לערך על הומו הביליס. כל החלק הראשון של הכתבה (עד למקום שבו מוזכר שמי) הינו פרי עטו ומחשבתו של כתב הארץ (מדובר על בחור ולא בחורה, כפי שנכתב פה מקודם). הערך הזה כלל לא נכלל במסגרת הבדיקות שנעשו בדוקטורט. בדף השיחה של הערך המדובר רשמתי את הדברים שנאמרו לי על ידי הכתב, לגבי נכונות הטענות שהוצגו.
עכשיו, משהבהרתי את עניין הערך אני רוצה לספר בקצרה על הדוקטורט.
מספר לא מועט של מחקרים בעולם בדקו את התנהגות המידע של המשתמש ואת האופן שבו הם מעריכים את איכות המידע. המסקנות, שהתקבלו מן המחקרים היא שהמשתמשים לא משקיעים זמן ומאמץ בביצוע פעולות הערכת איכות, גם מפני שאין להם יכולת קוגניטיבית לבצע פעולת הערכת איכות אך בעיקר מפני שאין להם מוטיבציה לעשות זאת (עידן הסיפוקים המיידים, רוצים את המידע כאן ועכשיו). ממצאים אלו, לצד ההבנה כי אין זה ישים להפעיל מנגנון שיפוט על ידי שופטים אנושיים כדי לקבוע את איכות המידע (בגלל שפע המידע ובגלל תדירות השינויים להם נתון המידע), הם שהיוו את הבסיס לאימוץ שיטות הערכה ממוכנות (שדרך אגב הן שיטות מקובלות ונפוצות מאוד בתחום מדעי המחשב).
בשנתיים האחרונות התפרסמו לא מעט מאמרים על פרוייקטים, המנסים ליצור מנגנון אוטומטי להערכת איכות הערכים בוויקיפדיה. המאמרים פורסמו בכתבי עת מובילים וכן הוצגו בכנסים החשובים בתחום. כל פרוייקט אימץ גישה משלו לחקר העניין. לשם דוגמה, ישנם מספר פרוייקטים, הנשענים על ההנחה שאם טקסט שורד את העריכות סימן שהטקסט איכותי. פרוייקט אחד עשה שימוש ברשתות בייסיאניות (מה שערן דיבר עליו. ככל הידוע לי, העבודה על הפרוייקט הופסקה). פרוייקט אחר מיושם על המאגר של וויקיפדיה בשפה האנגלית ומטרתו לצבוע את הטקסט בהתאם לאיכותו (הנה הלינק- [1]) (בהקשר זה חשוב לציין שהמחקר בתחום נמצא בראשית דרכו. ממש לא מזמן פורסמה כתבה בכתב עת מוביל שהפריכה לגמרי את ההנחה, שעומדת בבסיס הפרוייקטים הללו). אני בחרתי לתקוף את הסוגיה מנקודת המבט של המשתמש. גישתי היא שאם אנחנו רוצים ליצור רובוט שידמה שיפוט אנושי עלינו להשתמש בתובנות של המשתמשים עצמם וזה מה שניסיתי לעשות. אספר כאן בקצרה: יצאתי למחקר שטח מקיף, שבו בדקתי לעומק (באמצעות טכניקות איכותניות) כיצד שופטים המשתמשים את איכות הערכים בוויקיפדיה. לאחר מכן, ניתחתי את התובנות שלהם וחילקתי אותם לשתי קטגוריות: מאפיינים שאפשר למדוד באופן אוטומטי (ניתן להצמיד להם ערך מספרי) ומאפיינים שלא ניתן למדוד באופן אוטומטי (מאפיינים סובייקטיבים, כגון: שביעות רצון מהתוכן הכתוב או שביעות רצון מאופן ארגון המידע). חשוב לציין, כי בעוד המדידה של המאפיינים ברי המדידה האוטומטית הינה אובייקטיבית, הפרשנות שלהם תמיד תהיה סובייקטיבית (אם לערך יש חמישה תורמים שונים זו עובדה, הפרשנות של הנתון הזה היא סובייקטיבית - חלק יגידו שזה הרבה וחלק יגידו שזה מעט). בשלב הבא, אספתי נתונים אודות המאפיינים ברי המדידה האוטומטית עבור למעלה מ-2000 ערכים (וזה הזמן לאודות שוב ל-(costello) על עזרתו הרבה) ובדקתי האם אכן הם תורמים לזיהוי איכותו של הערך (באמצעות מודלים של רגרסיה לוגיסטית מולטינומינלית לכל מי שמעוניין בשם השיטה הסטטיסטית ששימשה לתיקוף המודלים). ראוי לציין שבדקתי מספר מודלים שונים, שהדגש בכולם הוא על שילוב בין המאפיינים השונים (אף פעם לא להתבסס אך ורק על מאפיין אחד ולפיו לשפוט את איכות הערך).
כל מה שתיארתי כאן זה רק חלק אחד מהמחקר. המחקר בחן סוגיות נוספות, הקשורות למשמעות המאפיינים הכמותיים השונים לזיהוי איכותו של הערך (כלומר, למה מאפיין מסוים נחשב כמנבא את איכות הערך) וכן, האם לדעת המשתמשים כדאי לצרף כלי ממוכן להערכה לסביבת וויקיפדיה (התקבלו כאן ממצאים מפתיעים מאוד) ובאיזה אופן להציג בפניהם את תוצאות ההערכה הממוכנת (ציון מול נתונים גולמים (כולל אפשרות לשילוב נוסחת הערכה מותאמת אישית) וכן בתוך מסך הערך או מחוצה לו). אין זה המקום כאן לפרט ולתאר לעומק מחקר, שבוצע במשך שנתיים אינטנסיביות וסוכם על פני דו"ח, שאורכו מעל 200 עמודים. אשמח להגיע לאחד מן המפגשים של הקהילה ולספר על תחום מחקר מרתק זה וכן על המחקר שלי, שבוצע ושיתבצע בעתיד (כולל בדיקת האפשרות לשיתוף פעולה).
באופן כללי, ההתרשמות שלי (וגם של חוקרים אחרים) היא שהמערכות האוטומטיות עושות עבודה טובה מאוד. נכון שלא מדובר על תחליף מושלם לשיפוט אנושי וצריך להכיר במגבלות של הכלי האוטומטי אבל בסך הכל מדובר על פיתרון, שראוי לחקור אותו לעומק ובטח שלא לפסול אותו על הסף.

ולסיום הבהרה לאותו וויקיפד שמכנה את עצמו בשם "ארתור" - זה מאוד נחמד לזרוק ככה לאוויר אחוזים ולומר הנה יש לי נוסחה להערכה. ברור שזה ממש לא רציני. על מנת לפתח את הנוסחה הטובה ביותר להערכה אוטומטית יש צורך בהרחבת המחקר, הן מנקודת המבט של המשתמש והן במנקודת המבט של המערכת (תיקוף סטטיסטי). הדוקטורט היווה רק את מחקר החלוץ. כעת ברצוננו בשלב הראשון להגדיל את מספר המשתמשים ולהרחיב את הבדיקה מולם, בשלב השני לפתח את הכלי ובשלב השלישי לבדוק אותו מול משתמשים אנושיים (הרי בסופו של דבר הכלי מיועד עבורם). זו הסיבה שיש לנו צורך במענק מחקר.
מקווה שהבהרתי כמה סימני שאלה בקשר למחקר ובקשר לכתבה בהארץ.
כמו שאמרתי, יש לי הערכה רבה כלפי וויקיפדיה בכלל ובשפה העברית בפרט והערכה זו היא שהובילה אותי לחקור מיזם מרתק זה. אתי י. - שיחה 01:23, 21 במאי 2008 (IDT)[תגובה]

1. את כותבת שבדקת האם הכלים האוטומטיים "תורמים לזיהוי איכותו של הערך". האם נעשתה בדיקה נפרדת של איכות הערך, מלבד עמדתם של המשתמשים (שענו כיצד הם שופטים את איכות הערכים)? כיצד?

2. בסופו של התהליך, האין זה נכון שהכלי שאת מנסה לבנות ישקלל כמה מדדים כמותיים, ויחזיר לכל ערך מספר שיחושב באופן דומה לזה שמציע ארתור (גם אם המקדמים יהיו אחרים, על-פי מודל הרגרסיה)? עוזי ו. - שיחה 02:11, 21 במאי 2008 (IDT)[תגובה]

היבטים כמותיים מסוימים של טקסטים עיוניים מרשימים מאוד את ההמון הנבער ועל כן תיתכן קורלציה בין ערכים נמדדים אלה לבין הערכות סובייקטיביות של משתמשים "רגילים". על מנת שלמודל תהיה משמעות אמיתית (מעבר לתמונת מראה של דעת ההמון הנבער) צריך שהכרעתו תהא דומה להכרעתם של מומחים בתחומים הרלוונטיים. אני מניח שאלה הדברים שאליהם כיוון עוזי בנימוס של איש אקדמיה. לילה טוב, זיגמונד פרויד - שיחה 02:34, 21 במאי 2008 (IDT)[תגובה]

אני מציע לך ליצור קשר עם עמותת ויקימדיה ישראל שעושייה להתעניין בפרוייקט. דניאל ב. 03:42, 21 במאי 2008 (IDT)[תגובה]

ראו תגובתי בשיחה:הומו הביליס, בן הטבע - שיחה 10:19, 21 במאי 2008 (IDT)[תגובה]

לעוזי - כפי שכתבתי קודם, לא יכולתי לכתוב באופן מפורט את כל השלבים אותם בצעתי ואני גם חושבת שלא כאן הבמה לכתוב זאת. זו הסיבה שלא הרחבתי על אופן הבדיקה האוטומטית. ובכל זאת, הבדיקה נעשתה בדומה לבדיקות שנעשו על ידי רוב רובם של המחקרים שבדקו סוגיה זו ועיקרה השוואת הערכים המומלצים אל מול ערכים, שדורגו על ידי הקהילה כבעלי בעייתיות מסוימת (בוויקיפדיה בשפה העברית מדובר על דורשי שכתוב, דורשי עריכה ודורשי השלמה). ברור שהיה עדיף להשוות אל מול שופטים אנושיים (וציינתי זאת במסגרת מגבלות המחקר), אולם הדבר אינו ישים, במיוחד כאשר יש צורך בהערכה של כמות רבה של ערכים (מלבד המחקר המפורסם של כתב העת Nature, שבדק 42 ערכים, נעשו מספר בדיקות "ידניות" וכולם על כעשרה ערכים בלבד, דבר לא מפתיע כלל נוכח המורכבות של המשימה). ולגבי הסעיף השני - הדברים שרשמתי באו בעקבות הנימה המזלזלת בדבריו של ארתור והתהייה שלו לגבי הצורך במענקי מחקר בתחום. רשמתי וארשום זאת שוב, מה שעשיתי עד כה הוא מחקר חלוץ וצריך להתייחס אליו ככזה. המחקר במסגרת הדוקטורט התמקד בתובנות המשתמשים וביכולת העקרונית להשתמש בתובנות אלו על מנת להעריך את איכות הערכים באופן אוטומטי. זה הכל. בהמשך, ייתכן מאוד שתפותח נוסחת הערכה, הדומה למה שתואר על ידי ארתור. בכל מקרה, בין אם מדובר על נוסחה כזו או אחרת היא תתוקף באמצעות מספר שיטות, כאשר נבחנת גם אפשרות לבחינת הסוגיה באמצעות טכניקה של למידה חישובית. עוד מוקדם לדעת מה יהיה. אנחנו נמצאים רק בתחילת הדרך.

ל"זיגמונד פרויד" - אני חושבת שעניתי להערותיך בתגובה שכתבתי לעוזי אבל בכל זאת אני רוצה להוסיף עוד משהו. משתתפי המחקר לא ידעו בעת ביצוע משימת שיפוט הערכים, שמטרתו הינה לבדוק אילו היבטים ניתן למכן. מדובר על תגובות אותנטיות, שמלמדות על האופן האמיתי שבו שופטים משתמשים את הטקסט המוצג לפניהם. רק לאחר קריאת המחקר כולו ובעיקר הנימוקים, העומדים מאחורי הבחירה במאפיינים השונים (כאמור, המחקר בוצע באמצעות שיטות איכותניות) ניתן להבין את התמונה המלאה של ממצאי המחקר. אתי י. - שיחה 12:29, 21 במאי 2008 (IDT)[תגובה]

נאמר זאת בגלוי: אני מטיל ספק אם יכולת לבדוק לעומק אלפי ערכים כטענתך בפרק הזמן המדובר, על מנת לבחון את איכותם להגדרתך. כדי להצליח במשימה היה עלייך לקרוא גם את כל הדפים בקישורים החיצוניים, את דפי השיחות, ואת דפי ההיסטוריה.

לא יכולת לעשות זאת לבדך. חד וחלק. בן הטבע - שיחה 12:40, 21 במאי 2008 (IDT)[תגובה]

אני לא אוסיף דבר מלבד שני המשפטים הבאים: (א) חבל לי שאתה תופס טרמפ על המחקר שלי בשביל לסגור חשבונות עם וויקיפדיה ועם עורכיה (כן, כן, קראתי את דף השיחה של הערך הומו הביליס). (ב) ובאשר אלי - לפני שאתה ממהר לפסול ולהשמיץ - קודם תקרא את כל המחקר שלי (וכן את המחקרים האחרים בתחום) ותבין את כל הממצאים ואת כל התמונה. אתי י. - שיחה 13:01, 21 במאי 2008 (IDT)[תגובה]

שלחי לי אותו. אם אמצא אותו מסקרן, אפרסם אודותיו כתבה מדעית ועניינית באתר הגדול במדינה, תוך שיתוף פעולה עימך. אגב, אין לי שום בעיה עם ויקיפדיה. אני אחד ממייסדיה ואוהב אותה כמו כל אחד מאיברי גופי. יש לי בעיה עם ערכים נחותים, ואוי ואבוי אם לא היתה לי בעיה כזו. בן הטבע - שיחה 13:14, 21 במאי 2008 (IDT)[תגובה]

אתי, אני חושש שהבעיה היא שיש פה הרגשה שנהגת כמעשה הברון מינכהאוזן שנחלץ מהביצה על ידי שמשך בשערותיו הוא. לקחת קריטריונים להערכת איכות ערכים, והראית שאפשר לתת למחשב לשפוט על פיהם, קיבלת שהשיפוט של המחשב דומה לשיפוט של האנשים שהשתמשו בקריטריונים האלה, ואז (ופה הבעיה - עד עכשיו הכל טוב ויפה) הסקת מפה שהקריטריונים שמהם התחלת את העבודה הם טובים. אבל זו בדיוק הבעיה. לדעתי, ולדעת עוד אנשים פה, הקריטריונים האלה הם שטחיים ובמקרה הטוב חלקיים.

בסופו של דבר חלק חשוב מהערכת איכותו של הערך צריך לנגוע לדיוק ולאמינות המידע שבו. ולמרבה הצער, הרבה פעמים אנחנו חוזים (בייחוד בוויקיפדיה האנגלית) במראית עין של סימוכין לעובדות, בשיטת ה"ירה את החץ, ואז מצא איזה קישור באינטרנט שיהיה המטרה שתסמן סביבו" שרק מבלבלת את הקורא וגורמת לו להאמין לשווא שהמידע אמין ומדוייק. ומה שאני רואה זה שאת בדיוק מאמצת את שיטת ההסתמכות על מראית העין, בלי שום שמץ של כלי לבדוק האם יש מאחוריה משהו.

על זו התרעומת - ואשמח לשמוע שאני טועה, וכן נעשה מאמץ להשוות את מה שהתקבל מהקריטריונים האלה שמבוססים על מראית עין, למה שייתקבל מבדיקה מדוקדקת. eman • שיחה • ♥ 14:33, 21 במאי 2008 (IDT)[תגובה]

אני חושבת שהבעיה היא שאתם מוציאים כאן דברים מפרופורציות. סך הכל מה שבדקתי במסגרת המחקר הוא איך אנשים שופטים את איכות התוכן בוויקיפדיה והאם אפשר לדבר בכלל על פתרון אוטומטי שיעריך את האיכות של הערך על סמך תובנות המשתמשים. זה כל מה שביקשתי לדעת במסגרת המחקר וזה בדיוק הדברים שלגביהם קיבלתי תשובה. לתומי חשבתי שהערכים המומלצים של וויקיפדיה עברו בדיקה מדוקדקת והם נחשבים לבעלי איכות גבוהה (לפחות ביחס לערכים אחרים, שסומנו על ידי הקהילה עצמה כבעייתיים. כפי שציינתי, לא בדקתי כלל וכלל ערכים "רגילים" - כאלו שאין עליהם תבנית). האם טעיתי בהנחה לגבי הערכים המומלצים ? אתי י. - שיחה 15:35, 21 במאי 2008 (IDT)[תגובה]

אני חושב שבשורה האחרונה אכן עמדת על מקור מה שהיה פה. הכנסת את עצמך ללב ויכוח ארוך על הנושא של איך אנחנו קובעים מהם ערכים מומלצים. אם את שואלת אותי (ונדמה לי שגם את מי שהחל את הדיון הזה פה) אכן טעית בהנחה שהערכים המומלצים אכן תמיד, ואפילו לרוב, ראויים להיות מומלצים. הרבה פעמים אנשים שופטים את הערכים בצורה מאוד שטחית, ואפילו "אוטומטית".

אז אם כל מטרתך היא להראות מה הקריטריונים לפיהם אנשים מחליטים שערכים הם מומלצים, אז הביקורת היא לא עליך אלא על אלה שמשתמשים בקריטריונים אלה. אם בנוסף את גם מציעה להגביר את האוטמטיזציה, אז הביקורת היא במידה גם עליך (לפחות על החלק הזה). eman • שיחה • ♥ 16:12, 21 במאי 2008 (IDT)[תגובה]

כבר קיבלתי תשובה על שאלתי בהודעה שמופיעה מתחת. תשובה מעניינת ביותר ואני בטוחה שהיא תעניין את קהל הכותבים והקוראים כאחד וגם את שאר החוקרים המכובדים בעולם. אתי י. - שיחה 15:56, 21 במאי 2008 (IDT)[תגובה]

ועוד משהו - כנראה שחלקכם לא הבין את משמעות תת הכותרת העיתונאית, שצורפה לכתבה. נכתב שם "מפתחות" בלשון הווה ולא "פיתחו" בלשון עבר. הפיתוח כלל לא החל ולא היתה כל כוונה להתחיל לפתח על בסיס הדוקטורט בלבד. הדוקטורט הינו מחקר ראשוני ומכאן יוצאים לעוד עבודת שטח מעמיקה ורק אחרי שהיא תסתיים, יתחיל שלב הפיתוח (שדרך אגב, כלל לא אמרתי מה יהיו הנחות היסוד בו, אז בבקשה לא להכניס לי מילים לפה). אתי י. - שיחה 16:08, 21 במאי 2008 (IDT)[תגובה]

באשר למחקר של בלומנסטוק[עריכת קוד מקור]

רציתי רק לציין שהמסקנה המצוטטת מהמאמר המרתק של ג'ושוע בלומנסטוק אינה נכונה. איור 4 במאמר בסך הכל מלמד שכמעט כל המאמרים המומלצים במהדורה האנגלית של ויקיפדיה עולים באורכם על ששת אלפים מילה. רוב המאמרים המומלצים שם עומדים על 8-9 אלפי מילים, בעוד שרוב המאמרים הלא-מומלצים עומדים על פחות מששת אלפים מילים.

אילו מר בלומנסטוק היה מציג את שתי העקומות שבאיור 4 זו על גבי זו, היינו רואים שעקומת המאמרים המומלצים טובעת בזנב עקומת המאמרים הלא-מומלצים. משמע - אם מצאנו מאמר בן שמונת אלפים מילה, זה עדיין לא אומר שהוא מומלץ. ובבניין ציון נתנחם, ליאור ޖޭ 09:09, 21 במאי 2008 (IDT)[תגובה]

דרך אגב, המאמר של בלומנסטוק הוא רק אחד מיני רבים, שדיברו על היכולת לקבל רמזים (עם דגש על רמזים) אודות איכות הערך בוויקיפדיה מתוך מדד אורך הערך (ודרך אגב, משתמשים במדד הזה גם כדי להעריך איכות של טקסטים, שלא קשורים לוויקיפדיה). ובכל מקרה, כפי שכתבתי בתגובתי הקודמת, זהו רק מדד אחד ויחיד מתוך סדרה של מדדים, שמשתקללים זה בזה. חוץ מזה, אתם חייבים להבין שכל מה שבדקתי הוא את תובנות המשתמשים. עבור המשתמשים המדד הזה מרמז על איכות ובמסגרת העבודה הרחבתי על המקור לתפיסה זו (נימוקי המשתמשים לבחירה במאפיין אורך הערך כמדד לאיכותו). אתי י. - שיחה 11:17, 21 במאי 2008 (IDT)[תגובה]

באוניברסיטת בר אילן מלמדים את מדעי המוח, מי שישמע "מדעי המוח" עוד יחשוב מי יודע מה. חלק מכריע בלימודים האלה מושתת על פסיכולוגיה – בליל של תיאוריות הזויות שפילוסופיית המדע פוסלת מכל וכל. הכלי היחיד להעריך איכות של ערך אנציקלופדי היא דרך פעולה מוחית, ולא חלילה מין אמצעי של בינה מלאכותית. אולם, איש אינו יודע כשורה כיצד פועל המוח האנושי, כך שלעולם לא נדע עד כמה ערך איכותי באמת. זהו כלל יסוד בתורת ההכרה. קודם יש לפתור סוגיה זו לפני שפונים לפתור בעיות איכות של ערכים. בן הטבע - שיחה 11:39, 21 במאי 2008 (IDT)[תגובה]

מאחר ואני חוקר את הבסיס העצבי ללמידה של הכללה (אנ'), אני יכול לאשר כי דבריך משוללי יסוד. אינך מבדיל בין שיטות מסוימות של פסיכולוגיה קלינית, שאינן נאמנות לשיטה המדעית, לבין עשרות שנים של מחקר פסיכולוגי הנאמן לשיטה המדעית ומפריך עצמו לפיה. אשמח מאד לשתף פעולה עם אתי בפיענוח סוגיות היסוד המעניינות באמת - מהי ויקיפדיה, איך היא עובדת, למה לתרום לה, מתי היא תיסגר וכו'. ליאור ޖޭ 12:21, 21 במאי 2008 (IDT)[תגובה]

ויקיפדיה העברית לעולם לא תיסגר. בסופו של דבר כל ישראלי יהיה בעל חשבון בויקיפדיה. הערכים המומלצים הם לרוב איכותיים, ועלינו לשאוף לערכים דוגמתם, רבים ככל האפשר. 12:28, 21 במאי 2008 (IDT)

תגובתי הארוכה מדי[עריכת קוד מקור]

לאתי י. ולאחרים,

כפי שרמזתי אני וכפי שרמזו גם עוזי ו. וזיגמונד פרויד (הוויקיפדי), הבעיה אינה נעוצה במידת התקפות של הדברים שבאת לאמוד, בסיכויי יצירת רובוט אמידה כזה, ואף לא בתקפות הבדיקה או ברום מעמדה בהשוואה ל'אלגוריתם' שלי. לבטח אין לי ולאף אחר שום הסתייגות מזכאות מחקרך לקבל מענקי מחקר — להפך! כפי שפקיד השומה שלי ישמח לספר לך, אני אחד ממממני מענק המחקר, ובנסיבות אלו שמחת קידום המדע מטביעה בלי כל קושי את העגמומיות הנובעת מהרגרסיה המולטינומינלית בתקציבי האישי.

השאלה המעניינת יותר — ולטעמי, היחידה שיש בה עניין לוויקיפדים ולציבור הרחב — היא האם רובוט הערכת ערכים כזה משפר את יכולתנו אנו להעריך ערכים, או מעניק לציבור הקוראים כלי שיש לו ערך לאומדן ערכם של ערכים.

כפי שאת כותבת, ניסית במחקרך לבדוק "כיצד שופטים המשתמשים את איכות הערכים בוויקיפדיה," כימתת את הניתן לכימות מקריטריונים של שיפוט אלו, ויישמת אותם בהשוואה להערכות פנים-וויקיפדיות של איכות הערכים ("השוואת הערכים המומלצים אל מול ערכים, שדורגו על ידי הקהילה כבעלי בעייתיות מסוימת"). המסקנה הייתה כי "המערכות האוטומטיות עושות עבודה טובה מאוד."

מן הדברים קל ללמוד כי את יוצאת מהנחה שההערכה הפנים-ויקיפדית מיישמת בפועל הערכה אנושית פרטנית, שוות ערך לזו של מומחים בתחום, לגבי איכות הערכים. או, בניסוח פשוט יותר, גילית ש-א' (הערכת הנבדקים) דומה מאוד ל-ב' (הערכת ויקיפדיה). אם יתגלה כי ב' (הערכת ויקיפדיה) דומה ל-ג' (הערכה 'אובייקטיבית' או הערכת מומחים), כי אז למחקרך ולתוצאותיו ערך רב. אם, לעומת זאת, יתגלה כי ב' (הערכת ויקיפדיה) אינו ג' (הערכת מומחה) אלא בעצם סוג של א' (הערכת הנבדקים), כי אז המחקר מצביע, כבדרך אגב, על העובדה הטריוויאלית למדי, שהכותבים בוויקיפדיה והקוראים בה דומים באופן בו הם מגבשים הערכות.

על הנקודה האחרונה אין חולקים, דומני. ויקיפדיה עצמה מכריזה כי היא אנציקלופדיה חופשית "שאותה כולם יכולים לערוך" וקצרה וקלה הדרך מכאן למסקנה כי אין הבדל משמעותי באופן ההערכה של איכות ערכים בין כותבי ויקיפדיה למי שקוראים אותה.

דיון ער מתנהל בוויקיפדיה לאורך שנים האם המנגנון של "ועד ניהול" משותף ורב משתתפים אכן מביא לשיפור הערכים והערכתם, או דווקא להפך; והאם הפתיחות של ויקיפדיה מושכת כוחות ראויים, שאחרת לא היו מוצאים ביטוי, או דווקא מרתיעה אותם. יש הסוברים שהמנגנון תורם. אחרים סבורים שאינו תורם או, מכל מקום, אינסידנטלי. ההסתמכות על ההנחה שהערכת ויקיפדיה שונה מהותית מהערכת הדיוטות סתם היא, מכל מקום, הסתמכות על עובדה שנויה במחלוקת וההנחה כי זו עובדה מוגמרת מעוררת תמיהות לגבי בסיס מחקרך.

בעיה אחרת, מעשית יותר אך חשובה לא פחות, היא ההבחנה בין ערכים מומלצים לבעייתיים. כפי שציינת (וציין גם Costello) עיקר מחקרך היה "השוואת הערכים המומלצים אל מול ערכים, שדורגו על ידי הקהילה כבעלי בעייתיות מסוימת (בוויקיפדיה בשפה העברית מדובר על דורשי שכתוב, דורשי עריכה ודורשי השלמה)." הנחתך הייתה, מן הסתם, כי אלו ערכים המייצגים קצוות של קשת מסוימת של הערכה: מהערכים הפגומים, שיש בהם בעיות ניכרות; ועד ערכים איכותיים, שיש בהם מעט מאוד בעיות.

הנחה זו שגויה מיסודה, משום שהיא מתייחסת לשתי קביעות נפרדות, שגם קובעיהן וגם שיטת הקביעה שלהן שונות מאוד. ערכים הנחשבים דורשי שכתוב, עריכה או השלמה מתויגים כך בעיקר על־ידי מפעילי מערכת או כותבים בעלי נסיון, והיא נעשית במהירות ובמקום בו אין חילוקי־דיעות בדרך כלל : ביחס לערכים חדשים מאוד, ערכים בעייתיים מאוד בעליל מבחינה חיצונית או ערכים שיש למחקם, אך מעדיפים להשאירם כבעיה שתתוקן בעתיד במקום למחוק את הערך לחלוטין. במלים אחרות, הקביעה שערך מסוים הוא ברמה נמוכה מאוד נקבעת במהירות ובדיוק רב יחסית על בסיס צורת הערך, ניסוחו, וכדומה, כאשר רק במיעוט קטן של המקרים התווית לשכתוב או עריכה עוסקת בתכניו ובאיכותם.

בחירת ערכים מומלצים, לעומת זאת, נעשית באופן שונה: בהצבעה שמשתתפיה אינם מומחים לנושא ובדרך כלל גם לא קראו את הערך. השיקולים המופעלים, כפי שעולה מן ההערות בהצבעה, הם בדרך כלל אורכו של הערך, כמות הקישורים הפנימיים ה"אדומים" וה"כחולים" (המובילים או שאינם מובילים לערך אחר בוויקיפדיה), קריאותו, מספר התמונות והקישורים בערך, קשרים אישיים, עניין או שעמום בקשר לנושאו, שיקולים פרוצדורליים (כבר היה/לא היה ערך בנושא דומה בעבר הקרוב), וכדומה. אפשר, כמובן, להתווכח אם שיקולים ממין אלו תורמים או שאינם תורמים לבחירה בערך איכותי יותר על פני איכותי פחות, אבל קשה לראות איך ניתן להתייחס לעניין כעובדה מובהקת ומוגמרת שניתן להסתמך עליה בבדיקת איכות. גם זה מביא אותי לחשוב שהנחת יסוד במחקרך מבוססת כבדרך אגב על נקודה שנויה במחלוקת.

ארתור צווינגלי 15:23, 21 במאי 2008 (IDT)[תגובה]

האם הבנתי נכון את דבריך ? הערכים המומלצים כלל אינם איכותיים אלא סתם כך ניתן להם המעמד הנ"ל ? בלי שום קשר למחקר שלי, זה עצוב מאוד לשמוע. ושוב, כפי שכתבתי קודם. הוצאתם מכל פרופורציה אפשרית את המחקר ואת מה שהוא ביקש למצוא. המחקר הינו מחקר משתמש ומטרתו היתה לעמוד על תובנות המשתמשים. זה הכל. אתי י. - שיחה 15:53, 21 במאי 2008 (IDT)[תגובה]

1. כדאי להדגיש את הדברים האלה: המחקר משווה את הציון שמשתמשים נותנים לערכים, עם הכלים שהם מדווחים ששימשו אותם בקביעת הציון הזה. קיומו של קשר כזה בכלל אינו מובן מאליו (משום שבהערכה נכנסים הרבה גורמים לא מודעים, וכאלו שאינם קלים למדידה ישירה), ובוודאי שיש מקום לבדוק את עוצמת הקשר, את ההיטלים שבהם הוא חזק יותר, וכן הלאה. מנקודת המבט הזו, ויקיפדיה היא מאגר מידע שדרכו נבדקו תהליכי הערכת איכות; המחקר מתמקד בתהליכים האלה, ולא בויקיפדיה עצמה.

2. "ארתור" מצביע על כך שהתואר "ערך מומלץ" אינו זהה לאופן שבו אנחנו מבינים "ערך איכותי" (היינו, כזה שמומחים העידו עליו ככזה). זה נכון במידה רבה, אבל למרות זאת, אני חושב שגם הוא יודה שהמתאם בין שני המושגים גבוה מאד; אני בטוח שאם יבוצע מחקר שישווה ציונים שמעניקים מומחים לשתי קבוצות הערכים - מומלצים ושאינם כאלה - יתברר שגם לאחר נטרול הגורמים הטכניים (אורך, מספר קישורים וכדומה), יתברר שההמלצה היא חזאי מעולה לחוות הדעת של המומחים. עוזי ו. - שיחה 16:20, 21 במאי 2008 (IDT)[תגובה]

(לא רמזתי כלום). עוזי ו. - שיחה 16:20, 21 במאי 2008 (IDT)[תגובה]

המחקר לא משווה את הציון שנתנו המשתתפים, משום שהמשתתפים כלל לא נתנו ציון לערך. הבדיקה נעשתה באופן הבא: כל משתתף קיבל לידיו חמישה ערכים לבחירתו (מתוך רשימה של ערכים בשישה תחומים, כאשר חמשת הערכים שנבחרו הם כולם באותו נושא והיו: מומלץ, רגיל שדומה בצורתו החיצונית למומלץ, דורש עריכה, דורש שכתוב ודורש השלמה. כל הערכים, למעט הרגילים (שלא נכנסו לבדיקה האוטומטית אח"כ) נדגמו באופן אקראי. פירוט מלא בעבודה עצמה. ולפני שאתם קופצים - רק מחצית מהמשתתפים ראו את תבניות הקהילה ובעבודה עצמה הרחבתי לגבי האופן שבו עשיתי זאת ולגבי ממצאים מפתיעים שהתקבלו גם בנקודה זו). בקיצור, הם צפו בחמישה ערכים והתבקשו לבחור שניים, הערך בעל האיכות הגבוהה ביותר והערך בעל האיכות הנמוכה ביותר, לפי תפיסתם את המושג איכות (שידוע כי הינו מושג סובייקטיבי שקשה מאוד למדוד אותו באופן ישיר) ולנמק מדוע בחרו דווקא בערכים אלו. חשוב לי להדגיש, זהו תיאור קצרצר ושטחי של אחת המשימות שבוצעו על ידי המשתמשים. אין לי את היכולת לבוא ולפרט פה באופן מלא את כל מה שנעשה במחקר וזה גם לא המקום. אתי י. - שיחה 16:35, 21 במאי 2008 (IDT)[תגובה]

אורי, אני חולק עליך בנקודה אחת בולטת: ערכים מומלצים לא נהיו כאלה רק בגלל סיבות אסטתיות (מכמות תמונות, דרך אורך הטקסט, צבע הקישורים ומספר טעויות הכתיב) ופוליטיות (מי כתב ומה הנושא). תוכנו ודיוקו של הערך בהחלט נבדקים. נכון שלא תמיד יש יותר ממומחה אחד לנושא (ובנושאים כמו יהדות וגאוגרפיה יש פה הרבה בקיאים), אבל ערך מומלץ הוא בהחלט ערך מדוייק במידה רבה מאוד, במיוחד לאחר ייסוד שלב ההמתנה והאפשרות של הסרת ההמלצה. אין "מושלם" ואין "מלא", אבל התרשמותי מהערכים המומלצים היא שהם, ככלל, מאוד מאוד ראויים וממילא אין מניעה משימוש בהנחת היסוד שלה במחקר מדעי. ‏DGtal‏ 16:00, 21 במאי 2008 (IDT)[תגובה]

אתי, אל דאגה. ערכים מומלצים עוברים תהליך ארוך של ביקורת עמיתים ושיפור לפני שהם מגיעים להצבעה, שבא אתה מצביע רק אם קראת את הערך. דניאל ב. 16:04, 21 במאי 2008 (IDT)[תגובה]

אני חושש שאתה תמים אם אתה חושב שכל מי שמצביע קרא את כל הערך. eman • שיחה • ♥ 16:36, 21 במאי 2008 (IDT)[תגובה]

זה לא "רק" בגלל סיבות אסטתיות, אבל לצערי יש להן משקל הרבה הרבה הרבה יותר גדול מהמ שהיה רצוי.

וכמובן יש הסיבות הפוליטיות (במובן של פוליטיקה פנים ויקיפדית). זה מאוד קשה לצאת נגד ערך שכתבו ויקיפדים בולטים ו/או מקושרים, ומי שמעז לעשות את זה משלם מחיר לא קל. דבר זה ללא ספק גורם לאנשים לחשוב פעמיים ושלוש לפני שהם מעיזים לעשות זאת, וזה גורם להטיה.

יש גם עוד נושא שאורי/ארתור העלה, וזה נשוא העיניין. אנשים משתתפים בהצבעה לפי העיניין שלהם בנושא, ועצם השאלה האם ערך הוא מעניין הוא קריטריון - וקריטריון לגיטימי. לכן יכולים להיות ערכים במצב מצויין, שלא יהיו מומלצים, ולא צריכים להיות מומלצים, כי יש בהם עיניין רק לציבור קטן (או אפילו מקצועי), ולא לציבור הקוראים הרחב. eman • שיחה • ♥ 16:36, 21 במאי 2008 (IDT)[תגובה]

יפה אמרת (זו הסיבה שלא בדקתי ערכים רגילים). וכמו שעוזי כתב קודם, אני לא באתי לבדוק את וויקיפדיה, אני באתי לבדוק את המשתמשים. כנראה שלא הבנתם נכון או שבחרתם לא להבין נכון וראיתם את המחקר שלי כסוג של מתקפה. חבל. אתי י. - שיחה 16:41, 21 במאי 2008 (IDT)[תגובה]

טוב, גם לי יש משהו קטן להגיד. אני חושב שיש פה אי הבנה מצערת של מושג הערכים המומלצים. מתייחסים לזה בסוג של חרדת קודש, וברצינות שמביאה לטעויות בתפיסה. הערכים המומלצים הם בסך הכל מנגנון פנים-ויקיפדי לבחירה של הערכים הטובים יותר שמתוך המצאי הקיים של הערכים בכלים העומדים לרשותנו. זה מה שזה, ולא יותר. מצאי הערכים שלנו לא מושלם, והכלים שעומדים לרשותנו לוקים בחסר. זה ברור לכל מי שמבין את כוונתו המקורית של המוסד הזה. ‏Harel‏ • שיחה 16:59, 21 במאי 2008 (IDT)[תגובה]

לאתי י.,

מדברייך מתחוור לי שלא הבנתי את מטרת מחקרך נכונה. בתיאור הראשון של מחקרך כתבת כי אחד מתחומיו היה שימוש במאפיינים בני מדידה אוטומטית כדי לבדוק "האם אכן הם תורמים לזיהוי איכותו של הערך." לתומי, סברתי כי זו השורה התחתונה של המחקר. עתה, עם זאת, את מציינת כי "המחקר הינו מחקר משתמש ומטרתו היתה לעמוד על תובנות המשתמשים. זה הכל." עדיין לא ברור לי איך בדיוק את מתקפת את תובנות המשתמשים כמנבא לאיכות ערך בלי להניח שיש לך מדד ברור לאיכות ערך שאינו בדיקתו המקיפה. למיטב הבנתי, את לא יכולה לעשות את הראשון בלי להניח את השני. או, בניסוח לוגי, את מניחה כך:

סוקרטס הוא סוס (המאפיינים הניתנים למדידה של הערכת משתמשים נמצאים במתאם להערכת ויקיפדיה).
כל הסוסים לבנים (הערכת ויקיפדיה לאיכות = איכות).
לכן, סוקרטס לבן (המאפיינים הניתנים למדידה מנבאים איכות).

האם לא לשם כך נדרש מענק המחקר? לטעמי, המציאות היא כזו:

סוקרטס הוא סוס (המאפיינים הניתנים למדידה של הערכת משתמשים נמצאים במתאם להערכת ויקיפדיה).
כל הסוסים לבנים או שחורים (הערכת ויקיפדיה לאיכות שווה לאיכות או שאינה שווה לאיכות).
לכן, סוקרטס לבן או שחור (המאפיינים הניתנים למדידה מנבאים או שאינם מנבאים איכות).

מכל מקום, הרגיעי נפשך: איש אינו רואה במחקרך מתקפה על ויקיפדיה.

לעוזי, אני חושב שבדיקה של "ערכים מומלצים" היא במקרה הטוב חסרת ערך. גם אם נניח שהערכים המומלצים הם אכן קבוצה איכותית ונצליח לאושש הנחה זו (ואני לא לגמרי משוכנע כי אפשר) עדיין יש כאן כשל הפצה (איליקיט מינור, אני חושב). בין קריטריוני היסוד לבחירת ערך מומלץ נמצאים אורכו (הנתון החשוב ביותר), מספר הקישורים שלו, מספר ההערות, וכדומה. משמעות הדבר היא כי כל הערכים המומלצים מאופיינים בתכונה זו. גם אם נניח שכל הערכים המומלצים הם איכותיים, לא נובע מכך, אפילו לא בקירוב, שכל הערכים הארוכים, הנערכים, ובעלי שפע הקישורים וההערות הם איכותיים.

עורכת המחקר הניחה לתומה כי ערך מומלץ מייצג את קבוצת הערכים בעלי תכונות דומות, אבל הנחה זו היא -- לדעתי לפחות -- שגויה ולעתים קרובות נמצאת במתאם הפוך.

ארתור צווינגלי 20:03, 21 במאי 2008 (IDT)[תגובה]

סטיבן באלמר הכריז לאחרונה ש"מיקרוסופט היא חברה ישראלית כמעט כמו שהיא אמריקאית", משום שביחס לגודל האוכלוסיה, בישראל יש אותו מספר עובדים במיקרוסופט כמו בארצות הברית. מה שההוכחה הזו מראה, כמובן, הוא שישראל היא מיקרוסופטית כמעט כמו ארצות הברית. עוזי ו. - שיחה 20:22, 21 במאי 2008 (IDT)[תגובה]

אני מסכים לחלוטין עם צווינגלי ועם בן הטבע (מה שמלמד, כנראה, שאיני בבק"ש של איש מהם). בראש ובראשונה, המחקר אינו מהווה מתקפה על ויקיפדיה. איש לא יטען זאת. הוא מהווה מתקפה על השכל הישר. בן הטבע, אף שדבריו התפרשו על ידי אחדים כהתייחסות לכלל המחקר הפסיכולוגי כאילו היה פסיכואנליזה (פסבדו-מדע במקרה הטוב), צודק בטיעונו הבסיסי. אם המחקר של א"י אכן נועד לסייע בעיצוב אוטומט המספק ציון איכות לערכים ויקיפדיים, הרי שהוא פגום מיסודו. אין קורלציה בין המשתנים הכמותיים לבין איכות. אין קורלציה בין דעת ההמון לבין איכות. לא עיינתי במחקר השלם ולפיכך איני יכול לאמר עד כמה המתודולוגיה לקויה. אם, כמאמרו של צווינגלי, מטרת המחקר הייתה להראות שסוקרטס לבן או שחור - הוא הצליח בכך מעל למשוער, אלא שלמסקנה זו אין ערך ממשי. על כל פנים, יש כשל מרכזי אחד במחקר כולו. החוקרת התבססה על הנחות אינטואיטיבית לגבי ארגון אנושי שהיא לא מכירה כלל מבפנים. נקודת המוצא של כל מחקר העוסק בתופעה אנושית היא התבוננות בתופעה על קרביה. תמונה מן המרחק, בלי הבנה כלשהי של התוך, אינה לוכדת דבר מן האסנס. לו הייתה מתחילה את דרכה בהיכרות עם המנגנון שאותו בדקה הייתה מבינה שחלק מהנחותיה מופרכות. ויקיפדיה עבור חוקרת זו היא קופסה שחורה. היא יודעת שהיא קופסה והיא יודעת שהיא שחורה, אך היא אינה יודעת מה מטרת הקופסה וכיצד היא פועלת. אני, בניגוד לצווינגלי, כן מוטרד מבזבוז משאבים על ייצור אשליות. הייתי מעדיף שהם יופנו לייצור מקומות תעסוקה. ובניגוד לדוד שי, אין לי סנטימנט להופעה עניינית וצנועה. לאחר שכמה מן הבעיות המרכזיות במחקר נחשפו על ידי ויקיפדים בעלי תחומי מומחיות שונים לחלוטין, מי יודע מה תהא תגובת הקהילה המדעית? גם אני הייתי שומר על פרופיל נמוך. זיגמונד פרויד - שיחה 01:42, 22 במאי 2008 (IDT)[תגובה]

כל הקהיליה המדעית טועה, רק אתם צודקים.

A Framework for Information Quality Assessment

Assessing information quality of a community-based encyclopedia

Measuring article quality in wikipedia: models and evaluation

Computing Trust from Revision History

Mining Revision History to Assess Trustworthiness of Article Fragments

Assessing the value of cooperation in Wikipedia

Investigations into Trust for Collaborative Information Repositories: A Wikipedia Case Study אתי י. - שיחה 10:08, 22 במאי 2008 (IDT)[תגובה]

הפנית לשבעה מאמרים. הראשון והשני נכתבו על־ידי קבוצת חוקרים אחת. הרביעי, השישי והשביעי, על־ידי שנייה. הפנייה לארבעה מחקרים עדיין אינה משקפת את "כל הקהיליה המדעית" (כך לכל הפחות אני מקווה).

המאמרים הרביעי, השישי והשביעי (של אותם כותבים, כאמור) גורסים כי דגם העריכות בויקיפדיה, עם שיפורים שונים שנעשו בו, אכן מביא לשיפור באיכות הערכים; המאמר הראשון, השני, והשישי (וכנראה גם השלישי) מסתמכים על הרעיון שמאמרים מומלצים הם קבוצת איכות ייציגה ובדיקה לפי אותם תקנים.

מהמאמרים ומהערתך עולה כי את סבורה שניתן לשמר את הנחת היסוד שבמחקרך לגבי היציגות של מאמרים מומלצים כי יש הסכמה כללית של "כל הקהיליה המדעית" לגבי נושא זה. כפי שעולה מהדברים שלעיל, קשה לראות איך ניתן להגיע למסקנה זו. ייתכן כי כל הקהילה המדעית אכן תומכת בהנחת היסוד שלך. המאמרים שהבאת רחוקים מלאשש טיעון זה.

מה שמטריד יותר, אולי, הוא שזו כבר הגדרה שלישית של יעדי מחקרך, מה שמותיר אותי מבולבל מתמיד. האם המטרה הייתה להסתמך על דירוג המאמרים המומלצים בויקיפדיה כאמת מידה מתוקפת ומוכחת, כפי שטענת תחילה? האם המטרה הייתה רק לערוך מחקר של גישות משתמשים, כפי שטענת אחר־כך? או שהמטרה היא, שוב, הראשונה, ועתה פשוט את מביאה את ההוכחות לקיום הסכמה כללית של "כל הקהיליה המדעית" לטענות אלו?

המאמרים:

המאמר הראשון (שמו: A Framework for Information Quality Assessment) מתבסס על אותה הנחה לא בדוקה של א"י לגבי מאמרים מומלצים.
המאמר השני (שמו: ASSESSING INFORMATION QUALITY OF A COMMUNITY-BASED ENCYCLOPEDIA) הוא מחקר מוקדם יותר של אותם חוקרים, שהמאמר הראשון מתבסס על נתוניו.
המאמר השלישי (שמו: Measuring article quality in wikipedia: models and evaluation) נגיש רק כתקציר, ולכן קשה לחוות דעה עליו. מן התקציר דומה כי נעשה שימוש באותה גישה.
המאמר הרביעי (שמו: Computing Trust from Revision History) עוסק באמון שניתן לתת או שלא לתת בעריכות.
המאמר החמישי (שמו: Mining Revision History to Assess Trustworthiness of Article Fragments) הוא של כותבי המאמר הרביעי ואומר דברים דומים.
המאמר השישי (שמו: Assessing the value of cooperation in Wikipedia) בוחן את מידת ההצלחה או אי ההצלחה של עריכה שיתופית (ומסקנותיו מעורבות. לדוגמה, הוא מצביע על כך שעריכות רבות לערך אינן במתאם לאיכותו).
המאמר השביעי (שמו: Investigations into Trust for Collaborative Information Repositories: A Wikipedia Case Study) הוא חזרה על אותם דברים, לערך, ועל ידי אותם כותבים, כמו במאמר הרביעי והחמישי.

ארתור צווינגלי 12:17, 22 במאי 2008 (IDT) ��[תגובה]

ההשוואה בין "מאמר מומלץ בויקיפדיה" לבין "מאמר איכותי, כפי שמומחים מדרגים אותו" אינה נושא המחקר של אתי (כפי שאני מבין אותו), ולכן אפשר לכנות את הקשר בין שני המושגים "הנחה לא בדוקה". הנח לרגע את הצורך לבדוק את ההנחה הזו בצורה מסודרת. האם לדעתך היא אינה נכונה?

נניח שהיינו בוחרים באקראי 30 ערכים מומלצים; 30 ערכים בעלי אותם מאפיינים כמותיים, שלא נבחרו כמומלצים; ו- 30 ערכים כאלה שסומנו כדורשים שכתוב. את 90 הערכים האלה היינו מעבירים לבדיקה של מומחים, לאחר הסרת התבניות המסגירות. המומחים מחזירים ציון (1-10). אני מנחש שיהיו הבדלים מובהקים בין שלושת הקבוצות. האם לדעתך לא יהיו כאלה (ואז הטענה היא שאין קשר בין המושגים), או שיהיו, אבל המחקר הזה טרם נעשה (ואז הטענה היא שיש קשר אבל לא הוכחנו את קיומו)? עוזי ו. - שיחה 13:22, 22 במאי 2008 (IDT)[תגובה]

עוזי, ההשוואה אינה נושא המחקר של א"י, כמובן -- תהייתי הייתה לא על כך אלא על השימוש ב"הנחה לא בדוקה" (כדבריך) כאילו מדובר בהנחה בדוקה. ההפנייה שלה למאמרים המשתמשים ב"הנחה לא בדוקה" זו נראתה לי כנסיון לטעון כי מדובר בהנחה בדוקה ומוסכמת.

לעניין עצמו: אני חושב שהבדיקה שאתה מציע חסרת משמעות, שכן היא מציעה דרך טובה לגלות מתאם אקראי. ערכים ארוכים יותר (אך לא כאלו שנערכו יותר פעמים או על ידי יותר עורכים!) אכן איכותיים יותר בממוצע מערכים קצרים יותר, אבל סיבת היסוד לפער באיכות אינה האורך, מספר הקישורים, וכו'. זוהי סיבת לוואי: מבדיקה שלי המאפיין המשותף המנבא כמעט באופן מלא ומוחלט פערי איכות ניכרים הוא ערך שנכתב ברובו על־ידי אדם אחד, בנושא שאינו 'בעייתי'. ה"המלצה" על הערך, או דיון ההמלצה, משמעם בעיקר שהערך עובר עריכה לשונית נוספת, עובדה המשווה לו מראה נאה יותר.

לדוגמה, לצורכי בדיקת איכות של ערכי ויקיפדיה העברית, יש מספר מאפיינים חיוניים, שלדעתי יוכלו לנבא בהצלחה של כמעט מאה אחוז איכות טובה של ערך:

אם אורכו מעל ל-45,000 בתים.
ואם כותב לפחות 90 אחוז מהערך הוא אדם אחד או, לכל היותר, שניים.
ואם בוצעו לפחות 20 עריכות על־ידי אחרים (לא כולל בוטים).
ואם נושא הערך אינו אירוע מחמש השנים האחרונות, טלוויזיה, אדם חי, ספורט, הבי מטל, הרי פוטר, היאבקות (וכו').
תוצאה: ערך שיהיה תמיד איכותי יותר מכל ערך שאינו מחונן בתכונות אלו, באופן מדורג.

דגימה אקראית של ערכים שבדקתי: (קום הוק)

ההכנות לפיגועי 11 בספטמבר: הערך כולו (כמעט) נכתב בבעריכה אחת, הראשונה על ידי שן שש זעם.
המערכה באוקיינוס האטלנטי (1939 - 1945) -- נכתב כמעט כולו על־ידי קלונימוס.
המצור הגדול על מלטה -- גילגמש.
המרד על הבאונטי -- נכתב בעריכה אחת על־ידי Frenk.
הקרב על מוסקבה -- החריג היחיד: נכתב על־ידי Eranb ואלמוג.
טבח יער קאטין -- נכתב ב-85 אחוז על־ידי אלמוג.
טבח מי ליי -- נכתב על־ידי Ches.
כיבוש קונסטנטינופול -- נכתב על־ידי אריה ענבר.
מהומות סטונוול -- נכתב על־ידי דורית.
מלחמת איטליה-יוון -- נכתב על־ידי אלמוג.

ארתור צווינגלי 15:35, 23 במאי 2008 (IDT)[תגובה]

שלום לך, מה מבדיל הבי מט(א)ל, ספורט, ה(א)רי פוטר מנושאים אחרים? זה דבר ראשון. דבר שני, יש לך מספר שגיאות. hafnaya צ"ל הפניה ולא הפנייה, וכמובן האל"פים ששכחת בהארי פוטר והבי מטאל. 16:34, 23 במאי 2008 (IDT)

מה שמבדיל בין טרש מטל, ספורט או פוטר הוא מה שמבדיל מנהל מחלקת עיבוד שבבי מדוד אבידן. בתקווה שהדברים התבהרו. ארתור צווינגלי 20:30, 23 במאי 2008 (IDT)[תגובה]

אורי-ארתור, יש פגם אחד בהנחת היסוד המפורטת שלך - היו, ומן הסתם גם יהיו, בוויקיפדיה הרבה ערכים שענו על כל תביעות הסף שלך - אורך, כותב יחיד, עשרים ועריכות ויותר, נושא - ועדיין היו באיכות ירודה מאין כמותה מסיבות שונות: תרגמת קשה, אי-הבנה של הנושא (מוזיקה, במקרים שאני מדברת עליהם) ושפה עילגת. העורכים המזדמנים בחרו לטפל בבעיות משניות, כמו הוספת קישור, הכחלת שנים, סילוק מקף או פסיק מיותר וכו', והתעלמו לאורך חודשים ארוכים מן הבעיות האמיתיות. ברור שערך כזה, במצבו זה, לא היה הופך לעולם למומלץ, אבל למראית עין, לפי הפאראמטרים שלך, הוא "תמיד איכותי יותר מכל ערך שאינו מחונן בתכונות אלו, באופן מדורג".שלומית קדם - שיחה 21:25, 23 במאי 2008 (IDT)[תגובה]

וודאי שהיו, יש וגם יהיו, ולכן הוספתי גם את התנאי של כמות מינימלית של עריכות אחרים. אבל, וזה אבל גדול, מושא המחקר אינו מציאת ערכים העונים על דרישות הסף שאינם איכותיים אלא נסיון לבנות רובוט או אוטומטון שייתן אינדיקציה מסוימת -- ברמת דיוק טובה מספיק -- לערכים איכותיים יותר מול ערכים איכותיים פחות -- הכל בממוצע ו"בדרך כלל." את מוזמנת לעיין בעמודים כמו רשימת הגרסאות הנערכות ביותר ולהשוות את איכות המצאי שם לערכים ארוכים העונים על הדרישות הנוספות, ובייחוד זו של כותב מוביל אחד. לא נראה לי שהמימרה לגבי כמה טבחים המקדיחים את התבשיל אינה נכונה לעניין זה. ארתור צווינגלי 13:32, 24 במאי 2008 (IDT)[תגובה]

תגובות להופעה בלונדון וקירשנבאום[עריכת קוד מקור]

לפי מה שאמרו הבנתי שאתי תדבר על הדברים לקראת סוף התוכנית (בטח עשרה ל 8), אז הנה כולם יודעים, ואחרי זה יהיה אפשר לפתוח פה את הדיון. eman • שיחה • ♥ 19:03, 21 במאי 2008 (IDT)[תגובה]

בקשתי הצנועה כמי שלא נמצא בארץ הקודש היא שבטרם יתחילו כאן הויכוחים הנזעמים בערבות השידור, יגלה אחד הצופים אדיבות ויביא כאן את עיקרי הדברים. בתודה, אורי • שיחה 19:17, 21 במאי 2008 (IDT)[תגובה]

התכנית משודרת גם במרשתת. כאן. יוסאריאן • שיחה 19:19, 21 במאי 2008 (IDT)[תגובה]

תודה! אשתדל לראות. אורי • שיחה 19:21, 21 במאי 2008 (IDT)[תגובה]

נהניתי לראות את הופעתה של אתי, שהייתה עניינית וצנועה (אני רגיל לאנשים שטופחים על חזם ואומרים "אני תותח", ולכן גישתה של אתי, שאמרה שמחקרה הוא רק תחילת הדרך, קסמה לי מאוד). אם מישהו טרם שמע על ויקיפדיה, הערב הוא קיבל הזדמנות נוספת. דוד שי - שיחה 22:36, 21 במאי 2008 (IDT)[תגובה]

גרסאות מאושרות[עריכת קוד מקור]

אם כבר באמינות עסקינן, כאן המקום לציין כי הוויקיפדיה הגרמנית התחילה להפעיל הרחבה שמאפשר אישור גרסאות על ידי משתמשים שקיבלו הרשאה לעשות זאת. למיטב ידיעתי, כרגע יש כ-2000 משתמשים כאלו, ואושרו כ-200 אלף גרסאות מתוך כ-760 אלף ערכים. אילו הייתי מבין גרמנית, הייתי יכול לספר לכם יותר. אולי הראל יכול לקפוץ לוויקיפדיה הגרמנית, לנסות את התוכנה, ולחזור עם המלצות :-) ‏Yonidebest Ω Talk‏ 02:57, 22 במאי 2008 (IDT)[תגובה]

משתמש:Harel/גרסאות מסומנות דב ט. - שיחה 03:00, 22 במאי 2008 (IDT)[תגובה]

מסתבר שהוא חושב כמוני, רק מהר יותר :-) ‏Yonidebest Ω Talk‏ 03:08, 22 במאי 2008 (IDT)[תגובה]

מעט בוז בריא[עריכת קוד מקור]

מבלי להכנס לגופו של עניין, וגם לשאלות הנוגעות לערכים המומלצים, למנגנון בחירתם, להומו האביליס וכיוצא בזה, שמתי לב למידה בריאה של בוז המופיעה בדברי רבים מן הכותבים כאן כלפי מדעי החברה. אמנם, עד כמה שינסו לא יגיעו להשתלחותו של אחד האזרחים כאן בשיחה: חובש רחוב, שעל פיו "לפי מה שאני למדתי "מדע המדינה" הוא לא מדע. זה כינוי נחמד למה שאומרים בלשון מכובסת "מדעי החברה". ובלשון הלא מכובסת שלי (בלבד) - ערמות של מילים בלתי מבוססות, הנחת כללים אוניברסלים על סמך דעות קדומות, הסתכלות חלקית (ומוטעה) על מערכות מורכבות, ושימוש במשלים דביליים", אבל אין ספק שמתקרבים לכך. הדברים הגיעו לכדי כך שבשיחה על הומו האביליס מרגיש אורי רצון להצטדק כלפי "כל מי ששולל את עצם הדיסציפלינה". ובכן, "הדיסציפלינה" מבוססת על אלפי שנים של הגות אנושית, על פעולתם של כמה מהמוחות המבריקים ביותר, ועל שיטות מדעיות של ניסוי וטעייה. אני איני שולל את התקפות של מדע המתימטיקה או הפיסיקה. להיפך. בעת שאני מקליד הודעה זו אני מפגין אמון מוחלט בהם, המתבטא בכך שאני מאמין שהמנגנון המורכב המבוסס על חוקי המתימטיקה והפיסיקה יביא לידי כך שהאותיות שאני מקיש במקלדתי אכן יגיעו למסך. באופן דומה, כל מי שמקיים אינטראקציה חברתית (מעבר לבסיסית ביותר) במדינה מודרנית, מביע אמון מלא בסוציולוגיה, במדע המדינה וכיוצא בזה. האבסורד הוא שגם עצם הדיון בתקפות של המחקר (וממנו של מדעי החברה בכלל) התייחס למונחים השאובים ישירות מהסוציולוגיה וממדעי החברה. הכלל הגדול הנקוט בידי הוא "אם אתה לא מבין במשהו, אל תביע עמדה". אני מציע למשתתפים בדיון להפגין מעט ענווה (פרט לאלו שאינם מסוגלים לכך מטבעם. גם זו, פחות או יותר, שאלה של מדעי החברה). בינינו פועלים לא מעט אנשים ראויים, ואלו שהגיעו לכאן מתחום מדעי החברה (והשמות ידועים), הם בין התורמים החיוביים ביותר כאן. אין סיבה שפעם אחר פעם יוטל ספק בדיסציפלינה שעליה הם מבססים את חייהם המקצועיים. ניתן, עם זאת, להביע כל מידה של בוז כלפי מקצוע המשפטים. בניגוד לדיסציפלינות אחרות במדעי החברה, למקצוע זה יש יכולת מכאיבה להוכיח את הנחות הבסיס שלו בצורה הישירה ביותר, ואינו זקוק להגנה מיוחדת. אלמוג*הצטרפו למיזם המדינות* 07:01, 22 במאי 2008 (IDT)[תגובה]

סימנם של התורמים אינו רלוונטי. ציונו החוזר משרה תחושה שמא עימות עם כותב חיובי מחשיד את הצד השני בשליליות אינהרנטית.

בדבר אחד לפחות, ויקיפדיה היא מודל מצויין לעולם כפי שהוא צריך להיות: מי שמתנשא, משתמש בטרמינולוגיה מעורפלת, מסתתר מאחורי מומחים אחרים ומסרב לענות לשאלות ממוקדות, אינו יכול להחשב למומחה. המומחיות אינה מצדיקה "כזה ראה וקדש". מומחה צריך להיות מסוגל לנסח מחדש, להסביר, לשכנע, למקד את הדיון, ולהביא ראיות לדבריו. (וראשון לכל: לדעת במה אינו מומחה).

את הטענה שמי שחי במדינה מביע בהכרח אמון במדעי המדינה קשה לקבל, כפי שמי שחי במהלך ההיסטוריה אינו בהכרח מביע אמון בהיסטוריונים, ומי שמצונן אינו בהכרח מביע אמון ברופאים משום סוג (והרי תמיד יש יותר מאחד). אבל זה לא רלוונטי. לא התכנסנו כאן כדי להכריע לגבי תקפותן של דיסציפלינות אקדמיות. מסקנה: כדי לקדם דיונים קונקרטיים, כדאי להתעלם מן ההיבט הזה שלהם.

ויקיפדיה אינה נכתבת על-ידי מומחים הראויים לציטוט (היינו, כאלו שהיית מביא את דבריהם בערך כראיה לנכונותן של טענות הנובעות מהם). לכן כל פעולה ויקיפדית חשופה לביקורת עמיתים. לכן הבאת דבריו של מומחה בר-ציטוט אינה סוף פסוק. לכן יש להצדיק את עצם הבאת הציטוט (מדוע הוא רלוונטי); ויש להצדיק את הטענה שהציטוט מוכיח מה שהוא כביכול מוכיח. עוזי ו. - שיחה 13:12, 22 במאי 2008 (IDT)[תגובה]

מהו כותב חיובי? כותב הכותב לשם שמיים. לא לקידום אידיאולוגיה, לא לקידום עצמי, לא על מנת להאיר את עיני הקוראים באמת האחת שאין בלתה, לא על מנת למכור את מרכולתו מכל סוג שהוא. ויכוח בין שני כותבים חיוביים כמוהו כפעולת כפל, תמיד יהא חיובי. וכך גם ויכוח בין תורם חיובי ותורם שאינו חיובי. מכל מקום, אין ספק שיש להשתמש בטרמינולוגיה ברורה ככל האפשר, והבאת דברי מומחה אינה סוף פסוק. התנשאות והתחמקות אינם ראויים, ואחת היא מיהו המתנשא והמתחמק. אבל כל ויכוח ויקיפדי צריך להתנהל מתוך מידה ראויה של כבוד למקום ממנו מגיע הצד השני. כשם שלי אין ספק שאתה, עוזי, המומחה לעניין קוהומולוגיית צ'ך, ושקוהומולוגיה זו, תהא אשר תהא, שמעולם לא אתקרב אפילו להבינה, אומרת משהו מסויים על העולם, ומאחוריה יש שיטה וסדר נכונים שמהווים בסיס לשיטה מדעית, המבהירה לאדם משהו מאוד בסיסי לגבי עולמו. כך על כל המתדיינים בעניין הקשור במדעי החברה להניח לגבי הדיסציפלינות השונות במדעי החברה. לא יותר, אך גם לא פחות. אגב הטענה לא הייתה שעצם החיים במדינה מחייבים אמונה בתקפות של מדעי החברה, אלא שפעולות של אינטראקציה חברתית מסדר גודל מסויים של מורכבות מפנימות מושגי בסיס במדעי החברה ופועלות על פיהן. אלמוג*הצטרפו למיזם המדינות* 13:25, 22 במאי 2008 (IDT)[תגובה]

לגבי קוהומולגית צ'ך, בצורה מאוד גסה הייתי מסביר שהיא עונה על השאלה הבאה: נניח שיש לך תמונה, ומישהו בא ושובר אותה להרבה חלקים. קוהומולגית צ'ך באה למדוד - עד כמה ניתן להדביק את החלקים האלה בחזרה לתמונה שלמה. (וסליחה על ההארה הלא קשורה). לירן (שיחה,תרומות) 18:46, 22 במאי 2008 (IDT)[תגובה]

בואו נעשה סדר[עריכת קוד מקור]

אתי, עד עכשיו קראנו כל מיני פרטים חסרי הקשר וסדר בעניין המחקר. זה גורם לאי הבנות ולתחושה לא נעימה בדיון הזה. המחקר נשמע לי בנושא מאוד מעניין, אבל אני חושב שחסר לנו היסוד, ואשמח אם תוכלי להשלים את הפרטים הבסיסיים:

מה שאלת המחקר? מה ניסית לחקור?
מה המתודה?
איזה תוצר רצית לקבל, ואיזה תוצר קיבלת? מה המסקנות?
ומה התכניות להמשך המחקר?

תודה, עופר קדם - שיחה 11:53, 22 במאי 2008 (IDT)[תגובה]

בואו נפסיק לדון בנושא[עריכת קוד מקור]

הדיון במזנון על מחקרה של אתי חרג מכל פרופורציה. באה חוקרת וכתבה מחקר שאני מעיז לשער שאיש כאן לא קרא. רוב מה שאנו יודעים עליו מבוסס על כתבה עיתונאית מצומצמת שהטעתה אותנו לא מעט, ראיון בן 5 דקות בטלביזיה אתמול, וכמה תגובות של אתי כאן. בתמורה היא מקבלת הצעות לשיפור, רשימות קריאה, יחס ביקורתי על מה שנדמה לנו שהיא אומרת ובקשות לתקצר את העבודה שהשקיעה משך שנים ועשרות או מאות עמודים בכמה פסקאות, כאילו אנו איזו ועדת אישור תזה חסרת סבלנות.

רבותי, כל הדיון הזה מקומו לא כאן, ואם אתי מוצאת אותו מפרה ומועיל לה, שימשיכו המתעניינים לקיים אותו בדף שיחתה. אני בטוח שכולנו נשמח לשמוע מעט יותר על המחקר מפיה שלה ואשמח לראות אם היא, למשל, תכתוב טור לטילדה, תשלח אבסטראקט למי שירצה ב PDF במייל, תכתוב משהו בדף המשתמש שלה או תפנה אותנו למאמר שלה שפתוח לציבור הרחב. ואם לא תעשה זאת, ותשמור את מסקנותיה לפרסומים המדעיים המקובלים הדרושים לה לשם התקדמותה המקצועית - זה מובן לגמרי ונמתין לקרוא אותם לכשיתפרסמו.

לאתי: אם את מוצאת את הדין הזה מועיל - יופי. אנא המשיכי אותו באמצעים אחרים או בדף שיחתך (ואני יודע שלא את התחלת אותו) ואם לא כך הוא - אל תרגישי מחוייבת לענות, להתווכח או להצדיק. נחכה בסבלנות למאמר או לספר. ושיהיה בהצלחה.

קיצורו של דבר, לא מדובר על דיון כללי, לא על מדיניות ולא על שום דבר אחר שקשור למשנון. מדובר במידע מעניין על מחקר אקדמאי אודות ויקיפדיה וכעת יש לסיים את הדיון הזה. בברכה, ובהצלחה לאתי, אורי • שיחה 16:29, 22 במאי 2008 (IDT)[תגובה]

כיוון שראיתי שיש חוסר בסיסי במידע לגבי המחקר הזה (כמו שכתבה אתי מספר פעמים), ביקשתי לקבל פרטים באופן מסודר. הבקשה שלי לא גדולה, ולא מסובכת. הנקודה החשובה ביותר בשאלה שלי היא זו - "מהי שאלת המחקר?" תשובה לשאלה הזו כבר תסביר הרבה, כי כרגע אפילו זה לא ברור.

אתי ביצעה מחקר על המערכת הזו, שמתבססת על כמות העבודה האדירה שאנחנו השקענו בה. היא מצאה את הזמן לספר לעיתון ולטלוויזיה על ממצאיה - אני חושב שזה יהיה נחמד אם תספר גם לנו, כדי שלא נתעה באפלה בעניין, ניזונים מעיוותים עיתונאיים. עופר קדם - שיחה 16:41, 22 במאי 2008 (IDT)[תגובה]

סבבה, דיון מעניין. לא כאן מקומו. מישהו יכול להסביר לי למה שאני לא אעביר אותו לכיכר העיר? נינצ'ה - שיחה - פתרו את החידה, אם תוכלו. 18:59, 22 במאי 2008 (IDT)[תגובה]

אתה צודק. יש רק בעיה אחת. במזנון הדיון מתנהל על סנדוויץ' וכוס קפה. בכיכר העיר, באופן מסורתי, מוציאים להורג בתלייה, בסקילה, בהצלפה בשוט, או בגיליוטינה. זיגמונד פרויד - שיחה 19:13, 22 במאי 2008 (IDT)[תגובה]

עופר: אתה צודק - מדובר במחקר מעניין, ואולי יש לנו אפילו את "הזכות" לבקש לדעת פרטים נוספים.ץ אני, בכל אופן, אשמח. אבל הדיון לעיל חרג פי כמה מבקשה צנועה זו, ושנית, כפי שכתבתי, לדעתי מקומו של דיון זה איננו כאן, לפחות מששככה משהו הסערה בכוס התה שהתחוללה אתמול ושלשום. בברכה, אורי • שיחה 22:36, 22 במאי 2008 (IDT)[תגובה]