ויקיפדיה:סקר קוראים/יולי 2007/ניתוח סטטיסטי

מתוך ויקיפדיה, האנציקלופדיה החופשית

בדף זה מוצג ניתוח סטטיסטי עתיר-גרפים של סקר הקוראים שנערך ביוני 2007. הניתוח כולו תיאורי, ואינו כולל בדיקת השערות או נסיונות לאמידת פרמטרים.

בסקר השתתפו 2252 משיבים. למעט מספר זעום של רשומות ריקות או לא אמינות, שנמחקו, ומספר דומה של נתונים שתוקנו (בסעיף #היכרות), רוב התוצאות מתקבלות על הדעת ומצביעות על התייחסות רצינית של המשתתפים. על מרבית השאלות השיבו כמעט כל המשתתפים בסקר (בדרך כלל יותר מ- 2000), למעט שאלות ההמשך (ראו להלן). יוצאת דופן שאלה 9, על שימוש בויקיפדיה לצרכי עבודה.

השאלות ממוספרות לפי סדרן בסקר, אך מובאות בשינויי-סדר קלים, על-פי תחומי הכיסוי שלהן.

התשובות לשאלות הסקר[עריכת קוד מקור]

היכרות[עריכת קוד מקור]

איור 1. כיצד שמעו על ויקיפדיה

1. כיצד נודע לך על ויקיפדיה העברית לראשונה?

בנוסף לתשובות שניתנו בטופס (המופיעות באיור 1 משמאל), רבים השיבו ששמעו על ויקיפדיה בבית הספר או מוויקיפדיה בשפה אחרת. היו גם שחזרו, מילולית, על אפשרות קיימת ("אחר: חיפוש בגוגל"); השאלון לא תוקן על-פי תשובות אלה.

איור 2. משך היכרות

2. מה משך היכרותך עם ויקיפדיה העברית?

התשובה ניתנה ביחידות על-פי בחירת המשיב (D, M או Y); במספר מקרים היה צורך לתקן את התשובות (100Y, 15Y, 13Y, 12Y - כולן הוחלפו ב- 4Y). מן החלוקה באיור 2 ניתן לראות שמרבית המשיבים מכירים את ויקיפדיה (על-פי הערכתם) לפחות שנה.

איור 3. כמה מכרים שמעו על ויקיפדיה

3. להערכתך, איזה חלק ממכריך שמעו על ויקיפדיה העברית?

בהמשך לתשובה לשאלה הקודמת, נראה שהמשיבים מכירים את ויקיפדיה מזה זמן, וחושבים שגם בין מכריהם ויקיפדיה מוכרת במידה רבה.

איור 4. האם השתמשת בויקיפדיות זרות

4. האם השתמשת פעם בוויקיפדיה בשפות זרות?

איור 5. שימוש בוויקיפדיות פרט לעברית

5. האם מידת השימוש שלך בוויקיפדיות בשפות זרות גדולה יותר מאשר בוויקיפדיה העברית?

כשלושה רבעים מן המשיבים השתמשו גם בויקיפדיה בשפות זרות. עם זאת, הרוב הגדול מבין אלה משתמש בוויקיפדיה העברית יותר מאשר בויקיפדיות אחרות; רק 10% מן המשיבים לשאלה 5 (כ- 7.5% מן המשיבים בכלל) משתמשים בויקיפדיות בשפות זרות יותר מאשר בוויקיפדיה העברית.

איור 6. משמעות הצבע בקישורים

18. האם ידוע לך מה מסמל הצבע בקישורים הכחולים והאדומים?

כ- 70% מן המשיבים יודעים מה מסמל הצבע. הממוצע הגאומטרי של זמן ההיכרות עם ויקיפדיה (שאלה 2) של אלו היודעים מה מסמל הצבע הוא 645 ימים, בעוד שממוצע הותק של אלו שאינם יודעים הוא רק 515 ימים; עדיין, די והותר.

איור 7. האם ניתן לתקן?

19. האם, למיטב ידיעתך, יש לקוראים אפשרות לתקן ערכים בוויקיפדיה העברית?

איור 8. האם ניתן לכתוב ערכים חדשים?

20. האם, למיטב ידיעתך, יש לקוראים אפשרות לכתוב ערכים חדשים בוויקיפדיה העברית?

11% מן המשיבים חושבים שלא ניתן לתקן ערכים בויקיפדיה; 12% חושבים שלא ניתן לכתוב ערכים חדשים. המתאם בין שתי השאלות גבוה (0.48), אבל אפשר היה לצפות למתאם גבוה אפילו יותר. כ- 17% מהמשיבים חושבים שלא ניתן לתקן, או שלא ניתן לפתוח ערכים חדשים (ורק 6.4% סבורים שלא ניתן לבצע אף אחת משתי הפעולות). לסיכום שלוש השאלות האחרונות: יש למצוא דרך ליידע את כל הקוראים לגבי המוסכמות הבסיסיות ביותר בוויקיפדיה.

שביעות רצון מהתוכן[עריכת קוד מקור]

איור 9. האם ניתן מענה

6. בעת חיפוש בוויקיפדיה, האם נמצא מענה למבוקשך?

הרוב הגדול של המשיבים מוצא את מבוקשו בוויקיפדיה בדרך כלל, או אפילו "תמיד". פחות מ- 2% "בדרך כלל" אינם מוצאים, או "בכלל לא".

איור 10. שביעות רצון כללית

7. מהי מידת שביעות רצונך מוויקיפדיה העברית?

בשאלה זו, של שביעות רצון כללית, ויקיפדיה זוכה לתמיכה בשיעורים מרשימים: כ- 50% מרוצים, עוד 40% מרוצים מאד, ורק 4% לא מרוצים או "מאד לא מרוצים". בנוסף להתפלגות שביעות הרצון של כלל המשיבים, מוצגת ההתפלגות בקרב אותם משתמשים שאינם כותבים בויקיפדיה כלל (כ-75%, על-פי שאלה 29), וכן בקרב המשיבים בני 30 ומעלה.

איור 11. שימוש לצרכים שונים

8. באיזו מידה משמשת אותך ויקיפדיה העברית לצורך לימודים?

9. באיזו מידה משמשת אותך ויקיפדיה העברית לצורך עבודתך?

10. באיזו מידה משמשת אותך ויקיפדיה העברית לצורך ידע כללי והרחבת אופקים?

בשתי השאלות הראשונות ניתנה, בנוסף לאפשרויות שבאיור 11, גם האפשרות "לא רלוונטי". כ- 200 משיבים בחרו בתשובה זו לשאלה הראשונה, וכ- 500 בחרו בתשובה זו לשאלה השניה (הנתונים באיור אינם כוללים אפשרות זו). ויקיפדיה משמשת, אם כך, במידה רבה או רבה מאד לכל הצרכים, אבל בעיקר להרחבת אופקים וידע כללי. רק ל- 4% מן המשיבים (על שלוש השאלות), רמת השימוש הממוצעת בשלושת התחומים היא מועטה או מועטה מאד.

איור 12. רמת העברית

11. מה דעתך על רמת העברית בוויקיפדיה העברית באופן כללי?

רוב מכריע של המשיבים סבור שרמת העברית "בסדר גמור". כ- 10% סבורים שהרמה נמוכה מדי, ועוד 2.5% סבורים שהרמה קשה מדי.

איור 13. שביעות רצון מתמונות ואיורים

12. מהי מידת שביעות רצונך מן התמונות והאיורים בוויקיפדיה העברית?

רמת שביעות הרצון גבוהה, אבל לא כמו בשאלה 7, המתייחסת לשביעות הרצון באופן כללי. כמעט 15% אינם מרוצים מן התמונות והאיורים.

איור 14. היקף הכיסוי ביחס לאנציקלופדיות אחרות

13. האם לדעתך קיימים בוויקיפדיה העברית ערכים על נושאים שלא קיימים באנציקלופדיות אחרות בשפה העברית?

82% מן המשיבים סבורים שאכן, קיימים בויקיפדיה העברית ערכים על נושאים שאינם קיימים באנציקלופדיות אחרות בשפה זו.

איור 15. שימוש בפורטלים

14. האם השתמשת אי פעם בפורטלים הקיימים בוויקיפדיה העברית?

כ- 40% השתמשו, 60% לא השתמשו. מה זה פורטל?

איור 16. האם ישנם נושאים שאינם מכוסים היטב

15. האם ישנם נושאים שלדעתך אינם מכוסים ברמה טובה בוויקיפדיה העברית?

כ- 20% מהמשיבים ידעו לומר שיש נושאים רבים שאינם מכוסים; כ- 43% סבורים שכך ב"חלק מהנושאים", ו- 37% סבורים שרק ב"נושאים בודדים". בשאלת ההמשך ניתנו דוגמאות רבות, שכדאי יהיה לסקור בנפרד.

שביעות רצון מן הממשק[עריכת קוד מקור]

איור 17. קושי במציאת ערך עקב איות

16. האם קרה שהתקשית במציאת ערך עקב ספק לגבי האיות הנכון?

כ- 40% מן המשיבים התקשו במציאת ערכים עקב ספק לגבי האיות הנכון. איננו יודעים האם מדובר בספק לגבי איות של מלים ומונחים בעברית, או שמות של אנשים ומקומות שמקורם אינו בעברית.

איור 18. מסגרות ניווט וקטגוריות

17. האם מסגרות הניווט והקטגוריות עונות על הצרכים שלך בחיפוש ערכים?

פחות מ- 10% משיבים בשלילה לשאלה זו; בדיעבד, חבל שלא נעשתה הפרדה בין מסגרות ניווט וקטגוריות. באופן כללי ניכר שהמשיבים מרוצים מאפשרויות הניווט שמספקים להם.

נכונות להפוך לכותבים[עריכת קוד מקור]

איור 19. האם נתקלו בשגיאת כתיב

21. האם נתקלת אי פעם בטעות כתיב בוויקיפדיה העברית? אם כן, האם תיקנת טעות זו?

איור 20. האם נתקלו בשגיאה עובדתית

22. האם נתקלת אי פעם בטעות עובדתית בוויקיפדיה העברית? אם כן, האם תיקנת טעות זו?

רוב המשיבים לא נתקלו בשגיאות כתיב, אבל מבין אלו שכן נתקלו בכאלה, 3 מכל 7 מעידים על עצמם שתיקנו אותן. לגבי שגיאות עובדתיות, 73.5% לא קראו מספיק בעיון; מבין האחרים, הרוב מציינים שלא תיקנו - ורק מעטים השתמשו באפשרות להשאיר הודעה בדף השיחה. בשאלה השניה ניתנה גם אפשרות לציין היכן היתה הטעות; הרשימה תוצג בנפרד.

23. האם לדעתך ראוי לאפשר לכל אדם הרוצה בכך לכתוב בוויקיפדיה העברית?

איור 21. האם ראוי לאפשר לכל אדם לכתוב - לפי גיל
איור 22. האם ראוי לאפשר לכל אדם לכתוב - לפי מגדר

בשאלה חשובה זו הדעות חלוקות כמעט באופן אחיד; מרבית המשיבים גם נימקו את עמדתם בקצרה. מתברר שבקרב המשיבים יש תמיכה גדולה יותר בכתיבה חופשית, מאשר בקרב המשיבות. בנוסף, ואולי במפתיע, שעור התמיכה בכתיבה חופשית עולה עם הגיל - למעט בקבוצת הגיל העליונה, שבה חלה ירידה משמעותית ביחס לקבוצה שלפניה (מ-61% ל-40%).

24. האם ברצונך לכתוב בוויקיפדיה העברית?

איור 23. האם ברצונך לכתוב - לפי גיל
איור 24. האם ברצונך לכתוב - לפי מגדר

כ- 43% משיבים בחיוב (איפה הם, כולם?). בחלוקה לפי גיל - שעור המעוניינים לכתוב אחיד בכל הקבוצות, ויורד באופן משמעותי בקבוצה המבוגרת יותר. בקרב הגברים מעל למחצית מעוניינים לכתוב, ובין הנשים - רק 30%.

דמוגרפיה[עריכת קוד מקור]

25. גיל (0-12, 13-18, 18-21, 22-30, 30-50, 50+)

איור 25. גיל
איור 26. גיל - בנים ובנות

כ-40% בגיל חטה"ב והתיכון, וביחד כ- 50% מתחת לגיל 18. קשה לדעת האם זהו הפילוח המדויק של אוכלוסיית הקוראים, או שקוראים אלה נוטים יותר מאחרים להשתתף בסקרים. בין הבוגרים יש רוב לבני 18-30; רק 11.7% מן המשיבים הם בני 30 ומעלה. באיור 26 - התפלגות גיל המשיבים על-פי מינם: ההבדל העיקרי הוא בקבוצות הגיל העליונות, שם מתחזק יתרונם של הגברים.

26. השכלה (יסודית, על-יסודית, תיכונית, אקדמית)

30% בעלי השכלה אקדמית, 40% בעלי השכלה תיכונית - נתונים אלה מתנגשים עם נתוני הגיל; מבין המשיבים בגילאי 13-18 ענו כמחצית שהם בעלי "השכלה תיכונית" - כנראה מתוך בלבול עם "לימודי תיכון". בפעם הבאה צריך לחדד את הנקודה הזו יותר.

איור 27. מגדר

27. מגדר.

שניים לכל אחת.

איור 28. שפת אם

28. שפת אם.

רוב מכריע לדוברי העברית; אחוזים בודדים דוברי רוסית, אנגלית או ערבית.

איור 29. פעילות בוויקיפדיה

29. פעילות בוויקיפדיה

הסקר יועד באופן מוצהר לקוראים בלבד. בכל זאת, בין המשיבים כ- 12% משתמשים רשומים (מן הסתם בעלי רמת פעילות נמוכה יחסית), וכ- 12% כותבים מפעם-לפעם כאלמוניים, ואינם רשומים.

מקדם המתאם הוא מדד לקשר ליניארי בין משתנים (כמו זוג שאלות), שערכו תמיד בין 1 ל- 1-, והוא קרוב לאפס אם אין קשר בין השאלות. המקדמים הגבוהים ביותר מנויים להלן, לפי סדר יורד.

  1. בין הגיל להשכלה יש מתאם צפוי של 0.73.
  2. בין הנטיה לתקן שגיאות כתיב והנטיה לתקן שגיאות עובדתיות יש מתאם של 0.69.
  3. בין רמת השימוש בויקיפדיה לצרכי עבודה ורמת השימוש לצרכי לימודים יש מתאם של 0.57.
  4. יש מתאם גבוה בין רמת הפעילות בויקיפדיה, לבין הנטיה לתקן שגיאות עובדתיות (0.58) ושגיאות כתיב (0.53).
  5. המתאם בין קבלת מענה (שאלה 6) לשביעות הרצון (שאלה 7) הוא 0.52.
  6. יש מתאם של 0.48 (שהוזכר לעיל) בין ההערכה שניתן לכתוב בויקיפדיה להערכה שניתן לתקן בה שגיאות.
  7. יש מתאם של 0.43 בין רמת הפעילות (שאלה 29) למוכנות להפוך לכותב (שאלה 24).
  8. יש מתאם של 0.41 בין היקף הנושאים שאינם מכוסים (שאלה 15) לשביעות הרצון (שאלה 7).

ישנם עוד כמה עשרות מתאמים שגודלם 0.2 או יותר, ועוד רבים (מובהקים) אחרים.

ניתוח צירים[עריכת קוד מקור]

ניתוח צירים

את 2500 המשיבים לסקר אפשר לייצג כ- 2500 נקודות במרחב בן 29-ממדים, המתאימים לשאלות השונות. ניתוח צירים הוא שיטה סטטיסטית המאפשרת למצוא את הכיוונים שבהם ענן הנקודות הזה מסודר, כאשר מידת האינפורמציה בכל ציר היא הגדולה ביותר האפשרית. כך, על-ידי סיבוב המרחב באופן הנכון, אפשר לצפות בתופעות שטבעו הרב-ממדי של המדגם מקשה לראות באופנים אחרים.

באופן עקרוני, מכיוון שיש 29 שאלות שונות, יש להציג 29 מספרים נפרדים לכל משיב. ניתוח הצירים מראה כמה אינפורמציה ניתן לקבל על-ידי בחינת מספר צירים קטן, ומאפשר לקבל יותר אינפורמציה עבור צירים מסויימים, שהשיטה בוחרת בקפידה, מאשר החלק האחד מ- 29 שמגיע לכל שאלה באופן נאיבי.

במקרה שלנו מחזיק הציר הראשון 12% מן האינפורמציה (משקל השווה לזה של 3.5 שאלות), ואילו הציר השני מחזיק בעוד 10% (כשלוש שאלות). הטלת 2500 הנקודות על המישור המתאים לשני צירים אלה נותנת (במקרה שלנו) רסס מעוגל ואחיד של נקודות, שבו ניתן להעזר לאיתור משיבים חריגים (כך, לדוגמא, "נלכד" משיב אחד שהתשובות שלו היו קיצוניות באופן מופרז; כאישור לפסילתו, התברר שהתשובות המילוליות שלו כללו מספר קללות).

באופן אנלוגי לכך, אפשר להטיל גם את 29 השאלות על שני הצירים, ולקבל מעין פירוק של כל שאלה למרכיבים העיקריים שלה; ולהיפך, לקבל תאור של כל ציר בתור צירוף של שאלות. היטל זה נתון באיור שבראש הסעיף, ואפשר למצוא בו את השאלות החריגות (רמת הפעילות, הדעה בעניין נושאים שאינם מכוסים, והשימוש לצרכי ידע כללי), וגם לאתר קבוצות של שאלות דומות, שאינן מוסיפות מידע רב זו על-פני זו.

הציר הראשון מורכב בעיקר מהתחושה שויקיפדיה מספקת מענה לשאלות (0.32), משביעות הרצון (0.35), משעור התחומים שאינם מכוסים (0.34-), מן השימוש לצרכי לימודים (0.28) ועבודה (0.27) ומן הנטיה לתקן שגיאות עובדתיות (0.24-) ושגיאות כתיב (0.23-). זהו, באופן גס, ציר של "בעד ונגד". הציר השני מורכב בעיקר מנטיה להצטרף ככותב (0.31), שימוש לצרכי ידע כללי (0.29), שימוש בפורטלים (0.24), הכרת ההבדל בין צבעי הקישורים (0.25) הנטיה לתקן שגיאות כתיב (0.26), ורמת הפעילות (0.33). נראה שזהו ציר של "היכרות עם ויקיפדיה". כעת אפשר לנתח כל שאלה, על-פי המרכיבים שיש לה בשני הצירים. למשל, לשאלת המגדר (בה הכיוון החיובי מצביע מגברים לנשים) יש מרכיב 0.11- בציר הראשון (כלומר: גברים יותר 'בעד ויקיפדיה' מנשים), ו- 0.20 בציר השני (כלומר: נשים מכירות את ויקיפדיה פחות מגברים).