ויקיפדיה:סקר קוראים/אוקטובר 2009/ניתוח סטטיסטי

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בדף זה מוצג ניתוח סטטיסטי עתיר-גרפים של סקר הקוראים שנערך באוקטובר 2009. הניתוח כולו תיאורי, ואינו כולל בדיקת השערות או נסיונות לאמידת פרמטרים.

רקע כללי[עריכת קוד מקור]

התפלגות מספר התשובות למשיב (מתוך 23 שאלות הסקר)

הסקר נמשך שבוע, והשתתפו בו 3394 משיבים. כ-90% מהם ענו כמעט על כל השאלות. יש רק כמה עשרות של רשומות ריקות או כמעט ריקות. התוצאות עקביות ונראה שהמשיבים התייחסו לסקר ברצינות. כל האחוזים בהמשך הם מתוך המשיבים על אותה שאלה.

הערות רבות מניתוח הסקר הקודם (ויקיפדיה:סקר קוראים/יולי 2007/ניתוח סטטיסטי) נכונות גם הפעם, ולא חזרתי עליהן.

עקב תקלה טכנית, התשובות לשאלה האחרונה (על מידת ההיכרות עם וויקיפדיה) אבדו, ולכן התוצאות מתייחסות לכלל המשיבים; אין אפשרות לבודד את המשיבים שאינם משתמשים רשומים, כפי שרצוי היה לעשות.

התשובות לשאלות הסקר[עריכת קוד מקור]

שביעות רצון מהתוכן[עריכת קוד מקור]

Hewiki survey 2009 1.PNG
Hewiki survey 2009 24.PNG

1. באיזו מידה לדעתכם ויקיפדיה העברית אמינה?

כ-75% מייחסים לוויקיפדיה אמינות גבוהה או גבוהה מאד, ורק 5% אמינות נמוכה או נמוכה מאד. 41 משיבים (1.2%) חושבים, משום מה, שזה לא רלוונטי. גיל המשיב כמעט אינו משפיע על התשובות לשאלה זו.

Hewiki survey 2009 2.PNG

2. מה דעתכם על רמת העברית בוויקיפדיה העברית באופן כללי?

לכ-40% מהמשיבים הרמה גבוהה מדי (7%) או גבוהה. ל-54% היא בסדר גמור, ולעוד 5% נמוכה מדי.

Hewiki survey 2009 3.PNG

3. בעת חיפוש בוויקיפדיה, האם נמצא מענה למבוקשכם?

72% מוצאים מענה כמעט תמיד או בדרך כלל; עוד 22% לפעמים, ורק 4.8% בדרך כלל לא או גרוע מזה.

Hewiki survey 2009 4.PNG

4. האם קרה שהתקשיתם במציאת ערך על מושג בעברית, בשל ספק לגבי איות המלה?

12% אומרים שכן.

Hewiki survey 2009 5.PNG

5. האם קרה שהתקשיתם במציאת ערך על אדם או מקום שמקור שמו לועזי, בשל ספק לגבי איות המלה?

19% אומרים שכן.

Hewiki survey 2009 6.PNG
Hewiki survey 2009 25.PNG

6. באיזו מידה לדעתכם יכולה ויקיפדיה העברית להחליף את האנציקלופדיות המודפסות?

69% חושבים שבמידה רבה או אף רבה מאד, 20% במידה בינונית, ו-11% במידה מועטה או מועטה מאד. גם כאן הגיל כמעט אינו משפיע על התשובות.

Hewiki survey 2009 7.PNG

7. אם יוחלט להדפיס חלק מערכי ויקיפדיה הנבחרים, ולשווק את הספר במחירי עלות, האם תשקלו לרכוש ספר זה לשימוש עצמי או כמתנה?

בערך 35% כן או אולי כן, בערך 65% כנראה שלא.

Hewiki survey 2009 8.PNG

8. האם ישנם נושאים שלדעתכם אינם מכוסים ברמה טובה בוויקיפדיה העברית?

לפי 37% מהמשיבים, רק נושאים בודדים חסרים.

שביעות רצון מכלי הניווט[עריכת קוד מקור]

Hewiki survey 2009 9.PNG

9. באיזו מידה משמשים אתכם הפורטלים הקיימים בוויקיפדיה העברית?

בפורטלים משתמשים במידה רבה או בינונית רוב המשיבים.

Hewiki survey 2009 10.PNG

10. באיזו מידה משמשות אתכם הקטגוריות הקיימות בוויקיפדיה העברית?

ובקטגוריות - שני שלישים.

Hewiki survey 2009 31.png

השוואה בין מידת השימוש בפורטלים (1-במידה רבה מאד, עד 6-"מה זה פורטלים?") למידת השימוש בקטגוריות (1-במידה רבה מאד, עד 6-"מהן קטגוריות?").

Hewiki survey 2009 32.png

השוואה בין הקושי באיתור ערכים (התשובה לשאלה "האם מצאת מענה למבוקשך" בסולם 1-6, פחות סכום התשובות לשאלות על קושי באיות, בסולם 1-3; ככל שהמספר גבוה יותר, מוצאים פחות ונתקלים ביותר קושי), לבין השימוש בפורטלים וקטגוריות (סכום התשובות לגבי מידת השימוש, בסולם 1-6; ככל שהמספר גבוה יותר, השימוש מועט יותר). הנקודות ברבע השמאלי-תחתון מייצגות את אלו שמוצאים את מבוקשם ומשתמשים בקטגוריות. הנקודות ברבע השמאלי-עליון מייצגות את אלו שמוצאים את מבוקשם ואינם משתמשים בקטגוריות, וכן הלאה.

Hewiki survey 2009 11.PNG

11. האם ידוע לכם כיצד ניתן לעבור מערך בשפה העברית לאותו ערך בשפה זרה?

שלושה רבעים יודעים איך לעבור, ורבע - לא.

Hewiki survey 2009 12.PNG

12. האם ידוע לכם מה מסמלים צבעי הקישורים (קישור כחול לעומת קישור אדום)?

כ-28% מהקוראים אינם יודעים מה פשר הצבעים המוזרים האלה.

Hewiki survey 2009 13.PNG

13. באיזו מידה משמש אתכם העמוד הראשי כשער כניסה לאתר?

כ-60% נכנסים לאתר במידה בינונית או רבה דרך העמוד הראשי.

נכונות להפוך לכותב/ת[עריכת קוד מקור]

Hewiki survey 2009 14.PNG

14. האם, למיטב ידיעתכם, יש לכם כקוראים אפשרות לתקן ערכים בוויקיפדיה העברית?

30% חושבים שלא.

Hewiki survey 2009 15.PNG
Hewiki survey 2009 26.png

15. האם ידוע לכם כיצד ניתן להעביר משוב על ערכים?

60% לא יודעים. אולי לא קישרו "שיחה" עם משוב.

בגרף השני מוצגת התפלגות מספר התשובות הנכונות לשאלות ההיכרות עם ויקיפדיה (שאלות 11, 12, 14, 15), על-פי גיל המשיב. כאן יש הבדלים ניכרים.

Hewiki survey 2009 16.PNG

16. האם נתקלתם אי פעם בטעות עובדתית בוויקיפדיה העברית?

36% נתקלו בטעויות עובדתיות. זה לא מפריע ל-60% מהם לייחס לוויקיפדיה אמינות "גבוהה" או "גבוהה מאד".

Hewiki survey 2009 17.PNG

17. האם אי פעם תיקנתם טעות עובדתית בוויקיפדיה?

רק 29% השיבו על השאלה הזו. 14% תיקנו, 15% לא תיקנו, 2% העירו בדף השיחה.

Hewiki survey 2009 18.PNG
Hewiki survey 2009 19.PNG
Hewiki survey 2009 33.png

18. האם ברצונכם לכתוב בוויקיפדיה העברית? אם לא, מדוע?

37% רוצים לכתוב, 63% לא רוצים. בין אלו שלא רוצים, הרוב מציינים העדר ידע מקצועי או מחסור בזמן.

נתונים דמוגרפיים[עריכת קוד מקור]

Hewiki survey 2009 20.PNG

19. גיל.

כ-58% מהמשיבים מתחת גיל 21. כ-8% מעל גיל 40.

Hewiki survey 2009 21.PNG

20. השכלה.

25% תלמידי תיכון, 30% בעלי השכלה אקדמית.

Hewiki survey 2009 22.PNG
Hewiki survey 2009 27.png

21. מגדר.

68% גברים, השאר נשים. בין הנשים, 25% רוצות לכתוב בוויקיפדיה; בין הגברים - 44%.

Hewiki survey 2009 23.PNG

22. שפת אם

כ-89% כותבים ששפת אמם עברית. הגרף מציג את התפלגות שאר ה-11%.

ניתוח צירים[עריכת קוד מקור]

Hewiki survey 2009 29.png

אם מוותרים על שתי שאלות ההמשך ("אם מצאת טעות - האם תיקנת", "אם אינך רוצה להפוך לכותב, מדוע"), נשארים בדיוק 2400 משיבים שענו על כל השאלות, והמשך הניתוח נוגע להם בלבד. את המשיבים האלה אפשר לייצג באמצעות 2400 נקודות במרחב בן 21-ממדים, המתאימים לשאלות השונות. ניתוח צירים הוא שיטה סטטיסטית המאפשרת למצוא את הכיוונים שבהם ענן הנקודות הזה מסודר, ולהטיל אותו על (נאמר) שני צירים ראשיים הנושאים את מירב האינפורמציה. כך, על-ידי סיבוב המרחב באופן הנכון, אפשר לצפות בתופעות שטבעו הרב-ממדי של המדגם מקשה לראות באופנים אחרים.

באופן עקרוני, מכיוון שיש 21 שאלות שונות, יש להציג 21 מספרים נפרדים לכל משיב. ניתוח הצירים מאפשר לקבל יותר אינפורמציה עבור צירים מסויימים, שהשיטה בוחרת בקפידה, מאשר החלק האחד מ- 21 שמגיע לכל שאלה באופן נאיבי.

Hewiki survey 2009 30.png

במקרה שלנו מחזיק הציר הראשון 15.6% מן האינפורמציה (משקל השווה לזה של 3.3 שאלות), ואילו הציר השני מחזיק בעוד 10% (כשתי שאלות). הטלת 2400 הנקודות על המישור המתאים לשני צירים אלה נותנת (במקרה שלנו) רסס מעוגל ואחיד של נקודות, המדגים עבור כל משיב עד כמה הוא קרוב לממוצע.

השתמשתי בהטלה הזו כדי לענות על השאלה המסקרנת הבאה: האם אפשר לנבא את מינו של המשיב מן התשובות שלו (או שלה) לשאלות הסקר, למעט כמובן שאלת המגדר? הגרף מציג את ההיטלים עבור הגברים (נקודות כחולות) והנשים (נקודות אדומות), לאחר נטרול מרכיב המגדר משני הצירים הראשיים. מתברר שהתשובה חיובית: בין 240 המשיבים הצפוניים ביותר בגרף יש 55% נשים, ובין 240 המשיבים הדרומיים ביותר רק 14% נשים (וזאת לעומת 30% בכלל האוכלוסיה).

באופן אנלוגי לכך, אפשר להטיל גם את 21 השאלות על שני הצירים, ולקבל מעין פירוק של כל שאלה למרכיבים העיקריים שלה; ולהיפך, לקבל תאור של כל ציר בתור צירוף של שאלות. היטל זה נתון באיור שבראש הסעיף, ואפשר לראות בו איך השאלות הקרובות מתקבצות בקבוצות: ההשכלה קרובה לגיל, כל שאלות הידע (יחד עם הרצון לכתוב - והמגדר!) מופיעות יחד, ההתייחסות לקטגוריות ולפורטלים אחידה, וכו'.

בציר הראשון בולטות השאלות על אמינות (0.36), מתן המענה (0.30) והתחומים החסרים (בסימן ההפוך: 0.32-). אולי זה ציר של "שביעות רצון". בציר השני בולטות שאלות הידע והרצון לכתוב, לעומת ההשכלה והגיל. זה עשוי להיות ציר השייכות והתחושה הנינוחה מול האתר. כעת אפשר לנתח כל שאלה, על-פי המרכיבים שיש לה בשני הצירים. למשל, שאלת שפת האם אינה באה כמעט לידי ביטוי באף אחד מן הצירים (מן הסתם מחכה לתורה, לבלוט בציר השלישי).