שיחת ויקיפדיה:נתונים סטטיסטיים/יומית

תוכן הדף אינו נתמך בשפות אחרות.
מתוך ויקיפדיה, האנציקלופדיה החופשית

מדוע לא לאחד את מיוחד:/חיפוש עם מיוחד:/Search? יחסיות האמת • י"א בשבט ה'תשס"ח 13:36:34

אלו הבקשות כפי שהן, יכול להיות שאפשר לנתח (או לנחש) על פי ההבדלים מאיפה מגיעים חיפושים שונים (ייתכן למשל שרק קישור חיצוני מפנה לsearch ומיוחד:חיפוש מופיע רק בקישורים פנימיים - צריך לבדוק...) ‏ costello • ‏ שיחה 21:27, 21 בינואר 2008 (IST)[תגובה]

צריך לסדר- הרשימה עולה על התיבות מימין (כך בפיירפוקס).--שומבלע שיחה 19:41, 21 בינואר 2008 (IST)[תגובה]

תוקן, תודה. ‏ costello • ‏ שיחה 21:27, 21 בינואר 2008 (IST)[תגובה]

נתונים סטטיסטיים כלליים?[עריכת קוד מקור]

אני משער שמאחוריי הדף הזה קיים בסיס נתונים ובו מס' הכניסות לכל הערכים אליהם נכנסו(ולא רק ל200 העליונים) האם אפשר להעלות אותו לדף בוויקיפדיה? או אם מסיבות טכניות זה בלתי אפשרי (כי מאות אלפי שורות ייקחו זמן ארוך מדי לטעינה בדפדפן נניח) אז לפרסם את זה בגליון נתונים כלשהוא שיהיה ניתן להורדה? תודה, --איש המרק 03:31, 2 בפברואר 2008 (IST)[תגובה]

ולי חסרים נתונים שבועיים, נדמה לי שכבר אפשר ליצור אותם, לא? יחסיות האמת • כ"ו בשבט ה'תשס"ח 03:47:53

כדי להכניס דברים לפרופורציה של גדלים - בסיס הנתונים שמכיל את כל המידע הזמין לתקופה של מעט יותר משבועיים (מאז ה-14 בינואר ועד היום) שוקל כרגע 3 ג'יגה. אני כרגע בוחן את הדרך הנכונה לשמור עליו קטן יחסית, ועם זאת לא לאבד מידע בעל ערך. ביום ממוצע מדובר על בין 150,000 ל-200,000 שמות דפים שונים שנצפים, להשוואה - מספר השורות המקסימלי ברב תוכנות גליון הנתונים (אקסל, gnumeric, אופן אופיס calc, וכו') הוא כ-65,000. אם נעבור גם את המכשול הזה - תרצה בוודאי שנתונים יהיו מעודכנים יחסית - להעלות קובץ נתונים (גם בסדר גודל של מאות MB בודדות) לוקח מספר שעות על מלוא רוחב הפס של חיבור ביתי - ודרוש שרת שיוכל לקבל את המידע ולעמוד בקצבים. כרגע, זה לא ממש ריאלי. עם זאת אני אשמח לספק חיתוכים ורשימות נוספות - ראה דיון בשיחת ויקיפדיה:נתונים סטטיסטיים#סטטיסטיקות צפייה - סיעור מוחות. לגבי נתונים שבועיים - אכן ניתן לייצר אותם - לא חשבתי על שבוע כעל פרק זמן מעניין לניתוח, אני אטפל בנושא מיד אחרי הנתונים ל(חצי) חודש ינואר. ‏ costello • ‏ שיחה 17:59, 2 בפברואר 2008 (IST)[תגובה]

אני לא כל כך מבין למה זה כזה גדול, אני מדבר על דף אקסל פשוט, עבור כל דף דרושה עמודה של שם ועמודה של מספר, המספרים הם ברובם (כרגע) קטנים מ65000, והשמות ארוכים מעט יותר, נניח 20 תווים, עבור כל תו 16 ביט (או 32, זה לא משנה ממש). יוצא שעבור ייצוג שם בודד אנחנו צריכים 21*16, וסה"כ 21*16*65000 ביט כלומר, כלומר עבור 65000 הערכים הנקראים ביותר נצטרך כ3 מגה (ברור לי שבפועל זה יתפוס יותר, אבל באיזה סדר גודל?) מכיוון שמספר הדפים ע"פ עמודי הסטטיסטיקה הוא כרגע 263,939, מדובר בסך הכל על 15 מגה (ראיתי שיש גם שמות שמתחילים ב"מיוחד" ואלה למעשה אין סופיים, אבל אפשר לסנן אותם). והאמת שהעדכון לא כל כך חשוב לי, אם הגליונות יועלו פעם בחודש זה בסדר גמור, המטרה היא שהכותבים פה יידעו כמה אנשים קוראים את הערכים שלהם, אם מישהו כתב ערך, והוא רואה שקראו אותו 1000 איש (אפילו בתקופה של כמה חודשים), אני חושב שזה נותן מוטיבציה להמשיך לכתוב. בברכה, --איש המרק 23:53, 2 בפברואר 2008 (IST)[תגובה]

הורדת עמודת החיפושים[עריכת קוד מקור]

נראית לי מיותרת, מעבר לכך שהנתונים בה מספרית לא נראים לי אמינים, הרי שאחרי תקופה ממושכת כבר הבנו את הפואנטה, גולשים מחפשים פה פורנו בכל מיני וריאציות. אין סיבה שכל העמוד הזה יהיה מלא בנגזרות החיפוש השונות שלו, אין פה תרומה לידע או למיזם. tomtom - שיחה 09:40, 12 ביוני 2009 (IDT)[תגובה]

למה? אני דווקא מעיין בזה מדי פעם. מדלג על 10 השורות הראשונות... חגי אדלרשיחהל-65 ערי מיליונים אין עדיין ערך. קחו אחת! • כ' בסיוון ה'תשס"ט • 15:56, 12 ביוני 2009 (IDT)[תגובה]
גם התוצאות אחרי ה-10 הראשונות נראות לא סבירות, גם בכמות החיפושים וגם בערכים עצמם. יש פה איזה דפקט tomtom - שיחה 13:42, 25 ביוני 2009 (IDT)[תגובה]
נראה שרוב החיפושים לא עוברים בדפים מהצורה http://he.wikipedia.org/wiki/... והסטטיסטיקה שיש לנו זמינה רק לגבי הדפים האלו - ולכן אנחנו מקבלים מידע רק על החיפושים שנעשים בצורה מסויימת (אולי אפילו מתוך מנוע חיפוש חיצוני). במהלך סוף השבוע אני אנסה לבדוק האם יש דרך לשלוף את הנתונים על החיפושים שמופנים לדפים אחרים - ואעדכן בהתאם. ‏ costello • ‏ שיחה 16:43, 25 ביוני 2009 (IDT)[תגובה]

על 21.11.09 ניצן צבי כהן - שיחה 20:02, 9 בדצמבר 2009 (IST)[תגובה]

תקוע על פברואר. תומר א. - שיחה - משנה ויקיפדית 12:53, 31 במרץ 2010 (IDT)[תגובה]
ידוע. המחשב שהריץ את הסטטיסטיקות קירטע כבר כשנה, ומת סופית לפני כשבועיים, וייקח לי כמה שבועות עד שאני ארים אחד חדש עם כל הנתונים. ‏ costello • ‏ שיחה 15:35, 2 באפריל 2010 (IDT)[תגובה]
ברוך דיין אמת. תומר א. - שיחה - משנה ויקיפדית 15:40, 2 באפריל 2010 (IDT)[תגובה]