שיחת ויקיפדיה:גרף ערכים

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית
תגובה אחרונה: לפני 9 שנים מאת IKhitron בנושא תאריכים מדוייקים

תאריכים מדוייקים[עריכת קוד מקור]

הועבר מהדף ויקיפדיה:מזנון
... אבל משהו מוזר: היה 167,000 איך קפץ פתאום ל-170,000 ? מוזר מאד צריך לבדוק. ‏dMy‏ • שיחה • 02:10‏, 05/04/2015 • ט"ז בניסן ה'תשע"ה

וואלה... רק עכשיו שמתי לב. זה באמת לא תקין. ב-18 במרץ 2015‏ הגענו ל-167,00 ולא סביר שנוספו עוד 3000 ערכים בשבועיים. נעביר את התהייה למזנון? זה חייב להבדק. השערה שלא מבוססת על כלום: פתאום אנו מונים גם את דפי ההפניות. Ldorfmanשיחה 00:58, 6 באפריל 2015 (IDT)תגובה
יש הרבה יותר הפניות, לא סביר. ביקורת - שיחה 01:06, 6 באפריל 2015 (IDT)תגובה
בשבועיים האחרונים נוצרו 1009 ערכים חדשים, כולל ההפניות: [1] יגאל (בקשת עזרה, IKhitron ושיחה) 15:26, 6 באפריל 2015 (IDT)תגובה
עוד משהו מוזר: ב-18/03 Ldorfman מצא 167,000 ואילו ב-30/03 רשם Amimqj בדיעבד 14 יום מוקדם יותר את הערך 170,000 מישהו יכול להסביר לי מה קורה ? ‏dMy‏ • שיחה • 21:48‏, 06/04/2015 • י"ח בניסן ה'תשע"ה
אז לפי "ויקיפדיה:ציוני דרך", בין ה-9 בינואר ל-16 במרץ נוספו 5000 ערכים. משהו במונה השתגע... אין לי מושג איך זה קרה. אני יודע שכשהוספתי את העמודה לגרף, בוודאות עברנו רק את ה-167K. נעביר את התעלומה למזנון? Ldorfmanשיחה 22:44, 6 באפריל 2015 (IDT)תגובה
תשובה: https://phabricator.wikimedia.org/T68867 מתניה שיחה 23:40, 6 באפריל 2015 (IDT)תגובה
אנא הסבר להדיוטות כמוני מה קרה. האם הספירה לא היתה תקינה עד עכשיו, ומעתה היא תקינה ? מדוע שינוי של ריצה פעם בחודש לתדירות גבוהה יותר, צריך להשפיע כל כך (אנו מדברים על פער של כ-3000 ערכים, ובוויקי העברית נוספים כל חודש כ-1,000 ערכים בלבד) ? ‏dMy‏ • שיחה • 00:01‏, 07/04/2015 • י"ח בניסן ה'תשע"ה
זו שאלה טובה, ושאלתי את המתכנת שאחראי על כך, אעדכן כשתהיה לי תשובה ברורה. מתניה שיחה 00:31, 7 באפריל 2015 (IDT)תגובה
מונה הערכים אף פעם לא לא נתן את המספר הנכון. סיפרתי על כך במזנון לפני שנים. אולי מישהו סוף סוף תיקן את זה. תומר א. - שיחה - משנה ויקיפדית 17:41, 8 באפריל 2015 (IDT)תגובה
הדיון היה שיחת משתמש:תומר א./ארכיון 13#אורכם של מאמרים בוויקיפדיה. אני זוכר שהנושא הוזכר גם במזנון. תומר א. - שיחה - משנה ויקיפדית 18:10, 8 באפריל 2015 (IDT)תגובה
אז ככה:
זה בוודאות כי יש רשימה מלאה של כל הערכים, מהראשון ([2], נפתח ממש לאט). כנראה היה באג בחישוב שתוקן בזמן האחרון. יגאל (בקשת עזרה, IKhitron ושיחה) 15:32, 7 באפריל 2015 (IDT)תגובה
אצטרך להקים את הגרף מההתחלה. הבעיה היא שאין לנו מידע מה היה ידוע בתאריך מסויים. ב-7 בדצמבר לא בטוח שהיו 167,000 כי:
  1. היו אז ערכים שנמחקו מאוחר יותר, כלומר: ערכים שבאותו יום נחשבו לערכים, אך כיום בדיעבד לא נחשבים לערכים.
  2. חלק מהערכים שכלולים ב-167,000 היו אז טיוטות וארגזי חול, כלומר: ערכים שבאותו יום לא נחשבו לערכים, אך כיום בדיעבד כן נחשבים לערכים.
dMy‏ • שיחה • 19:31‏, 07/04/2015 • י"ט בניסן ה'תשע"ה
אז אתה בבעיה. לא נראה לי ששומרים עותק מהטבלאות לכל יום בהיסטוריה. אם זה חשוב לך, שאל את ערן. יגאל (בקשת עזרה, IKhitron ושיחה) 19:37, 7 באפריל 2015 (IDT)תגובה
אני חושב שהתשובה של יגאל היא הערכה טובה אין לי רעיון להערכה טובה יותר. ערן - שיחה 23:58, 8 באפריל 2015 (IDT)תגובה
אני כותב תוכנית, שמחשיבה ערך רק כאשר הוא סופית במרחב הערכים. ‏dMy‏ • שיחה • 15:28‏, 10/04/2015 • כ"א בניסן ה'תשע"ה
מתבסס על השאילתה הבאה: ‏dMy‏ • שיחה • 00:30‏, 11/04/2015 • כ"ב בניסן ה'תשע"ה
select p.page_id, p.page_title, min(r.rev_timestamp) create_date
        ,(select max(l.log_timestamp) from logging l where l.log_page=p.page_id and l.log_namespace<>0) moved_date
from page as p
left join revision r on p.page_id=r.rev_page
where p.page_namespace=0 and p.page_is_redirect=0
group by p.page_id
הרגו לי את השאילתה הנ"ל ולכן אני מפצל אותה לשתיים: ‏dMy‏ • שיחה • 00:44‏, 11/04/2015 • כ"ב בניסן ה'תשע"ה
select p.page_id, p.page_title, min(r.rev_timestamp) create_date
from page as p
left join revision r on p.page_id=r.rev_page
where p.page_namespace=0 and p.page_is_redirect=0
group by p.page_id
select l.log_page, max(l.log_timestamp) moved_date
from logging l
l.log_namespace<>0 and l.log_type = 'move'
group by l.log_page

dMy‏, לדעתי ניתן להשאיר את הגרף כפי שהיה קודם ופשוט להוסיף את העמודות לפי המועדים של הערכים בין ה-167,00 ל-170,000. זה הכל. חבל לבזבז את הזמן על מציאת כל אחד מהמועדים המדוייקים יותר, לפי הספירה המחודשת. זה פשוט לא שווה את הזמן הזה מכיוון שבכל מקרה, כשמסתכלים על הגרף כולו, המיקום של כל אחת מהעמודות לא ישתנה ברמה כזו שעין אנושית תבחין בכך. אם ממש רוצים, ניתן להוסיף הערה באותיות קטנות, בתחתית הגרף, בסגנון "במרץ 2015 השתנתה מעט שיטת החישוב של כמות הערכים וכך, תוך פרק זמן קצר נוספו למניין כ-3000". ההערה כזו תעשה חסד עם דורשי השלמות ותהיה מספיק מעורפלת כדי שמי שלא ממש יתעניין בנושא, לא יאלץ לקרוא הסבר ארוך יותר. אישית, אני לא חושב שיש צורך בהערה מעין זו (בת'כלס, אין רבים שזה יעניין אותם וכל נושא המספור-מחדש יהיה בסה"כ בגדר פרט טריוויה להיסטוריוני ויקיפדיה), אבל זה נתון להחלטתך, כמי שיצר עבורנו את הגרף הזה מלכתחילה.
כך או כך, בצורת ההצגה הנוכחית נוצר קו שחור אופקי עבה מאוד בתחילת שנותיה של ויקיפדיה העברית ואת זה כן ראוי לתקן. רצוי שהקו יהיה אחיד, כפי שהופיע קודם. תודה על כל מאמציך. Ldorfmanשיחה 02:11, 11 באפריל 2015 (IDT)תגובה

הבעיה לא נוצרה ב-167,000 אלא היתה קיימת תמיד. ולכן נדרש התיקון הבא:
מספר ערכים תאריך מתוקן לפי שעון ישראל תאריך שהופיע עד עכשיו בגרף פער בימים
1,0002003-10-272003-10-25‎2
2,0002003-12-122003-12-15‎-3
3,0002004-01-112004-01-03‎8
4,0002004-02-192004-02-07‎12
5,0002004-04-012004-03-07‎25
6,0002004-05-142004-04-14‎30
7,0002004-07-012004-06-03‎28
8,0002004-08-062004-07-15‎22
9,0002004-09-072004-08-10‎28
10,0002004-10-092004-09-10‎29
11,0002004-11-162004-10-16‎31
12,0002004-12-152004-11-22‎23
13,0002005-01-132004-12-23‎21
14,0002005-02-042005-01-20‎15
15,0002005-02-272005-02-12‎15
16,0002005-03-242005-03-09‎15
17,0002005-04-092005-04-01‎8
18,0002005-04-282005-04-16‎12
19,0002005-05-222005-05-04‎18
20,0002005-06-172005-05-29‎19
21,0002005-07-092005-06-24‎15
22,0002005-07-272005-07-13‎14
23,0002005-08-132005-07-31‎13
24,0002005-08-292005-08-04‎25
25,0002005-09-222005-09-01‎21
26,0002005-10-152005-09-27‎18
27,0002005-11-102005-10-19‎22
28,0002005-12-072005-11-16‎21
29,0002005-12-302005-12-15‎15
30,0002006-01-152006-01-04‎11
31,0002006-02-032006-01-24‎10
32,0002006-02-212006-02-11‎10
33,0002006-03-132006-03-02‎11
34,0002006-03-312006-03-23‎8
35,0002006-04-182006-04-08‎10
36,0002006-05-062006-04-27‎9
37,0002006-05-242006-05-13‎11
38,0002006-06-092006-05-31‎9
39,0002006-06-252006-06-17‎8
40,0002006-07-102006-07-03‎7
41,0002006-07-262006-07-20‎6
42,0002006-08-132006-08-06‎7
43,0002006-08-312006-08-24‎7
44,0002006-09-182006-09-11‎7
45,0002006-10-062006-10-01‎5
46,0002006-10-212006-10-17‎4
47,0002006-11-072006-11-01‎6
48,0002006-11-252006-11-20‎5
49,0002006-12-142006-12-09‎5
50,0002006-12-302006-12-24‎6
51,0002007-01-162007-01-10‎6
52,0002007-02-052007-01-29‎7
53,0002007-03-012007-02-19‎10
54,0002007-03-242007-03-18‎6
55,0002007-04-112007-04-08‎3
56,0002007-04-232007-04-21‎2
57,0002007-05-102007-05-08‎2
58,0002007-05-282007-05-27‎1
59,0002007-06-142007-06-13‎1
60,0002007-07-052007-07-12‎-7
61,0002007-07-252007-08-05‎-11
62,0002007-08-142007-08-29‎-15
63,0002007-09-062007-09-23‎-17
64,0002007-09-272007-10-12‎-15
65,0002007-10-152007-10-28‎-13
66,0002007-10-292007-11-18‎-20
67,0002007-11-222007-12-02‎-10
68,0002007-12-082007-12-22‎-14
69,0002007-12-222007-12-30‎-8
70,0002007-12-312008-01-08‎-8
71,0002008-01-122008-01-30‎-18
72,0002008-02-042008-02-20‎-16
73,0002008-02-252008-03-11‎-15
74,0002008-03-172008-04-04‎-18
75,0002008-04-102008-04-25‎-15
76,0002008-04-282008-05-14‎-16
77,0002008-05-192008-06-04‎-16
78,0002008-06-092008-06-24‎-15
79,0002008-06-292008-07-15‎-16
80,0002008-07-182008-08-02‎-15
81,0002008-08-062008-08-24‎-18
82,0002008-08-282008-09-16‎-19
83,0002008-09-192008-10-12‎-23
84,0002008-10-122008-11-07‎-26
85,0002008-11-062008-12-01‎-25
86,0002008-11-302008-12-23‎-23
87,0002008-12-232009-01-18‎-26
88,0002009-01-162009-02-10‎-25
89,0002009-02-092009-03-07‎-26
90,0002009-03-052009-03-30‎-25
91,0002009-03-282009-04-19‎-22
92,0002009-04-172009-05-18‎-31
93,0002009-05-132009-06-13‎-31
94,0002009-06-072009-07-09‎-32
95,0002009-07-042009-08-02‎-29
96,0002009-07-272009-09-01‎-36
97,0002009-08-232009-10-02‎-40
98,0002009-09-242009-11-03‎-40
99,0002009-10-232009-12-07‎-45
100,0002009-11-232010-01-10‎-48
101,0002009-12-282010-02-09‎-43
102,0002010-01-242010-03-08‎-43
103,0002010-02-212010-04-06‎-44
104,0002010-03-212010-05-05‎-45
105,0002010-04-152010-06-05‎-51
106,0002010-05-152010-07-05‎-51
107,0002010-06-142010-08-02‎-49
108,0002010-07-132010-08-30‎-48
109,0002010-08-122010-09-25‎-44
110,0002010-09-072010-10-20‎-43
111,0002010-10-022010-11-16‎-45
112,0002010-10-292010-12-13‎-45
113,0002010-11-242011-01-09‎-46
114,0002010-12-192011-02-02‎-45
115,0002011-01-162011-02-25‎-40
116,0002011-02-062011-03-22‎-44
117,0002011-03-022011-04-14‎-43
118,0002011-03-282011-05-06‎-39
119,0002011-04-192011-05-30‎-41
120,0002011-05-132011-06-21‎-39
121,0002011-06-052011-07-16‎-41
122,0002011-06-292011-08-09‎-41
123,0002011-07-242011-08-30‎-37
124,0002011-08-172011-09-23‎-37
125,0002011-09-082011-10-16‎-38
126,0002011-10-022011-11-07‎-36
127,0002011-10-242011-12-04‎-41
128,0002011-11-192011-12-31‎-42
129,0002011-12-162012-01-29‎-44
130,0002012-01-112012-02-23‎-43
131,0002012-02-082012-03-20‎-41
132,0002012-03-032012-04-16‎-44
133,0002012-03-302012-05-07‎-38
134,0002012-04-222012-06-01‎-40
135,0002012-05-142012-06-26‎-43
136,0002012-06-092012-07-20‎-41
137,0002012-07-052012-08-14‎-40
138,0002012-07-282012-09-12‎-46
139,0002012-08-242012-10-06‎-43
140,0002012-09-192012-10-31‎-42
141,0002012-10-122012-11-30‎-49
142,0002012-11-072012-12-29‎-52
143,0002012-12-082013-02-04‎-58
144,0002013-01-082013-03-09‎-60
145,0002013-02-112013-04-10‎-58
146,0002013-03-142013-05-03‎-50
147,0002013-04-142013-06-04‎-51
148,0002013-05-082013-07-04‎-57
149,0002013-06-052013-08-01‎-57
150,0002013-07-052013-08-29‎-55
151,0002013-08-012013-10-05‎-65
152,0002013-08-282013-11-14‎-78
153,0002013-09-302013-12-19‎-80
154,0002013-11-072014-01-20‎-74
155,0002013-12-112014-02-21‎-72
156,0002014-01-112014-03-31‎-79
157,0002014-02-102014-05-08‎-87
158,0002014-03-132014-06-08‎-87
159,0002014-04-192014-07-08‎-80
160,0002014-05-202014-08-07‎-79
161,0002014-06-172014-09-07‎-82
162,0002014-07-162014-10-08‎-84
163,0002014-08-132014-11-07‎-86
164,0002014-09-122014-12-05‎-84
165,0002014-10-122015-01-09‎-89
166,0002014-11-092015-02-13‎-96
167,0002014-12-092015-03-18‎-99
168,0002015-01-11
169,0002015-02-15
170,0002015-03-20
זה כמובן לא מדוייק ב-100% כי יש עוד כמה מקרי קצה (כגון הפנייה שלא נספרה והפכה לערך, ערך שנמחק ושוחזר ועוד ועוד) אבל זה הכי טוב שאפשר להגיע אליו. ‏dMy‏ • שיחה • 02:38‏, 11/04/2015 • כ"ב בניסן ה'תשע"ה

תיקון גם ב"ציוני דרך"[עריכת קוד מקור]

אחלה. תודה על תיקון. אם כך, האם לדעתך ראוי לתקן גם את ההיסטוריה המוזכרת בדף "ויקיפדיה:ציוני דרך" - האם יש לנו בכלל אפשרות לקבוע מהו הערך המדוייק שהגיע בעבר לכל אחד מהמספרים העגולים? אם לא/אם לא כדאי, ניתן גם להסתפק בהוספת שורה בפרק לגבי 2015 לפיה במרץ-אפריל בוצע חישוב מחדש של כמות הערכים... Ldorfmanשיחה 02:54, 11 באפריל 2015 (IDT)תגובה
אפשר בהחלט, כך למשל הערך ה-100,000 היה כנראה כנסיית מריה הקדושה (ליבק) שנכתב ב-23/11/2009 על ידי MathKnight (ולא אחוזת סיטון דלאוואל שנכתב על ידי ברוקולי ב-10/01/2010). אבל שוב - לא מדוייק ב-100% כי כאמור יש עוד כמה מקרי קצה, שקשה מאד מאד לפצח אותם. ממליץ לתקן רק מ-165,000. ‏dMy‏ • שיחה • 03:05‏, 11/04/2015 • כ"ב בניסן ה'תשע"ה
אנו מציינים ב"ציוני דרך" רק את אלה שבכפולות של 5000. לפי הרשימה של יגאל לעיל, אני מבין שהערך ה-170K הוא קרב סותול. מהו ה-1650K? במקביל, אכתוב על זה כמה מילים במזנון כדי ליידע את כולם. Ldorfmanשיחה 03:15, 11 באפריל 2015 (IDT)תגובה
קרב סותול הוא הערך ה-169,976. ההבדלים בין השיטה של IKhitron לבין השיטה שלי:
  • IKhitron מסתמך על מספר סידורי של דפים, אני מסתמך על תאריך + שעה. מסתבר שיש הרבה יוצאי דופן והמספר הסידורי איננו עקבי לפי תאריכים במקרים לא מעטים.
  • IKhitron מניח שתאריך יצירת הדף הוא כביכול גם התאריך שבו הדף מצטרף למרחב הערכים. זה לא כך, עבור דפים רבים שהיו בארגזי חול למיניהם. אני מחשיב את התאריך שבו דף הועבר ממרחב שאיננו מרחב הערכים - אל מרחב הערכים (ואם היו פינג פונג - אז אני מחשיב רק את ההעברה האחרונה).
לפי השיטה שלי, הערך ה-170,000 הוא איליה (בלארוס) מ-20/03/2015, והערך ה-165,0000 הוא זמן פציעות מ-12/10/2014. ‏dMy‏ • שיחה • 08:44‏, 11/04/2015 • כ"ב בניסן ה'תשע"ה
למען הסר ספק - אלו בהחלט היו ההנחות שלי, ובפירוש אמרתי שהנתונים שהצגתי לא נותנים תמונה נכונה רטרואקטיבית. יגאל (בקשת עזרה, IKhitron ושיחה) 15:24, 12 באפריל 2015 (IDT)תגובה