שיחת ויקיפדיה:בוט/בוט היישובים/בוט היישובים של מאיר מ.

תוכן הדף אינו נתמך בשפות אחרות.
הוספת נושא
מתוך ויקיפדיה, האנציקלופדיה החופשית

דף זה הוא דף ארכיון של דיון או הצבעה שהסתיימו. את המשך הדיון יש לקיים בדף השיחה של הערך או הנושא הנידון. אין לערוך דף זה.

לראש הדף
לתחתית הדף

שלום לכולם. מה דעתכם להשתמש בבוט כדי ליצור כתבות על ערים בישראל באופן אוטומטי על סמך מידע מהלשכה המרכזית לסטטיסטיקה, כמו ש-Ram-Man עשה בויקיפדיה האנגלית עם מידע מהמפקד האמריקאי? אפשר לראות דוגמה ב-משתמש:AdamRaizen/רמלה. -- אדם 22:40, 14 ספט' 2003 (UTC)

רעיון מצויין. את הערך לדוגמה יצרת ידנית, או כבר פיתחת בוט כנ"ל? --אלעד, 15/09/03, 10:51.
כבר פיתחתי את הבוט. מה אתם חושבים על התוכן של הכתבה? יש יותר מדי או פחות מדי סטטיסטיקות? יש עוד הרבה סטטיסטיקות שאפשר להוסיף, אבל לא רציתי להוסיף הרבה נתונים שאף אחד לא באמת מתעניין בהם. -- אדם
זה נהדר, אבל לחלוטין לא קריא. לדעתי, צריך לשבץ את המידע בטבלאות (ראה השדרוג שבעיצומו לדף דמויות קולנועיות כדוגמה טובה לעוצמה שבשימוש בטבלה) - ובהזדמנות זו ליצור בסיס לערכים עתידיים. כל הכבוד על ההשקעה! --אלעד, 15/09/03, 16:03.
אני לא בטוח. לדעתי מאמר שמכיל רק טבלה או כמעט כלום חוץ מטבלה זה קצת לא אנציקלופדי. המאמרים של Rambot (למשל Greeley, Colorado הם בצורה של משפטים. היה דיון נרחב על בוטים וטבלאות בויקיפדיה האנגלית. אולי הפיתרון הוא להשמיט כמה מהנתונים הפחות חשובים (כמו על נתונים על חינוך ובתי ספר, למשל). -- אדם 21:41, 15 ספט' 2003 (UTC)
  1. אני פשוט לא מאמין למה שאני קורא. ח"ח. עשית בדיוק מה שאני התכוונתי לעשות לפני כחודשיים (בנית BOTs לישובים בישראל ע"ס הלמ"ס). לא נעים, אבל פשוט לא הלך לי. לא BOT ולא נתונים מהלמ"ס. בהזדמנות אחר, ובשעה סבירה יותר, אבקש ממך פרטים.
  2. לשאלה על טבלאות / מלל אנציקלופדי:
    יש לי דיעה די ברורה. את כל מה שניתן לרשום כמלל מקוצר מינימלי על הישוב (נניח 2 משפטים ראשונים) במלל, ואת יתר המידע שנראה ונשמע סטט. טהור בטבלא. ולדעתי כל מידע סטט. צריך להופיע, גם אם הוא נראה לא מעניין (מה שלא מעניין אותי, אולי מעניין מישהו אחר, הרי הלמ"ס לא אוספים סתם כך נתונים ללא סיבה.)
    עברתי בזמנו על די הרבה ערכים כמו זה שהזכרת, בעיקר אחרי ששמעתי הרצאה של עו'ד חיים רביה על זה שגם הוא מוזכר בוויקי באנגלית Ravia, Oklahoma. הוא ציטט מקצת הנתונים הסטט. על הישוב הקטן בצחוק / הומור.
    וברצינות: קשה מאד לקרא ולהבין את הנתונים הסטטי. כשהם מופיעים כמשפטים. קל יותר להתייחס אליהם כשהם מאורגנים בטבלא, וגם קל יותר לכוון את העין לראות באותו מקום בטבלא את הנתון שאתה מחפש ביישובים שונים, נניח.
  3. טוב מספיק בינתיים.
    ושוב, אני מצדד מאד ב-STUB-ים. זה לדעתי יחייה, ינמף (מנוף) וייחצן (יחצן) את הוויקי שלנו.
  4. נ.ב כמובן שאני מוכן לסייע בעריכת הטבלא, וכל שיידרש כדי לקדם את העניין שבו התחלת. -- דוד1 01:26, 16 ספט' 2003 (UTC)
טוב יהיו טבלאות :-). אני אעדכן את הכתבה לדוגמה עוד מעט. אני מבין את מה שאתה אומר לגבי השימושיות של הנתונים למישהו, אבל יש המון המון סטטיסטיקות קטנוניות, שלא כל כך מתאימים לויקיפדיה, לדעתי. הרשימה המלאה אפשר לראות ב-משתמש:AdamRaizen/סטטיסטיקות. הגיליון שהורדתי מהלמ"ס נמצא ב-[1] -- אדם 16:09, 16 ספט' 2003 (UTC)
יש עדכון ב-משתמש:AdamRaizen/רמלה, עם טבלאות. הערות? -- אדם
נהדר! כדאי לציין תאריך עדכון אחרון של הנתונים (אולי תוכל לשלב בבוט?) ולפתח בסיס מוסכם לערכים כאלה, בהזדמנות זו. כל הכבוד! --אלעד, 17/09/03, 23:57.
אני אשלב את תאריך העדכון, ואם יש לך הערות או הצעות לגבי הפורמט של הכתבה, תגיד עכשיו. -- אדם

נתונים בוויקיפדיה באנגלית[עריכת קוד מקור]

למי שלא עוקב אחר הדיונים בויקיפדיה האנגלית, יש דיון נרחב על השאלה האם ואיך להוסיף את הנתונים האלה לויקיפדיה שם (תראו למשל m:Israeli statistics. בגרסה האנגלית יהיה קישור לכתבה על קבוצות אוכלוסיה בישראל, כי הם לא כל-כך הבינו איך מגדירים יהודי, ערבי, וכו'. אתם חושבים שצריכים כתבה כזו בויקיפדיה העברית? ובכל אופן, אם מישהו מכיר את המצב טוב, אם תוכלו לעזור בכתיבת מאמר בעברית שאני אתרגן. אני יכול להסביר על השאלה הפוליטית של 'מיהו יהודי', וכו', ועל זה שלרשות הדתית יש סמכות בענייני אישות, אבל אני לא כך מכיר איך משרד הפנים מתייחס למגזר המוסלמי והמגזר הנוצרי.

היה גם דיון על זה שסכום המספרים בכתבה הוא יותר מ-100%. (80.5% יהודים + 20.0% ערבים.) מישהו יודע איך משרד הפנים מתייחס למישהו שאביו ערבי ואמו יהודייה, למשל? -- אדם 03:00, 18 ספט' 2003 (UTC)

מה קורה עם ישובים שכבר קיימים להם ערכים?[עריכת קוד מקור]

הBOT דורס אותם? או שלא יוצר ערכים? או שמשלב? eman 16:56, 9 פבר' 2004 (UTC)

הוא בונה את ה"ערך החדש" ואחרי זה עושה קו תחתי ואומר משהו בסגנון:

זהו הערך הישן, נא לשלב את הערך הישן והחדש

ואז מוצג הערך הישן ערן

אתה בטוח? כי אם אתה אומר ת זה רק בהסתמך על פתח תקווה, זה לא נכון, כי שם היה הבדל בכתיב, ומישהו עשה את זה כנראה ידנית eman 17:40, 9 פבר' 2004 (UTC)

אני אומר את זה על סמך מקורות D: כלומר ראיתי בדוגמאות של הבוט שקרה כך גם בערך דוגמה של אילת.

ספר משרד ראש הממשלה על הישובים בישראל[עריכת קוד מקור]

למי שראה אתמול את הטור של נחמיה שטרסלר ביומן שישי של ערוץ 2, הוא הציג שם ספר שהוצא במשרד ראש הממשלה עם כל ישובי ישראל ומספר פרטים בסיסיים עליהם. ספר כזה יכול לעזור לנו מאוד בהעלאה של מספר רב של ערכים חדשים.

בוט הישובים העלה עד היום רק ערים ומועצות מקומיות יש עוד כ-1120 ישובים!!!! לפי החשבון הבא: ברשימת כל ישובי ישראל (שנלקחה ממאגרי רשות הדואר) יש 1330 ישובים, לעומת זאת ערים יש 69 ומועצות מקומיות יש 141. לדעתי יש כ-50-60 ערכים של ישובים שהם לא ערים ולא מועצות מקומיות שכבר הוזנו (ללא תבנית סטנדרטית).

רק בשביל להדגים מה אפשר לעשות באופן אוטומטי על כזה בסיס נתונים תחשבו שיש שם (לפי מה שהספקתי לראות בטלויזיה) נ"צ של כל ישוב. ניתן לחולל באופן אוטומטי מפת התמצאות שמראה את מיקומו הכללי של הישוב על גבי מפת ישראל!

בקשתי הנרגשת היא לנסות ולהשיג את המידע בפורמט דיגיטלי. מקורותי במשרד ראש הממשלה יכולים להשיג את הספר עצמו אבל אין טעם בפרויקט הקלדה אדיר מימדים כזה.

האם חוק חופש המידע יכול לעזור לנו כאן?

למישהו יש הצעות למי במשרד ראש הממשלה ניתן לפנות?

מאיר מ 05:34, 1 מאי 2004 (UTC)             "ויקיפודי כל העולם התאחדו!"

מידע מאוד בסיסי על כל יישובי ישראל מופיע באתר של הלמ"ס. אני משער שגם המידע המקיף יותר שראית בטלוויזיה מקורו שם. דוד שי 08:06, 1 מאי 2004 (UTC)
דוד, אני לא מצאתי בין הטבלאות, אחת שמכילה את כל הישובים. בכל מקרה זהו קובץ PDF, ונראה לי שהוא מסוג שאינו מאפשר הפיכתו למסמך אלקט. שמאפשר עיבוד תמלילים ע"י וורד או אקסל. ^^ דוד1 10:07, 1 מאי 2004 (UTC)
דוד1, ליד הקישור יש לוגו של אקסל. מאיר מ 10:14, 1 מאי 2004 (UTC)
דוד שי,
ראיתי את הקובץ הזה כשאספתי מידע לבוט הישובים. חוץ מהרשימה ומספר התושבים הוא לא מכיל שום מידע רלוונטי, אין בו אפילו שם מועצה אזורית שהיה עוזר לשייך את הישוב לאזור כלשהוא בארץ. מזה אי אפשר לחולל כלום. מהרשימה שהראו בכתבה אפשר ממש ליצר ערך קטן ואינפורמטיבי.
מאיר מ 10:14, 1 מאי 2004 (UTC)
מאיר צדקת ואני לא התייחסתי לקישור ה-EXCEL-י. אגב הקובץ היחיד שמכיל את כל הישובים הוא זה ומכיל רק שם בעברית ואנגלית מספר תושבים, דת הישוב, וסמל הישוב (מספר מזהה שלו?) ועם זה אי אפשר ללכת רחוק מדי - או שגם כאן אני פסימי מדי ? ^^ דוד1 16:19, 1 מאי 2004 (UTC)


חוק חופש המידע - נראה לי שהחוק הזה יוכל לעזור לנו המון בעניין. באתר משרד המשפטים ניתן להוריד חוברת הכוללת את נוסח החוק והתקנות הרלוונטיות ואת רשימת הרשויות הציבוריות והממונים מטעמן על חופש המידע. בדוק אותה בעיון. (ראה גם ארגז החול שלי, שם יש "ערך לדוגמא" שעוסק בין היתר בתחום זה.)
תכל'ס, אפשר לנסות לפנות בכתב לממונה לפי חוק חופש המידע מטעם משרד ראש הממשלה (יואל חסון, טל. 02-6705555, פקס 02-6705475) ולבקש את המקור הדיגיטלי של החומר. אני מאמין שיש סיכוי לקבל את החומר, בפרט אם נסביר מהי המטרה. קח בחשבון שהבקשה כרוכה בתשלום אגרת בקשה (75 ש"ח), אגרת טיפול (40 ש"ח לכל שעת טיפול, מהשעה השלישית והלאה) ואגרת הפקה (1 ש"ח לעמוד או 4 ש"ח לדיסקט).
נפתלי 06:41, 2 מאי 2004 (UTC)

==מה עושים אם יש טעות בנתונים שהגיעו מהלמ"ס לגבי ישובים בארץ?== בכפר ורדים למשל, יש שני בתי ספר, אבל לפי הלמ"ס אין שם בית ספר אחד לרפואה... ש. יוברו

מעדכנים !! . ^^ דוד1 01:16, 6 מאי 2004 (UTC)
איפה? בטבלה מצד שמאל (שעליה חתומה הלמ"ס...) או בטקסט הראשי? ש. יוברו
מוזר מאוד הסיפור הזה.
בדקתי עוד פעם בנתוני הלמ"ס ואכן אין שם בתי ספר. הרצתי חיפוש במאגר המוסדות של משרד החינוך והוא טוען שיש שם רק בית ספר אחד, "בית חינוך קהילתי - קשת".
בכל אופן תיידעו אותי בשביל שאני אתקן את בסיס הנתונים של הבוט כדי שהוא לא ידרוס את השינויים בטבלה בפעם הבאה.
מאיר מ 10:38, 6 מאי 2004 (UTC)
יש ויש! "קשת" הוא בית ספר יסודי. "אמירים" היא חטיבת ביניים שאינה מוכרת כבית ספר נפרד (אך נפרדת מ"קשת" לכל דבר ועניין). העניין הוא שבטח יש עוד המון טעויות בדפים האלה. אני בדקתי רק את הישוב שאני גר בו... ש. יוברו

יש טעות בכל הישובים [בדקתי כמה ובכולם זה ישנו] בישום התגים הדינמיים. תגים אלו מופיעים בדרך כלל בקטע הראשון של המאמר.

מקור הבעייה הוא בכך שהתגים מצויים בשורה אחת עם הכיתוב העברי שסביבם. הפתרון הוא למקם את התגים הדינמיים כל תג בשורה נפרדת ואת הכיתוב העברי שסביבו למקם בשורות נפרדות ע"י לחיצה על המקש הנטר.

כעת הקוד כתוב כך:

לפי נתוני הלמ"ס ([[הלשכה המרכזית לסטטיסטיקה]]) נכון ל <!--HebWikiCityBot:PopDate-->[[ספטמבר]] [[2003]]<!--/HebWikiCityBot:PopDate--> יש בהוד השרון <!--HebWikiCityBot:PopNum-->39,900<!--/HebWikiCityBot:PopNum--> תושבים. האוכלוסיה גדלה בקצב גידול שנתי של <!--HebWikiCityBot:PopGrowth-->4.5 <!--/HebWikiCityBot:PopGrowth--> אחוז.

והתוצאה נראית כך:

לפי נתוני הלמ"ס (הלשכה המרכזית לסטטיסטיקה) נכון ל ספטמבר 2003 יש בהוד השרון 39,900 תושבים. האוכלוסיה גדלה בקצב גידול שנתי של 4.5 אחוז.

בכדי שהתוצאה תראה כך:

לפי נתוני הלמ"ס (הלשכה המרכזית לסטטיסטיקה) נכון ל ספטמבר 2003 יש בהוד השרון 39,900 תושבים. האוכלוסיה גדלה בקצב גידול שנתי של 4.5 אחוז.

יש לכתוב כך:

לפי נתוני הלמ"ס ([[הלשכה המרכזית לסטטיסטיקה]]) נכון ל
<!--HebWikiCityBot:PopDate-->
[[ספטמבר]] [[2003]]
<!--/HebWikiCityBot:PopDate-->
יש בהוד השרון
<!--HebWikiCityBot:PopNum-->
39,900
<!--/HebWikiCityBot:PopNum-->
תושבים. האוכלוסיה גדלה בקצב גידול שנתי של
<!--HebWikiCityBot:PopGrowth-->
4.5
<!--/HebWikiCityBot:PopGrowth-->
אחוז.


מלח השמים 15:38, 9 אוק' 2004 (UTC)

נ.ב. אני מציע להוסיף הסבר זה בדף משתמש:בוט ישובים לידיעת הויקיפדים.
נ.ב.ב. למשתמש:מאיר מ התפעלתי מעבודתך ומכרטיסך האישי. מלח השמים

בנתיים התחלתי לתקן. עד עתה תיקנתי בכל הישובים המתחילים באות א ואני ממשיך...
מלח השמים 20:02, 9 אוק' 2004 (UTC)
תיקנתי גם את כל הישובים המתחילים באות ב. עבדתי לפי הרשימה המופיעה ב Category:ישובים בישראל.
ואני מותיר לאחרים בקעה להתגדר בה...
מלח השמים 21:05, 9 אוק' 2004 (UTC)
מלח השמים,
תודה על המחמאות אבל מהתבוננות בבאג המביך אני לא ראוי להן.
לא הייתי מודע לתופעה כלל. אני תוהה אם לא עדיף לעשות בוט שיתקן את הבעיה. אחרי הכל מדובר פה רק על הוספת CrLf. מה דעתך?
מאיר מ 09:32, 11 אוק' 2004 (UTC)
"מי שלא עושה אינו טועה" ואתה ודאי יודע, שבכל פרוייקט תוכנה, חלק אולי הארי של הזמן, מוקדש לדיבוג.
גם אני חשבתי על הרעיון שהעלית ואני סבור שזו הדרך המקצועית לטפל בעניין. במקצועי אני מתכנת [למרות שאיני מתפרנס כרגע מזה]. אך בכתיבת בוטים אין לי נסיון.
איך אתה מציע להריץ את העניין ?
מלח השמים 17:13, 11 אוק' 2004 (UTC)
במאמר חיפה מצויין שמספר התושבים ל9/2003 הוא 270400. עם זאת ברשימת ערים (שקבלתי בהפניה מ"העיר השלישית בגודלה") מוצאים נתון מאוחר יותר (9/2005) ובו מספר התושבים 268300. איני יודע כיצד לסדר זאת בהתחשב בהערה שבראשית הדף.--Act 17:32, 20 פברואר 2006 (UTC)

הפעלת הבוט[עריכת קוד מקור]

מרבית הנתונים של הערים מעודכנים לשנת 2000 או 2001. האם מתוכננת הפעלת הבוט בקרוב, ואם לא- מדוע? ירון 01:26, 28 יולי 2006 (IDT)