ויקיפדיה:דפים ללא בינוויקי/ארכיון 1 – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
לא פעיל
דיוק: המיזם הסתיים כי כיום קישורי הבינוויקי מאורגנים בוויקינתונים
שורה 1: שורה 1:
{{סטטוס מיזם|לא פעיל}}
{{סטטוס מיזם|הסתיים}}


{{ויקיפדיה:דפים ללא בינוויקי/פתיח}}
{{ויקיפדיה:דפים ללא בינוויקי/פתיח}}

גרסה מ־00:43, 26 בינואר 2014

מיזם זה הסתיים
מיזם דפים ללא בינוויקי

מטרת מיזם זה היא לצמצם את מספר הדפים, ובמיוחד הערכים, נטולי קישורי בינוויקי מתאימים לוויקיפדיות בשפות זרות וכן לתקן קישורים קיימים שיש בהם שגיאות. בסיס המיזם, מלבד כמובן העורכים והוויקיפדיות הזרות, הוא הרשימות של חסרי הבינוויקי ותבנית {{אין בינוויקי}} באמצעותה ניתן לסמן דפים שלא נמצא עבורם בינוויקי מתאים, כדי שיצאו מהרשימה ל"תקופת צינון" על מנת לחסוך מהעורכים השונים לבדוק הימצאותו של בינוויקי כמה פעמים בתאריכים קרובים.

מטרה ודרך פעולה

חסרי הבינוויקי ממוינים ברשימות שונות כך שניתן לעבור על סוגים שונים של דפים שאין להם בינוויקי. מה אפשר לעשות עם הרשימה:

  • אם יש בוויקיפדיה זרה דף מקביל:
    • הוסיפו לדף בעברית קישור לדף הזר. אם אפשר, העתיקו את רשימת הבינוויקי במלואה מהדף הזר והוסיפו את אנגלית במקום הראשון[1].
    • הוסיפו לדף הזר קישור לדף בעברית. אין צורך לעבור על כל הוויקיפדיות הזרות ולהוסיף קישורים לעברית, כי בוטים ישלימו את העבודה הזו[2].
    • מחקו את הדף מהרשימה המתאימה.
    • אם מצאתם את הדף המקביל בוויקיפדיה האנגלית ובדף בעברית מופיעה תבנית {{אין בינוויקי}} - מחקו את התבנית[3]. אין למחוק את התבנית אם יש בדף קישור לשפה שאינה אנגלית (en).

הערות:

  • לעתים, העובדה שאין לערך קישור בינוויקי יכולה להצביע על כך שהנושא בו עוסק הערך לא ראוי לערך עצמאי. בהתאם למצב ניתן לשקול לפתוח דיון בדף השיחה בנושא איחוד הערך עם ערך אחר (ראו ויקיפדיה:מדיניות איחוד ערכים) או להוסיף תבנית {{חשיבות}} אם חשיבותו לא ברורה מתוכן הערך. ייתכן גם שלערך חסר בינוויקי מכיוון שהוא ערך חדש יחסית או שלא עברו עליו די עורכים, במקרה זה ייתכן שהוא ידרוש טיפול מיוחד, ראו ויקיפדיה:מאמרים שנערכו מעט. אולם, שימו לב שאין העובדה שחסרים קישורי בינוויקי מצביעה בהכרח על בעיה כלשהי בערך או בנושאו.
  • אם נושא הערך נדון בוויקיפדיה האנגלית בצורה שונה מהעברית ואי אפשר למצוא ערך מקביל בצורה מדויקת, השתמשו בשיקול דעת: ניתן לקשר בבינוויקי למרות ההבדל, אם הדבר יועיל לקוראים. כמו כן, אם נראה לכם שהדבר יתרום לשיפור הוויקיפידה העברית, היו נועזים ועשו שינויים מבניים אצלנו או באנגלית, אך עם זאת, לא צריך לצאת מהכלים רק כדי לקרב את ויקיפדיה העברית לאחותה האנגלית.
  • דפים שיש ביניהם קישור בין-לשוני צריכים לדון על אותו נושא. אנא השתדלו לשמור על מצב שבו בין שני ערכים קיים רק קישור אחד ושלא יהיה מצב ששני ערכים בשפה א' מקשרים לערך אחד בשפה ב'. זה מבלבל הן את הקוראים והן את הבוטים שמתקנים קישורים (ראו דף עזרה בנושא זה באנגלית, רשימת דפים בעלי קישורים לדפים לועזיים שונים ורשימת דפים לועזיים בעלי יותר מקישור בינוויקי אחד לעברית).

מה לכתוב בתקציר עריכה

מומלץ להשתמש בתקצירי העריכה הבאים:

בוויקיפדיה העברית:

אין בינוויקי סיווג דפים ללא בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]
הוספת בינוויקי הוספת קישורי בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]
תיקון קישורי בינוויקי קיימים תיקון קישורי בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]

כשמוסיפים לדפים בוויקיפדיות זרות קישורים לעברית מומלצים התקצירים הבאים:

אנגלית
adding interlanguage link - he. [[WP:WPIW/HE|You can help!]]
רוסית
интервики - иврит. [[ВП:П:ИНТЕР|Вы можете нам помочь!]]
צרפתית
ajouté iw he. [[:he:ויקיפדיה:דפים ללא בינוויקי|Parlez-vous l'hébreu ? Pouvez aider ! יודעים עברית? בואו לעזור]]
ספרדית
añadí interwikis. [[:he:ויקיפדיה:דפים ללא בינוויקי|¿Ud. sabe hebreo? ¡Ud. puede ayudarnos ! יודעים עברית? בואו לעזור]]
איטלקית
ho aggiunto interwiki. [[:he:ויקיפדיה:דפים ללא בינוויקי|Parla ebraico? Può aiutarci ! יודעים עברית? בואו לעזור]]
קטלאנית
he afegit interwiki a l'hebreu. [[:he:ויקיפדיה:דפים ללא בינוויקי|Saps l'hebreu? Pots ajudar-nos ! יודעים עברית? בואו לעזור]]

(אפשר להוסיף עוד שפות, ולתקן את הקיימות.)

שימוש בתבנית אין בינוויקי

השימוש בתבנית:אין בינוויקי: {{אין בינוויקי|תאריך=~~~~~|סוג=סוג/ים מסוימים|סבירות=א-ד}}

פרמטרים

תאריך

חמשת הטילדות יתורגמו לתאריך של היום עם שמירת הדף. זה מאפשר לבוט לדעת מתי נעשה חיפוש ולא נמצא בינוויקי מתאים.

סוג

יש לבחור סוג מסוים, או כמה סוגים, מרשימת הסוגים. כאשר בוחרים בכמה סוגים יש להפרידם על ידי נקודה-פסיק ורווח. ציון סוג מאפשר לבוט להכניס את הדף לרשימה של דפים חסרי בינוויקי באותו נושא. ההכנסה נעשית עם הרצת הבוט הראשונה בתום "תקופת הצינון". חלוקה זו של חסרי-הבינוויקי עוזרת לעורכים המעוניינים לחפש בינוויקי לערכים בתחום מסוים בלבד. קיים תכנון לתת לבוט יכולת לסווג את הדפים על פי הקטגוריות בהן הם מקוטלגים, דבר שיוריד את הצורך בפרמטר זה. בינתיים יש להשתמש בפרמטר זה ולמלא אותו כדרוש.

סבירות

פרמטר זה מציין את הסבירות שערך מקביל ייכתב בוויקי זרה ויִימצא קישור בינוויקי הולם. הרמות הן: א - סבירות גבוהה, ב - סבירות בינונית, ג - סבירות נמוכה.

סבירות ד רושמים רק כאשר ידוע בוודאות שלא יימצא קישור הולם. זה נפוץ בדפי פירושונים שבהם ניתן להוסיף כמה קישורי בינוויקי שונים לכל שפה ולכן עדיף כלל לא להוסיף קישורים. במקרים אחרים יש להפעיל שיקול דעת היטב לפני שימוש בסבירות ד. למשל, אין לסווג ערכים על אישי תרבות ישראליים או הצגות ישראליות שאינם ידועים בחו"ל בסבירות ד, אלא בסבירות ב או ג.

הוספת פרמטר "סבירות" מאפשרת לתת לדפים השונים "תקופות צינון" שונות, כאשר ככל שהסבירות גבוהה יותר כך "תקופת הצינון" מתקצרת. דפים עם סבירות ד לא ייכנסו לרשימות הרגילות אלא לרשימה מיוחדת אחת, כדי לאפשר מעקב אחריהם ולהבטיח שרק הדפים המתאימים סומנו כך. ההכנסה לרשימה תיעשה עם הרצת הבוט הראשונה אחרי הוספת התבנית (או שינוי הסבירות ל-ד), ללא שום תקופת צינון. ייתכן כי הרשימה גם תתחלק לסוגים.

דוגמה לשימוש בתבנית: {{אין בינוויקי|תאריך=~~~~~|סוג=חברי כנסת; רבנים; ישראל - חינוך|סבירות=א}}

כללים חשובים

  • יש להוסיף את שמות כל הפרמטרים ולמלא כל אחד מהם.
    • בפרמטר "תאריך" יש להוסיף 5 טילדות ולא 4.
    • בפרמטר "סוג" לרשום בדיוק את שמות הסוגים ולהפריד בין הסוגים אך ורק בנקודה-פסיק ורווח.
    • בפרמטר סבירות יש לרשום אך ורק אות אחת, ורק מבין האותיות א' עד ד'.
  • מיקום התבנית: יש לשים את התבנית בסוף הערך, אחרי כל התבניות האחרות והקטגוריות, מכיוון שזה המיקום של קישורי הבינוויקי, שלא נמצאים. אם יש בדף קישורי בינוויקי, אך לא לאנגלית, יש להוסיף את התבנית לפניהם‏‏[3]. אם יש בדף קישור בינוויקי תקין לאנגלית, יש להסיר את התבנית.

כל מופע תבנית שלא מתאים לכללים יש לשנות בהתאם.

רשימות

סיווג

הדפים השונים שנבדקו והתגלה כי אין להם בינוויקי מסווגים לסוגים שונים על מנת שאחרי "תקופת הצינון" ימצאו ברשימות שונות ויקלו על העורכים לגשת אל הדפים בתחום עיסוקם. בינתיים הסיווג נעשה ידנית באמצעות תבנית "אין בינוויקי", כאמור בפרק "שימוש בתבנית אין בינוויקי", אך יש תכנון לאפשר סיווג אוטומטי על בסיס עץ הקטגוריות של ויקי, מה שגם יאפשר לסווג את הדפים עוד לפני שנעשה חיפוש בינוויקי מתאים בשבילם.

רשימת הסוגים.

דפים לא מסווגים

כאן מופיעים דפים לא מסווגים (מסווגים בסוג "אחר"). ביניהם:

  • דפים חדשים שאין להם לא קישור בינוויקי ולא תבנית {{אין בינוויקי}} - רוב הדפים בהם מטפל מיזם זה.
  • דפים שיש להם תבנית {{אין בינוויקי}} ללא ציון סוג, שעברה "תקופת הצינון" שלהם, או עם שגיאה.
  • דפים שהוכנסו בכוונה לסוג "אחר". למשל תימא (כתב עת) שייך ל"ישראל - עיתונות", אבל מכיוון שתחום העיסוק של כתב העת הזה צר מאד (יהדות תימן), הוא עלול ללכת לאיבוד שם. אם מישהו הכניס את המאמר בכוונה לסוג "אחר", כנראה שרצוי להשאיר אותו שם, אבל אפשר להוסיף סוגים נוספים.

רשימת דפים לא מסווגים לפי א"ב.

דפים שאינם ערכים

דפי קטגוריות ודפי פירושונים ופורטלים - רצוי להוסיף גם אליהם קישורי בינוויקי מתאימים ואם אי אפשר למצוא כאלה, ניתן לסווג אותם כמו הערכים, למשל, קטגוריה:יחידות צה"ל מעוטרות בהחלט ניתן לסווג תחת "צה"ל".

  • רשימת קטגוריות ללא בינוויקי
    הערה: יש לקשר דפי קטגוריה רק לדפי קטגוריה בוויקיפדיהות זרות. ישנה טעות נפוצה - לקשר בין דפי קטגוריה לבין ערכים או רשימות בנושא דומה בוויקיפדיה זרה.
  • רשימת דפי פירושונים ללא בינוויקי
    הערה: ישנם דפי פירושונים שאין סיכוי שיהיו נחוצים בשפות זרות, כי מדובר במלים בעלות כתיב זהה שרלוונטי רק לעברית. נא לסמן אותם כך:
    {{אין בינוויקי|תאריך=~~~~~|סוג=פירושונים רק בעברית|סבירות=ד}}
  • רשימת פורטלים ללא בינוויקי
    הערה: לעיתים בוויקיפדיה זרה יש דף מקביל בתוכנו ובייעודו לפורטל בעברית, אך לא במרחב "פורטל". יש להפעיל שיקול דעת בכל מקרה ומקרה ולדון בדף שיחה.

פרטים טכניים על הסקריפט

תוכנה נפרדת לחיפוש של דפים ללא בינוויקי נחוצה מכמה סיבות:

  • הדף המיוחד Special:WithoutInterwiki מוגבל מסיבות טכניות רק לכמה אלפי רשומות, בעוד שבפועל יש הרבה יותר דפים כאלה.
  • גם אם הדף המיוחד הזה לא היה מוגבל, הוא מציג את הדפים לפי הא"ב ולא לפי סוגים. (מהסיבה הזו גם לא ניתן להשתמש בדאמפ של טבלת langlinks).
  • התוכנה יודעת גם לחפש מקרים של קישורים בעייתיים, כגון איות בעייתי, קישורים כפולים וקישורים עם תווי יוניקוד לא תקינים.

התוכנה לחיפוש וסיווג של חסרי בינוויקי מבוססת על קוד שכתבו Costello ו־Felagund. המידע נשאב לא מוויקיפדיה כפי שהיא באותו רגע אלא מ־dump שניתן להוריד מ־download.wikimedia.org.

לא מתבצעת העלאה אוטומטית של הרשימה המוכנה לוויקיפדיה. זה לא בוט, כי בתהליך הזה לא נעשה שום שינוי בוויקיפדיה בלי שמופעל שיקול דעת של עורך.

התוכנה כתובה ב־Perl. ומופצת כתוכנה חופשית (מה שמכונה same as Perl itself - ליתר דיוק GPL 3 ו-Artistic 2). קישורים לקוד המקור מופיעים בסוף הדף הזה.

בעיות והצעות לשיפור

בתהליך העבודה ובסקריפט שעושה אותה יש בעיות ומגבלות ידועות. כמו בכל נושא אחר - הצעות והערות יתקבלו בברכה.

לתיקון ממש בקרוב

  • תצוגה יפה של סטטיסטיקות פשוטות

לתיקון די בקרוב

  • דפים רגילים מסווגים לפעמים כפירושונים (עדיין?)
  • להמשיך להוריד את המעמד המיוחד של הקישורים לאנגלית
  • לשפר את התצוגה של רשימות קישורים מרובים לדף לועזי אחד:
    • להסדיר כיווניות בשמות דפים לועזיים (dir=ltr).
    • לנסות דאוג שכל דף בעברית יופיע ברשימה רק פעם אחת. (מעצבן למחוק אותו כמה פעמים אחרי שהוא טופל.)
    • רעיונות נוספים יתקבלו בברכה.

סטטיסטיקות שצריך להוסיף

(חלק מהסעיפים הבאים כבר נספרים, כלומר יש קוד שמחשב אותם, אבל עוד אין תצוגה יפה של הדברים.)

  • כמה דפים חסרי בינוויקי יש (נספר) ומה הוא אחוזם מסך כל הערכים (ייספר); התפלגות לפי מרחבי שם (נספר; בעקבות שאלה של טוסברהינדי)
    • כמה דפים יש ללא בינוויקי וללא תבנית. (נספר)
    • כמה דפים יש ללא בינוויקי ועם תבנית. (נספר)
    • כמה דפים יש עם בינוויקי ועם תבנית.
  • כמה דפים יש בכל סוג. (נספר)
  • כמה דפים ללא בינוויקי נוספו מאז ההרצה האחרונה. (ייספר)
  • לכמה דפים נוספו קישורי בינוויקי מאז ההרצה האחרונה. (ייספר, מסובך. - לא מסובך, ניתן לחשב על פי 2 נתונים אחרים שנספרים: [מספר הדפים חסרי הבינוויקי שנוספו] פחות [שינוי במספר דפים חסרי בינוויקי])
    • לכמה דפים עם תבנית נוספו קישורי בינוויקי מאז ההרצה האחרונה (ייספר, מסובך.)
    • לכמה דפים ללא התבנית נוספו קישורי בינוויקי מאז ההרצה האחרונה (ייספר, מסובך.)
  • לכמה דפים נוספה התבנית מאז ההרצה האחרונה (ייספר, מסובך.)
  • לאיזה דף יש הכי הרבה קישורי בינוויקי, סתם בשביל הסקרנות (נספר) (בעקבות שאלה של טוסברהינדי)
  • (יש לכם רעיונות נוספים לסטטיסטיקות? כתבו אותם כאן!)

חיפוש אוטומטי של דף שאפשר לנחש מה יהיה שמו הלועזי

יש ערכים בעברית שאין להם עדיין בינוויקי, אבל ברור שיום אחד הוא ייכתב, וגם ברור איך יקראו לו באנגלית. דוגמא: זוהר פרסקו. הרעיון: לשים בו תבנית שתראה נגיד כך:

  • {{אין בינוויקי|תאריך=00:25, 13 ביולי 2008 (IDT)|סוג=ישראל - מוזיקה|אנגלית=Zohar Fresco}}.

בוט יחפש את הערך בוויקיפדיה האנגלית כל כמה זמן. (רעיון של איתמר ק..)

לא דחוף

  • התחשבות ב"מיון רגיל" לצורך מיון.

לשקול בכובד ראש ובזהירות

ייבחן כששיטת ה"סוגים" תתייצב

  • לא מתבצעת העלאה אוטומטית של רשימות הקישורים לוויקיפדיה.
  • לחשוב על דרך לדרג סבירות כתיבת ערך מקביל של ערך עברי בוויקיפדיה זרה, זאת על מנת לשחק באורך "תקופת הצינון" ולסמן ערכים שבטוח לא יהיו זקוקים לבינוויקי, על מנת שלא יחזרו עוד לרשימה (למשל פירושונים של הומוגרפים שקיימים רק בעברית).
  • מחיקה אוטומטית של תבנית "אין בינוויקי" מערכים שכבר יש להם קישור לאנגלית.

קשרי חוץ

לשימוש טכני

כלים

ניתן למצוא את הקוד של הסקריפט לחיפוש דפים ללא בינוויקי ועם בינוויקי בעייתי באתר הזה:

הקוד הזה נמצא תחת הספריה /trunk/no-interwiki. כדי לראות הוראות הרצה יש להוריד את כל הקבצים מהספריה ולהריץ את הפקודה הבאה:

perldoc prepare_noiw_list.pl

יש תכנון להפוך את ההתקנה לנוחה יותר.

הערות שוליים

  1. ^ אם הדבר אפשרי, בשלב הזה כדאי לנסות להפעיל שיקול דעת ולבדוק את המאמרים בוויקיפדיות הזרות, מכיוון שקורה שחלה טעות בהוספת קישורים לשפות אחרות.
  2. ^ אם כי יש לציין שאמיר, מובילו של המיזם, עושה זאת מדי פעם מתוך סקרנות, ומגלה לעתים קרובות, שוויקיפדיה העברית לא רעה בכלל בהשוואה לאחיותיה.
  3. ^ 1 2 ‏לאנגלית יש בינתיים מעמד מיוחד בגלל מגבלות טכניות והיסטוריות; על פי התיכנון, בעתיד יהיה טיפול נאות גם בקישורים לשפות אחרות