ויקיפדיה:דפים ללא בינוויקי/ארכיון 1 – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
תאריך דאמפ
שורה 127: שורה 127:


=== לתיקון ממש בקרוב ===
=== לתיקון ממש בקרוב ===
* להחליף את rlm ב{{תב|כ}}
* האות הגרמנית [[ß]] לא אמורה להיות מזוהה כאות קטנה לצורך חיפוש קישורים עם איות לא מדויק.
* האות הגרמנית [[ß]] לא אמורה להיות מזוהה כאות קטנה לצורך חיפוש קישורים עם איות לא מדויק.
* להוציא פסקאות (#) מקישורים עם מספרי תווים
* להוציא פסקאות (#) מקישורים עם מספרי תווים
שורה 174: שורה 173:
* √ הדפים עלולים להיות ארוכים מאד - ויש לחלק אותם לדפי משנה בגודל סביר באופן אוטומטי.
* √ הדפים עלולים להיות ארוכים מאד - ויש לחלק אותם לדפי משנה בגודל סביר באופן אוטומטי.
* √ שם מרחב השמות לא זוהה נכון במקרים מסוימים - [http://rt.cpan.org/Ticket/Display.html?id=36255 באג בחבילת Parse::MediaWikiDump], התגלה ותוקן בזכות המיזם הזה.
* √ שם מרחב השמות לא זוהה נכון במקרים מסוימים - [http://rt.cpan.org/Ticket/Display.html?id=36255 באג בחבילת Parse::MediaWikiDump], התגלה ותוקן בזכות המיזם הזה.
* להחליף את rlm ב{{תב|כ}}


==קשרי חוץ==
==קשרי חוץ==

גרסה מ־14:04, 24 ביולי 2008

מיזם דפים ללא בינוויקי

מעבר מהיר

דפים מסווגים | דפים לא מסווגים

קטגוריות | פירושונים | קישורים עם בעיות טכניות

Information in English

עדכון מלא אחרון: כ"ז בסיוון ה'תשס"ח - 30 ביוני 2008

מטרת מיזם זה היא לצמצם את מספר הדפים, ובמיוחד הערכים, נטולי קישורי בינוויקי מתאימים לוויקיפדיות בשפות זרות וכן לתקן קישורים קיימים שיש בהם שגיאות. בסיס המיזם, מלבד כמובן העורכים והוויקיפדיות הזרות, הוא הרשימות של חסרי הבינוויקי ותבנית {{אין בינוויקי}} באמצעותה ניתן לסמן דפים שלא נמצא עבורם בינוויקי מתאים, כדי שיצאו מהרשימה ל"תקופת צינון" על מנת לחסוך מהעורכים השונים לבדוק הימצאותו של בינוויקי כמה פעמים בתאריכים קרובים.

מטרה ודרך פעולה

חסרי הבינוויקי ממוינים ברשימות שונות כך שניתן לעבור על סוגים שונים של דפים שאין להם בינוויקי. מה אפשר לעשות עם הרשימה:

  • אם יש בוויקיפדיה זרה דף מקביל:
    • הוסיפו לדף בעברית קישור לדף הזר. אם אפשר, העתיקו את רשימת הבינוויקי במלואה מהדף הזר והוסיפו את אנגלית במקום הראשון[1].
    • הוסיפו לדף הזר קישור לדף בעברית. אין צורך לעבור על כל הוויקיפדיות הזרות ולהוסיף קישורים לעברית, כי בוטים ישלימו את העבודה הזו[2].
    • מחקו את הדף מהרשימה המתאימה.
    • אם מצאתם את הדף המקביל בוויקיפדיה האנגלית ובדף בעברית מופיעה תבנית {{אין בינוויקי}} - מחקו את התבנית[3]. אין למחוק את התבנית אם יש בדף קישור לשפה שאינה אנגלית (en).

הערות:

  • לעתים, העובדה שאין לערך קישור בינוויקי יכולה להצביע על כך שהנושא בו עוסק הערך לא ראוי לערך עצמאי. בהתאם למצב ניתן לשקול לפתוח דיון בדף השיחה בנושא איחוד הערך עם ערך אחר (ראו ויקיפדיה:מדיניות איחוד ערכים) או להוסיף תבנית {{חשיבות}} אם חשיבותו לא ברורה מתוכן הערך. ייתכן גם שלערך חסר בינוויקי מכיוון שהוא ערך חדש יחסית או שלא עברו עליו די עורכים, במקרה זה ייתכן שהוא ידרוש טיפול מיוחד, ראו ויקיפדיה:מאמרים שנערכו מעט. אולם, שימו לב שאין העובדה שחסרים קישורי בינוויקי מצביעה בהכרח על בעיה כלשהי בערך או בנושאו.
  • אם נושא הערך נדון בוויקיפדיה האנגלית בצורה שונה מהעברית ואי אפשר למצוא ערך מקביל בצורה מדויקת, השתמשו בשיקול דעת: ניתן לקשר בבינוויקי למרות ההבדל, אם הדבר יועיל לקוראים. כמו כן, אם נראה לכם שהדבר יתרום לשיפור הוויקיפידה העברית, היו נועזים ועשו שינויים מבניים אצלנו או באנגלית, אך עם זאת, לא צריך לצאת מהכלים רק כדי לקרב את ויקיפדיה העברית לאחותה האנגלית.
  • דפים שיש ביניהם קישור בין-לשוני צריכים לדון על אותו נושא. אנא השתדלו לשמור על מצב שבו בין שני ערכים קיים רק קישור אחד ושלא יהיה מצב ששני ערכים בשפה א' מקשרים לערך אחד בשפה ב'. זה מבלבל הן את הקוראים והן את הבוטים שמתקנים קישורים (ראו דף עזרה בנושא זה באנגלית, רשימת דפים בעלי קישורים לדפים לועזיים שונים ורשימת דפים לועזיים בעלי יותר מקישור בינוויקי אחד לעברית).

מה לכתוב בתקציר עריכה

מומלץ להשתמש בתקצירי העריכה הבאים:

בוויקיפדיה העברית:

אין בינוויקי סיווג דפים ללא בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]
הוספת בינוויקי הוספת קישורי בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]
תיקון קישורי בינוויקי קיימים תיקון קישורי בינוויקי - [[ויקיפדיה:דפים ללא בינוויקי|בואו לעזור!]]

כשמוסיפים לדפים בוויקיפדיות זרות קישורים לעברית מומלצים התקצירים הבאים:

אנגלית
adding interlanguage link - he. [[WP:WPIW/HE|You can help!]]
רוסית
интервики - иврит. [[ВП:П:ИНТЕР|Вы можете нам помочь!]]
צרפתית
ajouté iw he. [[:he:ויקיפדיה:דפים ללא בינוויקי|Parlez-vous l'hébreu ? Pouvez aider ! יודעים עברית? בואו לעזור]]
ספרדית
añadí interwikis. [[:he:ויקיפדיה:דפים ללא בינוויקי|¿Ud. sabe hebreo? ¡Ud. puede ayudarnos ! יודעים עברית? בואו לעזור]]
איטלקית
ho aggiunto interwiki. [[:he:ויקיפדיה:דפים ללא בינוויקי|Parla ebraico? Può aiutarci ! יודעים עברית? בואו לעזור]]
קטלאנית
he afegit interwiki a l'hebreu. [[:he:ויקיפדיה:דפים ללא בינוויקי|Saps l'hebreu? Pots ajudar-nos ! יודעים עברית? בואו לעזור]]

(אפשר להוסיף עוד שפות, ולתקן את הקיימות.)

שימוש בתבנית אין בינוויקי

השימוש בתבנית:אין בינוויקי: {{אין בינוויקי|תאריך=~~~~~|סוג=סוג/ים מסוימים|סבירות=א-ד}}

פרמטרים

  • תאריך - חמשת הטילדות יתורגמו לתאריך של היום עם שמירת הדף, מאפשר לבוט לדעת מתי נעשה חיפוש ולא נמצא בינוויקי מתאים.
  • סוג - יש לבחור סוג מסוים, או כמה סוגים, מרשימת הסוגים. כאשר בוחרים בכמה סוגים יש להפרידם על ידי נקודה-פסיק ורווח. ציון סוג מאפשר לבוט להכניס את הדף לרשימה של דפים חסרי בינוויקי באותו נושא. ההכנסה נעשית עם הרצת הבוט הראשונה בתום "תקופת הצינון". חלוקה זו של חסרי-הבינוויקי עוזרת לעורכים המעוניינים לחפש בינוויקי לערכים בתחום מסוים בלבד. קיים תכנון לתת לבוט יכולת לסווג את הדפים על פי הקטגוריות בהן הם מקוטלגים, דבר שיוריד את הצורך בפרמטר זה. בינתיים יש להשתמש בפרמטר זה ולמלא אותו כדרוש.
  • סבירות - פרמטר זה מציין את הסבירות שערך מקביל ייכתב בוויקי זרה ויִימצא קישור בינוויקי הולם. הרמות הן: "א" - סבירות גבוהה, "ב" - סבירות בינונית, "ג" - סבירות נמוכה, ו-"ד" מוסיפים כאשר ידוע שלא יימצא קישור הולם, כמו שקורה רבות בדפי פירושונים בהם ניתן להוסיף כמה קישורי בינוויקי שונים לכל שפה ולכן עדיף כלל לא להוסיף קישורים. הוספת פרמטר "סבירות" מאפשרת לתת לדפים השונים "תקופות צינון" שונות, כאשר ככל שהסבירות גבוהה יותר כך "תקופת הצינון" מתקצרת. דפים עם סבירות "ד" לא יכנסו לרשימות הרגילות אלא לרשימה מיוחדת אחת, על מנת לאפשר מעקב אחריהם ולהבטיח שרק הדפים המתאימים סומנו כך. ההכנסה לרשימה תעשה עם הרצת הבוט הראשונה אחרי הוספת התבנית (או שינוי הסבירות ל-"ד"), ללא שום תקופת צינון. ייתכן כי הרשימה גם תתחלק לסוגים.

דוגמה לשימוש בתבנית: {{אין בינוויקי|תאריך=~~~~~|סוג=חברי כנסת; רבנים; ישראל - חינוך|סבירות=א}}

כללים חשובים

  • יש להוסיף את שמות כל הפרמטרים ולמלא כל אחד מהם.
    • בפרמטר "תאריך" יש להוסיף 5 טילדות ולא 4.
    • בפרמטר "סוג" לרשום בדיוק את שמות הסוגים ולהפריד בין הסוגים אך ורק בנקודה-פסיק ורווח.
    • בפרמטר סבירות יש לרשום אך ורק אות אחת, ורק מבין האותיות א' עד ד'.
  • מיקום התבנית: יש לשים את התבנית בסוף הערך, אחרי כל התבניות האחרות והקטגוריות, מכיוון שזה המיקום של קישורי הבינוויקי, שלא נמצאים. אם יש בדף קישורי בינוויקי, אך לא לאנגלית, יש להוסיף את התבנית לפניהם‏‏[3]. אם יש בדף קישור בינוויקי תקין לאנגלית, יש להסיר את התבנית.

כל מופע תבנית שלא מתאים לכללים יש לשנות בהתאם.

רשימות

סיווג

הדפים השונים שנבדקו והתגלה כי אין להם בינוויקי מסווגים לסוגים שונים על מנת שאחרי "תקופת הצינון" ימצאו ברשימות שונות ויקלו על העורכים לגשת אל הדפים בתחום עיסוקם. בינתיים הסיווג נעשה ידנית באמצעות תבנית "אין בינוויקי", כאמור בפרק "שימוש בתבנית אין בינוויקי", אך יש תכנון לאפשר סיווג אוטומטי על בסיס עץ הקטגוריות של ויקי, מה שגם יאפשר לסווג את הדפים עוד לפני שנעשה חיפוש בינוויקי מתאים בשבילם.

רשימת הסוגים.

דפים לא מסווגים

כאן מופיעים דפים לא מסווגים (מסווגים בסוג "אחר"). ביניהם:

  • דפים חדשים שאין להם לא קישור בינוויקי ולא תבנית {{אין בינוויקי}} - רוב הדפים בהם מטפל מיזם זה.
  • דפים שיש להם תבנית {{אין בינוויקי}} ללא ציון סוג, שעברה "תקופת הצינון" שלהם, או עם שגיאה.
  • דפים שהוכנסו בכוונה לסוג "אחר". למשל תימא (כתב עת) שייך ל"ישראל - עיתונות", אבל מכיוון שתחום העיסוק של כתב העת הזה צר מאד (יהדות תימן), הוא עלול ללכת לאיבוד שם. אם מישהו הכניס את המאמר בכוונה לסוג "אחר", כנראה שרצוי להשאיר אותו שם, אבל אפשר להוסיף סוגים נוספים.

רשימת דפים לא מסווגים לפי א"ב.

קטגוריות ופירושונים

קטגוריות ופירושונים - ניתן לסווג אותם כמו הערכים, למשל, קטגוריה:יחידות צה"ל מעוטרות בהחלט ניתן לסווג תחת "צה"ל".

הערות על פירושונים:

  1. בגלל באג בתוכנת החיפוש הרשימה עשויה לכלול גם ערכים שאינם פירושונים ממש. הבעיות יתוקנו בקרוב.
  2. ישנם דפי פירושונים שאין סיכוי שיהיו נחוצים בשפות זרות, כי מדובר במלים בעלות כתיב זהה שרלוונטי רק לעברית. נא לסמן אותם כך:
    {{אין בינוויקי|תאריך=~~~~~|סוג=פירושונים רק בעברית|סבירות=ד}}

פרטים טכניים על הסקריפט

תוכנה נפרדת לחיפוש של דפים ללא בינוויקי נחוצה מכמה סיבות:

  • הדף המיוחד Special:WithoutInterwiki מוגבל מסיבות טכניות רק לכמה אלפי רשומות, בעוד שבפועל יש הרבה יותר דפים כאלה.
  • גם אם הדף המיוחד הזה לא היה מוגבל, הוא מציג את הדפים לפי הא"ב ולא לפי סוגים. (מהסיבה הזו גם לא ניתן להשתמש בדאמפ של טבלת langlinks).
  • התוכנה יודעת גם לחפש מקרים של קישורים בעייתיים, כגון איות בעייתי, קישורים כפולים וקישורים עם תווי יוניקוד לא תקינים.

התוכנה לחיפוש וסיווג של חסרי בינוויקי מבוססת על קוד שכתבו Costello ו־Felagund. המידע נשאב לא מוויקיפדיה כפי שהיא באותו רגע אלא מ־dump שניתן להוריד מ־download.wikimedia.org.

לא מתבצעת העלאה אוטומטית של הרשימה המוכנה לוויקיפדיה. זה לא בוט, כי בתהליך הזה לא נעשה שום שינוי בוויקיפדיה בלי שמופעל שיקול דעת של עורך.

התוכנה כתובה ב־Perl. ומופצת כתוכנה חופשית (same as Perl itself). קישורים לקוד המקור מופיעים בסוף הדף הזה.

בעיות והצעות לשיפור

בתהליך העבודה ובסקריפט שעושה אותה יש בעיות ומגבלות ידועות. כמו בכל נושא אחר - הצעות והערות יתקבלו בברכה.

לתיקון ממש בקרוב

  • האות הגרמנית ß לא אמורה להיות מזוהה כאות קטנה לצורך חיפוש קישורים עם איות לא מדויק.
  • להוציא פסקאות (#) מקישורים עם מספרי תווים

לתיקון די בקרוב

  • דפים רגילים מסווגים לפעמים כפירושונים (עדיין?)
  • לשפר את התצוגה של רשימות קישורים מרובים לדף לועזי אחד:
    • להסדיר כיווניות בשמות דפים לועזיים (dir=ltr).
    • רעיונות נוספים יתקבלו בברכה.

סטטיסטיקות

  • כמה דפים חסרי בינוויקי יש ומה הוא אחוזם מסך כל הערכים
    • כמה דפים יש ללא בינוויקי וללא תבנית.
    • כמה דפים יש ללא בינוויקי ועם תבנית.
  • כמה דפים יש בכל סוג.
  • כמה דפים ללא בינוויקי נוספו מאז ההרצה האחרונה.
  • לכמה דפים נוספו קישורי בינוויקי מאז ההרצה האחרונה.
    • לכמה דפים עם תבנית נוספו קישורי בינוויקי מאז ההרצה האחרונה
    • לכמה דפים ללא התבנית נוספו קישורי בינוויקי מאז ההרצה האחרונה
  • לכמה דפים נוספה התבנית מאז ההרצה האחרונה
  • לאיזה דף יש הכי הרבה קישורי בינוויקי (סתם בשביל הסקרנות)
  • (יש לכם רעיונות נוספים לסטטיסטיקות? כתבו אותם כאן!)

חיפוש אוטומטי של דף שאפשר לנחש מה יהיה שמו הלועזי

יש ערכים בעברית שאין להם עדיין בינוויקי, אבל ברור שיום אחד הוא ייכתב, וגם ברור איך יקראו לו באנגלית. דוגמא: זוהר פרסקו. הרעיון: לשים בו תבנית שתראה נגיד כך: {{אין בינוויקי|תאריך=00:25, 13 ביולי 2008 (IDT)|סוג=ישראל - מוזיקה|אנגלית=Zohar Fresco}}. בוט יחפש את הערך בוויקיפדיה האנגלית כל כמה זמן. (רעיון של איתמר ק..)

לא דחוף

  • התחשבות ב"מיון רגיל" לצורך מיון.

לשקול בכובד ראש ובזהירות

ייבחן כששיטת ה"סוגים" תתייצב

  • לא מתבצעת העלאה אוטומטית של רשימות הקישורים לוויקיפדיה.
  • לחשוב על דרך לדרג סבירות כתיבת ערך מקביל של ערך עברי בוויקיפדיה זרה, זאת על מנת לשחק באורך "תקופת הצינון" ולסמן ערכים שבטוח לא יהיו זקוקים לבינוויקי, על מנת שלא יחזרו עוד לרשימה (למשל פירושונים של הומוגרפים שקיימים רק בעברית).
  • מחיקה אוטומטית של תבנית "אין בינוויקי" מערכים שכבר יש להם קישור לאנגלית.

תוקן

  • √ חלק מהדפים שאין להם שום קישור בינוויקי לא מופיעים ברשימה.
  • √ התייחסות מיוחדת לקטגוריות ופירושונים.
  • √ בתוך רשימת קישורים שמתחילים באותה אות צריך מיון לפי א"ב.
  • √ חלוקה אוטומטית לדפים.
  • √ תיקון של "בינויקי" ל"בינוויקי" בכל מקום שיהיה הגיוני ושלא ידרוש בזבוז יותר מדי זמן ומשאבים.
  • √ הקטגוריות לא נכתבות אוטומטית כקישור (עם :).
  • √ מיון קטגוריות לפי השם ולא דחיפה של הכל תחת ק'. (זה טיפ-טיפה יותר מורכב מכמה שזה נשמע.)
  • √ הדפים עלולים להיות ארוכים מאד - ויש לחלק אותם לדפי משנה בגודל סביר באופן אוטומטי.
  • √ שם מרחב השמות לא זוהה נכון במקרים מסוימים - באג בחבילת Parse::MediaWikiDump, התגלה ותוקן בזכות המיזם הזה.
  • √ להחליף את rlm ב{{כ}}

קשרי חוץ

לשימוש טכני

הערות שוליים

  1. ^ אם הדבר אפשרי, בשלב הזה כדאי לנסות להפעיל שיקול דעת ולבדוק את המאמרים בוויקיפדיות הזרות, מכיוון שקורה שחלה טעות בהוספת קישורים לשפות אחרות.
  2. ^ אם כי יש לציין שאמיר, מובילו של המיזם, עושה זאת מדי פעם מתוך סקרנות, ומגלה לעתים קרובות, שוויקיפדיה העברית לא רעה בכלל בהשוואה לאחיותיה.
  3. ^ 1 2 ‏לאנגלית יש בינתיים מעמד מיוחד בגלל מגבלות טכניות והיסטוריות; על פי התיכנון, בעתיד יהיה טיפול נאות גם בקישורים לשפות אחרות