שלום אמיר,
בדקות האחרונות ערכתי את הערך כמאל א-דין חוסיין. מספר פעמים בעריכתי מצאתי בתקציר העריכה את הכיתוב "תו כיווניות מפורש", למשל, בעריכה האחרונה שלי שם. מה פשר ההערה, ובאיזה תו כיווניות מדובר? לא ראיתי שהוספתי משהו מיוחד.
תודה מראש.
שלום אמיר,
בדקות האחרונות ערכתי את הערך כמאל א-דין חוסיין. מספר פעמים בעריכתי מצאתי בתקציר העריכה את הכיתוב "תו כיווניות מפורש", למשל, בעריכה האחרונה שלי שם. מה פשר ההערה, ובאיזה תו כיווניות מדובר? לא ראיתי שהוספתי משהו מיוחד.
תודה מראש.
או שלא הוספת את זה בכלל וזה היה שם עוד לפניך ופשוט נכנס ליומן, או שהוספת את זה בגלל איזה פיצ׳ר נסתר של הדפדפן שלך או מעבד התמלילים שלך (אם השתמשת במעבד תמלילים בשביל עריכה; אתה אולי לא עושה את זה, אבל יש אנשים שכן).
זה תג שהוספתי לא מזמן לצורך מעקב אחרי תווי הכיווניות, שמופיעים בהמון ערכים. חלקם לא נחוצים בכלל וצריך למחוק אותם, ואת אלה שכן נחוצים צריך בדרך־כלל להחליף בתבנית {{כ}}. ערן לאט־לאט מוחק כאלה שבוודאות לא נחוצים באמצעות בוט, אבל יש כאלה שצריך לטפל בהם ידנית.
אתה לא צריך לעשות עם זה שום דבר, אבל אם ממש מתחשק לך להתעסק בפינות אפלות של יוניקוד, אני יכול להדריך אותך איך תוכל לעזור לי לנקות את התווים האלה :)
לידע כללי, אפשר למצוא מידע בסיסי על כל התגים שמופיעים בתקצירי העריכה בדף מיוחד:תגיות.
תודה רבה.
האמת היא שיש לי לא מעט עניינים על סדר היום כרגע (כולל עניינים ויקיפדיים), אז זה ייאלץ להידחות, לפחות בשלב הזה. אבל כן אתעמק בעניין בהמשך, ואקרא גם את הכתוב בדף המיוחד תגיות. תודה על תשובתך המפורטת. אני מניח שאחזור אליך בעניין הנוכחי, כשאתפנה. :)
ההידד מגיע בעיקר לערן! :)
האם זה בכל המרחבים? במרחבי שיחה יש המון תווי כיווניות שאנשים מוסיפים לחתימות שלהם, אבל גם אין צורך להתאמץ למחוק את זה מדפי השיחה הקיימים. (גם את תופעת תווי הכיווניות בחתימות רצוי להפסיק, אבל אטפל בזה לחוד.)
בעצם, עכשיו שאני חושב על זה, יש לך אולי רשימה מוכנה שאומרת כמה פעמים הוא מופיע בכל ערך?
הרשימה מופיעה כאן: https://tools.wmflabs.org/checkwiki/cgi-bin/checkwiki.cgi?project=hewiki&view=only&id=16 אני חושב (לא בטוח), שהמספר הזה של 200E כלומר lrm ולא rlm (כלומר "D" ולא "כ")
נדמה לי שזה אפילו יותר תווי יוניקוד סמויים, כלומר גם PDF, ZWNJ ועוד דברים הזויים כאלה.
אבל הבוט עשה יותר מ4000 עריכות, אז אני לא בטוח שRLM ברשימה. (כל עריכה היא בערך נפרד, לא במופע נפרד)
ובכן, זה ירד שוב, הפעם ל-878 בלבד. זאת התקדמות ענק. אמיר, וערן. ואולי כבר תענו לי?
תודה על העדכון. 878 זה שוב בזכות ערן. מכאן והלאה זה כנראה יהיה קשה יותר, כי כנראה כבר מיציתי את כל התופעות שאפשר לעשות עם בוט. אבל אולי עוד אמצא משהו.
FEFF זה ZERO WIDTH NO-BREAK SPACE. נחוץ בשפות מסוימות, נדמה לי שבפרסית למשל. לא אמור להיות נחוץ בעברית, אלא אם מדובר בציטוט מאחת מהשפות האלה.
PUA זה בכלל תווים אזוטריים שבהגדרה אינם חלק מיוניקוד. צריך לראות במה מדובר בדיוק דף־דף.
אבוי, הקישור הזה מספק לי תעסוקה מעניינת מדי! כל PUA כזה זה משהו אחר, וזה נורא כיף וממכר!
ויש לי עבודה וילד!!! :)
חייב
להגביל
את
עצמי
לא
לגמור
הכול
ביום
אחד
אבוי.
פעם אות יוונית שהשתבשה בהעתקה, פעם קו מפריד שהשתבש בהעתקה, פעם סתם משהו מיותר.
(לפחות בחלק מהמקרים במקום „השתבש” כנראה נכון יותר לומר „שובש על־די מיקרוסופט וורד” או משהו כזה.)
עוד שאלה. ראה מיוחד:הבדלים/19278303 אם תצליח להסביר לי מה קרה שם, וזאת תופעה רחבה, אשמח מאוד.