עברית באינטרנט

מתוך ויקיפדיה, האנציקלופדיה החופשית

העברית, כשפה הנכתבת מימין לשמאל, הייתה חריגה בשנים הראשונות לקיומו של האינטרנט, שהתפתח בשפות הנכתבות משמאל לימין, ובפרט אנגלית. כתוצאה מכך ניתנו שני פתרונות להצגתם של טקסטים עבריים בדפדפן, עברית ויזואלית (או "עברית חזותית") ועברית לוגית (או "עברית משתמעת").

עברית ויזואלית[עריכת קוד מקור | עריכה]

הפתרון הראשון שניתן היה עברית ויזואלית. פתרון זה היה אלתור שבא לתת מענה לבעיית השפה העברית בדפדפן בלי להעסיק בכך את מפתחי הדפדפנים הראשונים. בפתרון זה נכתב הטקסט העברי שנועד להצגה בדפדפן משמאל לימין, והצגתו נעשתה באמצעות גופן מיוחד שפותח למטרה זו. אף שמבחינת מערכת ההפעלה אופיין גופן זה כגופן לטיני (כזה הנכתב משמאל לימין), אותיותיו היו עבריות, והטקסט העברי הוצג כמקובל מימין לשמאל. משתמשי הדפדפנים באותה עת התבקשו להתקין גופן זה במערכת ההפעלה שלהם.

פתרון זה פותח באוניברסיטה העברית בירושלים, על ידי דודו רשתי[1], ולאחר מכן פותחו שני גופנים עבריים נוספים למטרה זו. אתרים עבריים שנבנו עד סוף שנות ה-90 השתמשו כולם בפתרון זה, ובאתרים עבריים ותיקים הוא נמצא עד היום. כפתרון מאולתר, יש בפתרון זה בעיות אחדות:

  • גודל שורה קבוע וחוסר האפשרות של גלישת שורות. בשינוי גודל המסך, הטקסט לא הסתדר מחדש.
  • הדפדפן מתייחס לטקסט העברי כאל טקסט לטיני, ולכן כשהוא מחליט שיש לפצל שורה לשתי שורות, סדר השורות מתהפך.
  • פיתוח יישומי דפדפן (להבדיל מהצגת דפים סטטיים) אינו נוח.
  • לא ניתן להשתמש בכל הגופנים העבריים של מערכת ההפעלה, אלא רק בגופן אחד, אותו גופן שהמשתמש התקין במחשבו.
  • הצורך בהתקנה מיוחדת של גופן יצר בעיה למשתמשים מתחילים.
  • העתקת טקסט עברי ממעבד תמלילים לדפדפן ולהפך הצריכה היפוך של הטקסט באמצעות תוכנה מיוחדת.
  • חוסר תמיכה בניקוד.

עברית לוגית[עריכת קוד מקור | עריכה]

כאשר חברת מיקרוסופט הצטרפה לשוק יצרני הדפדפנים, היא נתנה פתרון יסודי וטבעי לשפה העברית (ולכל יתר השפות הנכתבות מימין לשמאל), פתרון הקרוי "עברית לוגית", והוא הפך להיות תקן ב-HTML 4. במסגרת גיור תוכנה זה הותאם הדפדפן להכרה בשפות הנכתבות מימין לשמאל, וכתיבת דף HTML המכיל טקסט עברי נעשית, כמקובל בעברית, מימין לשמאל. פתרון זה פתר את כל הבעיות שבעברית הוויזואלית, והפך את העברית לשפה סטנדרטית באינטרנט.

חרף יתרונותיה הרבים של העברית הלוגית, כניסתה לאינטרנט העברי הייתה איטית, הן משום שאתרים מובילים כבר היו כתובים בעברית ויזואלית, והן משום שעברית לוגית נתמכה רק על ידי הדפדפן של מיקרוסופט, אינטרנט אקספלורר. השתלטותו של דפדפן זה על שוק הדפדפנים בעולם ובישראל הביאה למעבר הדרגתי של אתרים לעברית לוגית, ומתחילת המאה ה-21 מפותחים אתרים עבריים חדשים רק בעברית לוגית. מעבר של אתרים ותיקים מעברית ויזואלית לעברית לוגית נעשה באיטיות, עקב מאמץ ההסבה הכרוך בכך. האתר של עיתון "הארץ", למשל, עבר לעברית לוגית רק בתחילת 2004. אחד האתרים הבולטים שהשתמשו בעברית ויזואלית הוא אתר "סנונית"[2] (שבמסגרת הקמתו נוצרה העברית הוויזואלית).

העברית, לפי תקן יוניקוד, היא לוגית בלבד. לפיכך, דף אינטרנט עברי בקידוד UTF-8 (כמו כל ויקיפדיה העברית) יהיה בעברית לוגית. קידוד windows-1255, עברית של חלונות, גם הוא מתייחס לעברית לוגית, וכך גם iso-8859-8-i. רק iso-8859-8 (בלי i בסוף, ולפעמים עם e בסוף) הוא הדרך לציין שהעברית בדף היא ויזואלית.

גרסה 6.1 של הדפדפן "נטסקייפ נוויגייטור" הייתה הגרסה הראשונה של דפדפן זה שתמכה בעברית לוגית, ובכך נפתחה גישה לאתרים הבנויים בשיטה זו גם למשתמשים במערכות הפעלה שבהן "אינטרנט אקספלורר" אינו פועל. דפדפנים שפותחו בתקופות מאוחרות יותר כגון מוזילה פיירפוקס ואופרה תמכו בעברית לוגית מן היסוד. לצורך תאימות לאחור תומכים כל הדפדפנים גם בעברית ויזואלית (על שרת האינטרנט או דף האינטרנט לציין את הקידוד הנכון. כמו כן קורא הדף יכול לשנות בעצמו את הקידוד בו משתמש הדפדפן להצגת הדף במידת הצורך).

הבעיה בתקופה שלפני האינטרנט[עריכת קוד מקור | עריכה]

הסוגיה של עברית ויזואלית לעומת עברית לוגית, אף על פי שהיא מוצאת את ביטויה הבולט ביותר באינטרנט, אינה מוגבלת לאינטרנט בלבד, אלא כל ההיסטוריה של המחשוב העברי הושפעה ממנה. בתחילת ימי המחשוב העברי משלה העברית הוויזואלית בכיפה. בימי DOS שימשו העברית הוויזואלית והלוגית בערבוביה (למשל, מעבד התמלילים QText השתמש בעברית ויזואלית בעוד שמעבד התמלילים איינשטיין השתמש בעברית לוגית), ובמעבר לחלונות כולם עברו לעברית לוגית בשימוש היומיומי.

ליטון של עברית[עריכת קוד מקור | עריכה]

ערך מורחב – ליטון של עברית

עקב הבעיות הצצות לפעמים בכתיבת או קריאת עברית בקידוד בלתי מתואם בין משתמשים ועקב הצורך להתקין גופני עברית במחשב, משתמשים רבים החלו להשתמש באלפבית הלטיני לשם התכתבות בעברית באינטרנט. שימוש זה היה נפוץ בעיקר בהתכתבויות דואר אלקטרוני ובתוכנות מסרים מיידיים כגון ICQ בראשית דרכה. כתיבת העברית באותיות לטיניות מתרחשת באינטרנט בדרך כלל לא על פי תקן כלשהו אלא מוגדרת בצורה דינמית אד-הוק בין זוג משתמשים. קיימים תקנים רשמיים, אך אף אחד מהם אינו מוכר לכלל הציבור.

מערכת ההפעלה חלונות XP תמכה בשפות הנכתבות מימין לשמאל וכללה גופנים בעברית בכל הגרסאות שנמכרו ברחבי העולם. עובדה זו גרמה לירידה בצורך בכתיבת עברית באותיות לטיניות.

שמות מתחם בעברית[עריכת קוד מקור | עריכה]

כיום ניתן לרשום שמות מתחם גם בשפה העברית. שמות דומיין בעברית הם חלק מטכנולוגיית IDN (Internationalised Domain Name). פיתוח טכנולוגיה זו החל בשנת 1998 באוניברסיטת סינגפור. אוניברסיטת סינגפור הקימה את חברת i-DNS.net, על מנת להוציא לפועל את השימוש בטכנולוגיה. תהליך קידום השימוש בטכנולוגיה גבר, בשנים האחרונות, ברחבי העולם. הקידוד שהוסכם כסטנדרט עבור IDN's על ידי ארגון ה-IETF הוא ה–Punycode. השימוש ב–IDN תופס את מקומו כשירות נדרש עם העמקת אחוז החדירה של האינטרנט במדינות ששפתם המקומית שונה מאנגלית, והשפה נכתבת בהן משתמשת בשיטת כתיב שאינה לטינית. הטכנולוגיה הוטמעה בדפדפנים המובילים – על ידי חברת מיקרוסופט בדפדפן אינטרנט אקספלורר 7 ועל ידי מוזילה החל בדפדפן פיירפוקס 2.0. הטכנולוגיה הוטמעה גם בדפדפנים אחרים כגון דפדפן כרום של חברת גוגל, בספארי של אפל ואחרים.

כתובות אתרים בעברית מתאפשרים כחלק מתקן IDN. ניתן לרשום שמות דומיין במספר סיומות, ושמות דומיין בעברית אלו מחלקים ל-2 סוגים (המבוססים על אותה טכנולוגית - Punycode):

  1. שמות דומיין עם סיומת בעברית Full Idn לדוגמה: דומיין.קום
  2. שמות דומיין בעברית עם סיומת באנגלית Hybrid Idn לדוגמה: דומיין.com

נכון לשנת 2011 אין ברשת האינטרנט שימוש בסיומות מתחמים בעברית (Full IDN) למעט מתחמי בדיקות של ICANN, והשימוש בשמות מתחם עבריים בעלי סיומות באנגלית (Hybrid IDN) מוגבל למספר סיומות בלבד, חלק מהסיומות של ישראל[3] נכללות בהן. כמו כן, מאחר שטרם נמצא פתרון לבעיות של שימוש לרעה בתווים מסוימים בשמות המתחם על־מנת להונות את הגולש, ישנן סיומות בהן שמות המתחם לא יופיעו בצורה הרצויה בחלק מהדפדפנים.

ראו גם[עריכת קוד מקור | עריכה]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]