תו (מחשב)

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

תו (Character) הוא יחידת מידע בסיסית ביותר, ומכילה ייצוג של סימול פלט בודד, כגון אות בשפה כלשהי, סימן פיסוק או סימן בודד אחר. רצף של תווים חזותיים נקרא מחרוזת. בנוסף לתווים המייצגים סימנים, ישנם גם תווי בקרה, שמטרתם להשפיע על אמצעי פלט, כגון מסך מחשב.

במערכות מחשב מיוצגים התווים באמצעות קידודים בינאריים שונים. מספר התווים האפשריים בכל קוד נקבע לפי מספר הסיביות שמרכיבות תו אחד. בקוד ISO 8859 ובקוד EBCDIC כל תו מורכב מ-8 סיביות, ולכן מספר התווים האפשרי בכל אחד מקודים אלה הוא 28 = 256. בקודים אחרים (כגון ASCII) תו הורכב מ-7 סיביות, שאיפשרו רק 128 תווים שונים. בקוד יוניקוד, בגרסאות ראשונות שלו תו יוצג על ידי 16 סיביות, שאיפשרו 65,536 תווים שונים. גרסה 2.0 של יוניקוד הורחבה להכיל 1,112,064 תווים באמצעות מנגנון UTF-16, שבו 2,048 קודים מנוצלים כדי לייצג יותר ממיליון תווים.

הסיביות המרכיבות כל תו ניתנות לכתיבה בקוד בינארי, אך נוח יותר לעשות זאת בכתיב הקסדצימלי. דוגמה: הערך 0xC1 בקוד EBCDIC הוא ייצוגה של האות A.

ראו גם [עריכה]