Codepage 437

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

Codepage 437 של IBM PC או של DOS, הידוע גם בשם DOS-US או OEM-US, הוא מפת התווים המקורית של ה-IBM PC, משנת 1981. מפת התווים נראית כך:

Codepage-437 מוצג על מסך
    x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x    
1x   §
2x   ! " # $ % & ' ( ) * + , - . /
3x   0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x   @ A B C D E F G H I J K L M N O
5x   P Q R S T U V W X Y Z [ \ ] ^ _
6x   ` a b c d e f g h i j k l m n o
7x   p q r s t u v w x y z { | } ~
8x   Ç ü é â ä à å ç ê ë è ï î ì Ä Å
9x   É æ Æ ô ö ò û ù ÿ Ö Ü ¢ £ ¥ ƒ
Ax   á í ó ú ñ Ñ ª º ¿ ¬ ½ ¼ ¡ « »
Bx  
Cx  
Dx  
Ex   α ß Γ π Σ σ µ τ Φ Θ Ω δ φ ε
Fx   ± ÷ ° · ²  

היא מבוססת על ASCII, עם השינויים הבאים:

  • תחום תווי הבקרה התחתון (C0, בהקסדצימלית 0x00 עד 0x1F) מוקצה לתווים גרפיים. קודים אלה יכולים לשמש בתפקידם המקורי בתור תווי בקרה (כפי שכך עדיין - כתיבת echo, רווח, control-G ואז לחיצה על Enter גורמת למחשב להשמיע צפצוף, אפילו בשורת הפקודה של Windows XP), אבל בתצוגה, כגון בעורך טקסט כגון edit של DOS, הם מוצגים כתווים גרפיים. הצורות הגרפיות מגוונות, כגון פרצופים מחייכים, סמלי קלפים ותווים מוזיקליים. המספר 0x7F, שהוא DEL ב-ASCII, אף הוא מוצג כתו גרפי (בית).

הרפרטואר של CP437 נלקח ממפת התווים של מכונות לעיבוד תמלילים של חברת ונג (Wang Laboratories), כפי שביל גייטס הודה בפירוש בראיון איתו ועם פול אלן במהדורת השניים באוקטובר 1995 של עיתון Fortune:

Cquote2.svg

גם התלהבנו ממעבדי התמלילים הייעודיים של ונג, מפני שהאמנו שמכונות רב-תכליתיות יכולות לעשות זאת באותה מידה. זאת הסיבה שכשהגיע הזמן לתכנן את המקלדת של ה-IBM PC שמנו את מפת התווים המצחיקה של ונג במכונה - אתה יודע, פרצופים מחייכים וקופסאות ומשולשים וכל מיני. חשבנו שאנחנו רוצים לעשות תואם של תוכנת עיבוד התמלילים של ונג באחד הימים

Cquote3.svg

.

CP437 אינה מספקת ליישום רב-לשוני, היות שחסרים לה תווים ההכרחיים לכמה שפות, כמו À לצרפתית, ויש לה רק מעט אותיות יווניות. מפות תווים מאוחרות יותר של DOS, כגון CP850 (מערב אירופה), CP852 (מרכז אירופה) ו-CP737 (יוון), מילאו את החסר לשימוש בינלאומי ויחד עם זאת נשארו כמעט תואמות ל-CP437 על ידי השארת התווים לשרטוט קווים במקומותיהם. כל תווי CP437 נמצאים ביוניקוד ובמפת התווים WGL4 של מיקרוסופט, ולפיכך ברוב הגופנים ב-Windows, וכן גם בגופן ה-VGA של לינוקס (וכמובן גם בגופני ISO 10646 של X11).

מי שמיישם טבלאות מיפוי ליוניקוד, עליו לשים לב כי CP437 מאחדת כמה תווים: 0xE1 היא גם האות הגרמנית ß וגם האות היוונית הקטנה בטא (U+03B2)‏; 0xE4 היא גם סימן הסיכום (U+2211) וגם האות היוונית הגדולה סיגמא (U+03A3);‏ 0xE6 היא גם סימן המיקרו (U+00B5) וגם האות היוונית הקטנה מו (U+03BC);‏ 0xEA היא גם סימן אום (U+2126) וגם האות היוונית הגדולה אומגה (U+03A9); ו-0xEE היא גם סימן יסוד-של (U+2208) וגם האות היוונית הקטנה אפסילון (U+03B5).