שיחה:אלפבית

תוכן הדף אינו נתמך בשפות אחרות.
מתוך ויקיפדיה, האנציקלופדיה החופשית

אני מחפש מידע על השכיחות של אותיות מסויימות בטקסטים בעיברית. אני רוצה לשלב מידע זה בערך דחיסת מידע. למשהוא יש את הנתונים הללו?

מאיר מ 08:46, 31 יולי 2004 (UTC)

כן. האותיות להלן מסודרות עפ"י השכיחות, לא עפ"י סדר האלפבית.

י 12.1%

ו 10.8%

ה 9.0%

ל 6.7%

ר 5.9%

מ 5.9%

ת 5.7%

א 5.0%

ב 4.9%

ש 4.7%

ע 3.4%

ח 3.1%

ם 2.9%

נ 2.8%

ד 2.8%

כ 2.4%

ק 2.3%

פ 2.3%

ס 1.7%

צ 1.2%

ג 1.1%

ט 1.0%

ן 0.8%

ז 0.8%

ך 0.4%

ף 0.2%

ץ 0.1%

רק שתדע, חיפוש קצר בגוגל (תוצאה שלישית מלמעלה) הייתה נותנת לך את זה בשניות...--רועי 09:26, 31 יולי 2004 (UTC)

רועי, האם תוכל לתת קישור למקור שבו מצאת מידע זה (כן, קלטתי "תוצאה שלישית מלמעלה בגוגל", אבל מה מילות החיפוש שנתת לגוגל?) דוד שי 12:13, 31 יולי 2004 (UTC)
כן, בוודאי. לא עשיתי שום חיפוש מיוחד, רק כתבתי "שכיחות אותיות". אבל בכל מקרה, הקישור: [1].--רועי 18:24, 31 יולי 2004 (UTC)
אגב, רציתי לציין שהדף המקושר שייך, בגדול, לאוניברסיטת חיפה, אם מישהו חשדן לגבי מהימנות הנתונים--רועי 18:41, 31 יולי 2004 (UTC)
OK, הדף מדבר על שכיחות האותיות בעשרה טקסטים ספציפיים מסוגים שונים. הוא בוודאי נותן מידע ראשוני על שכיחות האותיות, אך בוודאי שכדי להצדיק דיוק של ספרה אחרי הנקודה יש צורך בסריקת כמות הרבה יותר גדולה של טקסטים, למשל כל הטקסטים שנמצאים כעת בויקיפדיה. דוד שי 19:20, 31 יולי 2004 (UTC)

יהיו גם הבדלים משמעותיים בין כתיב חסר, למלא ולמעורב. למשל בדיקת שכיחות בתנ"ך תהיה אחרת מאשר טקסט בן ימינו בגלל שנעשה שם שימוש מרובה בכתיב חסר.--אפי ב. 19:35, 31 יולי 2004 (UTC)

איזו רמה של דיוק אתם צריכים? אני לא יודע בשביל מה אתם צריכים את זה, אבל לפי מה שכתוב בספר "סודות הצפנה" של סיימון סינג, בשביל לעשות ניתוח תדירויות לטקסט מוצפן, נהוג להשתמש בנתונים מטקסט בן 4,000 אותיות. פה אם אני לא טועה היו משהו כמו 3,111. אתם באמת צריכים משהו יותר מדויק מזה?--רועי 20:05, 31 יולי 2004 (UTC)

זה לא ערך בכלל[עריכת קוד מקור]

לא כתוב כאן כמעט כלום. זה דף קישוריות.. עִדוֹ (Eddau) - שיחה 03:09, 27 בנובמבר 2008 (IST)[תגובה]

לא נכון! אלפבית אינו אוסף סדור של סימנים ליצוג עיצורים ותנועות[עריכת קוד מקור]

”אלפבית הוא אוסף סדור של אותיות, שהן סימנים גרפיים המייצגים עיצורים ותנועות” (משפט הפתיחה של הערך). סבור שאלפבית הוא קבוצה סופית של סימנים גרפיים. וזהו. עד כאן המושג הבסיסי. סופית, כי מדובר במספר בן מניה. בהמשך ניתן לומר שהאוסף סדור, כלומר שלכל איבר בו ניתן לשיך מקום בקבוצה. וניתן להמשיך גם שכל סימן גרפי יקרא אות. והיא תיצג עיצור, או תנועה. ומהטענה שלי עולה שגם הרשום בדף הפירושונים אינו נכון. הערך לא עוסק ”במושג הבסיסי של אלפבית” (דף הפירושונים). במלים אחרות, מעל האלפבית הבסיסי נמצאת מחרוזת (מדעי המחשב). יתכן שהערך אלפבית עוסק במושג הבסיסי של אלפבית מבחינה לשונית.

איני לשונאי, ולא היסטוריון, ולא אנתרופולוג. אך נראה לי שיש קשר בין סימנים גרפיים קדומים בנוסח ציורי המערות, לבין אלף בית. וגם נראה לי ששפות עם אלפבית מורכב ועשיר, כדוגמת סינית עתיקה, הן שלב בהתפתחות האלפבית של ימינו. ונראה לי שבשפות כאלו יתכן שאפשר, אך לא קל, להפריד כל סימן לעיצור או תנועה. יכולתי להמשיך, אך איני בטוח שזה במקום. אולי בעלי ידע עשיר יותר יגיבו. 19 במרץ 2016.

האם הוא לא שֵמי? "והן בקרב עמים לא שמיים, כגון: החורים, העילמים והחיתים". (בפיסקה "שיטות הכתיבה שלפני האלפבית") תראו גם עילם אם כדרלעומר הוא מהעם המדובר, אז הוא שֵמי ללא ספקמ.נ. - שיחה 17:17, 30 באוקטובר 2017 (IST)[תגובה]