חוק זיף

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Incomplete-document-purple.svg יש להשלים ערך זה: בערך זה חסר תוכן מהותי. ייתכן שתמצאו פירוט בדף השיחה.
הנכם מוזמנים להשלים את החלקים החסרים ולהסיר הודעה זו. שקלו ליצור כותרות לפרקים הדורשים השלמה, ולהעביר את התבנית אליהם.

חוק זיף (Zipf Law) היא נוסחה אמפירית המתארת את התפלגות שכיחות מילים בטקסט בשפה טבעית. החוק התגלה ונוסח בשנות ה-30 של המאה העשרים, על ידי הבלשן האמריקאי ג'ורג' קינגסלי זיף, אבי הבלשנות החישובית. התפלגות זו נקראת "התפלגות זיף". בעקבותיו בדקו חוקרים אחרים תופעות טבעיות ואנושיות אחרות וגילו תופעות נוספות המתפלגות לפי התפלגות זיף.

ניסוח החוק[עריכת קוד מקור | עריכה]

בהינתן טקסט טבעי, יוצרים טבלת שכיחות של המילים בטקסט, ומעניקים לכל מילה דירוג (rank) לפי מקומה בטבלה. כך נייחס למילה השכיחה ביותר דירוג 1, למילה השנייה בשכיחותה דירוג 2 וכן הלאה.

חוק זיף אומר ששכיחותה של מילה כלשהי בטקסט נשמעת לנוסחה הבאה: \ P(r)=P(1)/r

\ P(r) - שכיחות מילה מסוימת בטקסט.
\ r - דירוג המילה (rank) בטקסט.
\ P(1) - שכיחות המילה בעלת התדירות הגבוהה ביותר בטקסט.

כך, לפי חוק זיף, המילה הנפוצה ביותר תופיע בטקסט כפליים מהמילה השנייה (כלומר בעלת דירוג 2), פי שלושה יותר מהמילה השלישית בתפוצתה וכן הלאה. טקסטים ברוב השפות הטבעיות נשמעים לחוק זיף, אם כי אין עדיין הסכמה בקרב הבלשנים לגבי הסיבה.

זיף הדגים את החוק באמצעות מחקר שערך יחד עם הסטודנטים שלו. המחקר בוצע באופן ידני, ובמסגרתו נספרו המופעים של המילים בספר "יוליסס" של ג'יימס ג'ויס.

קיימות תופעות נוספות, שאינן קשורות לשפה, הנשמעות לחוק זיף, כגון גודל אוכלוסייתן של ערים בארצות שונות, גודלן של חברות, התפלגות הכנסה ועוד.

לקריאה נוספת[עריכת קוד מקור | עריכה]

  • Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort: An Introduction to Human Ecology. Addison-Wesley, Reading, MA.
  • Robert L. Axtell: Zipf Distribution of U.S. Firm Sizes,Science 7 September 2001 Vol. 293. no. 5536, pp. 1818 - 1820 DOI: 10.1126/science.1062081
  • Hill, B.M, Zipf's law and prior distributions for the composition of a population, Journal of the American Statistical Association Vol. 65, No. 331 (Sep., 1970), pp. 1220-1232
  • K Okuyama, M Takayasu, H Takayasu Zipf's law in income distribution of companies Physica A, 1999 [1]
  • Mark Levene, José Borges, George Loizou: Knowledge and Information Systems, Volume 3, Number 1, February, 2001 [2]