PageRank

מתוך ויקיפדיה, האנציקלופדיה החופשית

קפיצה אל: ניווט, חיפוש

פייג' ראנק (PageRank) הינה שיטת הדירוג לדפי היפרטקסט המקושרים ביניהם, המשמשת את מנוע החיפוש גוגל. האלגוריתם נכתב על ידי לארי פייג' וסרגי ברין במסגרת מחקר שערכו באוניברסיטת סטנפורד. בשנת 1998 הציגו השניים אבטיפוס למנוע החיפוש. האלגוריתם רשום כפטנט השייך לאוניברסיטת סטנפורד[1] והשם PageRank הינו סימן מסחרי של חברת גוגל. גוגל חתמה על חוזה עם אוניברסיטת סטנפורד המאפשר לה שימוש בלעדי באלגוריתם תמורת 1.8 מיליון מניות של החברה‏‏[2].
תאור של גוגל לפייג' ראנק: [3]

"פייג' ראנק מסתמך על האופי הדמוקרטי הייחודי של הרשת ומשתמש במבנה הקישוריות העצום שלה כאינדיקציה לערכו של כל אתר. בעקרון גוגל מפרש קישור מאתר A לאתר B, כהצבעה של A ל B, אבל גוגל בוחן יותר מאשר את מספר ההצבעות שכל אתר מקבל, כלומר מספר קישורים שאתר מסוים מקבל; בנוסף, גוגל מנתח את האתר המצביע. הצבעות מאתר "חשוב" הן בעלות משקל גבוה יותר, ועוזרות לקדם אתרים אחרים."
ייצוג גרפי של העקרונות של PageRank
תרשים המציג את אופן חישובו של PageRank

[עריכה] שיטת הדירוג

זחלן הרשת (Crawler) סורק את כל הדפים במרחב האינטרנט ויוצר מבנה היררכי של כל הקישורים בין דפים. הקישורים מזוהים באמצעות תגי HTML[דרוש מקור], כך שקישורים אחרים (כדוגמת JavaScript/VBScript) לא יסרקו.

האלגוריתם מחשב עבור כל דף אינטרנט את מידת החשיבות שלו ומציג אותו בדירוג תוצאות החיפוש בהתאם. דירוג של דף נקבע על פי כמות הדפים שמקשרים אליו וחשיבותם של הדפים המקשרים. כלומר, במידה ודפים רבים מקשרים אל דף מסוים האלגוריתם קובע את מידת החשיבות של דפים אלה ומדרג את הדף על פי מידתם חשיבותם. הדירוג מתבצע על סקאלה לוגריתמית עם ערכים בין 1 ל-10 ומושפע מגורמים נוספים כגון כמות הכניסות לדף והופעה של מילים רלוונטיות נוספות‏‏[4].

[עריכה] התקפת וההגנה על השיטה

בוני אתרים רבים המעוניינים להעלות את ניקוד אתרם נכנסים לאתרים גדולים, ומחפשים מקומות בהם יכולים להוסיף קישור לאתר שלהם. לרוב הם מוצאים מקום בספר אורחים, בפורום או בתגובות משתמשים. לצורך הגנה מהתקפה זו, קיים פרמטר חדש לתג הקישור הנקרא - NOFOLLOW. כפי הנאמר לעיל כל קישור מזוהה על ידי התג <A>. בעל אתר המעוניין לתת לגולשיו אפשרות לכתוב, אולם מבקש להימנע ממתקפה, מכניס לכל קישור את הפרמטר NOFOLLOW. בצורה זו רובוט החיפוש נמנע מלתת ניקוד לאתר המקושר.
אם לבעל אתר מסוים יש מתחרה, והוא מבקש להזכיר אותו באתרו ולקשר אליו, אולם הוא אינו מעוניין לתת לו ניקוד, יוסיף בעל האתר לקישור את הפרמטר NOFOLLOW.

דוגמה לשימוש בפרמטר:

<a href="http://www.example.com" rel="nofollow">some text</a>

[עריכה] הערות שוליים

  1. ^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.htm&r=1&f=G&l=50&s1=6285999.PN.&OS=PN/6285999&RS=PN/6285999 Method for node ranking in a linked database, U.S Patent office
  2. ^http://www.redorbit.com/news/education/318480/stanford_earns_336_million_off_google_stock/ Starting Up, How Google got its groove. Stanford Magazine, December 2004
  3. ^ Google Technology: http://www.google.com/corporate/tech.html
  4. ^http://infolab.stanford.edu/~backrub/google.html The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page‏
Stub comp.png ערך זה הוא קצרמר בנושא מחשבים. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.