PageRank

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Incomplete-document-purple.svg יש להשלים ערך זה: בערך זה חסר תוכן מהותי. סיבה: חסר תיאור מדויק של אופן הפעולה. ייתכן שתמצאו פירוט בדף השיחה.
הנכם מוזמנים להשלים את החלקים החסרים ולהסיר הודעה זו. שקלו ליצור כותרות לפרקים הדורשים השלמה, ולהעביר את התבנית אליהם.

פייג' ראנק הוא אלגוריתם הנקרא על שם לארי פייג' שמשמש מנועי חיפוש. האלגוריתם מדרג דפי אינטרנט לפי קישורי היפרטקסט אליו, ומשמש את מנוע החיפוש גוגל. האלגוריתם נכתב על ידי לארי פייג', על שמו הוא נקרא, וסרגיי ברין במסגרת מחקר שערכו באוניברסיטת סטנפורד. בשנת 1998 הציגו השניים אבטיפוס למנוע החיפוש. האלגוריתם רשום כפטנט השייך לאוניברסיטת סטנפורד‏[1] והשם PageRank הוא סימן מסחרי של חברת גוגל. גוגל חתמה על חוזה עם אוניברסיטת סטנפורד המאפשר לה שימוש בלעדי באלגוריתם תמורת 1.8 מיליון מניות של החברה‏‏‏[2].
תיאור של גוגל לפייג' ראנק: ‏[3]

"פייג' ראנק מסתמך על האופי הדמוקרטי הייחודי של הרשת ומשתמש במבנה הקישוריות העצום שלה כאינדיקציה לערכו של כל אתר. בעיקרון, גוגל מפרש קישור מאתר A לאתר B, כהצבעה של A ל B, אבל גוגל בוחן יותר מאשר את מספר ההצבעות שכל אתר מקבל, כלומר מספר קישורים שאתר מסוים מקבל; בנוסף, גוגל מנתח את האתר המצביע. הצבעות מאתר "חשוב" הן בעלות משקל גבוה יותר, ועוזרות לקדם אתרים אחרים."

ייצוג גרפי של העקרונות של PageRank
תרשים המציג את אופן חישובו של PageRank

שיטת הדירוג[עריכת קוד מקור | עריכה]

זחלן הרשת (Crawler) סורק את כל הדפים במרחב האינטרנט ויוצר מבנה היררכי של כל הקישורים בין דפים. הקישורים מזוהים באמצעות תגי HTML, כך שקישורים אחרים (כדוגמת JavaScript/VBScript) לא ייסרקו.

האלגוריתם מחשב עבור כל דף אינטרנט את מידת החשיבות שלו ומציג אותו בדירוג תוצאות החיפוש בהתאם. דירוג של דף נקבע על פי כמות הדפים המקשרים אליו וחשיבותם של הדפים המקשרים. כלומר, אם דפים רבים מקשרים אל דף מסוים, האלגוריתם קובע את מידת החשיבות של דפים אלה ומדרג את הדף על פי מידת חשיבותם. הדירוג מתבצע על סקאלה לוגריתמית עם ערכים בין 0 ל-10 ומושפע מגורמים נוספים כגון כמות הכניסות לדף והופעה של מילים רלוונטיות נוספות‏‏‏[4].

ההתקפה על השיטה, וההגנה עליה[עריכת קוד מקור | עריכה]

בוני אתרים רבים המעוניינים להעלות את ניקוד אתרם נכנסים לאתרים גדולים, ומחפשים מקומות שבהם הם יכולים להוסיף קישור לאתר שלהם. לרוב הם מוצאים מקום בספר אורחים, בפורום או בתגובות משתמשים. לצורך הגנה מהתקפה זו, קיים פרמטר חדש לתג הקישור הנקרא - NOFOLLOW. כפי שנאמר לעיל, כל קישור מזוהה על ידי התג <A>. בעל אתר המעוניין לתת לגולשיו אפשרות לכתוב, אולם מבקש להימנע ממתקפה, מכניס לכל קישור את הפרמטר NOFOLLOW. בצורה זו רובוט החיפוש נמנע מלתת ניקוד לאתר המקושר.
אם לבעל אתר מסוים יש מתחרה, והוא מבקש להזכיר אותו באתרו ולקשר אליו, אולם הוא אינו מעוניין לתת לו ניקוד, יוסיף בעל האתר לקישור את הפרמטר NOFOLLOW.

דוגמה לשימוש בפרמטר:

<a href="http://www.example.com" rel="nofollow">טקסט כלשהו</a>

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא PageRank בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.htm&r=1&f=G&l=50&s1=6285999.PN.&OS=PN/6285999&RS=PN/6285999 Method for node ranking in a linked database, U.S Patent office
  2. ^ http://www.redorbit.com/news/education/318480/stanford_earns_336_million_off_google_stock/ Starting Up, How Google got its groove. Stanford Magazine, December 2004
  3. ^ Google Technology: http://www.google.com/corporate/tech.html
  4. ^ http://infolab.stanford.edu/~backrub/google.html The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page‏