גוגל

מתוך ויקיפדיה, האנציקלופדיה החופשית

(הופנה מהדף לתור מוטור)
קפיצה אל: ניווט, חיפוש
ערך זה עוסק במנוע החיפוש "גוגל". אם התכוונתם לחברת "גוגל", ראו גוגל (חברה).
גוגל
מנוע החיפוש של גוגל
מנוע החיפוש של גוגל
סוג: מנוע חיפוש
תאריך ההקמה: 15 בספטמבר 1997
מייסדים: לארי פייג' וסרגיי ברין
בעלות: גוגל
הרשמה: אופציונלית
דף הבית: www.google.com

גוגל (Google) הוא מנוע חיפוש הנמצא בבעלות חברת Google. זהו מנוע החיפוש הפופולרי ביותר כיום באינטרנט‏‏‏‏[1], המטפל בכל יום במאות מיליוני בקשות למציאת תוכן באתרי אינטרנט וזוכה למאות מיליוני מבקרים[2]. שם מנוע החיפוש (ושם החברה) הוא שיבוש של המילה גוגול‏‏[3] כרמיזה לכך שמנוע החיפוש יכול להתמודד עם כמויות אדירות של מידע.

אלגוריתם מנוע החיפוש הומצא על ידי לארי פייג' וסרגיי ברין בשנת 1997. האלגוריתם נקרא PageRank ומדרג את סדר הופעת הדפים על פי כמות הדפים המקושרים אליהם.

תוכן עניינים

מנועי חיפוש

עמוד ראשי
ערך מורחב – מנוע חיפוש

מנוע חיפוש הוא תוכנה המשמשת לחיפוש פריטי מידע במאגר מידע גדול. כיום, היישום הנפוץ ביותר של מנועי חיפוש הוא חיפוש דפים ברשת האינטרנט, אך קיימים גם מנועי חיפוש שמטרתם לחפש במאגרי מידע הנמצאים באופן מקומי במחשב.

מנועי חיפוש פותחו החל משנת 1990. בשנת 1994 יצא לשוק WebCrawler, שהיה מנוע החיפוש הראשון שהיה הראשון ששילב חיפוש בטקסט שבגוף האתרים ולא רק בכותרות האתרים. מנוע החיפוש המסחרי הגדול של התקופה היה לייקוס, שפותח על ידי מייקל מלודין מאוניברסיטת קרנגי מלון. בעקבות הצלחתו של לייקוס פותחו מנועי חיפוש נוספים. מנועי חיפוש באינטרנט נבחנים על ידי הגולשים לפי איכות התוצאות שהם מספקים, ובהתאם לכך מאז שנת 2001 שולט מנוע החיפוש גוגל בשוק מנועי החיפוש.

מנועי החיפוש סורקים את רשת האינטרנט בחיפוש אחר דפים באמצעות שימוש בזחלן אינטרנט. הזחלן מעביר עותקים של הדפים שנסרקו למנוע האינדקס לצורך פירוק הדף למרכיביו ובניית מאגר מידע של תוכן הדפים. בעת ביצוע חיפוש נשלחת שאילתה למאגר המידע, המידע המתקבל כפלט מוצג למשתמש על פי מידת הרלוונטיות שלו כתוצאת החיפוש.

מנוע החיפוש של גוגל

בשנת 2001 החל לפעול מנוע החיפוש של גוגל, חדשנותו של מנוע החיפוש הייתה בדירוג דפי האינטרנט שהוא מציג לפי חשיבותם באמצעות חישוב המתבסס על כמות הדפים המקשרים אליהם וחשיבותם של הדפים המקשרים.

אלגוריתם החיפוש

עמוד ראשי
ערך מורחב – PageRank

מנוע החיפוש מבוסס על אלגוריתם הנקרא PageRank. האלגוריתם מחשב עבור כל דף אינטרנט את מידת החשיבות שלו ומציג אותו בדירוג תוצאות החיפוש בהתאם. דירוג של דף נקבע על פי כמות הדפים שמקשרים אליו וחשיבותם של הדפים המקשרים. כלומר, במידה ודפים רבים מקשרים אל דף מסוים האלגוריתם קובע את מידת החשיבות של דפים אלה ומדרג את הדף על פי מידתם חשיבותם. הדירוג מתבצע על סקאלה לוגריתמית עם ערכים בין 1 ל-10 ומושפע מגורמים נוספים כגון כמות הכניסות לדף והופעה של מילים רלוונטיות נוספות‏‏[4].

האלגוריתם נכתב על ידי לארי פייג' וסרגי ברין במסגרת מחקר שערכו באוניברסיטת סטנפורד. בשנת 1998 הציגו השניים אבטיפוס למנוע החיפוש. האלגוריתם רשום כפטנט השייך לאוניברסיטת סטנפורד[5] והשם PageRank הנו סימן מסחרי של חברת גוגל. גוגל חתמה על חוזה עם אוניברסיטת סטנפורד המאפשר לה שימוש בלעדי באלגוריתם תמורת 1.8 מיליון מניות של החברה‏‏[6].

בזמן הסריקה מבצע מנוע החיפוש הטמנה של הדפים שהוא סורק. בנוסף לדפי HTML רגילים מתבצעות סריקה והטמנה של קובצי DOC ,PDF ,XLS וסוגים נוספים[7] המומרים בדרך כלל לפורמט HTML‏‏[8].

דף הבית של גוגל

בניגוד לנהוג בתעשיית האינטרנט, דף הבית של גוגל מעוצב בפשטות ומורכב מהלוגו של גוגל, תיבת החיפוש ועוד מספר אלמנטים טקסטואליים. באופן דומה, המודעות בדף תוצאות החיפוש מעוצבות בסגנון מינימליסטי. לכבוד אירועים מיוחדים מוחלף הלוגו של גוגל בראש עמוד החיפוש ללוגו המתאים למאורע‏‏‏‏[9].

נכון למרץ 2009 עמוד הבית תורגם ל-124 שפות [10] בהן שפות טבעיות, שפות עבר (כגון לטינית) ושפות מתוכננות (כגון קלינגונית ואספרנטו). בנוסף לחיפוש דפים בכל האינטרנט גוגל מאפשר לחפש תוכן באתרים מסוימים‏‏‏‏‏‏[11], לחפש את כל הדפים המקשרים לדף מסוים‏‏‏‏[12], להיכנס באופן אוטומטי לתוצאת החיפוש הראשונה שתמצא‏‏‏‏[13], ולבצע פעולות מתמטיות‏‏‏‏[14].

שירותים נוספים המתבססים על מנוע החיפוש של גוגל כוללים

  • Google News - חיפוש חדשות,
  • Google scholar - חיפוש מאמרים אקדמיים[15], שרות זה מאפשר חיפוש ממוקד של מאמרים אקדמיים ונותן מידע ביבליוגרפי, במסך תוצאות החיפוש ניתן להקיש על שם המאמר. במידה והמאמר זמין במלואו הוא יוצג בפני המחפש, אם אינו זמין ברשת יוצד תקציר ומידע המאפשר למחפש להזמין את המאמר המבוקש.
  • חיפוש הגדרות מילוניות למילים[16]
  • חיפוש תמונות[17].

ניתן להתאים את דף הבית של גוגל באמצעות iGoogle המאפשר לשנות את עיצוב דף הבית ולהוסיף עיצובים מותאמים אישית[18]. גוגל גם מאפשרת להוסיף את תיבת החיפוש שלה לאתרים אחרים‏‏[19].

סרגל הכלים של גוגל

בנוסף לשימוש מקוון במנוע החיפוש ניתן להשתמש בשירותי גוגל באופן מקומי באמצעות התקנת סרגל הכלים של גוגל. הסרגל מאפשר לבצע שימוש בכל הכלים של גוגל וכולל אפשרויות תיקון שגיאות, הצעות לחיפושים אפשריים וגישה למידע שמור באופן מקוון [20].

תוצאות החיפוש

תוצאות החיפוש מוצגות על פי סדר החשיבות שנקבע להן באמצעות אלגוריתם הסריקה. מנוע החיפוש אינו מכיל יכולות לשוניות לחיפוש מילה והטיותיה אך הוא מכיל אפשרויות להצגת חיפוש נפוץ יותר. במידה וקיימת מילה דומה בעלת איות נפוץ יותר יציג מנוע החיפוש אפשרות לחיפוש חדש המכיל את האיות הזה‏‏[21].

בנוסף לאפשרות לצפות בקישור ישיר לאתר, ניתן לצפות בגרסת המטמון השמורה שלו, לבצע חיפוש לדפים דומים ולתרגם אותו באופן אוטומטי באמצעות Google Translate‏‏[22]. כל האתרים המופיעים בתוצאות החיפוש עוברים סינון באמצעות כלי אבטחת מידע המתריעים בפני המשתמש על אתרים המכילים תוכנות זדוניות‏‏[23].

בשנת 2009 השיקה גוגל שירות חדש, SearchWiki, המאפשר לגולשים לדרג את רלוונטיות תוצאות החיפוש שלהם. באמצעות כפתורים שהתווספו ליד תוצאות החיפוש ניתן להקפיץ לראש הדירוג תוצאות מסוימות כך שיוצגו ראשונות בחיפושים הבאים או להסיר אותן כך שלא יופיעו כלל. ניתן גם להוסיף הערות לתוצאות חיפוש מסוימות ולחלוק אותן עם משתמשי גוגל אחרים[24].

תוכניות לעתיד

בראיון שנתן לעיתון The Futurist (השייך לאיגוד העתידנות העולמי) סיפר פיטר נורוויג מגוגל על מחקרים שעורכת החברה בחיפוש בתוך קובצי מוזיקה וסרטים ובהזנת שאילתות חיפוש באמצעות קול[25].

קידום אתרים במנוע החיפוש

עמוד ראשי
ערך מורחב – קידום אתרים במנועי חיפוש

כדי למשוך תנועה לאתר בעלי אתרים מעוניינים להציג אותם ראשונים ככל האפשר בתוצאות הדירוג. הדבר יצר תעשייה של קידום אתרים במנועי חיפוש. שיטות קידום אתרים כוללות הוספת מילות חיפוש נפוצות לעמודים (גם אם אינן קשורות לתוכן העמוד), תשלום לאתרים אחרים עבור קישור לאתר ועוד. קיימות חברות המתמחות בשיפור הדירוג עבור אתרי אינטרנט. חלק מהדרכים להצגת אתרי אינטרנט נחשבות לפעולות שאינן אתיות אשר גוגל מנסה להלחם בהן[26]‏‏[27], אך קיימות גם שיטות לגיטימיות לשיפור הדירוג במנועי חיפוש[28].

הפצצת גוגל

כיוון שאלגוריתם החיפוש של גוגל הוא סודי בחלקו לא ידוע מהם הגורמים המדויקים המשפיעים על הדירוג. אך ידוע שכאשר דפים רבים מפנים לאתר מסוים באמצעות טקסט אחיד, יציג גוגל את האתר הזה בתגובה לחיפוש של טקסט אחיד זה, אף אם הטקסט אינו מופיע באתר עצמו. תופעה זו פורסמה לראשונה על ידי אדם מאתס, במאמר שפרסם ב-6 באפריל 1999, ובו נטבע המושג "הפצצת גוגל" (Google bombing). מאתס גילה שחיפוש המילים internet rockstar נותן כתוצאה ראשונה את הערך של הזמר בן בראון, אף שהטקסט המבוקש לא הופיע באתר עצמו. התופעה קרתה, כנראה, עוד קודם לכן, כאשר התגלה שחיפוש בגוגל של הביטוי more evil than Satan מוביל לאתר של מיקרוסופט.

דוגמה להפצצת גוגל בלתי מכוונת היא חיפוש הביטוי "click here" ("לחץ כאן") שהתוצאה הראשונה שהוא נותן היא אתר הבית של אדובי אקרובט [29]. הביטוי "click here" כמעט ואינו מופיע באתר , אך כמעט כל אתר המחזיק קובצי PDF, מזמין את קוראיו להוריד את תוכנת Adobe Reader מהקישורית "Click Here".

בישראל התקיימה תחרות להפצצת גוגל על ידי האתר nrg תחת השם "לתור מוטור". מטרת התחרות הייתה לעודד מעשים של הפצצת גוגל למען הבנה טובה יותר של האמצעים שבהם ניתן לתמרן את מנוע החיפוש החשוב הזה ופענוח דרכי עבודתו. בעת פתיחת התחרות ב28 בדצמבר 2004 לא הניב חיפוש המילים "לתור מוטור" אף תוצאה ובסוף התחרות ב29 בפברואר 2005 הציג מנוע החיפוש כ-211,000 אתרים הכוללים את הביטוי.

רבות מההפצצות שהתפרסמו בשנים האחרונות נעלמו מראש תוצאות החיפוש. יש התולים זאת בשינוי האלגוריתם של גוגל, כך שהוא יתעלם מהפצצות, ויש הטוענים שמדובר בהסרה ידנית של הדפים מהאתרים שהשתתפו בתחרות אחרי סיומה ושבירת רשת הקישורים הצולבים כתוצאה מהסרה זו. הפצצות גוגל חדשות, כמו הודעה על חרם צרכנים בחיפוש שם החברה ישראייר, הצליחו להתברג במקומות הראשונים בחיפוש.

מדד גוגל

מדד גוגל, הוא קנה מידה הקרוי על שם מנוע החיפוש ומשמש למדידה של תפוצתו של מושג מסוים בדפי האינטרנט שמציג "גוגל", כמשקף את תפוצתו של המושג בציבור. מיקומו של מושג במדד נקבע על פי כמות התוצאות שמחזיר מנוע החיפוש בעת חיפוש המושג, מיקומו של אתר במדד נקבע על פי המקום שלו ביחס לאתרים אחרים בדף תוצאות החיפוש.

מדד גוגל הוא מאפשר לקבל מושג על הפופולריות של מונח מסוים אך לא על נכונותו, מכיוון שהמדד נותן מושג לגבי תפוצת המונח באינטרנט תנתן בו עדיפות למונח שגוי אך נפוץ לעומת המונח הנכון. באופן דומה עקב אופן ההפעלה של אלגוריתם החיפוש אחר מונחים אקטואליים יקבלו עדיפות על פני מונחים ישנים יותר.

ביקורת כלפי גוגל

ביקורת חריפה כלפי גוגל נשמעה על שיתוף הפעולה שלה עם צנזורת האינטרנט בסין. מנוע החיפוש אינו מציג תוצאות שאינן מאושרות על ידי הצנזורה בסין‏‏[30]. עם זאת, גוגל מפעילה לובי בארצות הברית שמטרתו למנוע ממדינות לצנזר את האינטרנט‏‏‏‏[31].

ביקורת נוספת כלפי גוגל נשמעה כאשר התגלה שמנוע החיפוש משתמש בעוגיות ארוכות טווח. העוגיות מאפשרות לגוגל לשמור מידע על זהות המשתמש, העדפותיו והיסטוריית החיפוש שלו. תוקף העוגיות הוגבל בתחילה לשנת 2036 אך לאחר הביקורת הודיעה גוגל שתגביל את משך העוגיות לשנתיים ותצנזר מידע אישי לאחר תאריך זה‏‏‏‏‏‏[32]‏‏‏‏[33].

ראו גם

לקריאה נוספת

  • ג'ון בטל, החיפוש - כיצד גוגל ומתחרותיה שינו את פני התרבות וכתבו מחדש את חוקי עולם העסקים, הוצאת "עברית" ו"כתר", 2006.
  • דייוויד א' וייז ומארק מאלסיד, הסיפור של גוגל - ההצלחה העסקית, התקשורתית והטכנולוגית החמה ביותר של זמננו, הוצאת מטר, 2006.

קישורים חיצוניים

הערות שוליים

  1. ^http://www.wiliam.com.au/wiliam-blog/search-engine-trends-2008 Search Engine Trends in 2008‏
  2. ^מונה כניסת מבקרים לאתר הרשמי של גוגל, מתוך אתר compete‏
  3. ^http://graphics.stanford.edu/~dk/google_name_origin.html Origin of the name "Google"‏
  4. ^http://infolab.stanford.edu/~backrub/google.html The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page‏
  5. ^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.htm&r=1&f=G&l=50&s1=6285999.PN.&OS=PN/6285999&RS=PN/6285999 Method for node ranking in a linked database, U.S Patent office
  6. ^http://www.redorbit.com/news/education/318480/stanford_earns_336_million_off_google_stock/ Starting Up, How Google got its groove. Stanford Magazine, December 2004
  7. ^http://www.google.co.il/intl/iw/help/faq_filetypes.html#what What file types are returned in a Google search? Google FAQ‏
  8. ^http://www.google.co.il/intl/iw/help/faq_filetypes.html#application Converting files to HTML or TXT. Google Special search features‏
  9. ^http://www.google.com/intl/en/holidaylogos.html גלריית הסמלים של גוגל‏
  10. ^ http://www.google.co.il/language_tools?hl=iw כלי השפה של גוגל
  11. ^http://www.google.co.il/intl/iw/help/features.html#sitesearch חיפוש אתר, אתר העזרה של גוגל‏
  12. ^http://www.google.co.il/intl/iw/help/features.html#link מי מקשר אליך, אתר העזרה של גוגל‏
  13. ^http://www.google.co.il/intl/iw/help/features.html#lucky יותר מזל משכל,‏ אתר העזרה של גוגל
  14. ^http://www.google.co.il/intl/iw/help/features.html#calculator מחשבון‏, אתר העזרה של גוגל
  15. ^ http://scholar.google.co.il/intl/en/scholar/about.html About Google Scholar
  16. ^ http://www.google.com/help/operators.html Alternate query types
  17. ^ http://www.google.com/support/websearch/bin/answer.py?hl=en&answer=112512 About Google Image Search
  18. ^ http://www.google.co.il/support/websearch/bin/answer.py?answer=20324&topic=9002 Getting started: Explore iGoogle
  19. ^http://www.google.com/sitesearch/ Power your Website Search with Google‏
  20. ^ http://www.google.com/tools/firefox/toolbar/FT5/intl/iw/features.html סרגל הכלים של גוגל
  21. ^http://www.google.com/support/websearch/bin/answer.py?hl=iw&answer=1723 תכונות: 'האם התכוונת ל'‏
  22. ^http://www.google.co.il/intl/iw/help/faq_translation.html#translink מהי המשמעות של הקישור "תרגם דף זה" שליד תוצאת חיפוש?‏
  23. ^http://www.google.com/support/websearch/bin/answer.py?answer=45449&cbid=1nebt2qkrm8o1&src=cb&lev=answer דואר זבל או תוצאות חיפוש לא רלוונטיות: תוצאות שכותרתן 'אתר זה עלול להזיק למחשב שלך'‏
  24. ^ http://www.google.co.il/support/websearch/bin/answer.py?answer=115764&hl=en&ctx=rosetta
  25. ^ http://www.wfs.org/Jan-Feb%2009/TechMA09.htm
  26. ^http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=66736 Paid Links‏
  27. ^http://www.haaretz.co.il/captain/pages/ShArtCaptain.jhtml?contrassID=11&subContrassID=0&itemNo=679038 כשגוגל מגרשת את ב-מ-וו מהרשת, הארץ‏
  28. ^ http://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf search-engine-optimization-starter-guide.pdf קובץ PDF
  29. ^ http://www.google.co.il/search?hl=iw&rls=GGLG%2CGGLG%3A2005-49%2CGGLG%3Aen&q=click+here&meta=
  30. ^http://net.nana10.co.il/Article/?ArticleID=223358 החומה הצינית, נענע
  31. ^http://www.ynet.co.il/articles/0,7340,L-3417097,00.html גוגל נלחמת בצנזורה באמצעות חוקי הסחר הבינלאומיים, ynet
  32. ^http://news.bbc.co.uk/2/hi/technology/6901946.stm Google cookies will 'auto delete', BBC website‏
  33. ^http://arstechnica.com/old/content/2007/07/google-cookies-to-expire-after-two-yearsas-long-as-you-dont-return.ars Google cookies to expire after two years?as long as you don't return‏
כלים אישיים