אפאצ'י הייב – הבדלי גרסאות
יצירה באמצעות תרגום הדף "Apache Hive" |
(אין הבדלים)
|
גרסה מ־17:25, 15 בספטמבר 2017
מפתח | קרן התוכנה אפאצ'י |
---|---|
מחזור חיים | 9 בנובמבר 2011 – הווה (12 שנים) |
גרסה אחרונה | 3.1.3 (9 באפריל 2022) |
מערכת הפעלה | חוצה-פלטפורמות |
נכתבה בשפות | Java |
סוג רישיון | אפאצ'י 2.0 |
קוד מקור | |
hive | |
אפאצ'י הייב (תרגום: כוורת; באנגלית: Apache Hive) הוא פרויקט תוכנה של מחסן נתונים שנבנה על גבי האדופ ומאפשר שירותי סיכום נתונים, שאילתות, וניתוחים.[1] הייב נותן ממשק מדמה SQL החושף ממשק לשאילתות על נתונים מאוחסנים על גבי בסיסי נתונים שונים ומערכות קבצים הנמצאים באינטגרציה עם האדופ. שאילתות SQL מסורתית חייבות להיות מיושמות בעזרת ממשק ה JAVA של MapReduce עבור יישומים הדורשים שאילתות על נתונים מבוזרים.
הייב מספק אבסטרקציה של SQL לאינטגרציה של שאילתות עם מאפייני SQL, הנקרא HiveQL לתוך שכבת הקוד (Java) ללא צורך למימוש השאילתות בממשק Java. מכיוון שמרבית ממחסני הנתונים משתמשים בשאילתות SQL הייב מאפשר הגירה של אפליקציות לשימוש בהאדופ.[2]
הפיתוח הראשוני היה על ידי פייסבוק, אולם מאוחר יותר נכנס לשימוש ופיתוח על ידי חברות אחרות כגון נטפליקס ו FINRA.[3][4] אמזון מתחזקת ענף של עץ הפיתוח של הייב הכלול בשירותי הרשת שלה, AWS.[5]
דוגמא לשימוש ב HiveQL
תכנית לספירת מילים ב"פיג"
תכנית "ספירת מילים" ב HiveQL
תכנית "ספירת מילים", מחשבת את מספר הפעמים שכל מילה מופיעה בקלט נתון. דוגמה לכתיבת תכנית כזו ב HiveQL:
הסבר על פעולת התכנית:
בדוק אם טבלתdocs
קיימת ומחק אותה אם כן. צור טבלה חדשה בשם docs
עם עמודה אחת מסוג STRING
בשם line
.
טען את הקובץ המפורט או הספרייה (במקרה שלנו "input_tzumer") לתוך הטבלה. OVERWRITE
מציין שטבלת היעד שאליה הנתונים נטענים תיכתב מחדש, אחרת הנתונים יהיה "מתווספים" (appended).
CREATE TABLE word_counts AS SELECT word, count(1) AS count
יוצר טבלה בשם word_counts
עם שתי עמודות: word
ו count
. שאילתה זו עובדת על פלט השאילתא הפנימית (SELECT explode(split(line, '\s')) AS word FROM docs) temp"
. שאילתה זו משמשת כדי לפצל את מילות הקלט לטבלה זמנית המכונה temp
. כאשר GROUP BY WORD
מקבץ את התוצאות בהתבסס על המפתחות שלהם. התוצאות של עמודת count
מחזיקה את מספר המופעים של כל מילה בעמודת word
. לבסוף, ORDER BY WORDS
ממיין את המילים לפי סדר האלף-בית.
הערות שוליים
- ^ Venner, Jason (2009). Pro Hadoop. Apress. ISBN 978-1-4302-1942-2.
- ^ Programming Hive [Book].
- ^ Use Case Study of Hive/Hadoop
- ^
שגיאות פרמטריות בתבנית:יוטיוב
פרמטרים [ id, title ] לא מופיעים בהגדרת התבנית אפאצ'י הייב, סרטון באתר יוטיוב - ^ Amazon Elastic MapReduce Developer Guide