לדלג לתוכן

משתמש:Amir Mef/ויקינתונים - הסבר מבוא

מתוך ויקיפדיה, האנציקלופדיה החופשית

ד"ר קרן שצמן מעמותת ויקימדיה ישראל מבוא לויקינתונים. כדי להוציא נתונים צריך להבין מה זה ויקידטה. ויקינתונים - אחד המיזמים החדשים במיזמי ויקימדיה. התחיל ב-2012 כל מיזמי ויקימדיה הם בפלטפורמת ויקי. מה שמשתנה הינו התוכן.

ויקיפדיה - האתר ה-5 הנצפה בעולם. מעל 500 מליון אנשים קוראים בויקיפדיה בחודש. 18,000,000,000 עמודים 300 שפות שונות שיתופי - כל אחד יכול לתקן ולשנות חופשי:

  • מותר לכולם לעיין בתכנים
  • ליצור ולערוך תכנים
  • להעתיק, לשנות ולהפיץ תכנים [ברשיון CC - יש רק צורך בקרדיט למקור]
  • ככל שניתן - חופשית מהטיות, כולל אלה הנובעות מאינטרס מסחרי
  • חופשיות ממגבלות מקום

מעליהם - גוגל, פייסבוק. ביידו-מנוע חיפוש סיני. כל אלו אתרים תאגידים מסחריים כבדים. ויקימדיה המעוז האחרון של ה'היפים' שרצו שיתוף כללי של נתונים ומידע. פעם רבים שאפו לכך. היום רוב המידע באינטרנט שייך לגופים מסחריים ומוסדות.

מה שמייחד את ויקינתונים הוא שגם מכונות ולא רק בני אדם יכולים לערוך ולהוסיף נתונים. בויקישיתוף - מקום מרכזי לאיחסון של תמונות, שניתן למשוך לכל דף ויקיפדיה או דפים אחרים של ויקימדיה, בלי לשכפל את הערך. חוסך זמן ועבודה. אבל אם יש נתון שמשתנה באופן קבוע - כגון מספר אוכלוסי עיר - עדיף שיהיה מעודכן במקום מרכזי מסויים [ויקינתונים] ומשם יימשך לכל המיזמים. הגיעו למסקנה שאם יוצרים בסיס נתונים [רשת סמנטית] - זהו ה ווב 3. בסיס נתונים רשתי שמכיל את הקשרים הסמנטיים בין מרכיביו. מעבר ממסמכים שרק אדם יכול לקרוא, למידע שיכול להיקרא הן על ידי אדם והן על ידי מחשב. הרשת הסמנטית מאפשרת לייצר מידע חדש ולשלוף אותו. וכן לייצר שאילתות. למשל מהן ראשי העיר הגדולות שהן ממין נקבה. המידע מבוסס על ויקינתונים ועל הקשרים ביניהם ולא על ויקיפדיה. המידע המאוחזר מבוסס על התעוד שיש בנושא. אם לא כתבו בויקינתונים את מינם של ראשי העיר - נתונים אלו לא יופיעו. אפשר לתת נתונים גם על ציר הזמן, ציר המרחב

ויקידאטה[עריכת קוד מקור | עריכה]

  • מיזם של קרן ויקימדיה
  • מאגר נתונים
  • נתונים מובנים
  • נתונים מקושרים (גם למאגרי נתונים אחרים)
  • רב לשוני
  • שיתופי
  • ברשיון חופשי (CC0)
  • מבוסס על עובדות ומקורות (רפרנסים)
  • ניתן לקריאה על ידי בני אדם ועל ידי מכונות

לכל פריט מידע בויקינתונים יש מספר מזהה. כך למשל ריצ'ארד סטולמן (Q7439) לכל פריט יש תווית ותיאור המופיעים בשפות שונות. לכל פריט יש הצהרות/קביעות שונות. למשל, שהוא אדם, תמונה, מין , אזרחות וכו'

גוגל למשל מושך כבר היום נתונים רבים מויקינתונים. ויקימדיה גרמניה הצליחו להשיג תרומות ממכון לבינה מלאכותית, מגוגל ועוד והם שעשו הפיתוח הראשוני של ויקינתונים.

נתונים מובנים ומקושרים מידע בנוי בצורה של הצהרות (קביעות) שיש להן 3 רכיבים: פריט 1 - פריט - מתחיל באות Q הקשר ביניהם - תכונה (PROPEERTY) - מספר מזהה שמתחיל באות P פריט 2 - ערך (VALUE)


פריט יכול להיות כל דבר - ערך בויקיפדיה, חפץ, אדם, מקום רעיון. אפשר ליצור פריטים חדשים לבד תכונה - היא סוג של נתון שרלוונטי לפריט. למשל גובה של הר, תאריך לידה וכו' ערך - יכול להיות פריט אחר ברשת, או ערך ממש. למשל מספר, תאריך וכו' [מספרים ותאריכים כעיקרון אינם פריטי מידע, אך במקרים מסויימים תהייה להם גם ערך] ריצ'ארד סטולמן Q נולד ב[תאריך לידה] -P שהוא XX.XX.XXXX - V

יכולים להיות פריטים שמקושרים לכמה ערכים. למשל עדה יונתQ זכתה בפרס P מסוג פרס ישראל Q בשנת V

לחלק גדול מהמקורות יש הפניה למקורות ברשת ומחוץ לרשת למידע שהוצהר. יש גם הרבה מידעים שהמקורות מפוקפקים או שחסר מידע. תחת הפריט יש את כל הקישורים לאותו פריט במיזמי ויקימדיה האחרים. למשל לעדה יונת תהיה הפניה לכל השפות בהן יש לה ערך בשפות שונות, לתמונות שלה בויקישיתוף וכו'.

מזהים IDENTIFIER - תמיד לינק. סוג של תכונה המקשרת לפריט במאגרים חיצוניים. למשל VIAF , LCCN, FREEBASE,

שאילתות[עריכת קוד מקור | עריכה]

בכל דף של ויקידאטה - יש בצד Query Service. שהוא ממשק השאילתות

בראש הדף יש לחצן EXAMPLES - ששם הרבה שאילתות שאפשר ללמוד מהן איך לעבוד. לעיתים נדירות צריך לכתוב שאילתה חדשה מאפס. בדרך כלל רק לשנות

http://tinyurl.com/yakleuoa - זו שאילתה פשוטה המאפשרת לשלוף מויקידטה פריטים שהם חתולים

#Cats - זה אומר תתעלם ממה שכתוב בשורה זו אחרי זה

SELECT ?item - תבחר [סימן שאלה מציין מחזיק מקום שבו אפשר להכניס ערכים כלשהם]

WHERE

{

  ?item wdt:P31 wd:Q146.

  }

WDT - עם התכונה

WD - עם הערך


INSTANCE OF - מופע של משהו [למשל

SUBCLASS OF - תת קטגוריה של משהו [למשל 'מוח' הוא תת קטגוריה של איבר גוף]

התוצאה תהייה כל הפריטים שקשורים לחתולי בית. יופיעו רק מספרים

הכיתוב ITEM אינו חובה. אפשר להכניס כל מה שנראה לנו, ובלבד שיהיה אותו שימוש בם לפני השאילתה עצמה.


#Cats

SELECT ?animal

WHERE

{

  ?animal wdt:P31 wd:Q146?.

  }


?itemLable - ,תביא לי את התוית לא רק את המספר [צריך להתחיל באות גדולה]

SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }


?itemDescription - , תיאור הפריט


אם רוצים שהתיאור יהיה בעברית צריך לכתוב "he"

אם כותבים "he,en" - הוא יכתוב בעברית, ואם אין - יכתוב באנגלית:

SERVICE wikibase:label { bd:serviceParam wikibase:language "he,en". }


SPARKLE FOR DUMMIES


אם רוצים במקום חתולים - כלבים יש למצוא את הפריט Q של כלבים. או שהולכים לעמוד הבית של ויקינתונים ומקישים בחיפוש את המונח שמחפשים. לצד שמו יופיע גם מספר הפריט.

אפשרות נוספת להחליף במקום ה Q של החתול לכתוב כלב והמערכת תחליף למספר הפריט באופן אוטומטי.

  ?item wdt:P31 wd:Q144.

Q144 זה כלב

אם רוצים רק כלב אפשר לכתוב ב wdt: sex והוא יציע לי אפשרויות. P21 מתיחס למין של בעלי חיים. אחר כך צריך את המאפיין 'זכר' אז נכתוב MALE והוא יתן לנו ב


#Femail Chemist

#defaultView:Map

בצורה כזו אפשר לבחור גם איך רוצים שהדברים יופיעו

כדי להפעיל השלמה אוטומטית של ערכים/פריטים צריך ללחוץ CTRL + SPACE

תחביר של OR זה {} UNION {}

תחביר של AND זה שורה לאחר שורה:

{}

{}


ותחביר ל NOT לכתוב EXCLUDE או בעזרת סינון

אפשר להגביל החיפוש בעזרת LIMIT: 500