נושא בדף שיחת משתמש:Mikey641

עדכון שם בשפת המקור בוויקינתונים

25
בורה בורה (שיחהתרומות)

משתמשת:רחל1 מוסיפה טונות כאלה בתבניות הקולנוע. תוכל להריץ את הבוט שישאב מתבניות הקולנוע השונות ויעדכן בוויקינתונים. כי השדה הזה חלש מאוד בוויקינתונים. לא יודע איך תתגבר על בעיית השפה שהיא שדה חובה לפריט זה. בורה בורה - שיחה 23:08, 25 בינואר 2017 (IST)

Mikey641 (שיחהתרומות)

בלתי אפשרי בלי שם השפה

בורה בורה (שיחהתרומות)

והרי את זה אני יודע... השאלה היא האם יש איזה טריק לדעת את השפה? הרי גוגל עושה זאת בעת שהוא מתרגם תוכן. יתכן וזו הסיבה שהשדות האלה אינם מאוכלסים, כי אף בוט לא התגבר על הבעיה.

Mikey641 (שיחהתרומות)

אם תמצא מישהו שיודע לכתוב בוטים, אפשר לעשות את זה בקלות. קח לדוגמה את ג'ונתן נולאן כתוב (באנגלית: Jonathan Nolan; נולד ב-1976). מופיע גם השם בשפת המקור, וגם השפה רק צריך שמישהו יכתוב קוד.

בורה בורה (שיחהתרומות)

רעיון טוב. משתמש:Kotz אפשר להכין קובץ על סמך המפרט הזה? צריך רק קובץ במבנה שם בעברית, שם בלועזית ושפת המקור. מייקי מזה כבר יכול לעדכן את ויקינתונים.

Kotz (שיחהתרומות)

לא הבנתי.

IKhitron (שיחהתרומות)

אם הבנתי אתכם נכון, dom בדרך כלל כולל פרמטר lang.

בורה בורה (שיחהתרומות)

משתמש:Kotz, אתה מנתח למשל את 200 התווים הראשונים בערך ומחפש מלים בשפה זרה בין (), יש להניח שתמיד יהיה (). זה יהיה השם בלועזית. גם בתוך הסוגריים, לפני הלועזית, יהיה אנגלית, צרפתית, ערבית וכו'. זו השפה. את השם בעברית אתה לוקח משם הערך, וזהו יש לנו דו"ח. יגאל, אנו מציעים ניתוח לקסיקלי בלבד.

Kotz (שיחהתרומות)

זה לא 200 תוים ראשונים בגלל כל התבניות שיש בראש הערך. אפשר לחפש ביטוי רגלורי מהסגנון "(באנגלית: jfkdjfkdfdk" ואח"כ ; או , או ).

אולי יותר פשוט: לחפש "(ב...:....)" ולהוציא את זה עם שם הערך ואח?כ מישהו יעבור על הרשימה, נניח בEXCEL.

בורה בורה (שיחהתרומות)

מדובר באלפים, מסתמא עשרות אלפים, כך שצריך כמה שפחות ידנית. ביטוי שיחפש (@@אנגלית@@name@@) כאשר @@ זה רווחים, מספרים או כל תו אחר, נראה לי מספיק טוב. משתמש:Kotz, תוכל לכתוב משהו כזה? אם יעבוד, להוסיף שפות כבר יהיה קל.

Mikey641 (שיחהתרומות)

אין צורך. מצאתי דרך הרבה הרבה יותר קלה

בורה בורה (שיחהתרומות)

תוכל להראות דוגמה של ערך שעודכן בשיטה החדשה?

Mikey641 (שיחהתרומות)

עוד מעט תראה 80,000 ביפנית

Mikey641 (שיחהתרומות)

אוקיי. אז זה ידחה למועד אחר. מה שעשיתי היה לייצא רשימה בSPARQL של יפנים ולצידם התווית היפנית בוויקינתונים. הבעיה היא השפה. השפה היא לא בצורה של qualifier ולכן אני לא יודע מה לעשות איתה בQuickStatements אז אני צריך לבדוק את זה עם המפתח של הכלי.

Mikey641 (שיחהתרומות)

שלחתי לו הודעה ואחכה לתגובתו

Mikey641 (שיחהתרומות)

אוקיי. הסתדרתי לבד וכרגע אני מוסיף 80,000 שם בשפת המקור ביפנית

בורה בורה (שיחהתרומות)

הזכר לי מה שם הבוט שלך?

Mikey641 (שיחהתרומות)

Mikey641Bot

Mikey641 (שיחהתרומות)

עכשיו עוד 150,000 בצרפתית...

בורה בורה (שיחהתרומות)

כמה ערכים הוא מעדכן בדקה? כי לבוט של קוץ יש לכל היותר 100-120 בדקה

בורה בורה (שיחהתרומות)

ובכמויות כאלה הוא כבר מזמן היה מתרסק...

Mikey641 (שיחהתרומות)

בדקתי עכשיו. ביפני זה 70 לדקה. בצרפתית לא בדקתי עדיין.

Mikey641 (שיחהתרומות)
בורה בורה (שיחהתרומות)

זה דומה ל-WIDAR שאיתו הייתי מעדכן את ויקינתונים במגדר? כי הוא עושה רק 6 בדקה שזה אסון. הכלי שלך גם מעדכן מגדר?

Mikey641 (שיחהתרומות)

דומה, רק שבQuickstatements אפשר לעשות הרבה יותר מרק לעדכן מגדר, כמו שאמרתי, הוספתי תוויות לכמה מאות ערכים של כלכלת X, חקלאות X, וכדומה. אפשר להוסיף באמצעותו לא רק קביעה אלא גם qulifiers ומקורות (לדוגמה מיובא מוויקיפדיה העברית)