שיחת ויקיפדיה:תחזוקה/שתי שקל

תוכן הדף אינו נתמך בשפות אחרות.
מתוך ויקיפדיה, האנציקלופדיה החופשית

על שתי שקל ובעיות מין אחרות של מספרים[עריכת קוד מקור]

השיבוש "שתי שקל" מוכר וידוע, ואפילו ראש ממשלתנו הנערץ עמד על חומרתו [1]. יש לי רושם שאנו מודעים פחות לעובדה שגם במספרים גדולים יותר יש להבחין בין זכר לנקבה. פעמים רבות אני נתקל, בוויקיפדיה ומחוצה לה, בצירופים שבהם מספר נכתב בצורה המתאימה לזכר בזמן שלאחריו מופיעה מילה בנקבה, למשל הצירוף "שלושת המעצמות", כשצריך להיות "שלוש המעצמות", או "ארבעת הקושיות", כשצריך להיות "ארבע הקושיות", ואפילו "חמשת המגילות" כשצריך להיות "חמש המגילות" ו"עשרת המכות" כשצריך להיות "עשר המכות". שימו לב ותקנו כאשר אפשר לתקן.

מומחי הבוטים מוזמנים לכתוב בוט שיציג את הצירופים החשודים כשגויים, כלומר מספר בזכר (מ"שלושת" ועד "עשרת") שאחריו מילה המסתיימת ב"ות". מובן שלא כל הצירופים שגויים ("עשרת הדברות", למשל, תקין), אבל זה ישמש בסיס לתיקון (אולי באמצעות שכלול של הבוט) דוד שי - שיחה 07:41, 18 באפריל 2013 (IDT)[תגובה]

אנשים פשוט לא יודעים שיש הבדל בין זכר ונקבה במספרים אורדינליים בסמיכות. במספרים אורדינאליים רגילים עוד יודעים משהו. והצירוף שמונa עשרה הורג אותי כל פעם מחדש. • חבר לחיים - אמצו כלב!Ori‏ • PTT14:36, 18 באפריל 2013 (IDT)[תגובה]
לא לשכוח גם שכשקוראים מתוך ויקיפדיה בקול, יש להגות "שְלוש המעצמות" עם שוא בראש המילה "שלוש", שהרי זוהי סמיכות... Liad Malone - שיחה 14:48, 18 באפריל 2013 (IDT)[תגובה]
יצרתי דף שמרכז צירופים שתואמים את התבנית שהציע דוד בויקיפדיה:תחזוקה/שתי שקל. אפשר להסתייע ברשימה כדי למצוא טעויות ולתקן ידנית, ואם יש טעויות נפוצות במיוחד נוכל לתקנן עם בוט. ערן - שיחה 20:40, 18 באפריל 2013 (IDT)[תגובה]
ערן, תודה רבה!! צעד גדול לשיפור המשלב הלשוני בוויקיפדיה. אגב, קבוצת "שלושת הקבוצות" וכו' (הייתה) גדולה במיוחד, ולא רק בערכי כדורגל, אז אנא שימו לב לכך במהלך כתיבתכם בעתיד קריצה. Ravit - שיחה 21:41, 18 באפריל 2013 (IDT)[תגובה]
תודה רבה על הבוט המצוין. מתברר שיש לא מעט מילים שהן בזכר ומסתיימות ב"ות", אבל גם לאחר שסיננתי אותן נותרו מאות מילים לתיקון (כדאי ללמד את הבוט את המילים התקינות, כדי שיתעלם מהן בהרצה הבאה שלו). מצאתי מקרים מעטים שבהם הבוט זיהה מספר במקום שלא התכוון למספר ("שבעת" במשמעות "שבזמן", "להעשרת התרבות", "חוששת לגלות"). אני מציע להתעלם מה"א הידיעה, כך ש"עונות" ו"העונות" יופיעו יחד. אני מציע שאת כל המקרים של 7+ מופעים ומעלה הבוט יתקן. אם לא יהיו הפתעות, נרחיב ל-4 מופעים ומעלה. דוד שי - שיחה 22:00, 18 באפריל 2013 (IDT)[תגובה]
דוגמאות נוספות לטעויות בזיהוי מספר: נשבע/להישבע (ולא שבע). כשמריצים בוט לתיקון הוא לא מבצע תיקונים לגבי "שבע" בגלל שזו החלפה מסוכנת יותר. ערן - שיחה 01:49, 19 באפריל 2013 (IDT)[תגובה]

בעקבות התוצאות הנפלאות של הבוט הזה, אני מבקש גם את הבוט המקביל, זה שיגלה שיבושים מהצורה "ארבע שערים". אני משער שיתגלו פחות תוצאות. דוד שי - שיחה 00:32, 19 באפריל 2013 (IDT)[תגובה]

יצרתי רשימה של מופעים כאלו (בלי "עשר שערים", שעשוי להיות "חמישה עשר שערים"). הרשימה מזובלת גם אחרי שסיננתי ממנה מילים נפוצות (פעמים/שנים), אבל יש גם בעיות אמתיות כמו "ארבע חודשים". אני מקווה ללמד את הבוט לזהות זכר/נקבה בהמשך לפחות לגבי המילים שהופיעו בתוצאות קודמות (לפי "תקין/תוקן") כך שבהרצות עתידיות התוצאות יהיו ממוקדות יותר. ערן - שיחה 01:44, 19 באפריל 2013 (IDT)[תגובה]
ערן, זה נפלא! תודה. טוסברהינדי (שיחה) 07:10, 20 באפריל 2013 (IDT)[תגובה]

עוד עבודה רבה לפנינו לתיקון השגיאות שהבוט גילה עד כה, אבל אני מבקש לקבל מקבץ שלישי של שגיאות (וריאציה של המקבץ הראשון): מספר בזכר ("שני", "שלושה" עד "תשעה") שאחריו מילה המסתיימת ב"ות". דוד שי - שיחה 14:37, 20 באפריל 2013 (IDT)[תגובה]

הרצתי פעם נוספת את הבוט ועדכנתי את הפסקה המתאימה. כעת הרשימה כוללת גם שלושה/ארבעה וכו' ומילים שסווגו כ"נקבה" למרות שמסתיימות ב"ים" (פעמים). אנא ציינו "תקין" רק לגבי מילים שהן ממין זכר (בפסקה המתאימה) ואם השימוש תקין מסיבה אחרת (למשל "שבעת" במשמעות של "שבזמן") לא להשתמש ב"תקין" אלא בניסוח אחר. הבוט נעזר אחר"כ במה שסומן כ"תקין" או כ"תוקן" כדי לזהות מילים כזכר/נקבה. לגבי דברים תקינים/תוקנו אפשר להסיר את ה' הידיעה (הבוט יודע להוסיף את ה' הידיעה לכל המילים במילון). ערן - שיחה 22:14, 20 באפריל 2013 (IDT)[תגובה]
אפשר להריץ את הבוט שוב ולעדכן את הדף ? יהיה יותר קל לעבוד על דף נקי. גיא - שיחה 22:28, 2 במאי 2013 (IDT)[תגובה]
העותק האחרון של מסד הנתונים בtoolserver הוא מ-17 באפריל ולכן התוצאות אמורות להיות זהות לאלו שהיו בהרצה הקודמת. אריץ את הבוט פעם נוספת כשיהיה dump עדכני. ערן - שיחה 23:33, 2 במאי 2013 (IDT)[תגובה]

שלושת, ארבעת[עריכת קוד מקור]

מתי משתמשים ב"שלושת", "ארבעת" וכו' ? גיא - שיחה 11:41, 24 באפריל 2013 (IDT)[תגובה]

כאשר מתייחסים לעצם ממין זכר, והמספר הוא בסמיכות, למשל: שלושת המוסקטרים, ארבעת המינים, חמשת מלכי מדין. דוד שי - שיחה 19:23, 24 באפריל 2013 (IDT)[תגובה]
תודה. גיא - שיחה 00:25, 26 באפריל 2013 (IDT)[תגובה]

הצעות להרצה הבאה[עריכת קוד מקור]

אני בונה רשימה חדשה על סמך dump שיצא היום. הוספתי זאת ומעט מקרים כלליים נוספים. ערן - שיחה 21:48, 5 במאי 2013 (IDT)[תגובה]
מתי צפויה הרצה הבאה ? גיא - שיחה 09:39, 26 במאי 2013 (IDT)[תגובה]
כנראה לקראת סוף השבוע. בברכה, ערן - שיחה 20:51, 26 במאי 2013 (IDT)[תגובה]
רק חצי מהרשימה עודכנה ? גיא - שיחה 08:41, 2 ביוני 2013 (IDT)[תגובה]
הסקריפט מורץ בנפרד ליצירת רשימה של זכר ורשימת נקבה. כרגע עודכנה רק רשימה נקבה, ואח"כ תעודכן גם רשימת זכר. (אגב הריצה היא על DUMP מאתמול - כלומר נכנסים לשם גם תכנים שנוספו ממש לאחרונה). ערן - שיחה 08:53, 2 ביוני 2013 (IDT)[תגובה]
יש הרבה תוצאות מסוג "באר שבע Xים" בתוצאות הריצה האחרונה. לייבניץ - שיחה 11:50, 12 באפריל 2017 (IDT)[תגובה]

'שתי מיליון'[עריכת קוד מקור]

באותו הנושא גם לפני מליון חובה שיבוא המספר המונה בזכר לפי כללי האקדמיה.[2] יש מספר חזרות של חמש מיליון וכו', יש להוסיפן או לבוט או לרשימת התחזוקה, בברכה, Nurick - שיחה 13:48, 18 במאי 2013 (IDT)[תגובה]

תוקן ידנית, אולי יש טעם עדיין להכניס לבוט האוטומטי, יש מספר גבוה של חזרות באופן יחסי, בברכה, Nurick - שיחה 17:48, 14 ביוני 2013 (IDT)[תגובה]

טון או טונות ?[עריכת קוד מקור]

מה נכון: "חמישה טון" או "חמש טונות" ? או אולי "חמישה טונות" ? גיא - שיחה 13:11, 2 ביוני 2013 (IDT)[תגובה]

יחידת המשקל קרויה "טון" (זכר) וגם "טונה" (נקבה), לכן כל הצורות שמנית תקינות, אבל הצורה שתים עשרה טון אינה תקינה. דוד שי - שיחה 06:07, 3 ביוני 2013 (IDT)[תגובה]

פי שניים/ פי שתיים[עריכת קוד מקור]

מה נכון ? גיא - שיחה 09:04, 16 ביוני 2013 (IDT)[תגובה]

פי שניים, פי שלושה - תמיד בזכר. דוד שי - שיחה 09:23, 16 ביוני 2013 (IDT)[תגובה]
תודה. אולי כדאי להוסיף את הבדיקה לבוט. גיא - שיחה 09:34, 16 ביוני 2013 (IDT)[תגובה]

הצעות להרצה הבאה (סיבוב שני)[עריכת קוד מקור]

נראה לי הגיע הזמן להרצה נוספת (לחכות לdump גם לוקח קצת זמן), בכל אופן כדאי להתעלם מהביטוי 'בת שבע' + X. בברכה, Nurick - שיחה 13:32, 16 ביוני 2013 (IDT)[תגובה]

ערן - אפשר להריץ את הבוט ? גיא - פתרון למחיקה 22:53, 7 בינואר 2015 (IST)[תגובה]

לא ברור לי מתי זה נקבה ומתי זכר. גיא - שיחה 15:33, 10 ביולי 2013 (IDT)[תגובה]

תוצאות חוזרות[עריכת קוד מקור]

אני לא יודע אם מתוכננת ריצה נוספת, אבל כדאי שהבוט יוכל להתייחס לעמוד התוצאות ולא לתת שוב את כל התוצאות שכתוב עליהן תקין. במצב אידאלי היינו יכולים לכתוב ב"התעלמות" את כל התקינים, אבל זה לא קורה. לכן, כדי שלא נסמן שוב ושוב את אותן תוצאות כתקינות, כדאי שהבוט יעבוד גם לפי הדף הזה. תודה, בריאן - שיחה 16:56, 25 ביולי 2013 (IDT)[תגובה]

בהרצה הבאה אשנה את הבוט כך שיזכור תוצאות קודמות. בברכה, ערן - שיחה 20:55, 25 ביולי 2013 (IDT)[תגובה]
תודה! בריאן - שיחה 22:18, 25 ביולי 2013 (IDT)[תגובה]
אבל צריך לשים לב - אם כתוב תקין על מילה מסויימת זה לא אומר שלא צריך לבדוק את המילה בכלל אלא רק בערכים מסויימים. גיא - שיחה 15:07, 26 ביולי 2013 (IDT)[תגובה]

הרצה נוספת[עריכת קוד מקור]

לאחר כמעט שנתיים מהסבב הקודם, אני חושב שיש מקום להרצה נוספת ולסבב תיקונים חוזר. כרגע תיקנתי למעלה מ-10 טעויות מסוג "שלושה פעמים" וכדומה. ערן, לעזרתך אודה. בריאן - שיחה 22:01, 7 במאי 2015 (IDT)[תגובה]

אני משכתב את הבוט שיצר את הרשימה כך שיתן תוצאות יותר רלוונטיות. ערן - שיחה 21:53, 8 במאי 2015 (IDT)[תגובה]
בריאן, כתבתי את הבוט מחדש והוספתי כעת פלט חלקי לדף ובהמשך יורץ על כל ויקיפדיה. בגרסה החדשה לא נעשה שימוש יותר במילון יוצאי דופן אלא בHspell שיודע להגיד לגבי מילה אם היא זכר/נקבה (אפשר לבדוק את התוצאה שלו בממשק אינטרנטי כשמפעילים "מידע לשוני") ולהציע משמעויות שונות. יכול להיות שבהמשך אוסיף מחדש אפשרות להתעלם ממילים מסוימות. ערן - שיחה 01:49, 9 במאי 2015 (IDT)[תגובה]
מעולה! תודה! בריאן - שיחה 09:13, 9 במאי 2015 (IDT)[תגובה]
את הטעויות הנפוצות (קבוצות, מדינות, דרכים) כדאי לתקן אוטומטית, אולי כהרחבה של בוט ההחלפות. כמו בוט ההחלפות, יש לאפשר גם כאן את תבנית:ללא בוט, לסימון חריגים שאין לתקן. דוד שי - שיחה 11:24, 9 במאי 2015 (IDT)[תגובה]

אפשר להפוך כל מילה לפרק כדי שיהיה יותר נוח לסמן את התיקון ? גיא - פתרון למחיקה 14:01, 9 במאי 2015 (IDT)[תגובה]

כל מילה יצור כנראה יותר מדי פרקים, אבל אפשר לחלק למקבצים קטנים יותר כרצונך :) ערן - שיחה 14:12, 9 במאי 2015 (IDT)[תגובה]

ערן, תוכל לבנות את הרשימה מחדש בבקשה ? היו הרבה תיקונים, כולל תיקוני בוט. גיא - פתרון למחיקה 22:44, 23 במאי 2015 (IDT)[תגובה]

גיא, בשלב זה אי אפשר ליצור את הרשימה מחדש, כיוון שעדיין לא נוצר dump חדש - אפשר לראות ב[3] (ובאופן ספציפי ב[4] צריך שיהיה זמין All pages, current versions only.), עדיף לחכות ליצירת הdump הבא. בברכה, ערן - שיחה 23:20, 23 במאי 2015 (IDT)[תגובה]
ערן, מה לגבי עכשיו ? גיא - פתרון למחיקה 21:18, 12 ביוני 2015 (IDT)[תגובה]
הרצתי. ערן - שיחה 01:05, 13 ביוני 2015 (IDT)[תגובה]
ערן, אפשר להריץ עוד פעם ? גיא - פתרון למחיקה 16:40, 24 ביולי 2015 (IDT)[תגובה]
אני לא חושב שצריך להריץ כל חודש. בואו נסיים את רוב הרשימה הנוכחית ואז יהיה כדאי להריץ שוב. בריאן - שיחה 11:02, 25 ביולי 2015 (IDT)[תגובה]
ערן, GuySh, נותרה רק הפסקה של "1" לתיקון ועברו כמעט 4 חודשים מאז ההרצה הקודמת. אפשר לסיים את התיקונים או להריץ שוב, לשיקולכם. בריאן - שיחה 14:25, 7 באוקטובר 2015 (IDT)[תגובה]
אני בעד להריץ. גיא - פתרון למחיקה 14:36, 8 באוקטובר 2015 (IDT)[תגובה]

ערן, ראיתי שהרצת ועדכנת, תודה. אך יש טעות משום מה: התוצאה הגדולה ביותר היא של המילה "המעמדות", אך כל המופעים הם תקינים והיא אף מופיעה במילון כחריגה. כדאי לבדוק איך בכל זאת נוצרה הטעות. בריאן - שיחה 20:06, 6 בנובמבר 2015 (IST)[תגובה]

גם את "עשרת הדברות" כדאי לסמן כחריג תקין. דוד שי - שיחה 20:25, 6 בנובמבר 2015 (IST)[תגובה]
עוד חריג תקין: "פי X מאות", כאשר X הוא מספר בנקבה (למשל "פי ארבע מאות"). דוד שי - שיחה 20:37, 6 בנובמבר 2015 (IST)[תגובה]
הוספתי תיקון שיכנס לשימוש בהרצה הבאה. ערן - שיחה 21:00, 6 בנובמבר 2015 (IST)[תגובה]
גם את "עשרת הדברות" כדאי לסמן כחריג תקין. דוד שי - שיחה 20:25, 6 בנובמבר 2015 (IST)[תגובה]
כעת כשהבוט מתבסס על hspell (וללא החרגות), אם יש טעויות של ניתוח לשוני שגוי של מילה, זה כנראה יהיה בגלל שהמילה חסרה במילון של hspell. אפשר לוודא בבממשק ה-webי (עם מידע לשוני) כיצד hspell מנתח מילה, ואם הניתוח שגוי אפשר לשלוח מייל ל nyh@math.technion.ac.il ולבקש שיוסיפו/יתקנו מילה (אני מניח שנוח יותר לטפל ברשימה מסודרת ולא במייל בודד לכל מילה - אז אפשר לקראת סוף הטיפול ברשימה לשלוח רשימה מסודרת). בצורה הזו פרויקטים אחרים שנהנים מ-hspell יוכלו גם כן לקבל את התיקונים.
לכן ביקשתי להחריג את "עשרת הדברות" (זה האיות הנכון) הסיכוי שמישהו ידבר על עשרת הדברות ויתכוון לעשר הדברות של מזיקים קלוש ביותר. דוד שי - שיחה 21:04, 6 בנובמבר 2015 (IST)[תגובה]

ערן, ראיתי תיקונים של הבוט. יש משהו שאנחנו צריכים לדעת ? גיא - פתרון למחיקה 19:57, 15 במאי 2015 (IDT)[תגובה]

גיא, ניסיתי להריץ בוט שיטפל בחלק מהבעיות שנראו פחות מסוכנות אבל בוט לא יכול לרוץ בצורה עצמאית לגמרי על הרשימה כיוון שיש יותר מדי מקרים שבהם החלפה תהיה שגויה ("זקן שבע ימים", "לחמש עבדים בנשק" וכו') אבל אני מנסה להגדיר כלי חצי אוטומטי שיאפשר לתקן בצורה שיטתית בעיות כאלו. בברכה, ערן - שיחה 01:12, 16 במאי 2015 (IDT)[תגובה]
את בעיית "שבע ימים" במשמעות של זקן תיקנתי באמצעות הוספת נקודה של שי"ן שמאלית. במהלך התיקון נתקלתי בבעיה אחרת שיוצר צירוף זה: המוסף "7 ימים" של "ידיעות אחרונות", שנכתב פעמים אחדות בטעות כפולה כ"שבע ימים" - תיקנתי מופעים אלה. דוד שי - שיחה 06:14, 16 במאי 2015 (IDT)[תגובה]
אם נתקן את כל הרשימה - הבוט לא יוכל להתאמן :) גיא - פתרון למחיקה 13:40, 16 במאי 2015 (IDT)[תגובה]
עדכון: הוספתי בדיקה כזו בצ'קטי. ערן - שיחה 22:49, 16 במאי 2015 (IDT)[תגובה]

ערן, תוכל לעדכן את הרשימה? בברכה, אורשיחה18:03, 10 באפריל 2017 (IDT)[תגובה]

כמה מילים וביטויים שיש להחריג[עריכת קוד מקור]

לריצות הבאות:

  • קארמפות - זכר
  • בודהיסטוות - זכר
  • באר שבע - לא מספר
  • גיל חמש/ארבע/תשע וכו' - לא מספר
  • דשבועות - לא ריבוי
  • ימותו - לא ריבוי
  • ארבע בבות - כך במקור
  • קרח תשע - לא מספר
  • איקונות - נקבה
  • קולבונות - זכר
  • אבונה, אבונאות - זכר
  • מצעות - נקבה
  • שלש עשרה מידות
  • ארבע גלגליים
  • מעמדות - זכר
  • עקבות, עקבה - נקבה
  • הולכי על ארבע - לא מספר
  • סטואה, סטואיי - נקבה
  • מלוות - נקבה
  • פחה, פאשה, פאשות - זכר

גיא - פתרון למחיקה 10:03, 5 ביוני 2017 (IDT)[תגובה]

ערן, אפשר להחריג את הרשימה הזו ? גיא - פתרון למחיקה 10:50, 15 ביוני 2017 (IDT)[תגובה]
גיא, לדעתי נכון יותר לטפל לפי מקרים:
  • במקרים שבהם הטעות היא במילון שמציין מילה כזכר/נקבה למרות שזה ההפך (למשל מעמדות), כדאי לעדכן בויקיפדיה:תחזוקה/שתי שקל/הצעות ל-hspell ונוכל בהמשך לשלוח תיקונים למיזם hspell בצורה מרוכזת. כשהמילון מתוקן גם לא נטעה, וגם נמצא טעויות בכיוון ההפוך.
  • במקרים של טעות במקור - אני צריך ללמד את הבוט בהזדמנות לדלג על ציטוטים. בינתיים כדאי שבמקומות שבהם יש טעות במקור לוודא שהמקור מופיע בתבנית:ציטוט, תבנית:ציטוטון או תבנית דומה אחרת לציטוט (כל עוד זה מתאים)
  • החרגות - אני צריך ללמד בהזדמנות את הבוט להתעלם ממושגים שכוללים מספר, למשל "באר שבע". הדרך הנכונה לעשות את זה היא כנראה אינפורמציה הדדית על זוגות מילים סמוכות בוויקיפדיה.
ערן - שיחה 22:59, 15 ביוני 2017 (IDT)[תגובה]
עוד משהו: כאשר לפני מספר נכתב "בני" או "בגיל", למשל "ילדים בני תשע" או "ילדים בגיל תשע", המספר צריך להיות בנקבה ואין לבדוק את המילה שלאחר המספר. דוד שי - שיחה 06:49, 16 ביוני 2017 (IDT)[תגובה]
ערן, רשמתי כמה דברים בויקיפדיה:תחזוקה/שתי שקל/הצעות ל-hspell, לא יודע אם זה תקין. גיא - פתרון למחיקה 13:22, 20 ביוני 2017 (IDT)[תגובה]
גיא: בגדול אם מילה צריכה להופיע במילון היא יכולה להתאים לשם, ואם היא לא מתאימה למילון אז לא צריכה - למשל אני לא בטוח ש"בודהיסטווה" מתאים. מבחינת הפורמט של המילון - אני חושב שזה נכון אבל מודה שמעולם לא ערכתי את המילון ואין לי נסיון בזה. ערן - שיחה 20:55, 20 ביוני 2017 (IDT)[תגובה]
גם לא ברור איך לסמן את המין של המילה. גיא - פתרון למחיקה 23:26, 20 ביוני 2017 (IDT)[תגובה]
ברשימה הנוכחית סימנתי מופעים בערכים שונים שאין לתקן, מסיבות שונות. יש לאפשר לסמן מספר בערך ככזה שאין לתקן, למשל: "בני באר {{מספר תקין|שבע}} הולכים לים". דוד שי - שיחה 06:26, 20 באוקטובר 2017 (IDT)[תגובה]
זה יסבך את הערכים. אני עדיין מאמין שאפשר ללמד את הבוט. גיא - פתרון למחיקה 20:30, 21 באוקטובר 2017 (IDT)[תגובה]
כאשר זו מילה שיש להחריג את כל מופעיה, כמו "מעמדות", ניתן ללמד את הבוט (או את hspell). כאשר מדובר בחריג נקודתי, אין טעם ללמד את הבוט. דוד שי - שיחה 20:40, 21 באוקטובר 2017 (IDT)[תגובה]
אני לא הייתי רוצה שייווצר מצב שאנחנו עושים שינויים בערכים רק במטרה שמא לא תתווסף רשומה בדף תחזוקה. גיא - פתרון למחיקה 15:59, 22 באוקטובר 2017 (IDT)[תגובה]
זה עיקרון מצוין, אבל כבר חרגנו ממנו בבוט החלפות. אפשר לצמצם את הנזק בכך שמידע לבוט לא יופיע בגוף הערך אלא בסופו, כך שכאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים". דוד שי - שיחה 19:08, 22 באוקטובר 2017 (IDT)[תגובה]
ערן, תוכל לממש את הצעתי האחרונה? כוונתי: כאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים" בערך זה. דוד שי - שיחה 09:59, 15 בנובמבר 2017 (IST)[תגובה]
זה אומנם עשוי להיחשב באג, אבל כבר כעת הבוט מתעלם ממילים שיש לפניהן סימן "|". ערן - שיחה 22:37, 15 בנובמבר 2017 (IST)[תגובה]

במפגש ויקיפדיה לפני שבוע הזכיר לי דוד שי את הדיון הנ"ל, ובעקבות זאת עדכנתי את הסקריפט (מתייג גם את GuySh). השינויים בסקריפט יחולו מהרשימה הבאה (מפורסמת ב15 בחודש) וכוללים:

  • ביטויים שמופיעים בתוך תבניות ציטוט לא יופיעו
  • ניתן להחריג ביטויים באמצעות תבנית:שתי שקל (מעצם זה שהיא תבנית ציטוט)
  • מילים שבהן מופיע גרש יופיעו מעתה ברשימה (למשל נינג'ה)
  • הבוט משתמש בגרסה מעט חדשה יותר של hspell שכוללת אוצר מילים גדול במעט

ערן - שיחה 17:39, 13 בינואר 2018 (IST)[תגובה]

ערן, בערך בריכות שלמה יש ביטוי "שתי קצותיה" אבל זה מופיע ברשימה למרות שזה בתוך ציטוט. גיא - פתרון למחיקה 10:08, 17 בינואר 2018 (IST)[תגובה]

איך מבקשים שינוי שם קובץ ? https://commons.wikimedia.org/wiki/File:%D7%94%D7%94%D7%A8%D7%99%D7%9D_%D7%94%D7%9B%D7%97%D7%95%D7%9C%D7%99%D7%9D_-_%D7%A9%D7%9C%D7%95%D7%A9%D7%AA_%D7%94%D7%90%D7%97%D7%99%D7%95%D7%AA.JPG#.7B.7Bint:filedesc.7D.7D גיא - פתרון למחיקה 22:00, 18 בספטמבר 2017 (IDT)[תגובה]

מטרופולינים[עריכת קוד מקור]

מדוע הבוט חושב שזאת נקבה ? גיא - פתרון למחיקה 10:22, 21 בדצמבר 2017 (IST)[תגובה]

נינג'ה הוא זכר או נקבה ? גיא - פתרון למחיקה 16:46, 15 בינואר 2018 (IST)[תגובה]

דוד שי ?
קיבלתי תשובה שזה כמו ג'ודוקא - גם זכר וגם נקבה. גיא - פתרון למחיקה 16:26, 21 בינואר 2018 (IST)[תגובה]

כמה בקשות[עריכת קוד מקור]

ערן, יש לי כמה בקשות:

  1. להריץ את הבוט גם על מרחב קטגוריות ותבניות.
  2. צריך ללמד את הבוט ש"שלוש עשרה" זה נקבה ולא "עשרה" שהוא זכר.
  3. וכנ"ל "שניים עשר" זה זכר ולא "עשר" שהיא נקבה.
  4. תודה לך. גיא - פתרון למחיקה 10:25, 18 ביולי 2018 (IDT)[תגובה]
גיא:
תוכל להביא דוגמאות ל2 ול3? ערן - שיחה 10:50, 18 ביולי 2018 (IDT)[תגובה]
ערן, למשל: אזכרה אלהים ואהמיה - "שלש עשרה מידות".
ישראל באירוויזיון - "שתיים עשרה נקודות". גיא - פתרון למחיקה 11:04, 18 ביולי 2018 (IDT)[תגובה]

שכלול הבוט[עריכת קוד מקור]

לאור נוחות השימוש בבוט ויקיפדיה:תיקון תקלדות בקליק, אני מציע שגם הבוט שלפנינו יפעל בטכניקה דומה, כלומר יציג קטע מהמשפט הבעייתי ויאפשר תיקון או הסרה בקליק. ערן וUziel302, לטיפולכם. דוד שי - שיחה 11:40, 13 באפריל 2019 (IDT)[תגובה]

דוד שי, תודה על ההצעה. אני אישית ממוקד בשיפור הגאדג'ט של תיקון תקלדות. Uziel302 - שיחה 11:43, 13 באפריל 2019 (IDT)[תגובה]
זה בסדר גמור. התכוונתי שתעביר לערן את הידע והתוכנה שצברת שם, כדי שישלב אותם בבוט שלפנינו. דוד שי - שיחה 11:45, 13 באפריל 2019 (IDT)[תגובה]

שתי דיברות או שני דיברות ?[עריכת קוד מקור]

צריך עזרת הציבור. מה נכון ? מתוך הערך טיעון מן הנס. גיא - פתרון למחיקה 00:31, 20 בנובמבר 2019 (IST)[תגובה]

כיוון שמוכר לנו הביטוי "עשרת הדיברות", מתבקשת הצורה "שני דיברות". דוד שי - שיחה 06:52, 20 בנובמבר 2019 (IST)[תגובה]
תודה, דוד, החלפתי. גיא - פתרון למחיקה 01:14, 22 בנובמבר 2019 (IST)[תגובה]

מודעה של מלון אמריקן קולוני[עריכת קוד מקור]

מלון אמריקן קולוני פרסם אתמול מודעה על עמוד שלם בפתח מוסף "הארץ", מודעה שבוודאי שולמו בגינה אלפי שקלים למשרד הפרסום ועוד אלפי שקלים ל"הארץ". ומה מופיע במרכזה:

כך, "ארבעת נשותיו". כמה חבל ש"בוט שתי שקל" אינו מגיה את מוסף "הארץ". גם בלי הבוט, לוּ קראו את הערך היו מוצאים בו ש"המבנה הראשי של המלון היה במקורו ארמון, שנבנה בידי רבאח אל-חוסייני עבור ארבע נשותיו". דוד שי - שיחה 17:11, 15 בפברואר 2020 (IST)[תגובה]

בדיקת סמיכות[עריכת קוד מקור]

ערן, האם הבוט בודק גם שגיאות כגון "שתי ענפי הספורט" ? גיא - פתרון למחיקה 11:41, 16 בפברואר 2020 (IST)[תגובה]