שיחת ויקיפדיה:מסנן השחתות/מסנן 12 – הבדלי גרסאות
מ שוחזר מעריכות של 109.160.253.47 (שיחה) לעריכה האחרונה של Havelock |
|||
שורה 105: | שורה 105: | ||
::::::::אנשים מוכשרים יודעים כיצד לשקר בסטטיסטיקה, יש לי מעט ידע בזה, קל להבין שהסטטיסטיקה לא משחקת פה בכלל מכיוון שאני מדבר על חשדות ועל ניטור של עריכות אנונימיות, ניטורים ובדיקות של עריכות כאלה לא מתועדות בשום מקום, כמו כן גם היחס לאנונימים. |
::::::::אנשים מוכשרים יודעים כיצד לשקר בסטטיסטיקה, יש לי מעט ידע בזה, קל להבין שהסטטיסטיקה לא משחקת פה בכלל מכיוון שאני מדבר על חשדות ועל ניטור של עריכות אנונימיות, ניטורים ובדיקות של עריכות כאלה לא מתועדות בשום מקום, כמו כן גם היחס לאנונימים. |
||
:::::::::ננסה גישה אחרת - מה אתה רוצה בעצם? מה מטרת הדיון? נראה שגיבשת דעתך. [[משתמש:Havelock|זהר דרוקמן]] - [[משתמש:Havelock/ספרד לוקחת|לזכר פול]] 08:10, 15 בפברואר 2011 (IST) |
:::::::::ננסה גישה אחרת - מה אתה רוצה בעצם? מה מטרת הדיון? נראה שגיבשת דעתך. [[משתמש:Havelock|זהר דרוקמן]] - [[משתמש:Havelock/ספרד לוקחת|לזכר פול]] 08:10, 15 בפברואר 2011 (IST) |
||
::::::::::המטרה שלי היא שיפור היחס למשתמשים אנונימיים ומה שאני רוצה לדעת בפרקטיקה למה המסנן הזה ומסננים נוספים (שהם תולדה של חשדנות ושל עוינות כלפי משתמשים אנונימיים) מופעלים בויקיפדיה. |
|||
:::::"מבטיח" זו אולי מילה קצת חזקה מדי. נתפשר על "משפר את הסיכוי"? [[משתמש:קיפודנחש|קיפודנחש]] - [[שיחת משתמש:קיפודנחש|שיחה]] 19:44, 6 בפברואר 2011 (IST) |
:::::"מבטיח" זו אולי מילה קצת חזקה מדי. נתפשר על "משפר את הסיכוי"? [[משתמש:קיפודנחש|קיפודנחש]] - [[שיחת משתמש:קיפודנחש|שיחה]] 19:44, 6 בפברואר 2011 (IST) |
||
::::::אוקיי, אבל לטעמי משפר את הסיכוי פלאים. מאחר וגם ככה יש לי נטייה לעבור על רשימות המעקב שלי עם שינויים של אנונימים בלבד... [[משתמש:Havelock|זהר דרוקמן]] - [[משתמש:Havelock/ספרד לוקחת|לזכר פול]] 23:36, 6 בפברואר 2011 (IST) |
::::::אוקיי, אבל לטעמי משפר את הסיכוי פלאים. מאחר וגם ככה יש לי נטייה לעבור על רשימות המעקב שלי עם שינויים של אנונימים בלבד... [[משתמש:Havelock|זהר דרוקמן]] - [[משתמש:Havelock/ספרד לוקחת|לזכר פול]] 23:36, 6 בפברואר 2011 (IST) |
גרסה מ־20:47, 16 בפברואר 2011
קללות
- הועבר מ-שיחת ויקיפדיה:מסנן_השחתות:
האם יש טעם ליצור מסנן נגד קללות? הבעיה היא שיש לנו ערכים עם קללות: זין (סלנג), כוס (כלי), תחת התות, שק לי בתחת, כאב ביצים, פקצה, פרחה וכד'. אולי יותר משתיים-שלוש קללות שונות? אולי בכל זאת להזהיר כאשר מדובר בקללות בטקסט שנוסף לערך? Yonidebest Ω Talk 00:29, 10 באפריל 2009 (IDT)
- לדעתי יש צורך במסנן כזה, ואפילו אחד שישחזר אוטומאטית. אחוז גדול מאוד מההשחתות מכילות קללות. כמובן שצריך להגיד למסנן לדלג על ערכים כדוגמת אלה שציינת - האם זה אפשרי? ובנוסף, המסנן צריך להבדיל בין קללות לביטויים לגיטימיים, למשל "זין" - קללה, "כלי זין" - לגיטימי, מה שבוודאי יהיה מאוד קל לתכנת באמצעות Regular Expressions. (שוב, האם זה אפשרי?) ברק שושני - שיחה 02:09, 16 באפריל 2009 (IDT)
- ומה אם מקשרים לערכים הלאה או שהתייחסות עצמה רלוונטית (כמה רחוק היום עד שהמשפט "והתקשורת הצמידה לה הכינוי הפקצה של המדינה" יופיע באופן לגיטימי בערך?)? זהר דרוקמן - I♥Wiki 02:17, 16 באפריל 2009 (IDT)
- אם משתמש ותיק מבצע עריכה - אז מצידי שירשום 700 קללות. אם אנונימי מבצע עריכה המכילה קללות - לדעתי צריך קודם לשחזר ורק אח"כ לבדוק אם העריכה לגיטימית או לא. ברק שושני - שיחה 09:28, 16 באפריל 2009 (IDT)
- זאת לא גישה בריאה בעיני. זהר דרוקמן - I♥Wiki 12:20, 16 באפריל 2009 (IDT)
- אפשר להתווכח על זה, אך בכל מקרה, אני חושב שאין ספק שכדאי שמסנן ההשחתות לפחות יתריע על עריכות המכילות קללות כדי שלא נפספס אותן בטעות. ברק שושני - שיחה 15:03, 16 באפריל 2009 (IDT)
- זאת לא גישה בריאה בעיני. זהר דרוקמן - I♥Wiki 12:20, 16 באפריל 2009 (IDT)
- אם משתמש ותיק מבצע עריכה - אז מצידי שירשום 700 קללות. אם אנונימי מבצע עריכה המכילה קללות - לדעתי צריך קודם לשחזר ורק אח"כ לבדוק אם העריכה לגיטימית או לא. ברק שושני - שיחה 09:28, 16 באפריל 2009 (IDT)
- ומה אם מקשרים לערכים הלאה או שהתייחסות עצמה רלוונטית (כמה רחוק היום עד שהמשפט "והתקשורת הצמידה לה הכינוי הפקצה של המדינה" יופיע באופן לגיטימי בערך?)? זהר דרוקמן - I♥Wiki 02:17, 16 באפריל 2009 (IDT)
- יצרתי מסנן עם אינספור קללות. טרם הפעלתי אותו. מי שחושב על עוד מוזמן להציע (ולהוסיף אם הוא מכיר ביטויים רגולריים). המסנן מזהיר לפני השמירה, וגם מסמן את העריכה אם האנונימי החליט בכל זאת לשמור. Yonidebest Ω Talk 17:55, 16 באפריל 2009 (IDT)
- שמע, מאיפה לך האוסף הנאה הזה של קללות? יש שם כמה שהייתי מוריד, למשל "חנון", "לגמור" (יהיו הרבה יותר עריכות לגיטימיות שיכילו את הביטוי הזה מאשר השחתות...), "אורגזמה" (זו בכלל לא קללה), "סיפוק מיני" (למה שזה יופיע בהשחתה?) ועוד. ברק שושני - שיחה 18:23, 16 באפריל 2009 (IDT)
- זונה, כוס, סקס, הומו, גיי, אשך, שמן, כלבה, מפגר, שיט, אנאלי, אוראלי, לסבית, סרסור, נרתיק, בתולה, בתולין, אוננות, אורגזמה, אורגיה, אשכים, פי הטבעת, קונדום, קרציה, שדיים, וסיפוק מיני, לכל אלה יש סיכוי רב להופיע במגוון רחב של צורות קבילות, חלקם אפילו בתדירות גדולה יותר שלא כהשחתה. על כן אני מציע לוותר על האזהרה ולאפשר למסנן זה רק לתייג עריכות כחשד לקללות. דניאל ב. 19:50, 16 באפריל 2009 (IDT)
- בנוסף אני לא חושב שיש להגביל מסנן זה רק לקללות, אלא להופכו לרשימה שחורה כללית. לדוגמה את המילה "ויקיפדיה" כמעט אף פעם לא אמורה להופיע במרחב הערכים ולרוב אנונימי יוסיף אותה במשפט כגון "ויקיפדיה <קללה>!" או "איך מכניסים ערך לוויקיפדיה?". כך גם כדי שיתריע על שמות תואר כגון "מכוער/ת" ו"קופה" ("קוף" נפוץ מידי במצב קביל). דניאל ב. 19:56, 16 באפריל 2009 (IDT)
- אפשר להפעיל את המסנן לצורך תיוג בלבד כי ייתכנו מקרים שבהם מילים יהיו לגיטימיות. כפי שנאמר כבר חלק מהמילים לגיטימיות (למשל זונה בהקשר של רחב הזונה). נפןץ מאוד השימןש בשגיעות כטיב או בתקיעת שטווויות באמצע מילים, שהמסנן יתקשה לתפוס. ערן - שיחה 20:36, 16 באפריל 2009 (IDT)
- מובן שחלק מהמילים לגיטימיות, כמו הזונה הזו רחב, אבל המטרה של המסנן הוא להתריע. אנונימיים יוכלו בכל זאת לשמור את הדף. המסנן אינו מונע מהם מלשמור. נקודת המוצא היא שאנונימיים שמוסיפים מילים כאלו, עושים זאת ככל הנראה למטרה רעה, ולא כדי לדבר על רחב, על כוסות, על גמירת הגמרא, על הכיף שבשיט ועל הכלבה הזו לאסי. אם בכל זאת לא התכוונו לקלל - שיישמרו את הדף. המסנן מרתיע ומזהיר - לא מונע.
- אוסיף את ויקיפדיה ומילות תיאור נוספות, ואראה כמה שגיאות כתיב אפשר להכניס.
- ברק - אני רק נראה נחמד ;-) Yonidebest Ω Talk 13:00, 17 באפריל 2009 (IDT)
- אבל הרתעה שכזאת פוגעת באנונימים שבאים לתרום וגורמת לבלבול. רצוי להימנע ממנה כמה שיותר. משתמש שיקבל אזהרה על שימוש במילה "ויקיפדיה" בכלל לא יבין מה רוצים ממנו ואיזו מילה שהויף היא "מילה רעה". עדיף תיוג בלבד, ככה גם אפשר להוסיף מילים רבות נוספות. דניאל ב. 13:12, 17 באפריל 2009 (IDT)
- אני לא חושב שהיא פוגעת. אני אגיד לך מה יותר פוגע - כשצריך למלא capcha. האזהרה מתייחסת למילים "לא רצויות" ולא למילים "רעות". אם אנונימי לא מבין - שלא יבין. העיקר שמנענו את השמירה. בינתיים אני שם תיוג בלבד כדי לראות אילו עריכות מתויגות. Yonidebest Ω Talk 03:46, 19 באפריל 2009 (IDT)
- מה זאת אומרת "העיקר שמנענו את השמירה", ואם מדובר בעריכה מועילה? דניאל ב. 18:57, 19 באפריל 2009 (IDT)
- "העיקר שמנענו את השמירה" = אחרי שמקללים ושומרים, מופיעה הודעת אזהרה לפני השמירה הסופית. אם מדובר בעריכה מועילה, אני מצפה מהאנונימי ללחוץ על "שמור" שנית. Yonidebest Ω Talk 21:40, 19 באפריל 2009 (IDT)
- ואני לא. מדובר באנונמי מבולבל. דניאל ב. 21:52, 19 באפריל 2009 (IDT)
- אם יקרא את האזהרה, כפי שאנחנו מצפים ממנו לקרוא אותה (אחרת למה היא שם), לא יהיה מבולבל. Yonidebest Ω Talk 13:09, 25 באפריל 2009 (IDT)
- ואני לא. מדובר באנונמי מבולבל. דניאל ב. 21:52, 19 באפריל 2009 (IDT)
- "העיקר שמנענו את השמירה" = אחרי שמקללים ושומרים, מופיעה הודעת אזהרה לפני השמירה הסופית. אם מדובר בעריכה מועילה, אני מצפה מהאנונימי ללחוץ על "שמור" שנית. Yonidebest Ω Talk 21:40, 19 באפריל 2009 (IDT)
- מה זאת אומרת "העיקר שמנענו את השמירה", ואם מדובר בעריכה מועילה? דניאל ב. 18:57, 19 באפריל 2009 (IDT)
- אני לא חושב שהיא פוגעת. אני אגיד לך מה יותר פוגע - כשצריך למלא capcha. האזהרה מתייחסת למילים "לא רצויות" ולא למילים "רעות". אם אנונימי לא מבין - שלא יבין. העיקר שמנענו את השמירה. בינתיים אני שם תיוג בלבד כדי לראות אילו עריכות מתויגות. Yonidebest Ω Talk 03:46, 19 באפריל 2009 (IDT)
- אבל הרתעה שכזאת פוגעת באנונימים שבאים לתרום וגורמת לבלבול. רצוי להימנע ממנה כמה שיותר. משתמש שיקבל אזהרה על שימוש במילה "ויקיפדיה" בכלל לא יבין מה רוצים ממנו ואיזו מילה שהויף היא "מילה רעה". עדיף תיוג בלבד, ככה גם אפשר להוסיף מילים רבות נוספות. דניאל ב. 13:12, 17 באפריל 2009 (IDT)
- אפשר להפעיל את המסנן לצורך תיוג בלבד כי ייתכנו מקרים שבהם מילים יהיו לגיטימיות. כפי שנאמר כבר חלק מהמילים לגיטימיות (למשל זונה בהקשר של רחב הזונה). נפןץ מאוד השימןש בשגיעות כטיב או בתקיעת שטווויות באמצע מילים, שהמסנן יתקשה לתפוס. ערן - שיחה 20:36, 16 באפריל 2009 (IDT)
- שמע, מאיפה לך האוסף הנאה הזה של קללות? יש שם כמה שהייתי מוריד, למשל "חנון", "לגמור" (יהיו הרבה יותר עריכות לגיטימיות שיכילו את הביטוי הזה מאשר השחתות...), "אורגזמה" (זו בכלל לא קללה), "סיפוק מיני" (למה שזה יופיע בהשחתה?) ועוד. ברק שושני - שיחה 18:23, 16 באפריל 2009 (IDT)
מסנן מוסתר
ראיתי שהמסנן תפס השחתה ורציתי לדעת איזה מילים בהשחתה לא עברו את הפילטר (ואולי להציע להוסיף מילים אחרות שהופיעו בהשחתה). האם ניתן להגביל את הצפויה לחברי קבוצת Autoconfirmed? תומר א. - שיחה 18:58, 24 באפריל 2009 (IDT)
- אין אפשרות טכנית כזו. Yonidebest Ω Talk 13:08, 25 באפריל 2009 (IDT)
- אוקי. אפשר לקבל בפרטי את רשימת המילים? תומר א. - שיחה 13:10, 25 באפריל 2009 (IDT)
- בפרטי? אני מניח שכן. אל תעביר אותם לאחר. לא סתם זה מוסתר. Yonidebest Ω Talk 13:47, 25 באפריל 2009 (IDT)
- ברור. תומר א. - שיחה 14:07, 25 באפריל 2009 (IDT)
- למה המסנן הזה פרטי ולא ציבורי? יחסיות האמת • ♥ • ב' באייר ה'תשס"ט 12:55:50
- כדי שלא יראו את רשימת המילים האסורות... Yonidebest Ω Talk 13:06, 26 באפריל 2009 (IDT)
- למה? אנחנו לא רוצים שכולם ידעו שאסור להשתמש במלים האלה? יחסיות האמת • ♥ • ב' באייר ה'תשס"ט 13:11:05
- אם כולם לא יודעים שאסור להשתמש במילים הללו, אני מציע שיתבגרו, ומהר. אנחנו לא רוצים שמשחיתי זדון יעברו על הרשימה וימצאו דרכים לעקוף אותה. Yonidebest Ω Talk 22:02, 26 באפריל 2009 (IDT)
- למה? אנחנו לא רוצים שכולם ידעו שאסור להשתמש במלים האלה? יחסיות האמת • ♥ • ב' באייר ה'תשס"ט 13:11:05
- כדי שלא יראו את רשימת המילים האסורות... Yonidebest Ω Talk 13:06, 26 באפריל 2009 (IDT)
- למה המסנן הזה פרטי ולא ציבורי? יחסיות האמת • ♥ • ב' באייר ה'תשס"ט 12:55:50
- ברור. תומר א. - שיחה 14:07, 25 באפריל 2009 (IDT)
- בפרטי? אני מניח שכן. אל תעביר אותם לאחר. לא סתם זה מוסתר. Yonidebest Ω Talk 13:47, 25 באפריל 2009 (IDT)
- אוקי. אפשר לקבל בפרטי את רשימת המילים? תומר א. - שיחה 13:10, 25 באפריל 2009 (IDT)
הודעת אזהרה
יצרתי אזהרה קצרה, תמציתית וברורה מדיה ויקי:Abusefilter-warning-cuss. מה דעתכם? לפי הסינון שבוצע עד כה, נראה כי המסנן יכול לחסוך עבודה. Yonidebest Ω Talk 13:47, 25 באפריל 2009 (IDT)
- "לאנציקלופדיה זו" הוא ניסוח בעייתי - הוא מרמז כאילו שיש אנציקלופדיה שהמלים האלה כן מתאימות לה... שיניתי בהתאם, וניסחתי מחדש את המשפט הראשון, תראה אם השינוי נראה לך. ברק שושני - שיחה 14:25, 25 באפריל 2009 (IDT)
- הניסוח מחדש שלך אינו מתאר נכונה את פעולת הזיהוי של המסנן. המסנן אינו בודק את המילה שנוספת, אלא את כל הפסקה שבה נוספת המילה שהוספה. שיניתי בהתאם. Yonidebest Ω Talk 20:08, 25 באפריל 2009 (IDT)
- בעד תומר א. - שיחה 14:27, 25 באפריל 2009 (IDT)
- נגד ראו דיון למעלה. אם רוצים להוסיף אזהרה אז רק אם יוצרים מסנן חדש שיכיל רק קללות מובהקות. דניאל ב. 20:19, 25 באפריל 2009 (IDT)
מוזר
מה בשינוי הזה גרם להפעלת המסנן? ברק שושני - שיחה 14:23, 25 באפריל 2009 (IDT)
- בדיוק עמדתי לשאול בעצמי :) תומר א. - שיחה 14:25, 25 באפריל 2009 (IDT)
- המילה "קצרמר", שכבר הוסרה על ידי לאור קיומה של תבנית "קצרמר". Yonidebest Ω Talk 20:09, 25 באפריל 2009 (IDT)
מה גרם להפעלת המסנן
אבקש לדעת מה גרם להפעלת המסנן בעקבות השינוי הזה. תודה, 94.230.81.203 13:58, 7 במאי 2010 (IDT)
- המילה "מכוער" נחשבת מילה בעייתית. אני אסיר אותה מהמסנן. מיקיMIK • שיחה • 14:28, 7 במאי 2010 (IDT)
- למה אתה מסיר אותה מהמסנן? היא אכן מילה בעייתית, ויש לסמן עריכות שכוללות מילה זו. Yonidebest Ω Talk 14:30, 7 במאי 2010 (IDT)
- טוב, זה ממש מוזר, כי לא הוספתי את המילה "מכוער", ובעריכות הקודמות שלי הפילטר לא הופעל. בכל מקרה, מישהו יכול לשחזר את העריכה? 94.230.81.203 14:35, 7 במאי 2010 (IDT)
- כתבתי לפני התנגשות עריכה: מילה נפוצה למידי ולגיטימית. ראה שינויים אחרים שעשיתי במסנן בימים האחרונים. המסנן היה רגיש מידי וגרם להרבה false negative. מיקיMIK • שיחה • 14:37, 7 במאי 2010 (IDT)
- אנחנו ממילא בודקים את כל העריכות, אבל כדאי וצריך להבליט (זה כל מה שהמנסן עושה, לא חוסם, לא מזהיר) עריכות שכוללות מילים בעייתיות. הרי ברור שגם במילה סרסור ניתן לעשות שימוש לגיטימי, אבל זה משהו שהמפעילים צריכים לבדוק - ואם העריכה מסומנת יהיה יותר סיכויים שהעריכה אכן תבדק. נראה לי שאתה מפספס את המטרה של המסנן הזה. Yonidebest Ω Talk 14:41, 7 במאי 2010 (IDT)
- אכן כך, אבל כאשר המשתמש המנטר בא לבדוק את העריכה שסומנה כבעייתית הוא לא יודע מה לחפש - כי הוא לא יכול לצפות במסנן ולא יודע מה מפעיל אותו. לכן לדעתי צריך להתרכז במילים שאין להם שימוש לגיטימי, או, שהשימוש הלגיטימי בהם הוא נדיר למדי. בדוגמא שנתת - "סרסור" היא מילה שכמעט באף ערך לא תהיה לגיטימית (למעט ערכים שעוסקים בזנות, או סרטים, ספרים וכו'). מיקיMIK • שיחה • 14:51, 7 במאי 2010 (IDT)
- המנטר יחפש מילה בעייתית, ואם לא ימצא - כנראה שהערך בסדר - וטוב שהמנטר בדק. לעומת זאת, אם המשחית כתב "איציק המכוער", המנטר יראה זאת מייד. זו מטרתו של המסנן - לסמן עריכות שעלולות להיות בעייתיות, שצריך לבדוק. המנטר צריך להפעיל שיקול דעת ולהחליט אם לשחזר או לא. שוב, אני חושב שעדיין לא הבנת את מטרתו של המסנן, ככלי עזר. אין בעיה של false negative כאן, שהרי השימוש במילה מכוער לא מקובל. שוב, אנא החזר את שתי המילים שהסרת, שכן מנטר צריך לבדוק שמי שמשתמש במילים אלו עשה זאת בצורה נכונה. Yonidebest Ω Talk 15:02, 7 במאי 2010 (IDT)
- אכן כך, אבל כאשר המשתמש המנטר בא לבדוק את העריכה שסומנה כבעייתית הוא לא יודע מה לחפש - כי הוא לא יכול לצפות במסנן ולא יודע מה מפעיל אותו. לכן לדעתי צריך להתרכז במילים שאין להם שימוש לגיטימי, או, שהשימוש הלגיטימי בהם הוא נדיר למדי. בדוגמא שנתת - "סרסור" היא מילה שכמעט באף ערך לא תהיה לגיטימית (למעט ערכים שעוסקים בזנות, או סרטים, ספרים וכו'). מיקיMIK • שיחה • 14:51, 7 במאי 2010 (IDT)
- אנחנו ממילא בודקים את כל העריכות, אבל כדאי וצריך להבליט (זה כל מה שהמנסן עושה, לא חוסם, לא מזהיר) עריכות שכוללות מילים בעייתיות. הרי ברור שגם במילה סרסור ניתן לעשות שימוש לגיטימי, אבל זה משהו שהמפעילים צריכים לבדוק - ואם העריכה מסומנת יהיה יותר סיכויים שהעריכה אכן תבדק. נראה לי שאתה מפספס את המטרה של המסנן הזה. Yonidebest Ω Talk 14:41, 7 במאי 2010 (IDT)
- למה אתה מסיר אותה מהמסנן? היא אכן מילה בעייתית, ויש לסמן עריכות שכוללות מילה זו. Yonidebest Ω Talk 14:30, 7 במאי 2010 (IDT)
אני לא רוצה להדחף למקומות לא לי, אבל מן הסתם אפשר לבנות מסנן יוריסטי סטטיסטי. כל מילה המתווספת בעריכה נבדקת ומקבלת משקל מתאים. מילים בעייתיות מקבלות משקלות שונים בהתאם לחומרתן, למשל "זין" = 10, "מכוער" = 2. למילים נייטרליות יינתן משקל שלילי קטן כלשהו, נניח −0.05, מכיוון שעריכה הכוללת רק מילים בעייתיות שונה מעריכה הכוללת מילה בעייתית אחת בתוך משפט שלם העוסק בנושא לגיטימי. אם סכום המשקולות עובר סף מסויים, הפילטר מופעל. את המשקולות ניתן למצוא באמצעות אימון מערכת סטטיסטית פשוטה, למשל רשת עצבית. 94.230.81.203 14:59, 7 במאי 2010 (IDT)
- אני לא חושב שאפשר לעשות זאת באמצעות המערכת הזו. Yonidebest Ω Talk 15:03, 7 במאי 2010 (IDT)
- אולי "Summer of Code" או פרוייקט באוניברסיטה לטובת העניין. 94.230.81.203 15:05, 7 במאי 2010 (IDT)
החזרתי את המילים למסנן. נמתין ונראה אם יהיו עוד תלונות. מיקיMIK • שיחה • 15:08, 7 במאי 2010 (IDT)
- אני מסכים עם יוני. איתי פ. • שיחה 15:09, 7 במאי 2010 (IDT)
ייתכן שהבעיה נוצרה מכיוון שהבדיקה לא מתבצעת על הטקסט שהוסף, אלא על השורות ששונו. המשתנה added_lines כולל את הטקסט הקיים יחד עם המילים שהתווספו לטקסט. לכן צריך לבדוק שהמילים הבעייתיות, אם מופיעות ב-added_lines לא הופיעו ב-removed_lines. זה עדיין לא פתרון מושלם, אבל ימנע הרבה סוגים של false positive המתקבל ממילים בטקסט הקיים. 94.230.81.203 15:20, 7 במאי 2010 (IDT)
שאלה
האם המילה "הומו" היא זו שהפעילה את המסנן בעריכה הזו? אם כן, צריך להסיר אותה מהמסנן, השימוש במילה הזו לגיטימי במקרים רבים מדי. אליסף • שיחה • 14:41, 15 במאי 2010 (IDT)
- כן, אבל המילה לא תוסר. היא עשויה להיות בעייתית, ולכן עריכות שכוללות מילה זו מסומנות ככאלו, והמנטר צריך לבדוק האם מדובר בשימוש נאות או לא. Yonidebest Ω Talk 14:47, 15 במאי 2010 (IDT)
- אז בעצם כמעט כל הערכים שעוסקים בערכים של להט"ב יסומנו על ידי המסנן, זה לא נשמע טוב. אליסף • שיחה • 14:48, 15 במאי 2010 (IDT)
- אתה צודק בזה. אני מציע לפצל את המסנן ולהוציא ממנו את כל המילים שקשורות למיניות. מסנן אחר יטפל בהם עם תגית "מילים-בעיתיות-מיניות" - תגית שהמנטרים ידעו להתעלם ממנה כאשר היא תופיע בערכים שעוסקים במיניות. מה דעתכם? מיקיMIK • שיחה • 15:21, 15 במאי 2010 (IDT)
- לא חכם לדעתי, גם שם כדאי לשים לב (להיפך - ערכים אלו עלולים להיות מועדים לבעיות שכאלה). אני גם לא חושב שאליסף צודק - לא עצם כמעט כל הערכים שעוסקים בערכים של להט"ב יסומנו על ידי המסנן, רק עריכות בהן שמכילות את המילים "הומו"/"אנאלי"/"אוראלי"/"קוקסינל". וכדאי מאוד לבדוק שהוספת המילים האלו לערכים אכן סבירה. זהר דרוקמן - מי לוקחת במונדיאל? 15:46, 15 במאי 2010 (IDT)
- אולי צריך לשנות את התג של המסנן ל"חשד-למילים-בעיתיות", כדי למנוע בלבול. Yonidebest Ω Talk 16:00, 15 במאי 2010 (IDT)
- כתבתי לפני התנגשות עריכה: מסכים. אלא מה, כאשר המנטר רואה את התגית "מילים בעיתיות" הוא לא יודע אם המילה הבעייתית היא "הומו" או "מטומטם". אם ניתן למנטר את המידע הנוסף הזה ע"י פיצול המסנן לשתיים זה יקל עליו לבדוק את העריכה. אם ערך שאינו עוסק במיניות מסומן ב"מילים-בעיתיות-מיניות" יש סיכוי גבוה מאוד שזאת השחתה. אבל, אם ערך שעוסק במיניות מסומן בתגית הזאת המנטר יידע שיתכן שזאת השחתה ויתכן שלא - הסיכוי להשחתה הוא בינוני. ברור שחובה לבדוק את העריכה בכל מקרה - אבל יהיה יותר קל לבדוק את העריכה אם תדע מה לחפש. מיקיMIK • שיחה • 16:07, 15 במאי 2010 (IDT)
- שתי ההצעות טובות, מצד אחד לפצל ומצד שני להוסיף את המילה "חשד" לשתי המסננים החדשים, שאנשים יבינו שזה רק חשד ופעמים רבות המסנן הזה טועה. אליסף • שיחה • 16:08, 15 במאי 2010 (IDT)
- לא חכם לדעתי, גם שם כדאי לשים לב (להיפך - ערכים אלו עלולים להיות מועדים לבעיות שכאלה). אני גם לא חושב שאליסף צודק - לא עצם כמעט כל הערכים שעוסקים בערכים של להט"ב יסומנו על ידי המסנן, רק עריכות בהן שמכילות את המילים "הומו"/"אנאלי"/"אוראלי"/"קוקסינל". וכדאי מאוד לבדוק שהוספת המילים האלו לערכים אכן סבירה. זהר דרוקמן - מי לוקחת במונדיאל? 15:46, 15 במאי 2010 (IDT)
- אתה צודק בזה. אני מציע לפצל את המסנן ולהוציא ממנו את כל המילים שקשורות למיניות. מסנן אחר יטפל בהם עם תגית "מילים-בעיתיות-מיניות" - תגית שהמנטרים ידעו להתעלם ממנה כאשר היא תופיע בערכים שעוסקים במיניות. מה דעתכם? מיקיMIK • שיחה • 15:21, 15 במאי 2010 (IDT)
- אז בעצם כמעט כל הערכים שעוסקים בערכים של להט"ב יסומנו על ידי המסנן, זה לא נשמע טוב. אליסף • שיחה • 14:48, 15 במאי 2010 (IDT)
הבעיה העיקרית במסנן
בואו נסתכל על כמה הגדרות של המסנן:
1. המסנן פועל רק על משתמשים בלי הרשאת autoconfirmed.
2. המסנן לא בודק רק את הטקסט ששונה הוא הוסף אלא את כל הטקסט שהמשתמש ערך, וזאת הבעיה.
בואו נסתכל על מספר דוגמאות: בערך יומנו של חנון מופיעה המילה חנון שמאותרת על ידי המסנן, אם ערכתי פסקה שלמה שבה מופיעה המילה חנון והוספתי רק נקודה בסוף המשפט בלי לשנות שום מילה, המסנן יקלוט זאת, כיוון שכל הטקסט שערכתי מכיל את המילה "חנון" למרות שהוספתי רק נקודה בסוף המשפט.
נניח ומשתמש ותיק מקלל(זה לא נקרא ממש משתמש ותיק כי כל אחד שרשום 4 ימים מקבל הרשאת autoconfirmed) ואז משתמש אנונימי עורך בצורה לגיטימית את אותו ערך בלי לשים לב לקללה שאותו ותיק הוסיף, המסנן יסמן את העריכה של האנונימי כבעייתית למרות שעריכתו הייתה לגיטימית.
- אני חושב שהמסנן כן פועל על משתמשים עם הרשאת בדוק עריכות אוטומטית. אליסף · שיחה 22:48, 5 בפברואר 2011 (IST)
- לא הוא לא, ניתן להבין זאת בקלות בעזרת בדיקת הערך יומנו של חנון, שבו כל העריכות של האנונימיים מסומנות על ידי מסנן 12 ועריכות של ותיקים לא מסומנות למרות שהן כוללות את המילה "חנון" בכל הגרסאות.
- בוא נבדוק: חנון. אליסף · שיחה 22:56, 5 בפברואר 2011 (IST)
- צודק. אליסף · שיחה 22:56, 5 בפברואר 2011 (IST)
- בוא נבדוק: חנון. אליסף · שיחה 22:56, 5 בפברואר 2011 (IST)
- לא הוא לא, ניתן להבין זאת בקלות בעזרת בדיקת הערך יומנו של חנון, שבו כל העריכות של האנונימיים מסומנות על ידי מסנן 12 ועריכות של ותיקים לא מסומנות למרות שהן כוללות את המילה "חנון" בכל הגרסאות.
הבעיות במסנן ידועות זה מכבר - בגלל זה המסנן לא מונע את הפעולה אלא רק מסמן אותה. תסמוך על השיקול דעת של המנטרים שידעו לטפל נכון בעריכות שסומנו. מיקיMIK • שיחה • 22:58, 5 בפברואר 2011 (IST)
- אתה מודע לכך שתוך זמן קצר יחסית אני יכול לבנות לעצמי מאגר של המילים שהמסנן מסמן? פשוט נכנסים ללוג של המסנן ובודקים עריכות שסומנו על ידו ומתוך ההקשרים והפסקאות המסומנות, ניתן באמצעות מספר מועט מאוד של ניסיונות עריכה לאתר כמעט את כל המילים. או לפחות את כל המילים השכיחות שהמסנן בודק.
המסננים האלה מביאים איתם הרבה באגים וניתן לעקוף אותם מאוד בקלות, כמו לדוגמא, מסנן 9 שתפקידו למנוע הצפה, אם אני אנסה להציף פעם אחת, אני יוכל לדעת את מספר הפעמים שלאחריהן המסנן מגביל את הפעולה ואחרי זה בעזרת מספר ניסיונות נוספים אני אוכל לדעת גם מה התנאי של פעמים לשניות להפעלת המסנן ומכאן הדרך לעקוף אותו קלה, זאת לא פעם ראשונה שאני בודק דברים כאלה באתרים, אני דיי מאומן בלאתר באגים ולמצוא דרכים לנצל אותם(תאמת שאני מקווה יום אחד להרוויח כסף על זה), בלי שום קשר, המסננים האלה מביאים הרבה צרות, בין היתר בניהול השוטף שלהם, כידוע, יותר אפשרויות - יותר באגים.
- מעולה. במטה-ויקי תוכל למצוא פרטים טכניים על המסננים אם זה מעניין אותך. יש מצב שתפתח חשבון ותצטרף לצוות הטכני של ויקיפדיה? מיקיMIK • שיחה • 23:10, 5 בפברואר 2011 (IST)
- רגע, לא הבנתי היכן הבאגים. זה שהמסננים אינם הפתרון המקיף והמושלם ביותר להתעסק עם משחיתים זה ידוע. בשביל זה עדיין יש צורך במנטרים ומפעילי מערכת. אבל לא הייתי קורא לזה באג. זהר דרוקמן - לזכר פול 23:42, 5 בפברואר 2011 (IST)
- כן זה אמנם לא באג אבל המסננים האלה נותנים פתרון שהוא לא פתרון ובשביל להשיג תוצאות שהן בינוניות כמעט תמיד צריך להתעסק בביטויים רגולרים ארוכים במיוחד שלוקח המון מרץ ואנרגיה לכתוב כאלה, זאת עבודת נמלים.
- למה לא פתרון? אם אני רואה אנונימי משנה משהו בערך חיפה והמסנן מופעל - זה כמעט תמיד השחתה והמסנן מבטיח שלא אפספס אותה. זהר דרוקמן - לזכר פול 07:40, 6 בפברואר 2011 (IST)
- ואם במקום לכתוב "חיפה בת זונה", הוא כותב "חיפה בת זןנה", טעות כתיב נפוצה שכמעט כל אחד עושה, איך תנטר את זה? וגם, כמו שכבר אמרתי, קל מאוד לגלות מהן אותן מילים שהמסנן מנטר וככה אפשר לעקוף אותו.
- אני אנטר את זה (או לא) כמו שאני מנטר כל עריכה של אנונימי. אבל העובדה שהמסנן הוא לא התרופה לאיידס לא אומרת שאין בו שום תועלת. זהר דרוקמן - לזכר פול 07:54, 13 בפברואר 2011 (IST)
- ופה בדיוק אני רוצה להעלות בעיה נוספת והיא העובדה שעריכה של אנונימי תמיד נחשדת ונבדקת וכולם תמיד עוברים עליה ועובדה שמסננים מסויימים פועלים על משתמשים אנונימיים, זה פסול לפי דעתי, החשדנות יתר הזאת לא בריאה לאתר וגם אם היא נעשית מאחורי גב ולמראית עין אתם יכולים לספר שכל המשתמשים נבדקים, בפועל כולנו יודעים את האמת, זה מצב מגעיל, ועדיף כבר לסגור את ויקיפדיה למשתמשים רשומים בכלל, ככה לפחות תצאו החוצה ותצהירו בגלוי שאתם לא סומכים בגרוש על אנונימיים ולא תעשו זאת בהסתר.
- דבריך אינם מתיישבים עם שתי עובדות: האחת שעריכות רבות של אנונימים נותרות על כנן והשנייה שעיקר ההשחתות הן של אנונימים. אין זה שאנו לא סומכים עליהם, אלא שמבחינה סטטיסטית - משתמשים לא מוכרים מועדים יותר להשחתות. הסיבה פשוטה - מעטים המשתמשים המוכרים שמשחיתים ונותרים כאן זמן רב. זהר דרוקמן - לזכר פול 08:36, 14 בפברואר 2011 (IST)
- אנשים מוכשרים יודעים כיצד לשקר בסטטיסטיקה, יש לי מעט ידע בזה, קל להבין שהסטטיסטיקה לא משחקת פה בכלל מכיוון שאני מדבר על חשדות ועל ניטור של עריכות אנונימיות, ניטורים ובדיקות של עריכות כאלה לא מתועדות בשום מקום, כמו כן גם היחס לאנונימים.
- ננסה גישה אחרת - מה אתה רוצה בעצם? מה מטרת הדיון? נראה שגיבשת דעתך. זהר דרוקמן - לזכר פול 08:10, 15 בפברואר 2011 (IST)
- ופה בדיוק אני רוצה להעלות בעיה נוספת והיא העובדה שעריכה של אנונימי תמיד נחשדת ונבדקת וכולם תמיד עוברים עליה ועובדה שמסננים מסויימים פועלים על משתמשים אנונימיים, זה פסול לפי דעתי, החשדנות יתר הזאת לא בריאה לאתר וגם אם היא נעשית מאחורי גב ולמראית עין אתם יכולים לספר שכל המשתמשים נבדקים, בפועל כולנו יודעים את האמת, זה מצב מגעיל, ועדיף כבר לסגור את ויקיפדיה למשתמשים רשומים בכלל, ככה לפחות תצאו החוצה ותצהירו בגלוי שאתם לא סומכים בגרוש על אנונימיים ולא תעשו זאת בהסתר.
- אני אנטר את זה (או לא) כמו שאני מנטר כל עריכה של אנונימי. אבל העובדה שהמסנן הוא לא התרופה לאיידס לא אומרת שאין בו שום תועלת. זהר דרוקמן - לזכר פול 07:54, 13 בפברואר 2011 (IST)
- "מבטיח" זו אולי מילה קצת חזקה מדי. נתפשר על "משפר את הסיכוי"? קיפודנחש - שיחה 19:44, 6 בפברואר 2011 (IST)
- אוקיי, אבל לטעמי משפר את הסיכוי פלאים. מאחר וגם ככה יש לי נטייה לעבור על רשימות המעקב שלי עם שינויים של אנונימים בלבד... זהר דרוקמן - לזכר פול 23:36, 6 בפברואר 2011 (IST)
- ואם במקום לכתוב "חיפה בת זונה", הוא כותב "חיפה בת זןנה", טעות כתיב נפוצה שכמעט כל אחד עושה, איך תנטר את זה? וגם, כמו שכבר אמרתי, קל מאוד לגלות מהן אותן מילים שהמסנן מנטר וככה אפשר לעקוף אותו.
- למה לא פתרון? אם אני רואה אנונימי משנה משהו בערך חיפה והמסנן מופעל - זה כמעט תמיד השחתה והמסנן מבטיח שלא אפספס אותה. זהר דרוקמן - לזכר פול 07:40, 6 בפברואר 2011 (IST)
- כן זה אמנם לא באג אבל המסננים האלה נותנים פתרון שהוא לא פתרון ובשביל להשיג תוצאות שהן בינוניות כמעט תמיד צריך להתעסק בביטויים רגולרים ארוכים במיוחד שלוקח המון מרץ ואנרגיה לכתוב כאלה, זאת עבודת נמלים.