Správa filtra zneužití

Rozdiely medzi verziami

PoložkaVerzia z 12:32, 16. december 2017 od používateľa TeslatonVerzia z 12:57, 16. december 2017 od používateľa Teslaton
Základné informácie
Poznámky:
Pôvodne podľa en: https://en.wikipedia.org/wiki/Special:AbuseFilter/135
Pôvodne podľa en: https://en.wikipedia.org/wiki/Special:AbuseFilter/135


Množina doplnená o ďalšie spoluhlásky (okrem slabikotvorných), ľahko zadávateľné na sk klávesnici [bcčdďfghjklľmnňpqrřsštťvwxzž]. False positives zbežne overené cez vyhľadávanie (insource:/[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}/). --Teslaton 2016-04-23
Množina doplnená o ďalšie spoluhlásky (okrem slabikotvorných), ľahko zadávateľné na sk klávesnici [bcčdďfghjklľmnňpqrřsštťvwxzž]. False positives zbežne overené cez vyhľadávanie (insource:/[bcčdďfghjklľmnňpqrřsštťvwxzž]{7,}/). --Teslaton 2016-04-23


Plus vybrané opakovania so samohláskou ("hahaha", "hi hi hi"), len v hlavnom NS. --Teslaton 2016-05-11
Plus vybrané opakovania so samohláskou ("hahaha", "hi hi hi"), len v hlavnom NS. --Teslaton 2016-05-11


Prerábka do zrozumiteľnejšej podoby a oprava chýb na základe testovania dielčích RE na textoch článkov z dumpu. --Teslaton 2016-05-18
Prerábka do zrozumiteľnejšej podoby a oprava chýb na základe testovania dielčích RE na textoch článkov z dumpu. --Teslaton 2016-05-18


HaHaHa/HiHiHi/BlaBlaBla cez rmdoubles(), aby to chytalo aj varianty ako "bla...bla...bla", "blaaa blaaa blaaa" a pod. --Teslaton 2017-12-16
HaHaHa/HiHiHi/BlaBlaBla cez rmdoubles(), aby to chytalo aj varianty ako "bla...bla...bla", "blaaa blaaa blaaa" a pod. Aj dlhé samohlásky. --Teslaton 2017-12-16
Podmienky filtra
Pravidlá:
(!("autoconfirmed" in user_groups) | (user_editcount < 25)) &  
(!("autoconfirmed" in user_groups) | (user_editcount < 25)) &  
(article_namespace != 2) &  
(article_namespace != 2) &  
(article_prefixedtext != 'Wikipédia:Pieskovisko') &  
(article_prefixedtext != 'Wikipédia:Pieskovisko') &  
(  
(  
   /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou */
   /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou */
   (
   (
     reSeq := "[^_:*'|={}<&-]{1,9}";
     reSeq := "[^_:*'|={}<&-]{1,9}";
     (rmwhitespace(added_lines) rlike ("(" + reSeq + ")\1{7}")) &
     (rmwhitespace(added_lines) rlike ("(" + reSeq + ")\1{7}")) &
     !(rmwhitespace(removed_lines) rlike ("(" + reSeq + ")\1{6}")) &
     !(rmwhitespace(removed_lines) rlike ("(" + reSeq + ")\1{6}")) &
     !(added_lines rlike ("https?:\/\/\S*(" + reSeq + ")\1{7}"))  /* nie v URL */
     !(added_lines rlike ("https?:\/\/\S*(" + reSeq + ")\1{7}"))  /* nie v URL */
   ) |
   ) |
    
    
   /* Dlhý blok spoluhlások (okrem výnimiek a mimo výskytov v názve súboru a URL) */
   /* Dlhý blok spoluhlások (okrem výnimiek a mimo výskytov v názve súboru a URL) */
   (
   (
     re := "[bcčdďfghjklľmnňpqrřsštťvwxzž]{7}";
     re := "[bcčdďfghjklľmnňpqrřsštťvwxzž]{7}";
     (added_lines rlike ("(?!štvrť|čtvrt|rškvrnn|rchschl|tschspr|rpwllgw)" + re + "(?![^\s|]*\.\w)")) &
     (added_lines rlike ("(?!štvrť|čtvrt|rškvrnn|rchschl|tschspr|rpwllgw)" + re + "(?![^\s|]*\.\w)")) &
     !(removed_lines rlike re) &
     !(removed_lines rlike re) &
     !(added_lines rlike ("https?:\/\/\S*(" + re + ")"))  /* nie v URL */
     !(added_lines rlike ("https?:\/\/\S*(" + re + ")"))  /* nie v URL */
   ) |
   ) |


   /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou, v zhrnutí */
   /* Sekvencia dĺžky 1-9 znakov (mimo výnimky), zopakovaná aspoň 8x za sebou, v zhrnutí */
   (
   (
     (rmwhitespace(summary)  rlike "([^_:*'|=}{-]{1,9})\1{7}") &  
     (rmwhitespace(summary)  rlike "([^_:*'|=}{-]{1,9})\1{7}") &  
     !("http" in summary)
     !("http" in summary)
   ) |
   ) |


   /* Kratšie notorické opakované sekvencie v hlavnom NS */
   /* Kratšie notorické opakované sekvencie v hlavnom NS */
   (  
   (  
     (article_namespace == 0) &
     (article_namespace == 0) &


     /* "hahaha", "hi hi hi", "bla bla bla"... */
     /* "hahaha", "hi hi hi", "blá blá blá bla bla"... */
     (     
     (     
       re := "(?i)((h[aei]|bl[ae])\W{0,2}){3}";
       re := "(?i)((h[aáei]|bl[aáeé])\W{0,2}){3}";
       (rmdoubles(added_lines) rlike re) &  
       (rmdoubles(added_lines) rlike re) &  
       !(rmdoubles(removed_lines) rlike re)
       !(rmdoubles(removed_lines) rlike re)
     )
     )
   )
   )
)
)