Discovery znanje
/ Knowledge Discovery >> Discovery znanje >> tech >> računalnik >> računalniška varnost >>

Kako bi lahko algoritem promptnih škrati na internetu?

uporabniki. So pridobili dostop do uporabniških pripombe Disqus gostuje na straneh Breitbart.com, CNN.com in IGN.com, ki zajema 18 mesecev, od marca 2012 do avgusta 2013. Podatki sestavljalo okoli 1,75 milijona uporabnikov (skoraj 49.000 izmed njih prepovedana), 1.26 milijona niti in 39 milijonov delovnih mest (skoraj 838.000 od njih črta in 1.350.000 njih poročali). So zožil prepovedana uporabniške podatke navzdol za okoli 12.000 uporabnikov, ki so se pridružile lokacij po marcu 2012, je bilo vsaj pet delovnih mest in so trajno prepovedali, za nekaj drugega kot spamming URL-jev [vir: Cheng].

Znanstveniki so zajeti podatki vključno s poštno vsebine, aktivnosti uporabnika, odziv skupnosti in moderatorskih ukrepov. Primerjali sporočil uporabnikov, ki niso bili nikoli prepovedanih sporočil uporabnikov, ki so trajno prepovedane, in pogledal na spremembe v obnašanju prepovedane uporabnikov nad svojim časom. Ekipa je pokazala, da so delovna mesta prihodnjih prepovedanih škrati večinoma imajo naslednje lastnosti:

  • revnimi črkovanja in slovnice
  • več kletvic
  • več negativnih besed
  • manj spravljiv ali pogojno jezik
  • nižje razumljivost branja, ki temelji na številnih testih berljivost (vključno z Automated berljivost Index), ki je dobil hujše proti času prepovedi
  • uporaba različnih žargonu in funkcijskih besed iz članov, ki niso prepovedani skupnosti
  • več odmik od teme
  • veliko večje število komentarje objav od povprečnega uporabnika
  • težnja, da se osredotoči svoje odgovore v posameznih niti
  • težnja, da bi spodbudili več odgovorov od drugih
  • slabše obnašanje sčasoma povzroči svojih delovnih mestih, ki se vse bolj izbrisanih pred prepovedjo

    Na CNN.com, povprečni uporabnik nagibale Da bi objavili okoli 22 delovnih mest v 18-mesečnem obdobju, ker so prihodnje prepovedala uporabniki objavil okoli 264-krat, nato pa so prepovedali [vire: Cheng, Collins]. Skupnost je tudi manj verjetno, da prenašajo troll v daljšem časovnem obdobju.

    Uporaba merljive rezultate, so bili raziskovalci sposobni razviti algoritem (niz korakov, ki se uporablja za reševanje problema ali opravljajo nalogo), ki se uporablja kot Nekaj ​​kot pet pripomb ugotoviti, kdo bi v prihodnosti prepovedane z 80-odstotno natančnostjo. Z 10 delovnih mest, so bili rezultati 82 odstotkov točna, vendar je učinkovitost dosegla vrhunec okoli 10 delovnih mest. Starejše uporabniške objav so bili bol

    Page [1] [2] [3] [4]