Discovery znanje
/ Knowledge Discovery >> Discovery znanje >> zdravje >> medicine >> sodobna medicina >>

Kako Google Flu Trends Works

je bilo več kot 11 odstotkov prebivalcev ZDA gripo. Če se to zdi veliko, je to zato, ker je - CDC, v primerjavi, poroča 6 odstotkov, da je sezona. Raziskovalci poročajo, da dejansko lahko natančnost Orodje je precej slabše; Ugotovili so, da začetek avgusta 2011 GFT precenila v 100 od 108 tednov. [vir: Hodson, Walsh, Lazer]

Najpogostejša razlaga za Googlov precenjevanja razširjenosti gripe ni nič več kot lastnega občutkov, ko se gripa Celoletne zvitkih okoli - saj veste, ko iščete besedo " kašelj " v prizadevanju, da ugotovimo, če greš dol z gripo, prehlad ali, morda, počakajte, bi bilo pljučnica? Media uporaba stavki kot " najslabša sezona gripe v letih " in poročila o sezonski gripi mediji prispevajo tudi k našim kašelj obseden iskanj. Problem je, da GFT ne vem, ali si bolan ali pa samo skrbelo pridobivanje bolan; menijo, da je le okoli 10 odstotkov vseh ljudi, ki iščejo zdravniško oskrbo za gripo dejansko imajo gripo [vir: Salzberg]. Google išče nimajo konteksta, in ne vedo svojega namena.

Ampak, da morda ne bo popoln odgovor.

Poleg povezanih z GPB medijski hype polnjenje iskanj gripe, delo z velikimi podatkov lahko vodi k temu, da korelacije, ki morda niso točni. To je velik podatki past. Medtem ko so rezultati rudarjenju podatkov lahko naslikamo razmerje med sezonskimi iskalnih poizvedb in, recimo, obiskov pri zdravniku, odklon množičnost nabora podatkov kažejo točnost te korelacijsko ni mogoče zaupati.

Še eno vprašanje o precenjevanja GFT je leži v Googlovih lastnih posodobitve algoritem iskalnika. Raziskovalci predlagajo, da je uvedba autosuggest funkcijo v Iskanju Google spremenil vedenje uporabnikov za potencial za previsokih GFT; Uporabniki, ki iščejo za eno gripe simptom so se zdaj spodbuja, da poiščete več (Google-priporočeno) pogoji v zvezi z gripo, ki vplivajo na splošne, povezanih z GPB iskanj.

Leta 2012 je začel iskalnik vključno z morebitnimi pogoji v zvezi z simptomi poizveduje, tudi potencialno dodal, da problem precenjevanja.

Vendar, ko spet slabe rezultate v sezoni 2012/2013 gripe, GFT algoritem je bil spet posodobljen. To bi zdaj podcenjevati nobene nepravilnosti, medijske pogon in da svoje napovedi, ki temelji na statistični metodi, imenovano ElasticNet (ki je posplošena Linearni model urejen regresija). Vendar je še vedno prostor za izboljšave; revidirana algoritem še vedno precenjene za kar 30 odstotkov [vir: Lohr].

Leta 2014, GFT inženirji posod

Page [1] [2] [3] [4] [5]