Discovery znanje
/ Knowledge Discovery >> Discovery znanje >> tech >> računalnik >> internet >> internet osnove >>

Kako Deep Web Works

oboko Spletno lahko od 400 do 500-krat večja, da je površina Web [vir: BrightPlanet]. In tako površinsko in globoko spletna raste večje in večje vsak dan.

Da bi razumeli, zakaj je toliko informacij je v očeh iskalnikov, da pomaga, da imajo malo ozadja o iskanju tehnologij. Si lahko preberete vse o tem, kako Iskalniki Internet delu, vendar vam bom dal hiter potek tukaj.

Iskalniki običajno ustvari indeks podatkov z iskanjem informacij, ki je shranjena na spletnih straneh in drugih spletnih virov . Ta proces pomeni uporabo avtomatiziranih pajki ali pajki, ki poiskati domene in sledite hiperpovezave do drugih področjih, kot pajkovcev sledi svilnatih vitic spletnega, v smislu ustvarjanja Izvaljen zemljevid spleta.

Ta indeks ali map je vaš ključ do iskanju specifičnih podatkov, ki je pomembna za vaše potrebe. Vsakič, ko začne iskanje po ključnih besedah, rezultati so prikazani skoraj takoj po zaslugi tega indeksa. Brez nje bi iskalnik dobesedno morali začeti iskati milijard strani iz nič vsakič, ko nekdo želel informacije, proces, ki bi bil tako okoren in Razdražujući.

Ampak iskalniki ne morejo videti podatke, shranjene na globoko Web. Obstajajo podatki nezdružljivosti in tehnične ovire, ki otežujejo prizadevanja indeksiranje. Obstajajo zasebne spletne strani, ki zahtevajo prijavo gesel, preden boste lahko dostopali do vsebine. Pajki ne morejo prodreti podatke, ki potrebuje iskanja ključnih besed na enem, določeno spletno stran. Obstajajo strani pravočasne dostopa, ki ne omogočajo javne poglede, ko je določen rok potekel.

Vse te izzive, in cel kup drugih, da podatki, veliko težje za iskalnike, da bi našli in indeks. Hranite branje za ogled več o tem, kaj ločuje površino in globoko spletu.
Tik pod gladino

Kot smo že omenili, obstaja na milijone in milijone podstraneh so posuti po vsej milijone domen. Obstaja notranji strani, ki nimajo zunanjih povezav, kot internal.howstuffworks.com, ki se uporabljajo za namene vzdrževanja spletne strani. Obstajajo neobjavljenih ali ne kotirajo na borzi blog objav, galerije slik, datotek, imenikov in neizmerno količine vsebin, iskalniki enostavno ne vidim.

Tukaj je samo en primer. Obstajajo številni neodvisni časopis spletnih strani na spletu, in včasih, iskalniki indeks nekaj člankov na teh straneh. To posebej velja za velike zgodbe novic, ki prejemajo veliko medijske pozornosti. Hitro iskanje Google bo nedvomno predstavil številne desetine člankov o, na primer,

Page [1] [2] [3] [4] [5] [6]