Tako, da nam pove nekaj o tem, kaj se dogaja na daljše razdalje, celo znotraj teh omejitev predpostavk o statistiki, kaj smo sposobni modelirati s to vrsto modela.
Kaj so gramatike?
Ja, ta beseda je bila uporabljena ohlapno, in to je pomenilo nekaj različnih stvari skozi čas. V najbolj splošnem pomenu, bi si o njej mislijo kot opis tega, kar lahko pričakujemo v smislu, kaj beseda nizi se lahko zgodi. V nekaterih sistemih, in to je zelo res za veliko sistemov, klicni center, bi imeli razmeroma dobro idejo o tem, kaj so ljudje precej verjetno, da pravijo, kajne? Imate sistem, ki je meni, hočeš A, B ali C? Morda ste pričakovali, večina ljudi bo rekel niti " A " " B " ali " C " ali bi lahko rekli, " Hočem " ali " B prosim, " ali stvari, kot da so stvari, ki zaradi uporabe dokaj predvidljiva
Vendar pa so jeziki, s katerim bi lahko ljudje navajajo ". Tukaj so pravila ali niz nizov, da bi ljudje rekli, v tem kontekstu. " To bi bil primer, ko je bil recognizer zelo omejena. To bi prepoznali le določeno število variacij pri tem, kako bi lahko rekli stvari. Recimo, " hočeš stanje na računu vaše ali izvesti prenos? &Quot; To ni všeč ljudje bodo natančno posnemajo te besede, vendar je razumno predvidljivo, da nekdo z izkušnjami, in po poslušanju nekaj podatkov, bi lahko imela razumno možnost pisanja izrecno slovnico, ki je dejal, " Tukaj je 50 razlike v tem, kako ljudje morda da to dvosmerno izbiro ".
ker, kot ste prišli do bolj zahtevnih aplikacij, kot so, na primer, glasovno iskanje, da je pot težje napovedati vseh teh različnih nizov besed, da bi lahko ljudje izreči. Torej, namesto, slovnica postane tisto, kar se imenuje statistično slovnico, ali kaj smo pogosto imenujemo jezikovnega modela statistično. To bi bilo nekaj več, v obliki, glede na zadnji dve besedi so A, B, tukaj so verjetnosti čez vse besede v mojem jeziku, kaj se lahko zgodi naslednje.
Koliko besed so v glasovno iskanje Google Baza podatkov?
A gazillion.
Torej, kaj mi je rekel takole. Za angleščino, strani besednjak, število različnih besed v našem besednjaku j