bomo pobliže ogledali, kako natančno se to naredi naslednje.
Prepoznavanje govora in statistični Modeliranje
Sistemi za prepoznavanje Early govor poskušala uporabiti nabor slovničnih in sintaktičnih pravil za govor. Če besede govorijo fit v določenem sklop pravil, bi lahko program ugotovi, kaj so bile besede. Vendar človeške jezik ima številne izjeme svojimi pravili, tudi takrat, ko je to govoril dosledno. Poudarki, narečja in mannerisms lahko močno spremeniti način, kako določene besede ali besedne zveze, ki se govorijo. Predstavljajte si nekoga iz Bostona rekel besedo ". Skednju " On ne bi izgovoriti " r " sploh, in beseda prihaja iz rimal z ". John " Ali upoštevati kazen, " bom videli ocean. &Quot; Večina ljudi ne enunciate njihove besede zelo previdno. Rezultat bi lahko prišla ven kot " Jaz grem da vidim tha ocean. &Quot; Oni vodijo več besed skupaj brez opaznega premoru, kot " jaz grem '" in ". ocean " Sistemi, ki temeljijo na pravila so bila neuspešna, ker ni zmogel te razlike. To tudi pojasnjuje, zakaj prejšnji sistem ni zmogel neprekinjeno govor. - Si moral govoriti vsako besedo posebej, s kratkim premorom med njimi
Sistemi za prepoznavanje govora Današnje uporabo močnih in zapletenih sistemov, statistično modeliranje. Ti sistemi uporabljajo verjetnosti in matematične funkcije za določitev najverjetnejši izid. Po mnenju Johna Garofolo, vodja skupine Govor na tehnologijo Laboratorij za informatiko Nacionalnega inštituta za standarde in tehnologijo, dva modela, ki prevladujejo polja so danes Hidden Markov Model in nevronske mreže. Te metode vključujejo kompleksne matematične funkcije, ampak v bistvu, ki jih sprejmejo na znane informacije v sistem, da ugotovimo, katere informacije skrit.
The Hidden Markov Model je najbolj pogosta, zato bomo pobliže pri tem postopku. V tem modelu vsak phoneme je kot člen v verigi, in končan veriga je beseda. Vendar pa so verige odcepi v različnih smereh, kot je program poskuša ujemajo digitalni zvok s fonem, ki je najbolj verjetno, da pridejo zraven. Med tem procesom, program dodeli verjetnostno oceno vsakega fonem, ki temelji na svojo vgrajeno v slovarju in uporabnikom usposabljanja
Ta proces je še bolj zapleteno za besednih zvez in povedi. - Sistem mora ugotoviti, kje vsaka beseda ustavi in se začne. Klasičen primer je beseda " prepozna govor, " ki zveni veliko, kot "