Iskanje Patterns
V našem prejšnjem primeru smo izbrali vse ponovi Besede in dal tistim v slovarju. Za nas je to najbolj očiten način, da napišete slovar. Ampak kompresijski program vidi precej drugače: To nima nobenega koncepta ločenih besed - je videti le za vzorce. In da bi se čim bolj zmanjša velikost datoteke, da skrbno izbere kateri vzorci v slovarju vključiti.
Če se bližamo stavek iz tega vidika, smo na koncu s povsem drugačnim slovarju.
Če je kompresijski program skenirane Kennedy stavek, prva redundanca, da bi prišel čez bi bilo le nekaj črk dolgo. V " Ne sprašuj, kaj je tvoj, " je ponovil vzorec pisma " t " sledi prostor - v " Ne " in ". kaj " Če kompresijski program to napisal v slovar, bi bilo napisati " 1 " vsakič, ko " t " Sledili s presledkom. Toda v tem kratkem stavku, se ta vzorec ne pride dovolj, da bi bilo vredno vstop, tako da je program bi sčasoma prepisati
Naslednja stvar je program morda opazili, je ". Ou, " ki se pojavlja v tako " Vaš " in ". država " Če bi bilo to daljše dokument, lahko pisanje tega vzorca slovarja prihranili veliko prostora - " ou " je precej pogosta kombinacija v angleškem jeziku. Ampak kot kompresijski program delal preko tega stavka, bi hitro odkrili boljšo izbiro za angleški vpisa: Ne samo, da je " ou " ponoviti, ampak celotno besede " svoj " in " država " sta ponovi, in so dejansko ponovili skupaj kot frazo " vaša dežela. " V tem primeru, bi program prepiše slovarja vnos za " ou " z vknjižbo za ". vaši državi "
Izraz " lahko storimo za " je ponovil tudi, enkrat sledi " Vaš " in enkrat sledil " ti, " nam daje ponavljajoč vzorec " lahko stori za vas. " To nam omogoča pisanje 15 znakov (s presledki) z eno številko vrednosti, medtem ko je " vaša država " samo nam omogoča pisanje 13 znakov (s presledki) z eno številko vrednosti, tako da je program bi prepisati " svojo državo " vnos le kot " r državi, " in potem napišite ločen vnos za " lahko stori za vas. " Program poteka na ta način, pobiral