bomo pogledali, kako datotek kompresijskih sistemov ukvarjajo z redundanco podrobneje v naslednji razdelek.
redundanca in algoritmi
Večina programov kompresijske uporabite variacijo adaptivne temelji na slovarju algoritmom LZ krčenje datotek. " LZ " nanaša na Lempel in Ziv ustvarjalcev algoritma je, in " slovarju " Nanaša se na metodo kataloških kosov podatkov.
Sistem za urejanje slovarjev spreminja, vendar pa bi se lahko tako enostavno, kot oštevilčeno seznamu. Ko gremo skozi Kennedyja znanimi besedami, izločiti besede, ki se ponavljajo in jih dal v oštevilčenih indeks. Potem smo preprosto napišite številko namesto pisno ven celo besedo.
Torej, če je to naša dictionary:
- ask
- what
- your
- country
- can
- for
- you
Our stavek se sedaj glasi: " 1 ne 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4 "
Če bi vedeli sistem, bi lahko zlahka rekonstruirati prvotni izraz uporabljajo samo to slovar in Številka vzorec. To je tisto, kar je program širitev na računalniku počne, ko se širi naloženo datoteko. Morda so prav tako naleteli stisnjene datoteke, ki se odpirajo. Če želite ustvariti to vrsto datoteke, programer vključuje preprosto razširitev programa s stisnjene datoteke. Samodejno rekonstruira izvirno datoteko, ko je to prenesli.
Ampak koliko prostora smo dejansko shranjene s tem sistemom? " 1 ne 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4 " je zagotovo krajši od " Ne sprašuj, kaj lahko vaša država stori za vas; vprašati, kaj lahko storite za svojo državo; " ampak imejte v mislih, da moramo rešiti slovar sam skupaj z datoteko
V dejanskem sistemu stiskanja, ugotoviti različne zahteve datotečne bi bilo precej zapleteno. vendar za naše namene, vrnimo se k ideji, da je vsak znak in vsak prostor prevzame eno enoto pomnilnika. Smo že videli, da je poln stavek povzema 79 enot. Naša stisnjeni stavek (vključno s presledki) zavzema 37 enot, in slovar (besede in številke) povzema tudi 37 enot. To nam daje velikost datoteke 74, tako da smo ne zmanjša velikost datoteke, ki jih je zelo veliko.
Ampak to je le en stavek! Lahko si predstavljate, da če je kompresijski program delal skozi preostali del govor