Discovery znanje
/ Knowledge Discovery >> Discovery znanje >> tech >> računalnik >> računalniška programska oprema >>

Kako Works

vse ponavljajoče bitov informacij in nato izračun katere vzorce bi moralo pisati v slovar. Ta sposobnost, da znova slovar je " adaptive " del LZ prilagodljivo na osnovi slovarju algoritma. Način, kako se program dejansko počne to je precej zapleteno, kot lahko vidite z razpravami o Data-Compression.com.

Ni važno, kaj posebno metodo boste uporabili, to poglobljeno Iskanje sistem vam omogoča, da stisne datoteke veliko bolj učinkovito, kot si bi jih le pobiral besed. Uporaba vzorcev smo izbrali zgoraj, in dodal, " __ " za prostore, smo prišli do tega večjega slovarju:

  1. ask__
  2. what__
  3. si
  4. r__country
  5. __ can__do__for__you

    In to manjši stavek: " 1not__2345 __ - __ 12.354 "

    Stavek sedaj zavzema 18 enot spomina, in naše slovar traja do 41 enot. Torej smo stisnjeni skupno velikost datoteke iz 79 enot na 59 enot! To je le eden od načinov, stiskanje stavek, in ne nujno najbolj učinkovita ena. (Glejte, če lahko najti boljši način!)

    Torej, kako dobra je ta sistem? Razmerje-Zmanjšanje datoteke je odvisna od številnih dejavnikov, vključno z vrsto datoteke, velikost datoteke in sheme stiskanja.

    V večini jezikov na svetu, nekatere črke in besede se pogosto pojavljajo skupaj v istem vzorcu. Zaradi te visoke stopnje redundance, besedilne datoteke stisniti zelo dobro. Zmanjšanje za 50 odstotkov ali več, je tipična za dober velika besedilno datoteko. Večina programskih jezikov so prav tako zelo odveč, ker jih uporabljajo relativno majhno zbirko ukazov, ki pogosto gredo skupaj v določenem vzorcu. Datoteke, ki vsebujejo veliko edinstvenih informacij, kot so slike ali MP3 datotek, ne morejo biti stisnjen veliko s tem sistemom, ker ne ponavljajo več vzorcev (več o tem v naslednjem poglavju).

    Če je datoteka ima veliko ponavljajočih se vzorcev, stopnja znižanja običajno povečuje z velikostjo datoteke. To lahko vidite samo jih je videti v našem primeru - če bi imeli več govora Kennedyja, bi lahko bolj pogosto nanašajo na vzorce v našem slovarju, in tako dobili več iz vsakega vstopa v prostor za datoteke. Poleg tega bi lahko bolj prodornim vzorci pojavljajo v daljšem delu, kar nam omogoča, da ustvarite bolj učinkovito slovar.

    To uspešnost je odvisna tudi od posebnega algoritma, ki ga program za stiskanje, ki se uporablja. Nekateri programi so še posebej primerni za pobiranje vzorcev v določenih vrst datotek, zato jih lahko stisne bol

    Page [1] [2] [3] [4] [5]