2. KOMPRESIJA MIRNIH SLIKA

 

 

Osnovni pojmovi vezani uz kompresiju mirnih slika

 

 

           Analogna slika sastoji se od linija. Svaka linija opisana je  kontinuiranim valnim oblikom. U digitalnoj slici linija sadrži diskretne valne oblike, a svaki takav diskretan valni oblik zove se element slike. Diskretne vrijednosti svih elemenata slike potrebno je kvantizirati s  bitova. Broj potrebnih bitova računa se prema slijedećem izrazu:

                                            

(od najveće diskretne vrijednosti),

(2.1)

 

pri čemu se dobiveni rezultat zaokružuje na prvi viši cijeli broj. Kompresija je definirana kao postupak smanjenja broja bitova uporabljenih za prikaz pojedinog elementa slike.  Uvodi se pojam stupnja kompresije (CR-Compression Ratio) koji je definiran kao omjer broja bitova po elementu originalne slike i broja bitova po elementu komprimirane slike:

 

,

(2.2)

 

 

 Ako pretpostavimo da je broj bitova po elementu slike originalne slike 16, a komprimirane slike 2 bita po elementu slike, slijedi da je stupanj kompresije      jednak:

.

 

Postupci kompresije mogu biti s gubitkom i bez gubitaka kvalitete slike. Kompresija bez gubitaka (lossless) ne može postići značajno smanjenje broja bitova, ali ne smanjuje kvalitetu slike. Neki od postupaka kompresije bez gubitaka su: kodiranje dužine niza (RLC-Run Lenght Coding), kodiranje s promjenjivom dužinom kodne riječi (VLC-Variable Lenght Coding; Huffmanovo kodiranje), kodiranje područja, diferencijalna impulsno-kodna modulacija ( DPCM-Differential Pulse Code Modulation). Kompresija s gubicima (lossy) omogućuje veliki stupanj kompresije uz nezamjetan pad kvalitete. Neki od postupaka s gubicima su: transformacijsko kodiranje, vektorska kvantizacija, fraktalno kodiranje, «Spline» aproksimacijske metode, aproksimacijske metode segmentacijom. U normama JPEG i JPEG2000 koriste se kombinacije postupaka kompresije s gubicima i bez gubitaka. Stoga JPEG i JPEG2000 nazivamo hibridnim kompresijskim postupcima.

 

 

 

Čimbenici na kojima se zasniva kompresija slike

 

 

          Kompresija se zasniva na statističkim svojstvima slike, te nesavršenosti ljudskog vizualnog sustava.

 

 

 

Statistička svojstva slike

       

          Elementi slike monokromatske slike poprimaju različite diskretne vrijednosti koje ovise o sadržaju slike. Te vrijednosti se kvantiziraju s n bitova, što daje  kvantizacijskih razina. Učestalost pojavljivanja pojedinih kvantizacijskih razina odnosno diskretnih vrijednosti u slici, ovisi o sadržaju slike. Zamislimo sliku kao dvodimenzijsku funkciju koju možemo prikazati matricom A s elementima . Elementi matrice su elementi slike. Neka je funkcija vjerojatnosti da element slike na mjestu  u matrici A poprimi diskretnu vrijednost  iz skupa vrijednosti .

Može se pisati funkcija gustoće vjerojatnosti :

                                      

,

(2.3)

 

gdje je  ukupan broj elemenata slike. Vjerojatnost  pojavljivanja diskretne vrijednosti  izražava se kao omjer elemenata slike koji poprimaju vrijednost  i ukupnog broja elemenata slike. Također se definira slijedeće:

 

 

, [bita]

(2.4)

 

gdje je  težina ili količina korisne informacije u bitovima, koju nosi odgovarajući elemet slike. To znači da svi elementi slike nisu jednako važni. Budući da vrijede slijedeće relacije:

                                           

,

(2.5)

 

,

(2.6)

 

slijedi da je:

 

,

(2.7)

 

Svojstvo logaritamske funkcije je da logaritam veće vjerojatnosti daje po apsolutnoj vrijednsoti manji broj nego logaritam manje vjerojatnosti. Iz toga se zaključuje da elementi slike koji poprimaju diskretnu vrijednost veće vjerojatnosti sadrže manje korisne informacije. Takvi elementi slike se mogu grublje kvantizirati. Na tom načelu radi entropijsko kodiranje opisano u 5. poglavlju. Prosječna količina korisne informacije koju nose svi elementi slike naziva se entropija [1], a može se definirati kao:

 

               

, [bit/elemetu slike]

(2.8)

 

Kada svi elementi slike imaju jednaku vrijednost , tada prema izrazu (2.3) i (2.4) proizlazi: 

                                                       

,

(2.9)

                                                         

,

(2.10)

 

iz toga prema (2.8) slijedi da je :

                                                     

,

(2.11)

 

tj. entropija je minimalna i iznosi nula. Sličnim razmatranjem se dobije izraz za maksimalnu entropiju koja iznosi:

 

                                                  

,

(2.12)

 

gdje je , tj. maksimalan broj uporabljenih kvantizacijskih razina. Kod postojanja maksimalne entropije, svaki element slike ima drugačiju diskretnu vrijednost odnosno potrebno je najmanje n bitova za prikaz svih diskretnih vrijednosti.

 

 

 

Primjer 1:

Ako sustav A/D pretvorbe raspolaže s  bitova, broj kvantizacijskih razina je 255. Neka blok ima 158 elemenata slike. Pretpostavimo da se u bloku slike pojavljuje prvih158 različitih diskretnih vrijednosti s jednakom vjerojatnošću pojavljivanja. Slijedi da je veličina skupa S=158.

Iz izraza (2.12) slijedi da je entropija maksimalna:

 bita/elementu slike,

dakle potrebno je minimalno 8 bitova po elementu slike, a redudantnih bitova nema.

 

 

Primjer 2:

Ako su u bloku za prikaz elemenata slike, od 255 mogućih kvantizacijskih razina, uporabljene prve 32 kvantizacijske razine sve s jednakom vjerojatnošću pojavljivanja, entropija je maksimalna i iznosi:bitova /elementu slike. Preostala 3 bita po uzorku predstavljaju višak informacije koju nazivamo redudancija [2].

 

 

Primjer 3:

Ako u Primjeru 1 pretpostavimo da nemaju sve vrijednosti jednaku vjerojatnost pojavljivanja, tada je prema (2.8) entropija još manja, što znači da postoji još više redudantnih bitova.

 

 

Primjer 4:

Ako promatramo bitonalnu (bilevel) sliku u bitmap formatu također s 8 bitova po uzorku, entropija iznosi 1, a redudancija 7 jer elementi slike mogu poprimiti samo dvije diskretne vrijednosti. Dakle za kvantizaciju bi bio dovoljan samo 1 bit po uzorku.

 

 

Takva redudancija se naziva statističkom redudancijom jer ovisi o sadržaju slike odnosno o vjerojatnosti pojavljivanja pojedinih diskretnih vrijednosti u slici.

Statistička redudancija se može izraziti kao:

 

                                                   

                                 

(2.13)

 

 

Iz izraza (2.13) se zaključuje da veća entropija znači manju redudanciju što je i logično. Entropija predstavlja teoretski maksimum komprimiranja nekom entropijskom metodom. Entropijske metode korištene u JPEG normi, Huffmanovo kodiranje i aritmetičko kodiranje, objašnjene su u 5. poglavlju.

 

 

 

Ljudski vizualni sustav

 

          U slici osim statističke, postoji i subjektivna redudancija koja se javlja uslijed nesavršenosti odnosno tromosti ljuskog vizualnog sustava. Slika može sadržavati niske i visoke prostorne frekvencije. Ljudski vizualni sustav ne vidi visoke prostorne frekvencije što znači da elementi slike koji generiraju visoke frekvencije, predstavljaju višak informacije (slika 2.1). Ljudsko oko neće zamijetiti svaki element slike već možda svaki treći ili više. Visoke frekvencije nastaju uslijed naglih prijelaza, puno sitnih detalja i naglih promjena boje u malom području slike. To znači da susjedni elementi slike poprimaju diskretne vrijednosti velike apsolutne razlike. Valja zamijetiti da visoka statistička redudancija ne znači i visoku subjektivnu redudanciju. Ova tvrdnja se može pojasniti slijedećim primjerom:

 

Primjer 5:

Ako se bitonalna slika kvantizira s 1 bitom, statističke redudancije nema jer elementi slike mogu poprimiti samo dvije diskretne vrijednosti. Međutim ako takva slika ima mnogo naglih promjena crno ] bijelo, frekvencijska analiza slike pokazuje zastupljenost visokih prostornih frekvencija. Dakle subjektivna redudancija je velika dok statistička uopće ne postoji.

 

 

Slika 2.1. Zgušnjavanje pruga generira veće prostorne frekvencije

 

 

 

 

 

 

MENTOR:

Prof.dr.sc.Sonja Grgić

Û prethodno poglavlje Û

Ü slijedeće poglavlje Ü

Autor:

Mihael Jančić