2. KOMPRESIJA MIRNIH SLIKA |
||||||||||||||||||||||||||||||
Osnovni pojmovi vezani uz kompresiju
mirnih slika Analogna slika sastoji se od
linija. Svaka linija opisana je
kontinuiranim valnim oblikom. U digitalnoj slici linija sadrži
diskretne valne oblike, a svaki takav diskretan valni oblik zove se element
slike. Diskretne vrijednosti svih elemenata slike potrebno je kvantizirati s
pri čemu se dobiveni rezultat
zaokružuje na prvi viši cijeli broj. Kompresija je definirana kao postupak
smanjenja broja bitova uporabljenih za prikaz pojedinog elementa slike. Uvodi se pojam stupnja kompresije
(CR-Compression Ratio) koji je definiran kao omjer broja bitova po elementu
originalne slike i broja bitova po elementu komprimirane slike:
Ako pretpostavimo da je broj bitova po
elementu slike originalne slike 16, a komprimirane slike 2 bita po elementu
slike, slijedi da je stupanj kompresije
jednak:
Postupci
kompresije mogu biti s gubitkom i bez gubitaka kvalitete slike. Kompresija
bez gubitaka (lossless) ne može postići značajno smanjenje broja bitova, ali ne
smanjuje kvalitetu slike. Neki od postupaka kompresije bez gubitaka su:
kodiranje dužine niza (RLC-Run Lenght Coding), kodiranje s promjenjivom
dužinom kodne riječi (VLC-Variable Lenght Coding; Huffmanovo kodiranje),
kodiranje područja, diferencijalna impulsno-kodna modulacija (
DPCM-Differential Pulse Code Modulation). Kompresija s gubicima (lossy)
omogućuje veliki stupanj kompresije uz nezamjetan pad kvalitete. Neki od
postupaka s gubicima su: transformacijsko kodiranje, vektorska kvantizacija,
fraktalno kodiranje, «Spline» aproksimacijske metode, aproksimacijske metode
segmentacijom. U normama JPEG i JPEG2000 koriste se kombinacije postupaka
kompresije s gubicima i bez gubitaka. Stoga JPEG i JPEG2000 nazivamo
hibridnim kompresijskim postupcima. Čimbenici na kojima se zasniva
kompresija slike Kompresija se zasniva na
statističkim svojstvima slike, te nesavršenosti ljudskog vizualnog sustava. Statistička svojstva slike Elementi slike monokromatske slike
poprimaju različite diskretne vrijednosti koje ovise o sadržaju slike. Te
vrijednosti se kvantiziraju s n bitova, što daje Može
se pisati funkcija gustoće vjerojatnosti :
gdje je
gdje je
slijedi da je:
Svojstvo
logaritamske funkcije je da logaritam veće vjerojatnosti daje po apsolutnoj
vrijednsoti manji broj nego logaritam manje vjerojatnosti. Iz toga se
zaključuje da elementi slike koji poprimaju diskretnu vrijednost veće
vjerojatnosti sadrže manje korisne informacije. Takvi elementi slike se mogu
grublje kvantizirati. Na tom načelu radi entropijsko kodiranje opisano u 5.
poglavlju. Prosječna količina korisne informacije koju nose svi elementi
slike naziva se entropija [1], a
može se definirati kao:
Kada
svi elementi slike imaju jednaku vrijednost
iz
toga prema (2.8) slijedi da je :
tj.
entropija je minimalna i iznosi nula. Sličnim razmatranjem se dobije izraz za
maksimalnu entropiju koja iznosi:
gdje
je Primjer 1: Ako sustav A/D pretvorbe raspolaže s Iz izraza (2.12) slijedi da je entropija maksimalna:
dakle potrebno je minimalno 8 bitova po elementu slike, a
redudantnih bitova nema. Primjer 2: Ako su u bloku za prikaz elemenata slike, od 255 mogućih
kvantizacijskih razina, uporabljene prve 32 kvantizacijske razine sve s
jednakom vjerojatnošću pojavljivanja, entropija je maksimalna i iznosi: Primjer 3: Ako u Primjeru 1 pretpostavimo da nemaju sve vrijednosti jednaku
vjerojatnost pojavljivanja, tada je prema (2.8) entropija još manja, što
znači da postoji još više redudantnih bitova. Primjer 4: Ako promatramo bitonalnu (bilevel) sliku u bitmap formatu
također s 8 bitova po uzorku, entropija iznosi 1, a redudancija 7 jer
elementi slike mogu poprimiti samo dvije diskretne vrijednosti. Dakle za
kvantizaciju bi bio dovoljan samo 1 bit po uzorku. Takva
redudancija se naziva statističkom redudancijom jer ovisi o sadržaju slike
odnosno o vjerojatnosti pojavljivanja pojedinih diskretnih vrijednosti u
slici. Statistička
redudancija se može izraziti kao:
Iz
izraza (2.13) se zaključuje da veća entropija znači manju redudanciju što je i
logično. Entropija predstavlja teoretski maksimum komprimiranja nekom
entropijskom metodom. Entropijske metode korištene u JPEG normi, Huffmanovo
kodiranje i aritmetičko kodiranje, objašnjene su u 5. poglavlju. Ljudski vizualni sustav U slici osim statističke, postoji i
subjektivna redudancija koja se javlja uslijed nesavršenosti odnosno tromosti
ljuskog vizualnog sustava. Slika može sadržavati niske i visoke prostorne
frekvencije. Ljudski vizualni sustav ne vidi visoke prostorne frekvencije što
znači da elementi slike koji generiraju visoke frekvencije, predstavljaju
višak informacije (slika 2.1). Ljudsko oko neće zamijetiti svaki element
slike već možda svaki treći ili više. Visoke frekvencije nastaju uslijed
naglih prijelaza, puno sitnih detalja i naglih promjena boje u malom području
slike. To znači da susjedni elementi slike poprimaju diskretne vrijednosti
velike apsolutne razlike. Valja zamijetiti da visoka statistička redudancija
ne znači i visoku subjektivnu redudanciju. Ova tvrdnja se može pojasniti
slijedećim primjerom: Primjer 5: Ako se bitonalna slika kvantizira s 1 bitom, statističke
redudancije nema jer elementi slike mogu poprimiti samo dvije diskretne
vrijednosti. Međutim ako takva slika ima mnogo naglih promjena crno ] bijelo, frekvencijska analiza slike pokazuje zastupljenost
visokih prostornih frekvencija. Dakle subjektivna redudancija je velika dok
statistička uopće ne postoji. Slika 2.1. Zgušnjavanje pruga generira veće prostorne frekvencije
|
||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||
MENTOR: Prof.dr.sc.Sonja Grgić |
Autor: Mihael Jančić |
|||||||||||||||||||||||||||||