Kompresja informacji
Kierunek
Specjalność
Rok studiów Symbol grupy lab.
Elektronika i Telekomunikacja
Telekomunikacja
4
CZ/P, 13:15
Temat
Numer lab.
Kwantowanie liniowe, kwantowanie dynamiczne i kwantowanie
nieliniowe w oparciu o krzywą
µµµµ
Ć
wiczenie nr 2
Skład grupy ćwiczeniowej
Uwagi
Ocena
1. Cel
ć
wiczenia
Celem ćwiczenia było zapoznanie się z procesem kwantowania liniowego i nieliniowego
w oparciu o krzywą
µ
.
2. Kwantyzacja liniowa
Pierwszym zadaniem było sprawdzenie działania oraz analizę otrzymanych wyników procesu
kwantyzacji liniowej. Proces kwantyzacji liniowej polega na podzieleniu nieskończonego
zbioru wartości próbek na zbiór o skończonej liczbie elementów. Zbiór moŜliwych wartości
zostaje podzielony na obszary, którym zostaje przyporządkowana jedna wartość. W procesie
kwantyzacji liniowej wszystkie zbiory są jednakowe co do długości. Liczba moŜliwych
wartości, jakie moŜe przyjąć próbka jest ściśle związana z ilością bitów przetwornika, jest to
zaleŜność:
k
przedział
liczba
2
_
=
,
gdzie:
k – liczba bitów przetwornika.
W tej części ćwiczenia naleŜało wyznaczyć stosunek sygnał/szum (SQNR) dla róŜnej
ilości bitów przetwornika. SQNR moŜna charakteryzować jako stosunek mocy sygnału do
mocy szumu. Dla sygnału mowy „mowa.wav” wykreślono zaleŜność stosunku sygnał/szum
od liczby bitów przetwornika. ZaleŜność pokazano na poniŜszym rysunku (rys. 1).
4
6
8
10
12
14
16
-20
-10
0
10
20
30
40
50
60
70
Wykres zaleznosci SQNR od liczby bitów przetwornika
liczba bitów przetwornika
S
Q
N
R
[
d
B
]
Rysunek 1 ZaleŜność SQNR od liczby bitów przetwornika
Jak łatwo zauwaŜyć wykres powyŜszy jest w przybliŜeniu linią prostą (szczególnie
widać to dla liczby bitów >10), wobec czego łatwo moŜna sprawdzić o ile zwiększa się
SQNR, gdy do przetwornika doda się jeden bit. W poniŜszej tabeli (tab. 1) przedstawiono
dokładne wartości SQNR dla poszczególnych liczby bitów.
Tab. 1
liczba
bitów
4
6
7
8
9
10
11
12
13
14
15
16
SQNR
[dB]
-11.46
2.69
9.59 15.99 22.12 28.17 34.11 40.19 46.21 52.19 58.20 64.29
Po dodaniu kolejnego bitu do przetwornika stosunek sygnał/szum zwiększa się. Dzięki
skorzystaniu z metody regresji liniowej za pomocą programu komputerowego wyznaczono
współczynnik nachylenia prostej. Wynosi on 6,21 [dB/bit]. Dla projektowania przetworników
wystarczy załoŜyć, Ŝe wzrost SQNR wynosi 6 [dB/bit]. Jest to bardzo waŜna informacja i
pozwala dobrać odpowiednią liczbę bitów w przetworniku w zaleŜności od oczekiwanego
SQNR.
PoniŜej przedstawiono tabele (tab. 2), która przedstawia wyniki badań odsłuchowych
dla przetwornika o róŜnej ilości bitów.
Tab. 2
Liczba
bitów
1
2
3
4
5
6
7
8
WraŜenia
odsłucho
we
Brak
zrozumia-
łości
dźwięku
B. duŜe
szumy, b.
niewyra-
ź
ny
dźwięk
DuŜe
szumy,
niewyra-
ź
ny
dźwięk
DuŜe
szumy,
zniekszta-
cony
dźwięk
DuŜe
szumy,
wyra-
ź
ny
dźwięk
DuŜe
szumy,
wyra-
ź
ny
dźwięk
Słyszal-
ne
szumy,
wyraźny
dźwięk
Słyszal-
ne
szumy,
wyraźny
dźwięk
Liczba
bitów
9
10
11
12
13
14
15
16
WraŜenia
odsłucho
we
Lekkie
szumy,
wyraźny
dźwięk
Czysty i
wyraźny
dźwięk
Czysty i
wyraźny
dźwięk
Czysty i
wyraźny
dźwięk
Czysty i
wyra-
ź
ny
dźwięk
Czysty i
wyra-
ź
ny
dźwięk
Czysty i
wyraźny
dźwięk
Czysty i
wyraźny
dźwięk
Po wykonaniu badań odsłuchowych stwierdzono, Ŝe szumy zaczynają być słyszalne
gdy przetwornik posiada poniŜej 10 bitów (początkowa wartość wynosiła 16 bitów). Jednak
mowa jest nadal zrozumiała.
3. Kwantyzacja dynamiczna
W tym ćwiczeniu badano jakość kwantyzera dynamicznego oraz porównanie go
z kwantyzerem liniowym 4-bitowym. Podczas działania kwantyzera dynamicznego
wyznaczono współczynnik nmse (normalized mean square error) – czyli znormalizowany
błąd średniokwadratowy.
Działanie tego kwantyzera przetestowano na tym samym sygnale co poprzednio
(mowa.wav), wynik działania 4-bitowego kwantyzera dynamicznego przedstawiono poniŜej.
nmse – 0.0078,
SQNR – 21.0906 [dB].
Jak łatwo zauwaŜyć, jest to wartość duŜo wyŜsza niŜ osiągnięta przy kwantyzerze
liniowym 4-bitowym (-11.46 [dB]). RóŜnica wynosi ~ 32.5 [dB].
Badania odsłuchowe wykazały, ze sygnał skwantowany kwantyzerem dynamicznym
4-bitowym, odpowiada kwantowaniu 9-bitowemu dla kwantyzacji liniowej. Dla kwantowania
liniowego dla przetwornika 9 bitów SQNR= 22.12[dB]. Zaletą kwantyzerów dynamicznych
jest to, Ŝe moŜna uzyskać wyŜszy SQNR niŜ za pomocą kwantyzerów liniowych, jednak
kosztem większej ilości operacji matematycznych wykonywanych na sygnale.
4. Kwantyzacja nieliniowa
•
Charakterystyka kompresora typu µ
Rodzina krzywych typu
µ
, to krzywe o róŜnym współczynniku. Są uŜywane m. in. do tego,
aby próbki o małych amplitudach mogły być dokładniej kwantowane. Działanie kompresora
opiera się na przemnoŜeniu kolejnych próbek sygnału przez odpowiedni współczynnik, dzięki
temu próbki o małych amplitudach na czas kwantowania posiadają większe amplitudy.
Rodzinę krzywych typu
µ
kompresora przedstawiono poniŜej (rys. 2). Współczynniki
wynoszą odpowiednio: [1,2,10,25,50,100,150,200,250,300]. Im współczynnik większy tym
bardziej krzywa jest „zagięta”.
-1
-0 . 8
-0 . 6
-0 . 4
-0 . 2
0
0 . 2
0 . 4
0 . 6
0 . 8
1
-1
-0 . 8
-0 . 6
-0 . 4
-0 . 2
0
0 . 2
0 . 4
0 . 6
0 . 8
1
c h a ra k t e ry s t y k a k o m p re s o ra t y p u u
w e js c ie
w
y
js
c
ie
Rysunek 2 Charakterystyka kompresora typu u
•
Charakterystyka dekompresora typu µ
Po kwantowaniu sygnał musi powrócić do swojej pierwotnej postaci, wobec czego
trzeba go przemnoŜyć przez współczynnik krzywej dekompresora. Ta krzywa musi mieć
ś
ciśle określony przebieg, aby sygnał mógł być odtworzony poprawnie. Na poniŜszym
rysunku (rys. 3) przedstawiono rodzinę krzywych dekompresora.
-1
-0 . 8
-0 . 6
-0 . 4
-0 . 2
0
0 . 2
0 . 4
0 . 6
0 . 8
1
-1
-0 . 8
-0 . 6
-0 . 4
-0 . 2
0
0 . 2
0 . 4
0 . 6
0 . 8
1
c h a ra k t e ry s t y k a d e k o m p re s o ra t y p u u
w e js c ie
w
y
js
c
ie
Rysunek 3 Charakterystyka dekompresora typu u
Poprawne dobranie krzywej gwarantuje prawidłowe odtworzenie przebiegu.
5. Rozkład amplitudy dla sygnału mowy
Kolejnym krokiem tego ćwiczenia było wykreślnie histogramu rozkładu amplitudy dla
badanego sygnału mowy (mowa.wav). Taki histogram utworzono dla 100 przedziałów
i zgodnie z teorią wartości próbek skupiły się w okolicach 0. PoniŜej (rys. 4) przedstawiono
otrzymany histogram.
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
histogram rozkladu amplitudy dla sygnalu mowy
amplituda
il
o
s
c
p
ró
b
e
k
Rysunek 4 Histogram rozkładu amplitudy dla sygnału mowy
6. Kwantyzacja dla ró
Ŝ
nych warto
ś
ci parametru µ
Kolejnym krokiem było przeprowadzenie kwantowania nieliniowego dla róŜnych ilości bitów
przetwornika oraz róŜnych wartości współczynnika µ. Takie doświadczenia pozwala
zaobserwować wpływ współczynnika krzywej na SQNR sygnału mowy. Do analizy
zastosowano ten sam sygnał mowy (mowa.wav), aby moŜliwe było porównanie wyników.
Dzięki wcześniejszym badaniom odsłuchowym moŜliwe było stwierdzenie, Ŝe dla
SQNR=28 [dB] szum nie jest słyszalny. Na poniŜszym rysunku (rys. 5) przedstawiono wynik
symulacji.
0
20
40
60
80
100
120
140
160
10
20
30
40
50
60
70
wartosc wspolczynnika u
S
Q
N
R
[
d
B
]
zaleznosc SQNR od wartosci wspolczynnika krzywej u dla roznych ilosci bitow przetwornika
Rysunek 5 ZaleŜność SQNR od wartości współczynnika u
Po przeanalizowaniu wyników symulacji moŜna zauwaŜyć, Ŝe wymagany poziom
(około 28[dB]) moŜna osiągnąć dzięki przetwornikowi 7-bitowemu po zastosowaniu krzywej
µ o współczynniku powyŜej 50. Ewentualnie skorzystać moŜna z przetwornika 8-bitowego
i zastosować współczynnik krzywej większy od 15.
Łatwo moŜna zauwaŜyć, Ŝe po przekroczeniu współczynnika o wartości 100 nie
następuje dalszy widoczny wzrost SQNR, wiec nie ma dalszej poprawy jakości.
Dla porównania wyników przytoczono wykres z ptk. 1 i naniesiono na niego
wymagany SQNR dla niezaszumionego dźwięku.
4
6
8
10
12
14
16
-20
-10
0
10
20
30
40
50
60
70
Wykres zaleznosci SQNR od liczby bitów przetwornika
liczba bitów przetwornika
S
Q
N
R
[
d
B
]
Rysunek 6 zaleŜność SQNR od liczby bitów przetwornika
7. Wnioski
Przeprowadzone ćwiczenie miało na celu przybliŜenie działania operacji kwantyzacji,
zarówno liniowej jak i nieliniowej. Kwantyzacja nieliniowa nie zakłada jednakowych
przedziałów kwantyzacji, wobec czego czasami moŜe dawać lepsze wyniki. Kwantyzacja
nieliniowa jest poŜądana w sytuacjach, gdy rozkład prawdopodobieństwa występowania
próbek nie jest jednostajny (np. tak jest dla sygnału mowy – próbki o małych amplitudach
występują częściej co moŜna zaobserwować na przedstawionym histogramie). Dla
odpowiednich sygnałów taki sposób kwantyzacji da lepsze wyniki w postaci większego
SQNR.
Sygnał mowy jest jednym w typów sygnałów, dla którego zalecane jest stosowanie
kwantyzera nierównomiernego z krzywa typu µ, co znacznie zwiększa SQNR.
Kwantyzery dynamiczne są zalecane dla kwantyzacji sygnału o przetwornikiem o
małej liczbie bitów (2-5), gdyŜ daje to lepsze rezultaty niŜ ta sama operacja na przetworniku
liniowym. Jednak kosztem jest duŜa złoŜoność operacyjna, przez to ten typ kwantyzacji nie
jest dobrym rozwiązaniem dla kwantowania sygnału za pomocą przetwornika o liczbie bitów
większej niŜ 5.