background image

Multimedia i grafika 

komputerowa

C

yfrowa obróbka dźwięku

Mateusz Pańkowski / ZSL 

2010

4. Kompresja dźwięku

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Kompresja

 - sposób zapisu informacji, polegający na 

usunięciu ich nadmiaru w celu zmniejszenia zbioru. 
Inaczej mówiąc chodzi o wyrażenie tych samych 
informacji, ale za pomocą mniejszej liczby bitów.

Wyróżnić można dwa typy kompresji:

- kompresja 

stratna

- kompresja 

bezstratna

Oba typy stosowane są zarówno w kompresji dźwięku, 
obrazu jak i zwykłych danych nie będących 
multimediami. Należy pamiętać, że raz skompresowany 
obiekt, po ponownej kompresji praktycznie nie zmieni 
już swojego rozmiaru.

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Kompresję 

bezstratną 

da się z postaci 

skompresowanej odzyskać informacje identyczne ze 
stanem pierwotnym (z tym co było przed kompresją). 
Najprostszym przykładem będzie:

Algorytm kompresji RLE:

1) Dane: 
AAAAaaJJJJJJJJJJJkkkkkkOOOOLLrrraaaaaPPP####sssssss
2) Używamy najprostszego algorytmu kompresji:
 

Widać doskonale, że długość ciągu znaków zmniejszyła 
się z 51 do 23, czyli ponad dwukrotnie. Czysty zysk. W 
drugą stronę, czyli podczas dekompresji, algorytm po 
prostu rozpisze wynik na postać początkową.

4

Aaa

11

J

6

k

4

OLL

3

r

5

a

3

P

4

#

7

s

3) Wynik:

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Kompresję 

stratną

 - polegającą na usunięciu z 

materiału źródłowego elementów nie mających dla nas 
znaczenia (mniej istotne informacje). Wadą jest brak 
możliwości odzyskania pierwotnego źródła.

 

W przypadku dźwięku, wykorzystano niedoskonałości 
ludzkiego zmysłu słuchu. Wiadomo, że słyszymy 
dźwięki z zakresu 16 Hz - 22 kHz, tak więc wystarczy z 
pliku usunąć elementy niesłyszalne dla nas (< 16 Hz i > 
22 kHz).

Stosunek rozmiaru pliku nieskompresowanego do 
rozmiaru pliku skompresowanego nazywany jest 

stopniem kompresji

. Jeśli plik skompresowany jest 2x 

mniejszy od oryginału, to stopień kompresji wynosi 2:1.

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Od stopnia kompresji zależy ilość usuniętych informacji, 
a co za tym idzie jakość dźwięku oraz rozmiar pliku
Im  większy  jest  współczynnik  kompresji,  tym  jakość 
dźwięku jest gorsza, ale rozmiar pliku jest mniejszy.
Wadą 

stosowania 

tego 

typu 

jest 

możliwość 

występowania  tzw.  artefaktów,  czyli  szumów  i 
niepożądanych  dźwięków  pojawiających  się  w  procesie 
kompresji.

UWAGA!!!

Kompresja  stratna  jest  procesem  nieodwracalnym, 
dlatego  zawsze  warto  wykonać  kopię  zapasową  pliku, 
który zamierzamy poddać kompresji.

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Formaty  kompresji  plików  audio 

 

formaty 

stanowiące postać wyjściową do zapisu danych audio w 
którymś z powszechnie stosowanych formatów plików.

PCM  (Pulse  Code  Modulation)  -  najpopularniejsza 
metoda  reprezentowania  sygnału  analogowego  w 
systemach 

cyfrowych. 

Sygnał 

analogowy 

jest 

próbkowany  ze  stałą  częstotliwością  -  im  większa 
częstotliwość  próbkowania,  tym  większa  dokładność 
odwzorowania.  Najczęściej  stosuje  się  częstotliwość 
44.1 kHz i rozdzielczość 16 bit/próbka. Wykorzystuje się 
w: 

- telekomunikacji

- cyfrowej obróbce sygnału audio

- zapisu na płytach CD-Audio, DVD-Audio

Pliki  zapisane  z  użyciem  tej  metody  mają  duże 
rozmiary.  Dźwięk  może  być  jedno-  dwu-  lub  wielo-
kanałowy. Pliki mają rozszerzenie .wav

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Ogg  Vorbis  -  jest  to  połączenie  kodera-dekodera 
stratnej  kompresji  dźwięku  -  Vorbis  i  kontenera  plików 
multimedialnych  Ogg.  Stworzono  go  na  potrzeby 
wolnego  oprogramowania  i  można  używać  go  zarówno 
do zastosowań niekomercyjnych i komercyjnych. Jakosć 
sygnału  Ogg  Vorbis  jest  wyższa  niż  formatu  MP3  przy 
podobnej wielkości pliku. Pliki mają rozszerzenie .ogg

ISO-MPEG-Audio Layer-3 - obecnie najpopularniejszy 
format  kompresji  dźwięku.  Cechą  jest  tzw.  Kodowanie 
percepcyjne
  oparte  na  modelu  psychoakustycznym.   
Wykorzystano  tu  również  zjawisko  zwane  efektem 
maskowania
.  Powstaje  on  gdy  nakładają  się  na  siebie 
dwa  dźwięki  o  podobnych  częstotliwościach.  Ludzkie 
ucho  słyszy  wtedy  tylko  dźwięk  głośniejszy,  dźwięk 
słabszy może zostać usunięty. Daje to możliwość prawie 
12-krotnego zmniejszenia objętości pliku w porównaniu 
do  wyjściowego  .wav,  bez  zauważalnego  pogorszenia 
jakości. Pliki mają rozszerzenie .mp3

background image

Multimedia i grafika 
komputerowa

Mateusz Pańkowski / ZSL 

2010

Kodery-dekodery 

audio

 

potocznie 

zwane 

kodekami,  są  to  programy  do  kodowania  i 
dekodowania 

zawartości 

plików 

audio 

według 

określonej  metody.  Kodowanie  polega  na  uproszczeniu 
zapisu  danych  audio,  umożliwia  kompresję.  Aby 
odtworzyć  zakodowane  informacje,  należy  poddać  je 
dekodowaniu.

Aby  sprawdzić  zainstalowane  w  systemie  Windows  XP 
kodeki należy:

1) wybrać  menu 

Start

  -> 

Ustawienia 

->

  Panel 

sterowania

;

2) wybrać 

Dźwięk i właściwości audio

;

3) w oknie 

Sprzęt

;

4) zaznaczamy  pozycję 

Kodery-dekodery  audio

  i 

wybieramy 

Właściwości

;

5) w  otwartym  oknie  ponownie  wybieramy  zakładkę 

Właściwości

 

wyświetli 

się 

nam 

lista 

zainstalowanych w systemie kodeków.


Document Outline