background image

MULTIMEDIA

AUDIO

1/11

AUDIO

Nieco informacji na temat AKUSTYKI

Dźwięki – mechaniczna (falowa) natura rozchodzenia się dźwięków w ośrodku 

sprężystym - częstotliwość 20 – 20 000 Hz, zakres ok. 10 oktaw

Natężenie dźwięku – odwrotnie proporcjonalne do kwadratu odległości
Ton dźwięku – harmoniczne (podstawowy i kilka wielokrotnych)
Odtwarzanie dźwięków 

głośniki elektrodynamiczne – rola obudowy i przegrody w zestawie, 

subwoofer, 

usytuowanie zestawów głośnikowych w pomieszczeniu – tłumienie lub wzmacnianie 

niskich częstotliwości – zobrazowanie przestrzeni dźwięku, systemy pasywne i aktywne

Słuchawki 

– izolacja od otoczenia (system aktywny redukcji hałasu), pasmo, impedancja, system 

mocowania na głowie, na (w) uchu, bezprzewodowe, minimalizacja wpływu pomieszczenia na 
jakość dźwięku

Mikrofony 

– pogaduchy internetowe,  nauka języków…
– magnetoelektryczne, pojemnościowe , wymagają zasilania, piezoelektryczne 

Mikrofony wstęgowe (ribbon microphones)
Mikrofon wielo- i jednokierunkowy, efekt bliskości – wzmocnienie niskich tonów (pykanie)

Charakterystyki 

1.

fizyczne – ‘lavaliere’ – shotgun – paraboliczne

2.

elektryczne – impedancja (niska – 50-600 

, wysoka – 50 k

) – poziom sygnału (mV, dB) – sygnał 

zrównoważony (dwa przewody + ekran), niezrównoważony (jeden przewód + ekran)

Jakość dźwięku – zakres częstotliwości (50-15 000 Hz), kolor dźwięku

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

2/11

Pojęcie: AUDIO – elektryczny równoważnik dźwięku – bez względu na system kodowania

analogowy (analog audio) – zazw. napięcie proporcjonalne do natężenia dźwięku
cyfrowy (digital audio) – modulacja impulsowo-kodowa PCM (pulse code modulation) - 

wartość liczbowa reprezentuje poziom dźwięku w danym momencie 

kodowanie analogowo-cyfrowe i cyfrowo-analogowe – 
częstotliwość próbkowania (sampling rate) i rozdzielczość (resolution)

jakość dźwięku 

częstotliwość próbkowania  8 kHz (telefon), 16 (komunikacja multimedialna), 22 i 32 (RTV 

cyfrowe), 44,1 (CD), 48 (magnetofony DAT), 96 (DVD), 192 HDTV i HD-DVD

rozdzielczość – 8, 16, 24 lub 32-bitowa
przepływowość – Bit Rate – liczba bitów opisująca 1 sekundę danych (dla MP3 standardowo 96 – 

128 – 192 kbit/s) – w odniesieniu do ich odtwarzania (zapisu) w czasie rzeczywistym!

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

3/11

Możliwości PC w zakresie audio

1. wytwarzanie, synteza dźwięków
2. przechwytywanie dźwięków ze świata zewnętrznego
3. miksowanie i edycja generowanych lub przechwyconych dźwięków
4. poprzez MIDI (Musical Instrument Digital Interface) sterowanie procesem 

wytwarzania dźwięków w innych urządzeniach

5. odtwarzanie całej zarejestrowanej kakofonii poprzez głośniki dowolnego rodzaju

pierwsze PC-ty – generator tonów 1,19 MHz – dzielnik 16-bitowy – najniższy - 18 Hz 

modulacja szerokościowo-impulsowa – zegar płyty głównej

synteza dżwięków

substraktywna – różnokształtne generatory – miksowanie – filtracja

addytywna – liczne generatory sinusoidalne – miksowanie

FM – dwa sygnały sinusoidalne – nośnik i modulator

Wave Table (sampling) – charakterystyczne przebiegi falowe przechowywane w tablicy 
elektronicznej – modyfikacja częstotliwości, filtracja harmonicznych, zmiana czasów 
narastania, podtrzymywania i wygasania

technologie zaawansowane

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

4/11

karta dźwiękowa - zadania

- konwersja analogowo-cyfrowa i cyfrowo-analogowa
- synteza własnych dźwięków (niektóre)
- miksowanie dźwięków
- wzmacnianie
- obsługa CD-ROM
- obsługa portu MIDI (Musical Instrument Device Interface)

STANDARDY I ZGODNOŚĆ KARTY 

Ad Lib – pierwszy standard
Sound Blaster Live– Creative Labs – 16-bitowy dźwięk cyfrowy, synteza WT (WaveTable), oparta na naturalnych 

próbkach dźwięku; doskonałe MIDI

Sound Blaster Platinium - rozszerzona, Dolby AC 5.1 
AC’97 Audio Codec’97 – standard (Intel) łączący część cyfrową i analogową urządzeń audio (karta dźwiękowa, modem...) 

w oddzielnym układzie Audio Digital Controller, bądź zintegrowanie go z chipsetem płyty – eliminuje to dublowanie 
przez urządzenia obróbki tych samych sygnałów, współpraca z urządzeniami standardu AMR – Audio/Modem Riser 
(46 stykowe złącze na płycie)

DSP (Digital Signal Procesor) – cyfrowy procesor sygnału audio
-

MWave – Texas Instr. I IBM

-

VCOS – AT&T

-

Windows DSP – Windows Sound System

Dolby Digital, DTS Digital Theater 5.1 ma 5 kanałów, potrzebne są 4 głośniki i jedna kolumna niskotonowa. 
THX – THXver5.1 standard dźwięku  lepszy niż DD, ale mniej rozpowszechniony. 
Dolby Surround EX 7.1 - używa kino, 7 kanałów. 

Inne standardy: Dolby Digital EX 6.1, DTS (Dolby Theatre System) -ES 6.1 

Oznaczenie: 2.1 5.1 6.1 7.1 – cyfra po kropce oznacza sobwoofer, cyfra przed – liczbę głośników satelitarnych 
otaczających słuchacza

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

5/11

SYSTEMY KODOWANIA AUDIO

Kompresja audio – bardzo uciążliwa programowo

przy jakości CD stereo (dla próbkowania 44,1 kHz i 16-bitowej rozdzielczości) 

1 sekunda dźwięku wymaga ok.150 000 bajtów (1 minuta – 10,5 MB)

1.

GCIT G.711 A.Law (

µ

-Law) – metoda kompresji dynamiki amplitudy – telefonia, 2:1, kod 8-b 

zastępuje 16-bitowy

2.

LPC – Linear Predictive Coding - metoda predykcji liniowej – w oparciu o model kanału 
głosowego (krtaniowy), nienaturalny dźwięk po dekompresji, ‘gadające maszyny’ – militaria, 
(st.komp. 40)

3.

Code Excited Linear Predictor – jw. oraz porównanie wejścia i wyjścia z korekcją błędów

4.

GSM 6.10 Audio – metoda pobudzania równomiernego - telekomunikacja, kompresja w czasie 
rzeczywistym, jakość mowy ludzkiej

5.

Microsoft ADPCM (Adaptative Delta Pulse Code Modulation) – metoda przyrostowa, 
zapamiętywane są tylko różnice między kolejnymi próbkami, kompresja w czasie rzeczywistym, 
encyklopedia Encarta (st.komp. 4)

6.

AC-3 (Dolby Digital) – metoda wierności percepcyjnej – usunięcie informacji percepcyjnie 
nieistotnej – MPEG-1 cz.3-audio, dyski DVD, HDTV w USA – kanały 5.1

7.

AAC (Advanced Audio Coding) – 6 kanałowy system prezentacji dźwięku, 8 kanałów 
komentatorskich – MPEG-2 cz.7 audio (st.komp. 10)

8.

CELP – Code Excited Linear Prediction – metoda pobudzania kodowego (w oparciu o tablice 
różnicowe dźwięków) – G.728 True Speech – lepsza jakość niż GSM

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

6/11

TECHNOLOGIE AUDIO 

pliki deskryptorowe – opis sposobu wytwarzania dźwięku, definicje instrumentów 

(SBI – pojedyncze instrumenty Creative Labs, IBK – deskryptory wielu – 128 – 
instrumentów MIDI)

pliki sterujące – sterują pracą instrumentów, ‘nuty’ dla syntezatorów 

(MID dla MIDI, RMI dla Resourche Interchange Format)

pliki kształtu fali – bitowy obraz dźwięku – oddaje jego wszystkie niuanse 

(WAV dla Windows)

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

7/11

FORMATY PLIKÓW AUDIO

AIFF – Audio Interchange File Format – Macintosh i Silicon Graphics

Samoopisujące się, spakowane 
Bezpośrednio nie są zgodne z PC

IBK Sound Blaster Instrument Bank

Definicja 128 instrumentów, każdy instrument ma 9-bajtową nazwę i 16-bajtowy 
deskryptor, plik 3024 bajtów

MOD pliki sterujące dla Commodore i Amigi, zaadaptowany dla PC

Komputerowe przeboje ‘combos’
Próbki dźwięków, głosów lub taktów w plikach .SAM

MID Musical Instrument Digital Imterface

Pliki sterujące w multimediach, polecenia dla syntezatorów MIDI
*.MID, .MIDI, .RMI - syntezowane lub próbkowane, bez możliwości zapisu śpiewu, 
niewielkie pliki, mogą automatycznie wyświetlać partytury i łatwo je programować
Struktura

1. wspólny nagłówek
2. porcja ścieżek (truck chunks) – identyfikator i zdarzenia MIDI – czas zdarzenia i rodzaj 

zdarzenia

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

8/11

RMI – standard IBM i Microsoft  MIDI, spełnia normy RIFF

SBI pliki instrumentów dla Sound Blaster Instrument

Definiują pojedyncze instrumenty, synteza FM dla SB, pliki 51-bajtów

SND - platformy Amiga, Apple, NeXT, SUN – różne!

VOC – Sound Blaster 

Przechowują zdigitalizowane dane głosowe (i nie tylko)
Struktura

1. blok nagłówkowy – identyfikatory
2. blok danych – podbloki 9 typów (1-mono 8-bit, 8-stereo 8-bit, 9-zastępuje 1 i 8, 2-

kontynuacja bloku, 6 i 7-pętle, 3-wyciszenie, 4-synchronizacja z tekstem, 5-dodają tekst)

WAV, WAVE

bez kompresji, bardzo dobra jakość i wierność dźwięku
Przechowują próbkowane cyfrowo wartości kształtu fali
Struktura

1. nagłówek identyfikacyjny – identyfikator, rodzaj kodowania, liczba kanałów, częstotliwość 

próbkowania, głębia bitowa sygnału

2. porcje składowe danych – długość danych, dane

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

9/11

MP3 - część standardu MPEG-1 warstwy 3, niezwykle rozpowszechniony, kompresja (stratna) 

rzędu kilkunastu, oparta o model psychoakustyczny. Jakość bliska CD wymaga strumienia 128 
kbitów/sek, spotykane zakresy od kilkunastu kb/s (mowa, wiadomości strumieniowo, 
monofonicznie) do 256 kb/s (HI-FI stereo). 

Kodowanie VBR (Variable Bit Rate) ze zmienną przepływowością daje nieco lepszą 

jakość przy tej samej wielkości plików. 
Bitrate

jakość dźwięku

gatunek muzyki

poniżej 128

bardzo mocno zniekształcona, metaliczny przydźwięk

128

mocno zniekształcona

dance, techno

160

dobra

rock, elektroniczna

192

bardzo dobra, zbliżona do CD

instrumentalna, poważna jazz

256 i więcej

jakość CD

muzyka poważna

MP3Pro - nieco mniejsze pliki, lepsza jakość, ale mało rozpowszechniony. 

VFQ - podobny do MP3, nieco lepsza kompresja ale mało rozpowszechniony. 

OGG - używa zmiennego kodowania (VBR), nieopatentowany, wielokanałowy dźwięk 

przestrzenny. 

WMA –  mają 1/3 objętości MP3! Przy 48 Kb/s jakość WMA nie ustępuje MP3 przy 128 Kb/s 

(dźwięki są nieco rozmyte) 

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

10/11

MIDI – Musical Instrument Digital Interface

System sterowania do łączenia instrumentów elektronicznych
MIDI – sterowanie zewnętrznymi instrumentami muzycznymi – PC pełni rolę sekwensera 

– ‘dyrygenta’ orkiestry

Analogia do zapisu nutowego – MIDI jest zapisem dla całej orkiestry, każdego 

instrumentu, głosu i dźwięku generowanego przez 
syntezator

MIDI to jeszcze jeden port szeregowy w systemie PC – złączki typu DIN jack (5-pinowe)
Zazwyczaj MIDI sprzętowo zgodny jest ze standardem Roland MPU-401

General MIDI

16 przypisań instrumentów – każdy dla grupy 8 instrumentów – razem 128 instrumentów
47 dźwięków bębnów (mapa perkusji)
sterowane głosy kierowane są do kanałów – każdy oddzielnie lub razem – kanały 1-9 dla 

instrumentów, 10 dla perkusji, 11-16 do dyspozycji muzyka

Basic MIDI – 4 kanały (13-16)
Extended MIDI – 10 kanałów (1-10)

dr inż. Andrzej Celmerowski       acel4@o2.pl

background image

MULTIMEDIA

AUDIO

11/11

Komunikaty MIDI

1.

status kanału  – kanał podstawowy (basic), 

steruje urządzeniem podłączonym do MIDI

– kanały głosowe (voice), 

steruje indywidualnym głosem

2.

tryb przekazywania komunikatów przez odbiornik poszczególnym głosom instrumentu

-

OMNI – 

grupuje kanały (on) lub odseparowuje od siebie (off)

-

MONO – 

scala wszystkie komunikaty kanałów i przesyła je do jednego głosu

-

POLY – 

kieruje komunikaty z jednego kanału do wszystkich głosów odbiornika

3. informacja systemowa

-

Ogólne – dla wszystkich odbiorników

-

Wyłączne – dla konkretnego odbiornika

-

Czasu rzeczywistego – do synchronizacji zdarzeń

4.

aftertouch – 122 specyficznych wartości – siła uderzenia, stan przełączników...

Zakres nut 128 (fortepian: 88, -21, +19), dźwięk ‘middle C’ – pozycja 60
Możliwość synchronizacji z czasem zewnętrznym

dr inż. Andrzej Celmerowski       acel4@o2.pl


Document Outline