Systemy operacyjne i sieci komputerowe

Podstawy fizyczne dźwięku

Dźwięk jest wytwarzany przez ciała drgające, które wywołują fale akustyczna.

Docierająca fala powoduje wrażenia dźwiękowe powstające w uchu człowieka. Najprostszym

rodzajem drgań są drgania sinusoidalne. Każde drganie charakteryzują następujące parametry:

 amplituda (maksymalne wychylenie membrany z poziomu równowagi)

 częstotliwość (liczba drgań membrany na sekundę - Hz). Wielkością odwrotna do

częstotliwości jest okres - czyli czas w którym źródło dźwięku wykonuje jedno pełno

drganie. Amplituda drgań jest związaną z głośnością odbieranego dźwięku. Natomiast

częstotliwość drgań odpowiada za wysokość słyszanego dźwięku. Im większa

częstotliwość tym dźwięk wydaje się być wyższy.

Ludzie słyszą dźwięki z zakresu ok. 15 Hz do 20 kHz. Granice te ulęgają zmianie w

zależności od wieku, stopnia zmęczenia, stanu emocjonalnego itp. Tony poniżej 400 Hz

odbiera się jako niskie, w przedziale 400 Hz - 3000 Hz jako średnie, a powyżej 3 kHz jako

wysokie.

Ton (drganie proste) jest najprostszym dźwiękiem. Jednak większość dźwięków spotykanych

w otoczeniu jest bardziej złożona. Drgania te można przedstawić jako suma pewnych drgań

prostych o różnych częstotliwościach i amplitudach. Dźwięki takie nazywa się wielotonami.

Jeżeli w widmie dźwięku wszystkie występujące składowe są całkowitą wielokrotnością

pewnej częstotliwości, to dźwięk taki nazywa się wielotonem harmonicznym, a każdy jego

ton to składowa harmoniczna. Ton podstawowy jest to ton będący największym wspólnym

podzielnikiem tonów składowych. Subiektywne wrażenie wysokości wielotonu jest związane

z tonem podstawowym. Może on w ogóle nie występować, a będzie słyszany. Np. jeśli

docierający dźwięk daje sie rozłożyć na tony harmoniczne o częstotliwościach 440 Hz, 660

Hz i 880 Hz, to wysokości dźwięku słyszanego będzie odpowiadać częstotliwości 220 Hz.

Inna kategoria dźwięku są szumy - czyli dźwięk, którego widmo akustyczne jest ciągłe, tzn.

Występują w nim wszystkie częstotliwości składowe. Jeżeli wszystkie częstotliwości

składowe maja te same amplitudy, to szum taki nazywa się białym. W przypadku, gdy

niektóre zakresy częstotliwości maja większe amplitudy niż inne, szum taki nazywa się

kolorowym.

Obwiednia dźwięku jest zależnością amplitudy od czasu. W największym przybliżeniu w

obwiedni dźwięku wyróżnić cztery fazy:

 narastanie (attack); amplituda dźwięku narasta od zera do głośności maksymalnej

opadanie (decay);

 dźwięk nieco zmienia swoja głośność ustalenie (sustain);

 natężenie dźwięku trwa przez pewien czas na ustalonym poziomie - wybrzmiewanie

(release);

 głośność dźwięku maleje do zera.

Obwiednie nazywa się często obwiednia ADSR (skrót od pierwszych liter poszczególnych

faz). Czasy trwania każdej z faz są charakterystyczne dla różnych instrumentów i dodatkowo,

obok barwy, ułatwiają rozpoznanie instrumentów.

Systemy operacyjne i sieci komputerowe

Budowa karty dźwiękowej

Typowa współczesna karta dźwiękowa jest wyposażona w:

 przetwornik analogowo-cyfrowy (ADC)

 przetwornik cyfrowo-analogowy (DAC)

 zestaw generatorów FM (generuje dźwięk wykorzystując modulacje częstotliwości

i/lub tabela próbek dźwiękowych - wave table)

 wbudowany wzmacniacz (wzmacnia sygnał do poziomu napięcia, które może

sterować małymi głośniczkami lub słuchawkami)

 wejście i wyjście sygnału zewnętrznego (line in i line out)

 złącze MIDI (do sterowania zewnętrznymi urządzeniami muzycznymi)

 mikser sygnałów z różnych źródeł dźwięku i regulacji poziomu niskich i wysokich

tonów (wspólna dla wszystkich kanałów)

 dynamiczne filtry dolno- i górnoprzepustowe

 sterownik napędu CD-ROM

Najczęściej dzisiejsze karty są stereofoniczne. Karta może ewentualnie przetwarzać

zdigitalizowany

dźwięk

za

pomocą

procesora

sygnałów

dźwiękowych.

MIDI

Złącze MIDI służy do podłączenia komputera z innymi urządzeniami muzycznymi

wyposażonych w złącze tego standardu. Koncepcja MIDI została wprowadzona we

wczesnych latach osiemdziesiątych. Interfejs MIDI (Musical Instrument Digital Interface),

czyli cyfrowy interfejs dla instrumentów muzycznych umożliwia łączenie urządzeń

spełniających jego założenia w siec. Wszystko co zostanie zagrane na klawiaturze komputera

czy tez zewnętrznym instrumencie klawiszowym (klawiatura MIDI), może być

zarejestrowane przez komputer w jego pamięci. Analogicznie, dowolne dane zapisane w

pamięci komputera mogą zostać odegrane przez syntezator klawiszowy. Zapis

poszczególnych utworów w standardzie MIDI nie składa się z poszczególnych dźwięków,

lecz z informacji jaka nutę, przez jaki czas i na którym instrumencie należy zagrać. W

przypadku cyfrowych plików muzycznych konieczne mogą być miliony bajtów, by

zarejestrować i odtworzyć zaledwie kilka minut muzyki, natomiast plik MIDI składający się

zaledwie z kilku tysięcy bajtów może zawierać instrukcje wykonawcze umożliwiające

odtworzenie godzin muzyki.

Plik MIDI jest komputerowym odpowiednikiem nut. Na dane MIDI składają się

komunikaty wielu rożnych typów. Najczęściej używane to Note Number (wartość nuty, która

należy zagrać), Note On (kiedy zacząć grac nutę), Velocity (siła z jaka zagrać nutę), Note Off

(kiedy zakończyć odgrywanie nuty), Channel Number (tzw. numer kanału, czyli instrument,

który ma zagrać nutę).

Mikser

Mikser zezwala na obróbkę i miksowanie dźwięków pochodzących z mikrofonu,

syntezatora FM, wejścia line-in, odtwarzacza CD, czy tez źródeł dźwięku zapisanego

cyfrowo. Na wielu kartach mikser umożliwia regulacje wysokich i niskich tonów, regulacji

głośności (główny, i np. dźwięk z CD, syntezy FM, wejścia in-line, wejście mikrofonowe),

jednoczesnego nagrywanie z kilku źródeł (można wybrać np. mikrofon i podkład muzyczny z

Audio CD).

Systemy operacyjne i sieci komputerowe

Procesor DSP

Najważniejszym układem na karcie dźwiękowej jest cyfrowy procesor dźwięku

(DSP). Przetwarza wszystkie komendy dotyczące dźwięku przekazywane przez aplikacje.

Układ DSP instruuje wszystkie inne układy dźwiękowe, aby spowodować wygenerowanie

dźwięków. Gdy program chce zagrać określoną sekwencje dźwięków za pośrednictwem

syntezatora FM, procesor DSP musi przejąć dane od komputera i poinstruować układ FM, jak

ma zagrać pożądaną sekwencje muzyczna. Inny przykładem jest odtworzenie zapisanych

cyfrowo próbek - układ DSP przetwarza dane z postaci cyfrowej na analogowa. Procesor DSP

może

wiec

pełnić

funkcje

przetwornika

DAC,

a

także

ADC.

Procesor sygnału cyfrowego zajmuje się przetwarzaniem dźwięku w postaci cyfrowej,

umożliwiając uzyskanie wszelkiego rodzajów efektów akustycznych (pogłos, echo, chorus

itp.), kształtowanie obwiedni dźwięku (narastanie, podtrzymanie, wybrzmiewanie),

miksowanie i poprawianie sygnału czy tez syntezę i rozpoznawanie mowy. Procesor DSP

znacznie rozszerza możliwości karty, ale powoduje również podwyższenie jej ceny.

Konfiguracja kart dźwiękowych

Aby poprawnie zainstalować w systemie kartę dźwiękową należy ustawić sprzętowo

(na karcie) lub programowo (za pomocą dołączonego do karty programu):

 numer portu

 numer kanału DMA

 numer przerwania IRQ

Karty Sound Blaster domyślnie używają numer portu 220h lub (rzadziej spotykana

konfiguracja) 240h. Inne karty dźwiękowe mogą używać innego portu. W przypadku wyboru

błędnego numeru portu (np. wykorzystywanego juz przez inna kartę) komunikacja pomiędzy

karta a komputerem może przebiegać blednie lub wręcz będzie niemożliwa. Objawia się to

nie działaniem karty (brak dźwięku), ewentualnie dziwnymi objawami (np. przerywanym

dźwiękiem). Podobnie karta może się zachowywać w przypadku złego skonfigurowania

kanału DMA. Najczęściej wykorzystywany jest numer 1. Przerwanie umożliwia

poinformowanie komputer, ze karta zada jej obsłużenia. W przypadku wyboru nie

prawidłowego numery przerwania karta nie wyda żadnego dźwięku, a także może to

doprowadzić nawet do zawieszenia systemu. Powszechnie wykorzystywane numery IRQ to 5

lub 7.

Dla kart z rodziny Sound Blaster i ich klonów (duża część kart dostępnych na rynku) w

środowisku DOS powinna być ustawiona zmienna BLASTER, która zawiera w sobie numery

portu, kanału DMA, przerwania, a także typ karty - np. dla Sound Blaster Pro numer ten

wynosi 4. Np. BLASTER=A220 D1 I5 T4.

W przypadku uaktywnienia ze specjalnych funkcji, jakie oferują układy DSP należy

najczęściej załadować driver dla karty muzycznej.

Systemy operacyjne i sieci komputerowe

Pliki zawierające zapis dźwiękowy

WAV

Format stosowany w Microsoft Windows. Zawiera zdigitalizowany dźwięk - próbkę

opatrzona nagłówkiem Tak wiec pomijając nagłówek plik zawiera czyste dane - cyfrowo

zapisany dźwięk Natomiast w nagłówku są zapisana dane o próbce - częstotliwość z jaka

dźwięk

był

próbkowany,

rozdzielczość

próbki,

mono

czy

stereo.

VOC

Format podobny do plików WAV, lecz struktura nagłówka jest nieco inna. Poza tym niczym

się nie różnią, pod warunkiem, ze dane nie są upakowane z wykorzystaniem techniki bloków

ciszy.

MOD

Plik typu MOD zawiera w sobie próbki (sample), które można wydzielić za pomocą

odpowiedniego programu do tworzenia muzyki oraz sam zapis muzyki. Format powstał

specjalnie dla komputerów AMIGA, dlatego tez oferuje cztery kanały. Dla każdego kanału

istnieje oddzielna ścieżką zapisem odgrywanych próbek.

MP3 (MPEG Layer 3)

Format kompresji plików muzycznych pozwalający znacznie zredukować wielkość

zajmowanego przez nie miejsca (przeciętnie od dziesięciu do dwunastu razy w porównaniu z

plikami WAV) przy minimalnym spadku jakości utworu.

Mała wielkość plików MP3 i wynikająca z tego łatwość przesyłania ich za pośrednictwem

Internetu w połączeniu z niemal doskonałą jakością dźwięku przyczyniły się ogromnej

popularności tego formatu.

MP3 wykorzystuje bardzo wydajny algorytm kompresji polegający na odrzuceniu

częstotliwości, które w danym fragmencie muzycznym nie są słyszalne dla ludzkiego ucha

(tzw. częstotliwości maskowane, spoza pasma 2 Hz; 4 KHz oraz dźwięki zagłuszane przez

inne dźwięki o tej samej częstotliwości lecz większym natężeniu). Takie rozwiązanie sprawia,

że utwór muzyczny zajmujący w postaci nieskompresowanej 50 MB, po zapisaniu w formacie

MP3 zmniejsza swoją objętość do ok. 4 MB. Format ten wykorzystywany jest także w

multimediach (zob. Flash) oraz mediach strumieniowych (zob. ShoutCast), gdzie pozwala

przesyłać dźwięk jakości CD (stereo, 16-bitów, 44 kHz) łączami o przepustowości 128 Kb/s.

Wersja formatu - MPEG Layer IV; łączy w sobie znacznie lepsze wyniki kompresji plików z

uniwersalnością. MP4 nie wymaga oddzielnego programu do odtwarzania; odtwarzacz wraz z

muzyką zapisany jest w jednym pliku wykonywalnym.