background image

PODSTAWY SŁYSZENIA I PERCEPCJA DŹWIĘKU 

(Pytania do zaliczenia) 

 
 
BUDOWA UKŁADU SŁUCHOWEGO 
 
1. Jakie są podstawowe części obwodowego (peryferyjnego) układu słuchowego? 
 

Peryferyjny układ słuchowy składa się z ucha umownie podzielonego na ucho zewnętrzne, 
środkowe i wewnętrzne oraz nerwu ślimakowego. 

 
2. Jaką rolę pełni małżowina uszna? 
 

Małżowina uszna jest nieregularnym, wydłużonym fałdem skóry, którego długość jest prawie 
dwukrotnie większa od szerokości. Małżowina spełnia ważną rolę przy ocenie kierunku, z 
którego dochodzą fale akustyczne, czyli przy ocenie położenia źródła dźwięku. U niektórych 
zwierząt jest to część ruchoma. Jej kształt pomaga również odbierać fale dźwiękowe i 
kierować je do przewodu słuchowego oraz podbija częstotliwości wokół 5 kHz. 

 
3.  Co to jest HRTF (Head Related Transfer Function)? 
 

HRTF zwana inaczej charakterystyką przenoszenia głowy jest to funkcja przenoszenia 
związana z głową Pojedynczy HRTF składa się z dwóch filtrów, po jednym dla każdego 
ucha, które zawierają wszystkie informacje o dźwięku (np. IID, ITD) istotne dla 
słuchającego. Filtry zmieniają się w zależności od miejsca, z którego dochodzą dźwięki do 
słuchającego. Kompletny HRTF zawiera zestaw wielu filtrów, które opisują sferyczne 
środowisko dźwiękowe - 360 stopni we wszystkich kierunkach. 
Jest to również zbiór odpowiedzi impulsowych u wejścia do kanału słuchowego zmierzone 
dla sygnałów z różnych punktów przestrzeni. Te dane pozwalają tak modelować dźwięk w 
słuchawkach, aby możliwa była jego eksternalizacja 

 
4. Podać cechy charakterystyczne przebiegu transmitancji zewnętrznego przewodu 

słuchowego. 

 

Przewód słuchowy zewnętrzny stanowi swego rodzaju układ rezonansowy w kształcie rurki o 
zmiennej szerokości i kształcie. Powyżej częstotliwości 1000Hz pojawiają się wyraźne 
maksima rezonansowe w przebiegach charakterystyk częstotliwościowych przewodu 
słuchowego. Najwyraźniejsze z nich przypada na częstotliwość ok. 2,6 kHz (ok. 12dB). 
Charakterystyki częstotliwościowe nie wykazują pełnej symetrii dla położeń źródła przód – 
tył. Charakterystyki są bardziej złożone, gdy sygnały akustyczne prezentowane są za pomocą 
słuchawek. 

 
5. Jaką rolę pełni ucho środkowe? 
 

Ucho środkowe pełni następujące funkcje: 

- poprzez drgania bębenka dopasowuje impedancję powietrza w przewodzie słuchowym i 

impedancję płynu znajdującego się w ślimaku, 

background image

-  stymuluje okienko owalne, 
- wyrównuje ciśnienie między uchem wewnętrznym a przewodem zewnętrznym. 
-  posiada mechanizmy ochrony przed nadmiernym hałasom. 

 
6.  Co to jest odruch strzemiączkowy? 
 

Odruch strzemiączkowy (inaczej refleks ucha środkowego) jest to efekt obronny przed 
dźwiękami o zbyt dużym natężeniu. Występuje on symetrycznie w obu uszach i polega na 
tym, że pierwszy z mięśni napina błonę bębenkową i wciąga ją w kierunku jamy bębenkowej, 
co znacznie ogranicza jej wychylenia, a drugi mięsień zmienia kierunek drgań podstawy 
strzemiączka. Odruch ten włącza się z pewnym opóźnieniem (ok. 10ms), więc jest 
nieskuteczny w przypadku głośnych dźwięków impulsowych (np. wystrzały). Ciekawostką 
jest, że odruch ten włącza się również bezpośrednio przed wokalizacją. 

 
7. Wymienić podstawowe elementy budowy ucha wewnętrznego? 
 

Ucho wewnętrzne leży w części skalistej kości skroniowej. Składa się ono z błędnika 
kostnego i leżącego w nim błędnika błoniastego. Przestrzeń między błędnikiem kostnym i 
błoniastym wypełnia ciecz zwana perilimfą, natomiast wewnątrz błędnika błoniastego 
znajduje sie ciecz zwana endolimfą. Błędnik kostny dzieli się na przedsionek, trzy kanały 
półkoliste i kanał zwinięty w spiralę zwany ślimakiem. Ślimak kończy się w miejscu zwanym 
osklepkiem. W uchu wewnętrznym znajdują się również okienka owalne i okrągłe oraz 
narządy związane z równowagą. 

 
8.  Na czym polega mechanizm aktywny ucha wewnętrznego? 
 

Ślimak spełnia rolę nie tylko odbiornika i procesora energii, ale również jest miejscem 
aktywnych procesów wspomagających ruch błony podstawnej. Czułość i selektywność  
częstotliwościowa wynika z aktywności zewnętrznych komórek słuchowych, które są 
rezonatorami o bardzo dużej dobroci i selektywnie reagują na drgania wprawiając w ruch 
błonę pokrywkową. Błona oddziałuje na wewnętrzną komórkę słuchową, która odprowadza 
sygnały do mózgu. Częstotliwość  dźwięku związana z maksymalnym wychyleniem błony 
podstawnej nazywa się częstotliwością charakterystyczną. Maksymalne wychylenie błony 
zmniejsza się, jeśli błonę tę stymuluje się równocześnie tonem o częstotliwość zbliżonej do 
CF. Efektu tego nie obserwuje się dla ślimaka uszkodzonego 

 
9.  W jaki sposób dokonuje się analizy widma dźwięku w uchu wewnętrznym? 
 

Analiza widmowa dźwięku w uchu wewnętrznym oparta jest na filtracji składowych 
spektralnych dźwięku złożonego. Każdemu punktowi błony podstawnej można 
przyporządkować filtr pasmowoprzepustowy o określonej częstotliwości  środkowej, 
bezwzględnej szerokości pasma i nachyleniu zboczy. Nachylenie zboczy charakterystyki 
filtru opisać można liczbą decybeli jej spadku na oktawę    częstotliwości, a bezwzględną 
różnicę pasma określa się jako różnicę pomiędzy dwiema częstotliwościami, dla których 
różnica poziomów ciśnienia względem poziomu maksymalnego wynosi –3dB. 

 

background image

10. Na czym polega synchronizacja impulsów neuronowych z przebiegiem czasowym 

sygnału akustycznego? 

 

Badania pokazały,  że wyładowania neuronów jako odpowiedź na powtarzany sygnał 
pobudzający pojawiają się najczęściej dla tej samej fazy sygnału, czyli są zsynchronizowane 
z przebiegiem czasowym sygnału pobudzającego. Efekt ten występuje tylko dla 
częstotliwości 4-5 kHz. 

 
 
FILTR SŁUCHOWY I MASKOWANIE 
 
11. Czym objawia się pasmowość słuchu w odniesieniu do zjawiska maskowania? 
 

W czasie jednego z eksperymentów badano położenie progu słyszalności w funkcji 
szerokości pasma szumu maskującego. Gęstość spektralna mocy maskera była stała, podczas 
gdy rosła moc całkowita wraz ze wzrostem szerokości pasma częstotliwości. Badania te 
pokazały,  że poszerzenie pasma szumu maskującego wpływało na podwyższanie progu 
słyszalności sygnału tylko do pewnej szerokości tego pasma. Aby wyjaśnić to zjawisko 
przyjęto,  że peryferyjny system słuchowy zachowuje się jak zespół liniowych filtrów 
pasmowych o zachodzących na siebie pasmach przepuszczania i charakterystykach 
przenoszenia w kształcie prostokąta. Bazą tych filtrów jest błona podstawna, której 
poszczególne miejsca reagują na określone częstotliwości, każdemu więc punktowi tej błony 
odpowiada określona częstotliwość środkowa filtru i określone pasmo przepuszczania. 

 
12. Jak zmienia się  głośność szumu pasmowego (zachowując jego stałą moc) przy 

rozszerzaniu jego pasma w zakresie do szerokości filtru słuchowego, a następnie poza tę 
szerokość? 

 

Podczas zwiększania szerokości pasma szumu do szerokości filtru słuchowego poziom 
natężenia dźwięku ustala się na pewnym poziomie. Gdy szerokość pasma szumu przekracza 
szerokość pasma filtru słuchowego, głośność zwiększa się. 

 
13. Jak zmienia się szerokość pasma filtru słuchowego w funkcji częstotliwości środkowej: 

a) według pomiarów „niemieckich” tj. szerokość tzw. pasma krytycznego (critical 

bandwidth) 

b) według pomiarów „angielskich” tj. tzw. równoważna szerokość prostokątna filtru 

ERB? 

 

Najważniejszym parametrem charakteryzującym filtr słuchowy jest szerokość jego pasma. 
Według pomiarów niemieckich rolę filtrów słuchowych pełniły pasma krytyczne, których 
szerokość była zarazem szerokością pasm filtrów słuchowych. Szerokość filtrów słuchowych 
można wyrażać za pomocą szerokości połówkowej określonej na wysokości –3dB poniżej 
maksymalnej wartości charakterystyki przenoszenia. Analityczna postać wyrażenia 
określająca wartość szerokości prostokątnej filtru słuchowego w funkcji częstotliwości 
środkowej f [kHz] ma postać: 

background image

a) Dla częstotliwości poniżej 700-800Hz szerokość jest stała i wynosi ok. 100Hz. Powyżej 

rośnie i stanowi stałą procentową szerokość pasma (w przybliżeniu filtr tercjowy)  
 

 

 (wzór przybliżony), 

69

,

0

2

)

4

,

1

1

(

75

25

f

ERB

Z

+

+

=

b) Szerokość filtrów zmienia się jednostajnie (podobnie jak filtry tercjowe) osiągając 

szerokość do ok. 20-30 Hz dla częstotliwości równej 100Hz 

   

 

)

1

37

,

4

(

7

,

24

+

=

f

ERB

GM

Ekwiwalentne szerokości filtrów słuchowych odbiegają od szerokości pasm krytycznych 
otrzymanych przez Zwickera dla częstotliwości poniżej 500 Hz. 

 
14. Czy filtry słuchowe mają charakterystykę niezależną od poziomu sygnału? 
 

Nie. Wyniki badań pokazały,  że kształt filtrów słuchowych w liniowej skali częstotliwości 
jest dość symetryczny dla średnich poziomów ciśnienia akustycznego. Natomiast dla dużych 
poziomów, kształt ten staje się niesymetryczny – po stronie niskich częstotliwości obwiednia 
filtru jest mniej stroma, niż po stronie wyższych. 

 
15. Co to są filtry Roex, Gammatone i Gammachirp? 
 

W.w. filtry to filtry modelujące filtry słuchowe. 
•  Filtr Roex jest to taki filtr, który ma jeden bezwymiarowy parametr 

β

r

, opisujący 

szerokość pasma krytycznego. Filtr jest opisany przez specjalną funkcję eksponencjalną: 

 

g

r

r

e

g

f

H

β

β

+

=

)

1

(

)

(

2

,  

 

gdzie g jest znormalizowanym odchyleniem częstotliwości od częstotliwości środkowej 
filtru. Jego ekwiwalentna szerokość wynosi: 

r

c

f

ERB

β

4

=

•  Charakterystyka filtrów Gammatone i Gammachirp oparta jest na tzw. funkcji gamma. 

Funkcja ta ma tę zaletę,  że charakteryzuje ona filtr na podstawie jego odpowiedzi 
impulsowej. 

 
16. Na czym polega zjawisko maskowania? 
 

Maskowaniem nazywa się proces, w którym próg słyszalności dźwięku maskowanego 
(sygnału) podnosi się na skutek obecności dźwięku maskującego (maskera). Wartość 
podwyższenia tego progu wyraża się najczęściej w dB. 

 
17. Jakie występują rodzaje maskowania i czym się różnią? 
 

- całkowite – sygnał przestaje być słyszany na tle maskera, 
- częściowe – obniża się głośność sygnału na tle maskera, 
-  równoczesne – sygnał i masker występują równocześnie w czasie, 
-  nierównoczesne – oba bodźce są przesunięte względem siebie w czasie: 

•  resztkowe (pobodźcowe) – sygnał występuje po maskerze, 

background image

•  wsteczne (przedbodźcowe) – masker występuje po sygnale, 

-  monoauralne (jednouszne) – sygnał i masker są prezentowane słuchaczowi jednousznie, 
-  centralne – do jednego ucha podajemy sygnał, do drugiego masker. 

 
18. Na czym polega asymetria maskowania w funkcji częstotliwości? 
 

Dla poziomów ciśnienia maskera większych niż 60dB SPL krzywe maskowania przestają być 
symetryczne. Ich stromość po stronie wyższych częstotliwości jest znacznie mniejsza, niż 
stromość po stronie niższych. Jeśli w takiej sytuacji częstotliwość środkowa jednego dźwięku 
jest większa, niż częstotliwość drugiego dźwięku – to dźwięk drugi bardziej zagłusza 
pierwszy, niż pierwszy zagłusza drugi. 
 

 
GŁOŚNOŚĆ DŹWIĘKU 
 
19. Jaki cechy ma przebieg absolutnego progu słyszenia i co na to wpływa? 
 

Próg absolutny określany jest przez najmniejszą wartość poziomu ciśnienia akustycznego, 
która wywołuje zaledwie spostrzegalne wrażenie słuchowe. Próg ten pokazuje, że czułość 
słuchu jest największa (poziom ciśnienia akustycznego ma wartość najmniejszą) w zakresie 
częstotliwości średnich (1000-4000Hz) i wyraźnie maleje w pasmie częstotliwości niskich i 
wysokich. Spadek czułości poniżej 1000Hz wynosi ok. 6dB na oktawę, natomiast powyżej 
4000Hz – ok. 24dB/okt. Wysoka czułość słuchu w zakresie średnich częstotliwości wynika z 
rezonansowego charakteru działania przewodu słuchowego oraz szczególnie efektywnego 
działania ucha środkowego w tym zakresie częstotliwości. 

 
20. Jak konstruowany jest audiogram? 
 

Badania słuchu rozpoczyna się od pomiaru przewodnictwa powietrznego, zaczynając od ucha 
lepszego. Najpierw wyznacza się wartość progu słyszalności podając ton o częstotliwości 
1000Hz. Następnie zmienia się częstotliwość kolejno na 2, 4, 8, 10 i ponownie na 1 kHz 
(badanie kontrolne). Dalsze badania wyznaczania kolejnych wartości progu wykonuje się dla 
częstotliwości 125, 250 i 500Hz. Podobne pomiary przeprowadza się dla ucha gorzej 
odbierającego dźwięki. W przypadku dużej asymetrii można do ucha przeciwległego 
podawać szum maskujący. Wyznaczoną zależność poziomu ciśnienia od częstotliwości 
przenosi się na wykres ubytku słuchu (różnicy między wartością zmierzoną, a wartością 
średniego progu uzyskanego dla osób normalnie słyszących) od częstotliwości. 

 
21. Co to jest zjawisko wyrównania głośności? 
 

Zjawisko wyrównania głośności jest to niewspółmiernie silny wzrost głośności dla słuchu 
uszkodzonego wraz ze wzrostem poziomu ciśnienia akustycznego, w porównaniu ze 
wzrostem głośności dla słuchu normalnego. Można wyróżnić zjawisko wyrównania głośności 
całkowite, częściowe i odwrotne. 

 
 
 

background image

22. Co to jest czasowe przesunięcie progu i kiedy występuje? 
 

Czasowe przesunięcie progu występuje na skutek zmęczenia słuchowego, powstającym pod 
wpływem działania silnych bodźców dźwiękowych. Zjawisko zmęczenia ustępuje dopiero po 
dłuższym czasie (nawet do kilku dni) od chwili zaprzestania stymulacji. 

 
23. Podać psychofizyczne prawo Webera-Fechnera i jego związek ze skalą decybeli? 
 

Odbierana wartość wrażenia jest logarytmiczną funkcją natężenia bodźca fizycznego: 

b

I

a

Wr

+

= ln

, gdzie Wr – wrażenie, I – natężenie bodźca, zaś a i b to stałe. Z prawem tym 

wiąże się w ogólności dyskryminacja wrażenia sensorycznego. W efekcie prawa Webera-
Fechnera stosowane są logarytmiczne skale do charakterystyki zjawisk fizycznych, które 
pierwotnie opierały się na subiektywnym wrażeniu ich wartości (np. poziom natężenia 
dźwięku w dB). 

 
24. Co to są izofony i jak się je tworzy? 
 

Izofony są to krzywe jednakowego poziomu głośności. Każda z krzywych przyporządkowana 
jest określonemu poziomowi głośności w fonach, przy którym tony o różnych 
częstotliwościach mają taką  głośność, jak ton wzorcowy o częstotliwości 1000Hz. Krzywe 
tworzy się dokonując pomiaru poziomu ciśnienia akustycznego tonów o różnych 
częstotliwościach zrównanych pod względem głośności z tonem wzorcowym. Aby otrzymać 
rodzinę izofonów, należy przeprowadzić badanie dla różnych poziomów głośności. 

 
25. Na czym polega wyrażenie głośności w sonach, czym skala sonów różni się od skali 

fonów? 

 

Son jest to jednostka głośności tonu o częstotliwości 1000Hz i poziomie ciśnienia 40dB SPL. 
Wyrażanie głośności w sonach polega na ilościowej zależności głośności od jego natężenia. 
Dźwięki o danej liczbie fonów wywołują  to  samo  wrażenie głośności, podczas gdy skala 
sonów wiąże liczbowo głośność z poziomem natężenia dźwięku. 

 
26. Co to są częstotliwościowe krzywe korekcyjne „A” i „C” i dlaczego stosuje się w 

pomiarach akustycznych? 

 

Krzywa korekcyjna A stanowi przybliżenie odwróconej krzywej izofonicznej 30 fonów, 
dzięki czemu ograniczony jest wpływ składowych o niskich częstotliwościach na wynik 
pomiaru. Krzywa B stosowana jest przy pomiarach średnich poziomów ciśnienia 
akustycznego, ma jednak niewielkie zastosowanie. Krzywa C jest prawie płaska w całym 
zakresie częstotliwości i jest wykorzystywana przy pomiarach dużych poziomów ciśnienia. 
Krzywe te stosuje się w urządzeniach elektroakustycznych, gdyż przy małych poziomach 
ciśnienia (np. przy cichym odtwarzaniu dźwięków) narząd słuchu jest znacznie mniej czuły 
na tony o niskich częstotliwościach, niż przy większych. 

 
 
 
 

background image

27. Na czym polega i jak odbywa się sumowanie głośności w czasie? 
 

Głośność  dźwięku zależy od czasu jego trwania. Dla bardzo krótkich czasów (do 200ms), 
głośność rośnie wraz ze wzrostem tego czasu. Efekt ten nazywa się sumowaniem głośności. 
Sumowanie głośności można opisać formułą eksponencjalną wyznaczoną doświadczalnie: 
 

τ

t

e

I

t

I

=

1

)

(

,  

gdzie I(t) – natężenie dźwięku wymagane dla uzyskania stałej głośności, 

– natężenie dla 

długich czasów trwania, t – czas trwania bodźca, 

τ

 – stała czasowa równa 80ms. Z punktu 

widzenia anatomii nie wydaje się możliwe, aby system słuchowy sumował energię sygnału – 
sumowanie to odnosi się  głównie do aktywności neuronów i ich wyładowań w czasie. 
Niekiedy sądzi się też,  że obserwowanie obniżenia progu detekcji dźwięku tłumaczy się 
lepszą możliwością jego spostrzeżenia dzięki powtarzanemu w czasie przetwarzaniu. 

I

 
28. Co to jest i ile wynosi próg różnicy głośności (różnicy natężenia). Czy jest on stały w 

funkcji poziomu ciśnienia akustycznego? 

 

Weber sformułował prawo, które głosi,  że najmniejsza spostrzegalna (progowa) zmiana 
natężenia dźwięku 

L jest proporcjonalna do jego wypadkowego natężenia. Badania 

wykazały,  że dla szumów i sygnałów szerokopasmowych dla poziomów ponadprogowych 
prawo to jest dość dobrze spełnione. W zakresie od 20 do 100dB próg różnicy głośności 
wynosi 0,5 – 1dB. Przy progu słyszenia wielkość ta jest większa. Dla tonów obserwuje się 
efekt zwany odstępstwem od prawa Webera. 

L maleje, a prosta ma współczynnik 

kierunkowy ok. 0,9. Próg wynosi 1,5dB dla 20 dB SL, 0,7dB dla 40dB SL, itd. 

 
 
PERCEPCJA ZMIAN CZASOWYCH 
 
29. Jakie  są graniczne (najmniejsze) progi postrzegania zmian parametrów czasowych 

sygnałów, w sytuacji gdy: 
a)  przy zmianach czasowym pojawiają się różnice w widmie mocy sygnałów? 

 

Jeśli przy zmianie parametrów czasowych zachodzą zmiany w widmie sygnału, to 
rozdzielczość czasowa sięga kilkudziesięciu mikrosekund. 
Łatwiej jest spostrzegać asynchroniczność w procesie narastania (próg detekcji wynosi 
ok. 1ms), niż w procesie zanikania składowych dźwięku (próg był 3-10 razy mniejszy). 

 

b)  przy zmianach czasowych nie ma zmian widma mocy sygnałów? 

 

Przy założeniu równości poziomów odczucia dwóch impulsów szumowych próg detekcji 
przerwy czasowej między nimi wynosi ok. 3ms. Wartość tego progu jest większa dla 
poziomów odczucia poniżej 30dB SL. W badaniach kolejności czasowej kolejność pary 
impulsów o tym samym widmie mocy była praktycznie niemożliwa do ustalenia gdy 
całkowity czas trwania bodźców osiągał wartość mniejszą niż 2ms. 

background image

30. Co to jest funkcja przeniesienia modulacji (TMTF) i jak przebiega? 
 

Funkcja przeniesienia modulacji charakteryzuje zdolność systemu słuchowego do percepcji 
zmian amplitudowych bodźca, dla różnych prędkości tych zmian. Funkcja jest w przybliżeniu 
stała dla częstotliwości modulacji do  ok. 40Hz. Jednakże, powyżej tej częstotliwości detekcja 
modulacji amplitudowej maleje z prędkością ok. 3dB/oktawę, aż do częstotliwości 1 kHz, 
powyżej której nie jest słyszana. 

 
31. Czy próg postrzegania zmian czasowych zależy od szerokości pasma sygnału? 
 

Dane pokazują,  że próg detekcji przerwy czasowej zmienia się w przybliżeniu odwrotnie 
proporcjonalnie do pierwiastka kwadratowego z szerokości pasma częstotliwości bodźców. 
Natomiast rozróżnienie czasu trwania bodźców nie zależy od szerokości ich pasma 
częstotliwości. 

 
 
32. Czym tłumaczy się ograniczoną rozdzielczość czasową układu słuchowego? 
 

Ograniczenie rozdzielczości czasowej wiąże się z ograniczonym przetwarzaniem sygnału na 
poziomie peryferyjnym bądź też centralnym. Na poziomie peryferyjnym wynika między 
innymi z filtrującego działania błony podstawnej i występuje głównie w zakresie niskich 
częstotliwości. Ograniczenie rozdzielczości na poziomie centralnym wynika z ograniczeń 
przetwarzania informacji słuchowej na drodze powyżej nerwu słuchowego, aż do mózgu. 

 
 
NIELINIOWOŚĆ SŁUCHU 
 
33. Jakie rodzaje produktów nieliniowości, czyli tzw. tonów kombinacyjnych, występują w 

układzie słuchowym? 

 

Tony typu: 
-  f

– f

1

 – ton różnicowy 

- (+ 1)f

1

 – nf

2

, w tym zwłaszcza 2f

1

 – f

2

 

 
34. Jakie są typowe poziomy tonu różnicowego? 
 

Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów 
pierwotnych do ich poziomu. Dla tonu różnicowego: 
 

Poziom t. różnicowego L

r

  poziom t. pierwotnych L

1,2

f

1

f

2

 

20 dB 

80 dB 

1000 Hz 

1400 Hz 

poziom progowy 

50 – 60dB 

700 – 5000 Hz f

1

 + 100, 200, 400 Hz

poziom progowy 

30 dB 

800 Hz 

1500 Hz 

30 dB 

60 dB 

300 – 900 Hz  1,3 f

1

 

 

background image

35. Jakie są poziomy tonu kombinacyjnego 2f

1

-f

2

 

Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów 
pierwotnych do ich poziomu. Dla tonu 2f

1

 – f

2

 

Poziom t. różnicowego L

r

  poziom t. pierwotnych L

1,2

f

1

f

2

/f

1

-15 – -20 dB 

20 – 80 dB 

250 - 8000 Hz  1,1 

poziom progowy 

 

 

1,4 – 1,7 

 

 
36. W jakim przeciętnie zakresie częstotliwości tonów pierwotnych występują zauważalne 

tony kombinacyjne? 

 

Zauważalne tony występują dla częstotliwości 300 – 8000 Hz, przy stosunku f

2

/f

na poziomie 

0 – 3. 

 
 
WYSOKOŚĆ DŹWIĘKU 
 
37. Wysokość tonów (przebiegów sinusoidalnych) – na czym polega skala meli? 
 

Skala meli charakteryzuje się tym, że dwukrotna liczba meli odpowiada podwojeniu 
wysokości tonu. W rzeczywistości można spotkać kilka skal melowych różniących się w 
zależności od procedury ich wyznaczania. Umownie przyjęto, że wysokość 1000 meli ma ton 
o częstotliwości 1000Hz i poziomie ciśnienia akustycznego 40dB SPL. Między skalą meli i 
skalą pasm krytycznych istnieje znacznie prostsza zależność: 1 bark odpowiada 100 melom. 

 
38. Od jakich parametrów sygnału sinusoidalnego i w jaki sposób zależy postrzegana 

wysokość? 

 

O wysokości dźwięku w głównej mierze decyduje częstotliwość jego przebiegu falowego. W 
przypadku tonu częstotliwością  tą jest odwrotność jego okresu, natomiast dla wielotonu 
harmonicznego – o wysokości w głównej mierze decyduje częstotliwość podstawowa, choć 
nie tylko. Na ocenę wysokości dźwięku wpływ mają również natężenie, czas trwania, postać 
widma i obwiedni, a także obecność innych dźwięków. Wysokość  dźwięku jest wielkością 
subiektywną, jednak rośnie ona z częstotliwością. 

 
39. Jak zmienia się wysokość  dźwięku przy obecności drugiego tonu lub szumu dolno-

/górno-pasmowego i czym to się tłumaczy? 

 

Jeśli szum pasmowy, bądź inny sygnał maskujący ma niższą częstotliwość niż ton 
maskowany, można zaobserwować podwyższenie wysokości tego tonu o ok. 1-2%. W 
przeciwnym razie, obserwuje się obniżenie wysokości w tych samych granicach. W 
przypadku szumu szerokopasmowego wysokość tonu maskowanego ulega przesunięciu w 
górę. 

 

background image

40. Jakie  są przeciętne wartości progów różnicy częstotliwości w różnym zakresie 

częstotliwości? 

 

W tabelce znajdują się wartości przybliżone: 
 

Częstotliwość [Hz] Próg 

∆F [Hz]

500 
2000 
4000 
8000 



10 
50 

 
41. W jaki sposób tworzona jest wysokość dźwięków złożonych widmowo, w szczególności 

dźwięków o widmie harmonicznym? 

 

Po odfiltrowaniu składowej podstawowej nie zauważa się zmiany wysokości dźwięku. Można 
więc sądzić,  że wysokość  dźwięku zależy od wysokości jego harmonicznych. Dźwięk 
złożony może zawierać nawet kilka różnych wysokości, odpowiadającym najczęściej 
harmonicznym o niskich częstotliwościach. Możliwa również jest percepcja wysokości 
wytworzonej w wyniku ich oddziaływania, niezwiązana bezpośrednio z żadną ze 
składowych. Wysokość tworzona przez grupę harmonicznych nazywa się wysokością 
rezydualną. 

 
 
SŁYSZENIE DWUUSZNE 
 
42. Co  oznaczają następujące terminy: lokalizacja, lateralizacja, odsłuch monauralny, 

binauralny, diotyczny i dychotyczny? 

 

-  lokalizacja – subiektywna ocena położenia źródła dźwięku w przestrzeni, 
-  lateralizacja – wrażenie przemieszczania się obrazu dźwiękowego wewnątrz głowy 

wzdłuż linii łączącej oboje uszu, 

-  ods. monauralny – percepcja dźwięku dokonywana jednousznie, 
-  ods. binauralny – percepcja dźwięku dokonywana dwuusznie, 
-  ods. dychotyczny – odsłuch dwóch różnych sygnałów podawanych na oboje uszu. 
-  ods. diotyczny – odsłuch tego samego sygnału podawanego na oboje uszu. 

 
43. Na czym polega „eksternalizacja” obrazu słuchowego? 
 

Jest to efekt polegający na tym, że podczas odsłuchu binauralnego np. z głośnika, obraz 
dźwiękowy tworzy się na zewnątrz głowy słuchacza. 

 
44. Co to jest międzyuszna różnica czasu i międzyuszna różnica natężenia? 
 

Jeśli fala akustyczna dociera do słuchacza z boku tworzy się binauralna różnica odległości, w 
wyniku której natężenia i czasy dotarcia dźwięków do obojga uszu nie są takie same. Dzięki 

background image

temu możliwe jest zlokalizowanie źródła dźwięku w płaszczyźnie poziomej. Różnica 
natężenia spełnia rolę dominującą dla częstotliwości wysokich. 
 

ITD: 

c

D

t

=

. Zmienia się w zakresie od 0 do 690

µs. 

 
45. Jakiego  rzędu międzyuszna różnica czasu powoduje przesunięcie obrazu słuchowego 

całkowicie w jedną stronę (tak, że dźwięk odbierany jest z boku)? 

 

ok. 690 mikrosekund 

 
46. Jakiego  rzędu międzyuszna różnica natężenia powoduje przesunięcie obrazu 

słuchowego całkowicie na jedną stronę (tak, że dźwięk odbierany jest z boku)? 

 

ok. 7 – 8 dB dla częstotliwości 1kHz 

 
47. W jakich zakresach częstotliwości o lokalizacji decyduje międzyuszna różnica czasu lub 

międzyuszna różnica natężenia. Co powoduje taki przebieg tych zależności i czy takie 
samo zróżnicowanie występuje przy odsłuchu słuchawkowym? 

 

ITD (międzyuszna różnica czasu) ma większy wpływ przy niskich częstotliwościach, 
IID (międzyuszna różnica natężeń) dominuje przy wysokich częstotliwościach. 

Dla niskich częstotliwości (do ok. 200Hz) fale uginają się wokół  głowy obserwatora, w 
wyniku czego międzyuszna różnica poziomu ciśnienia nie zależy praktycznie od azymutu 
źródła. Natomiast dla wysokich częstotliwości, tzn. gdy długość fali akustycznej jest 
porównywalna lub mniejsza od wymiarów głowy, powstaje po jednej stronie tzw. cień 
akustyczny. Wówczas wartości międzyusznej różnicy poziomu ciśnienia wyraźnie zależą od 
azymutu źródła. Dla częstotliwości pośrednich tzn. ok. 1500Hz lokalizacja dźwięku jest dość 
trudna i obarczona największym błędem. 

W przypadku odsłuchu słuchawkowego w całym przedziale częstotliwości o lokalizacji 

źródła decyduje jedynie różnica natężeń. Dzieje się tak dlatego, iż w tym systemie odsłuchu 
głowa nie stanowi przeszkody dla fal, nie ulegają one dyfrakcji. 

 
48. Co to jest tzw. stożek niepewności? 
 

Dla ustalonej wartości międzyusznej różnicy czasu istnieje powierzchnia w kształcie stożka, 
dla której wszystkie źródła dźwięku znajdujące się na niej powinny wywoływać takie same 
międzyuszne różnice czasu. 

 
49. Które z wielkości – międzyuszna różnica fazy sygnału (opóźnienie w przebiegu 

czasowym) czy międzyuszne opóźnienie obwiedni sygnału mają znaczenie przy 
lokalizacji? 

 

Międzyuszna różnica fazy jest bezpośrednio związana z różnicą czasu, zatem obie mają 
znaczenie przy wyznaczaniu lokalizacji źródła. 

 

background image

50. Na czym polega dwuuszne sumowanie głośności? 
 

Dwuuszne sumowanie głośności polega na tym, że sygnał  słyszany dwuusznie wydaje się 
głośniejszy 

 
51. 

Ile (ogólnie) wynoszą  kątowe progi różnicowe przesunięcia  źródła dźwięku w 
płaszczyźnie poziomej? 

 

Najmniejszą wartość  kątową progu różnicowego przesunięcia otrzymuje się dla źródła 
dźwięku zlokalizowanego na wprost obserwatora, szczególnie w zakresie częstotliwości do 
1000Hz. Wówczas próg detekcji międzyusznej różnicy czasu wynosi 10

µs, co odpowiada 

przesunięciu o 1

o

. Wzrost azymutu powoduje pogorszenie się rozdzielczości, zwłaszcza dla 

częstotliwości ok. 2000Hz. Dla przykładu dla azymutu równego 60

o

 może on wynieść nawet 

30

o

 
52. Co to jest zjawisko dominacji (pierwszeństwa)? 
 

Zgodnie z tym efektem, dla lokalizacji źródła w przestrzeni najważniejsza jest fala, która jako 
pierwsza dochodzi do obserwatora. Zjawisko to występuje dla dźwięków impulsowych i 
tłumaczy się tym, że pierwsza fala (bezpośrednia) wnosi najwięcej informacji o kierunku 
źródła dźwięku. Aby efekt wystąpił maksymalne czasy opóźnienia poszczególnych odbić, 
liczone względem dźwięku bezpośredniego nie powinny przekraczać kilkudziesięciu 
milisekund. Poziom ciśnienia akustycznego dźwięku odbitego względem dźwięku 
bezpośredniego nie powinien przekraczać wartości 10dB. 

 
53. W jakim zakresie opóźnień sygnału występuje zjawisko dominacji? 
 

W przypadku, gdy różnica czasu pomiędzy dźwiękami docierającymi do uszu jest mniejsza 
niż 1ms efekt nie występuje lub jest bardzo słaby. Aby efekt wystąpił maksymalne czasy 
opóźnienia poszczególnych odbić, liczone względem dźwięku bezpośredniego również nie 
powinny przekraczać kilkudziesięciu milisekund. 

 
54. Na czym polega odmaskowanie dwuuszne (BMLD)? 
 

Jest to odmaskowanie wynikające z dochodzenia do obojga uszu różnych sygnałów. Efekt ten 
powstaje wtedy, gdy międzyuszne różnice parametrów fizycznych dla sygnału lub maskera są 
różne. Efekt ten powoduje w pewnych przypadkach obniżenie progu detekcji sygnału 
maskowanego. 

 
55. Podać typowe wartości odmaskowania dwuusznego. 
 

T(x/y) – odmaskowanie sygnału x maskowanego przez y przy różnej prezentacji dwuusznej: 
T(x/y) wartość odmaskowania 
T(M/M) 0 

dB 

T(M/0) 6 

dB 

T(0/0) 0 

dB 

background image

T(π/0) 12 

dB 

T(π/π) 0 

dB 

M- monauralnie 
0 – binauralnie w fazie 
π – binauralnie w przeciwfazie 
 
 

KOMPRESJA DŹWIĘKU 
 
56. W jaki sposób wyznacza się profil maskowania w modelu psychoakustycznym przy 

stratnej kompresji dźwięku? 

 

Profil maskowania wyznacza się przez zsumowanie krzywej progu słyszenia oraz krzywych 
maskowania przez wyróżniające się tony i pasma szumowe. Zapisaniu podlega wyłącznie to 
co leży powyżej otrzymanej sumy. 

 
 
POMIARY SŁUCHU 
 
57. Na czym polegają metody: granic, dostrajania i stałego bodźca? 

 

•  Metoda stałych bodźców wykorzystywana jest do wyznaczania progu absolutnego lub 

progu różnicy pewnej wielkości fizycznej. W pierwszym przypadku polega ona na 
wielokrotnym prezentowaniu bodźców różniących się między sobą w zakresie pewnego 
przedziału. Bodźce prezentuje się  słuchaczowi wielokrotnie w porządku losowym, przy 
czym każdy bodziec taką samą liczbę razy (np. 100). Zadaniem słuchacza jest 
odpowiedzieć na pytanie, czy słyszał bodziec w systemie tak/nie. 

•  Metoda granic jest mniej dokładna w porównaniu z metodą stałych bodźców, ale ma tę 

zaletę,  że jest mniej czasochłonna. Przy pomiarze progu absolutnego eksperymentator 
prezentuje słuchaczowi ciąg bodźców w tzw. serii malejącej (rozpoczynając od natężeń 
zdecydowanie powyżej progu) i rosnącej (rozpoczynając od bodźców niesłyszalnych). Po 
przeprowadzeniu kilku serii na przemian uzyskuje się wypadkowy próg absolutny jako 
średnią wartość progów otrzymanych dla wszystkich serii. 

•  Charakterystyczną cechą metody dostrajania jest to, że słuchacz sam dobiera natężenie 

bodźca w czasie eksperymentu. Ponadto natężenie zmienia się w sposób ciągły. W każdej 
kolejnej serii pomiarowej eksperymentator powinien zmienić początkową wartość 
natężenia bodźca. Zarówno tę, jak i poprzednią metodę można stosować do wyznaczania 
progu dyskryminacji natężenia. W tym wypadku dopasowując natężenie, aż do uzyskania 
wrażenia zrównania ich głośności. 

  

58. Czego dotyczy statystyczna teoria detekcji? Co reprezentuje krzywa ROC? 
 

Teoria detekcji zakłada,  że decyzje dotyczące detekcji sygnału zależą od wartości pewnej 
zmiennej losowej x, której natura nie jest ściśle sprecyzowana. Zakłada się,  że wartość 
średnia tej zmiennej rośnie monotonicznie wraz ze wzrostem natężenia bodźca. Teoria 

background image

detekcji pozwala odróżnić reakcje słuchacza wynikające z czynników czysto sensorycznych 
od pozostałych. 
Krzywa ROC (charakterystyka funkcjonowania odbiornika) reprezentuje zależność między 
względną liczbą trafień (poprawnego wykrycia sygnału) danego słuchacza, a względną liczbą 
fałszywych alarmów (wykrycia niesłyszalnego sygnału). 

 
59. Co to jest wskaźnik detekcji d’? 
 

d’ jest miarą wrażliwości systemu słuchowego na sygnał (miarą wykrywalności sygnału) i 
wskazuje na zdolność  słuchacza do odróżnienia sygnału od szumu w tym sensie, że im 
zdolność jest lepsza, tym wartość  d’  jest  większa. Miara ma charakter obiektywny i jest 
definiowana jako: 
 

N

N

S

d

σ

µ

µ

=

'

,  

 
gdzie 

µ

S

 – wartość  średnia sygnału, 

µ

N

 – wartość  średnia szumu, 

σ

N

 – odchylenie 

standardowe szumu. 

 
60. 

Jakie typowe paradygmaty układu bodźców są stosowane w pomiarach 
psychoakustycznych prowadzonych z udziałem słuchaczy? 

 

Procedura TAK / NIE 
Procedura 2AFC - Two Alternative Forced Choice  
Procedura n-AFC - n Alternative Forced Choice  
Procedura "same-different" 

 
61. Na czym polegają procedury adaptacyjne stosowane w pomiarach słuchu? 
 

Procedury adaptacyjne charakteryzują się tym, że przebieg eksperymentu zależy od 
odpowiedzi słuchacza. Procedury te charakteryzują się dużą efektywnością, gdyż większość 
pomiarów koncentruje się w obszarze progowym. Warunkiem ich stosowania jest spełnienie 
założenia,  że prawdopodobieństwo poprawnej odpowiedzi wzrasta monotonicznie wraz ze 
wzrostem natężenia bodźca. Eksperyment oparty na procedurze adaptacyjnej polega na 
szybkim zawężeniu przedziału zmienności ocenianej wielkości do wartości okołoprogowych. 
Rozpoczyna się go od takiej wartości, dla której uzyskuje się odpowiedź poprawną. Przez 
stopniowe zmniejszanie wartości tego natężenia dochodzi się do odpowiedzi niepoprawnej. 
Wówczas ponownie zwiększa się wartość natężenia, aż do usłyszenia  poprawnej odpowiedzi. 


Document Outline