TESTOWANIE HIPOTEZ
Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji.
Przykłady
(a) Producent opon twierdzi, że nowy typ opony ma trwałość większą niż 60000 km. Jeśli ![]()
(km) oznacza wartość średnią trwałości opon, to hipotezą producenta jest ![]()
(b) Socjolog twierdzi, że dzieci w miastach mają lepsze wyniki w nauce niż dzieci poza ośrodkami miejskimi. Niech ![]()
(![]()
) oznacza proporcję dzieci w miastach (poza miastami) o średnich ocenach rocznych co najmniej dobrych. Hipotezą socjologa jest ![]()
(c) Producent twierdzi, że średni czas bezawaryjnej
pracy drukarki to 200 godzin. Wówczas
![]()
(d) Fizycy przypuszczają, że ilość cząstek
emitowanych przez substancję radioaktywną w
przedziałach czasu o danej długości jest zmienną
losową o rozkładzie Poissona. Wówczas
![]()
(e) Sprzedawca przypuszcza, że miesięczna wartość
sprzedaży ma rozkład normalny. Wówczas
![]()
![]()
![]()
.
Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru liczbowego lub wektorowego rozkładu cechy populacji,
np. hipotezy (a), (b), (c).
W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).
W zadaniach testowania hipotez występują 2 hipotezy:
Hipoteza zerowa - hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez ![]()
.
Hipoteza alternatywna - hipoteza, która będzie przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez ![]()
.
Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech ![]()
![]()
oznacza prawdopodobieństwo sukcesu w doświadczeniu Bernoulli'ego. Możliwe są hipotezy:


lub

, 
, ale niemożliwe jest sytuacja gdy

, 
, bo wartość 
jest parametrem z zakresu ![]()
i ![]()
jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.
Rola hipotez ![]()
i ![]()
nie jest symetryczna:
Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.
Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy zaakceptować na podstawie próbki hipotezy alternatywnej, ta którą poddajemy w wątpliwość.
Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi ![]()
. Zaproponowano nową terapię, której nieznana skuteczność ![]()
nie jest gorsza, tzn. wiemy, że ![]()
. Nowa terapia będzie szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że ![]()
. Wówczas
![]()
, ![]()
.
Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery. Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:
![]()
Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.
![]()
: Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.
Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:
Możliwe decyzje:
Nie ma dostatecznych dowodów aby odrzucić ![]()
, tzn. przyjąć ![]()
: na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.
Obserwacje dostarczają dostatecznych dowodów, aby przyjąć ![]()
, równoważnie odrzucić ![]()
, tzn. stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.
Model matematyczny:
Załóżmy, że
(a) ![]()
= znany średni poziom dobowy emisji
przy starej technologii
(b) ![]()
= nieznany średni poziom dobowy emisji
przy nowej technologii
(c) wiemy, że ![]()
. Chcielibyśmy
stwierdzić, że nowa technologia zmniejsza
poziom emisji. Zatem:
![]()
, ![]()
(d) w ciągu n losowo wybranych dni obserwujemy
dobowe poziomy emisji przy nowej
technologii: ![]()
(e) zmienne losowe ![]()
są niezależne o
jednakowym rozkładzie ![]()
, gdzie ![]()
jest
znane
Decyzję: „ przyjąć ![]()
” lub „ nie można odrzucić ![]()
” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej ![]()
, tzn. średniej z próbki ![]()
.
Uzasadnienie:
Rozkładem ![]()
jest rozkład 
skoncentrowany wokół ![]()
. Zatem dostatecznie małe wartości ![]()
sugerują, że ![]()
jest prawdziwa, ponieważ
(1) jeśli ![]()
jest prawdziwa, to wartości ![]()
skupiają się wokół ![]()
, statystyka

![]()
(2) jeśli ![]()
jest prawdziwa: ![]()
, to wartości ![]()
skupiają się wokół ![]()
.
Wówczas Z jest sumą zmiennej o rozkładzie ![]()
oraz stałej ujemnej:

.
(1) i (2) sugerują sposób testowania: niech c będzie
odpowiednio dobraną stałą, a ![]()
wartością ![]()
obliczoną dla próbki, wówczas
jeśli 
, to przyjmujemy ![]()
.
jeśli 
, to nie ma podstaw do
odrzucenia ![]()
.
Wybór c: Niech ![]()
będzie małą liczbą z (0,1), np.
![]()
lub 0, 01 lub 0,1, ...
Niech ![]()
. Wówczas jeśli ![]()
prawdziwa, to
![]()
.
Stąd ![]()
jest prawdopodobieństwem błędnej decyzji (przyjęcia ![]()
) w przypadku gdy hipoteza ![]()
jest prawdziwa. ![]()
= prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.
Zbiór ![]()
nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy ![]()
na korzyść ![]()
.
Błędy testowania
Podjęta decyzja
Stan natury |
Akceptacja
( |
Odrzucenie
(Akceptacja |
|
Decyzja prawidłowa |
Błąd I rodzaju |
|
Błąd II rodzaju (? ) |
Decyzja prawidłowa |
I. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy znana jest wariancja
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
- znane.
![]()
.
Statystyka testowa:

= 
.
Jeśli ![]()
prawdziwa, to ZZZ ![]()
.
Model 1. ![]()
![]()
.
Wówczas przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
.
Model 2. ![]()
![]()
Wówczas przyjmujemy C = ![]()
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
![]()
Wówczas
C =![]()
- obszar krytyczny, gdzie
![]()
![]()
![]()
Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:
1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.
Czy, na poziomie istotności ![]()
, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?
Rozwiązanie:
![]()
![]()
Statystyka testowa: 
4. ![]()
, ![]()
, ![]()
= 2,33.
Obszar krytyczny C = ![]()
5. ![]()
, ![]()
, z obliczeń ![]()
, stąd wartość statystyki testowej

.
6. ![]()
, więc odrzucamy ![]()
.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.
II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
- nieznane.
![]()
.
Statystyka testowa:

= 
.
Jeśli ![]()
prawdziwa, to ![]()
.
Model 1. ![]()
![]()
Wówczas przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu t - Studenta z ![]()
![]()
stopniami swobody.
Model 2. ![]()
![]()
Wówczas C = ![]()
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
![]()
Wówczas
C = ![]()
- obszar krytyczny, gdzie
![]()
![]()
![]()
Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano następujące przebiegi nie wymagające żadnego serwisu: 11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując ![]()
oraz rozkład normalny przebiegu.
Rozwiązanie:
1. ![]()
![]()
Statystyka testowa: 
4. ![]()
, ![]()
, liczba stopni swobody = ![]()
, ![]()
= 2,353.
Obszar krytyczny C = ![]()
.
5. ![]()
, z obliczeń ![]()
, 
, stąd wartość statystyki testowej

.
6. ![]()
, więc nie ma podstaw do odrzucenia ![]()
na poziomie istotności 0,05.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że nie można odrzucić twierdzenia producenta.
Definicja.
Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.
Np. w ostatnim zadaniu
![]()
, ![]()
![]()
![]()
0,063.
Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.
III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
,![]()
- nieznane.
![]()
.
Statystyka testowa:

= 
Jeśli ![]()
prawdziwa, to ![]()
.
Model 1. ![]()
![]()
Wówczas przyjmujemy C = 
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu ![]()
.
Model 2. ![]()
![]()
Wówczas C = 
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
![]()
Wówczas obszar krytyczny C = 

,
gdzie ![]()
, ![]()
.
Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe ![]()
(godz. ). Czy na poziomie istotności ![]()
( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)
Rozwiązanie.
1. ![]()
2. ![]()
3. Statystyka testowa: 
4. ![]()
, ![]()
, ![]()
,
![]()
, liczba stopni swobody ![]()
,
![]()
, ![]()
![]()
.
Reguła decyzyjna ( na podstawie obszaru krytycznego ): odrzuć ![]()
, jeśli obliczona wartość statystyki
![]()
![]()
lub ![]()
![]()
.![]()
5. s =13, stąd wartość statystyki testowej
![]()
= ![]()
![]()

.
6. ![]()
![]()
, więc nie ma podstaw do odrzucenia ![]()
.
Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że ![]()
10.
IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych
Niech ![]()
oraz ![]()
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych ![]()
oraz ![]()
, odpowiednio.
Model 1. ( znane odchylenia standardowe ![]()
)
![]()
,
lub równoważnie
![]()
.
Statystyka testowa:
Konstrukcja oparta na analizie ![]()
.
Statystka ![]()
ma rozkład normalny o wartości średniej ![]()
i wariancji 
( gdyż
średnie z obu prób losowych ![]()
są niezależnymi zmiennymi losowymi o rozkładach normalnych

, 
, odpowiednio ). Stąd, po standaryzacji mamy

~ ![]()
.
(a) ![]()
, ![]()
.
Jeśli ![]()
prawdziwa, to

~ ![]()
.
Przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu ![]()
.
(b) ![]()
, ![]()
.
Przyjmujemy C = ![]()
= obszar krytyczny.
(c) ![]()
, ![]()
Przyjmujemy C = ![]()
= obszar krytyczny.
Przykład. Średnia waga losowo wybranych 15 Europejczyków wyniosła ![]()
= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano ![]()
= 162 (funty).
Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: ![]()
i ![]()
. Czy można twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć ![]()
oraz rozkład normalny wag.
1. ![]()
.
2. ![]()
3. Statystyka testowa: 
4. ![]()
, ![]()
, ![]()
.
Obszar krytyczny C = ![]()
.
5. Mamy![]()
=154, ![]()
=162, ![]()
, ![]()
, ![]()
,
![]()
. Stąd wartość statystyki testowej


= - 2.
6. ![]()
, więc odrzucamy ![]()
.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.
Model 2. ( nieznane odchylenia standardowe ![]()
)
Założenie dodatkowe: ![]()
, ![]()
- nieznane.
![]()
,
lub równoważnie
![]()
.
Statystyka testowa:
Jeśli ![]()
prawdziwa, to

= 
~ ![]()
.
Var(![]()
) = 
,
Niech

, 
-
nieobciążone estymatory ![]()
.
Estymatorem nieobciążonym ![]()
, opartym na dwu próbach łącznie, jest statystyka

.
Wówczas we wzorze na Z podstawiając 
zamiast ![]()
otrzymujemy statystykę

~ ![]()
.
Dla trzech przypadków możliwych hipotez alternatywnych (a), (b), (c) z modelu 1 mamy analogiczne obszary krytyczne, przy czym kwantyle rozkładu ![]()
zastępujemy kwantylami rozkładu ![]()
.
Przykład. Klasyczne tranzystory domieszkowane złotem ( występujące w układach scalonych ) mają tzw. czas magazynowania ładunku rzędu 7 ns. Producent ma nadzieję, że pewna zmiana technologii zmniejszyła czas magazynowania. Producent chciałby przetestować hipotezę ![]()
przeciw ![]()
, gdzie ![]()
oznacza średni czas magazynowania przy starej technologii a ![]()
przy nowej technologii. Z poprzednich badań wiadomo, że obie technologie dają w przybliżeniu normalne rozkłady czasu magazynowania, oraz że odchylenia standardowe obu rozkładów są takie same.
Producent pobrał 2 niezależne 50 elementowe próbki tranzystorów, produkowanych starą i nowa technologią.
Średnie czasy magazynowania dla obu próbek wyniosły
![]()
, ![]()
oraz ![]()
.
Statystyka testowa

.
Wartość statystyki testowej:

.
![]()
, ![]()
. Stąd obszar krytyczny
C = ![]()
.
oraz p-wartość testu wynosi ![]()
Zatem, można przyjąć, że nowa technologia zmniejszyła średni czas magazynowania ładunku.
V. Testy o różnicy wartości średnich rozkładów brzegowych
Niech ![]()
będzie prostą próbą losową z rozkładu dwuwymiarowego. Niech ![]()
tworzą prostą próbę losową z rozkładu normalnego o nieznanej średniej ![]()
.
Hipoteza zerowa: ![]()
,
Hipotezy alternatywne możliwe:
![]()
,
![]()
(c) ![]()
.
Statystyka testowa:

.
Jeśli ![]()
prawdziwa, to ![]()
.
Zatem, obszary krytyczne takie same jak przy testowaniu hipotez o wartości średniej jednej populacji normalnej przy nieznanym odchyleniu standardowym.
Przykład. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z pacjentów. Otrzymano następujące wyniki:
Pacjent: 1 2 3 4 5 6 7
Przed : 210 180 260 270 190 250 180
Po : 180 160 220 260 200 230 180
Czy można twierdzić, na poziomie istotności 0,05, że lek powoduje zmniejszenie wartości średniej ciśnienia?
( podać odpowiednie założenia ).
1. ![]()
![]()
![]()
2. ![]()
![]()
![]()
3. Statystyka testowa: 
.
4. ![]()
30, 20, 40, 10, -10, 20, 0, ![]()
, ![]()
= 15,9,
n = 7,

5. ![]()
![]()
![]()
,
![]()
6. 2,24 >1,94, więc odrzucamy hipotezę zerową.
Odpowiedź. Można twierdzić, że lek obniżył wartość średnią ciśnienia w populacji pacjentów, na poziomie istotności 0,05.
VI. Testowanie hipotezy o równości wariancji dwóch rozkładów normalnych
Niech ![]()
oraz ![]()
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych ![]()
oraz ![]()
, odpowiednio,
![]()
.
Statystyka testowa:

Jeśli ![]()
prawdziwa, to ![]()
F Snedecora o ![]()
stopniami swobody.
(a) ![]()
,
![]()
,
![]()
.
W przypadkach (a), (b), (c) odrzucamy hipotezę zerową, na poziomie istotności ![]()
, jeśli obliczona wartość statystyki F Snedecora f spełnia nierówności, odpowiednio:
(a) f ![]()
,
(b) f ![]()
(c) f ![]()
lub f ![]()
,