TESTOWANIE HIPOTEZ
Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji.
Przykłady.
Producent opon twierdzi, że nowy typ opony ma trwałość większą niż 60000 km. Jeśli ![]()
(km) oznacza wartość średnią trwałości opon, to hipotezą producenta jest ![]()
.
Socjolog twierdzi, że dzieci w miastach mają lepsze wyniki w nauce niż dzieci poza ośrodkami miejskimi. Niech ![]()
(![]()
) oznacza proporcję dzieci w miastach (poza miastami) o średnich ocenach rocznych co najmniej dobrych. Hipotezą socjologa jest ![]()
.
Producent twierdzi, że średni czas bezawaryjnej pracy drukarki to 200 godzin. Wówczas
![]()
Fizycy przypuszczają, że ilość cząstek
emitowanych przez substancję radioaktywną w
przedziałach czasu o danej długości jest zmienną
losową o rozkładzie Poissona. Wówczas
![]()
(e) Sprzedawca przypuszcza, że miesięczna wartość sprzedaży ma rozkład normalny. Wówczas
![]()
![]()
![]()
.
Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru liczbowego lub wektorowego rozkładu cechy populacji,
np. hipotezy (a), (b), (c).
W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).
W zadaniach testowania hipotez występują 2 hipotezy:
Hipoteza zerowa - hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez ![]()
.
Hipoteza alternatywna - hipoteza, która będzie przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez ![]()
.
Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech ![]()
![]()
oznacza prawdopodobieństwo sukcesu w doświadczeniu Bernoulli'ego. Możliwe są hipotezy:

, 
lub

, 
, ale niemożliwe jest sytuacja gdy 
, 
, bo wartość 
jest parametrem z zakresu ![]()
i ![]()
jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.
Rola hipotez ![]()
i ![]()
nie jest symetryczna.
Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.
Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy zaakceptować na podstawie próbki hipotezy alternatywnej, ta którą poddajemy w wątpliwość.
Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi ![]()
. Zaproponowano nową terapię, której nieznana skuteczność ![]()
nie jest gorsza, tzn. wiemy, że ![]()
. Nowa terapia będzie szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że![]()
.
Należy przeprowadzić testowanie hipotez:
![]()
, ![]()
.
Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery. Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:
![]()
Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.
![]()
: Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.
Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:
Możliwe decyzje:
1. Nie ma dostatecznych dowodów aby odrzucić ![]()
, tzn. przyjąć ![]()
: na podstawie obserwacji nie możemy stwierdzić, że nowa technologia zmniejsza poziom zanieczyszczeń.
2. Obserwacje dostarczają dostatecznych dowodów, aby przyjąć ![]()
, równoważnie odrzucić ![]()
, tzn. stwierdzamy, iż można uznać, że nowa technologia zmniejsza poziom zanieczyszczeń.
Model matematyczny:
Załóżmy, że
(a) ![]()
= znany średni poziom dobowy emisji przy starej technologii
(b) ![]()
= nieznany średni poziom dobowy emisji przy
nowej technologii
wiemy, że ![]()
. Chcielibyśmy stwierdzić, że nowa technologia zmniejsza poziom emisji. Zatem:
![]()
, ![]()
.
(d) w ciągu n losowo wybranych dni obserwujemy dobowe poziomy emisji przy nowej technologii: ![]()
.
(e) zmienne losowe ![]()
są niezależne o jednakowym rozkładzie ![]()
, gdzie ![]()
jest znane.
Odpowiednią decyzję: „ przyjąć ![]()
” lub „ nie można odrzucić ![]()
” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej ![]()
, tzn. średniej z próbki ![]()
.
Uzasadnienie: Rozkładem ![]()
jest rozkład 
skoncentrowany wokół ![]()
. Zatem dostatecznie małe wartości ![]()
sugerują, że ![]()
jest prawdziwa, ponieważ
jeśli ![]()
jest prawdziwa, to wartości ![]()
skupiają się wokół ![]()
, statystyka

![]()
.
(2) jeśli ![]()
jest prawdziwa, tzn. nieznane ![]()
, to wartości ![]()
skupiają się wokół ![]()
. Wówczas Z jest sumą zmiennej o rozkładzie ![]()
oraz stałej ujemnej:

.
i (2) sugerują sposób testowania: niech c będzie
odpowiednio dobraną stałą, a ![]()
wartością ![]()
obliczoną dla konkretnej próbki, wówczas
jeśli 
, to przyjmujemy ![]()
.
jeśli 
, to nie ma podstaw do
odrzucenia ![]()
.
Wybór c: Niech ![]()
będzie małą liczbą z (0,1), np.
![]()
lub 0, 01 lub 0,1, ...
Niech ![]()
. Wówczas jeśli ![]()
prawdziwa, to
![]()
.
Stąd ![]()
jest prawdopodobieństwem błędnej decyzji (przyjęcia ![]()
) w przypadku gdy hipoteza ![]()
jest prawdziwa. ![]()
= prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.
Zbiór ![]()
nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy ![]()
na korzyść ![]()
.
Błędy testowania, gdybyśmy symetrycznie traktowali hipotezy
Podjęta decyzja
Stan natury |
Akceptacja
( |
Odrzucenie
(Akceptacja |
|
Decyzja prawidłowa ( ? ) |
Błąd I rodzaju |
|
Błąd II rodzaju (? ) |
Decyzja prawidłowa |
I. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy znana jest wariancja.
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
- znane.
![]()
Statystyka testowa:

= 
.![]()
Jeśli ![]()
prawdziwa, to Z ![]()
.
Model 1. ![]()
, ![]()
.
Wówczas przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
.
Model 2. ![]()
, ![]()
.
Wówczas przyjmujemy C = ![]()
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
, ![]()
. Wówczas
C = ![]()
- obszar krytyczny, gdzie
![]()
![]()
.
Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych, w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:
1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.
Czy, na poziomie istotności ![]()
, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?
Rozwiązanie:
![]()
![]()
Statystyka testowa: 
![]()
, ![]()
, ![]()
= 2,33.
Obszar krytyczny C = ![]()
![]()
, ![]()
, z obliczeń ![]()
, stąd wartość statystyki testowej

.
![]()
, więc odrzucamy ![]()
.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.
II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja.
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
- nieznane.
![]()
.
Statystyka testowa:

= 
.
Jeśli ![]()
prawdziwa, to ![]()
.
Model 1. ![]()
, ![]()
.
Wówczas przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu t - Studenta z ![]()
![]()
stopniami swobody.
Model 2. ![]()
, ![]()
.
Wówczas C = ![]()
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
, ![]()
. Wówczas
C = ![]()
- obszar krytyczny, gdzie
![]()
![]()
![]()
.
Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano następujące przebiegi nie wymagające żadnego serwisu: 11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując ![]()
oraz rozkład normalny przebiegu.
Rozwiązanie:
1. ![]()
2. ![]()
3. Statystyka testowa: 
4. ![]()
, ![]()
, liczba stopni swobody = ![]()
= 4 -1 = 3, ![]()
2,353.
Obszar krytyczny C = ![]()
.
5. ![]()
, z obliczeń ![]()
, 
, stąd wartość statystyki testowej

.
6. ![]()
, więc nie ma podstaw do odrzucenia ![]()
na poziomie istotności 0,05.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że nie można odrzucić twierdzenia producenta.
Definicja. Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.
Np. w ostatnim zadaniu
![]()
, ![]()
![]()
![]()
0,063.
Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.
III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia.
Niech ![]()
będzie prostą próbą losowa z rozkładu ![]()
, ![]()
,![]()
- nieznane.
![]()
.
Statystyka testowa:

= 
Jeśli ![]()
prawdziwa, to ![]()
.
Model 1. ![]()
, ![]()
.
Wówczas przyjmujemy C = 
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu ![]()
.

Model 2. ![]()
, ![]()
.
Wówczas C = 
- obszar krytyczny, gdzie
![]()
.
Model 3. ![]()
, ![]()
.
Wówczas obszar krytyczny C = 

,
gdzie ![]()
, ![]()
.
Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe ![]()
(godz. ). Czy na poziomie istotności ![]()
( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)
Rozwiązanie.
1. ![]()
2. ![]()
3. Statystyka testowa: 
4. ![]()
, ![]()
, ![]()
,
![]()
, liczba stopni swobody ![]()
,
![]()
, ![]()
![]()
.
Reguła decyzyjna ( na podstawie obszaru krytycznego ): odrzuć ![]()
, jeśli obliczona wartość statystyki
![]()
![]()
lub ![]()
![]()
.![]()
5. s =13, stąd wartość statystyki testowej
![]()
= ![]()
![]()

.
6. ![]()
![]()
, więc nie ma podstaw do odrzucenia ![]()
.
Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że ![]()
10.
IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych.
Niech ![]()
oraz ![]()
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych ![]()
oraz ![]()
, odpowiednio.
Model 1. ( znane odchylenia standardowe ![]()
)
![]()
,
lub równoważnie
![]()
.
Statystyka testowa:
Konstrukcja oparta na analizie ![]()
.
Statystka ![]()
ma rozkład normalny o wartości średniej ![]()
i wariancji 
( gdyż
średnie z obu prób losowych ![]()
są niezależnymi zmiennymi losowymi o rozkładach normalnych

, 
, odpowiednio ). Stąd, po standaryzacji mamy

~ ![]()
.
(a) ![]()
, ![]()
.
Jeśli ![]()
prawdziwa, to

~ ![]()
.
Przyjmujemy C = ![]()
= obszar krytyczny testu hipotezy ![]()
przeciw ![]()
na poziomie istotności ![]()
, gdzie
![]()
,
![]()
= kwantyl rzędu ![]()
rozkładu ![]()
.
(b) ![]()
, ![]()
.
Przyjmujemy C = ![]()
= obszar krytyczny.
(c) ![]()
, ![]()
Przyjmujemy C = ![]()
= obszar krytyczny.
Przykład. Średnia waga losowo wybranych 15 Europejczyków wyniosła ![]()
= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano ![]()
= 162 (funty).
Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: ![]()
i ![]()
. Czy można twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć ![]()
oraz rozkład normalny wag.
1. ![]()
.
2. ![]()
3. Statystyka testowa: 
4. ![]()
, ![]()
, ![]()
.
Obszar krytyczny C = ![]()
.
5. Mamy![]()
=154, ![]()
=162, ![]()
, ![]()
, ![]()
,
![]()
. Stąd wartość statystyki testowej


= - 2.
6. ![]()
, więc odrzucamy ![]()
.
Odpowiedź: Na poziomie istotności ![]()
stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.
Model 2. ( nieznane odchylenia standardowe ![]()
)
Założenie dodatkowe: ![]()
, ![]()
- nieznane.
![]()
,
lub równoważnie
![]()
.
Statystyka testowa:
Jeśli ![]()
prawdziwa, to

= 
~ ![]()
.
Var(![]()
) = 
,
Niech

, 
-
nieobciążone estymatory ![]()
.
Estymatorem nieobciążonym ![]()
, opartym na dwu próbach łącznie, jest statystyka

.
Wówczas we wzorze na Z podstawiając 
zamiast ![]()
otrzymujemy statystykę

~ ![]()
.
Dla trzech przypadków możliwych hipotez alternatywnych (a), (b), (c) z modelu 1 mamy analogiczne obszary krytyczne, przy czym kwantyle rozkładu ![]()
zastępujemy kwantylami rozkładu ![]()
.
Przykład. Klasyczne tranzystory domieszkowane złotem ( występujące w układach scalonych ) mają tzw. czas magazynowania ładunku rzędu 7 ns. Producent ma nadzieję, że pewna zmiana technologii zmniejszyła czas magazynowania. Producent chciałby przetestować hipotezę ![]()
przeciw ![]()
, gdzie ![]()
oznacza średni czas magazynowania przy starej technologii a ![]()
przy nowej technologii. Z poprzednich badań wiadomo, że obie technologie dają w przybliżeniu normalne rozkłady czasu magazynowania, oraz że odchylenia standardowe obu rozkładów są takie same.
Producent pobrał 2 niezależne 50 elementowe próbki tranzystorów, produkowanych starą i nowa technologią.
Średnie czasy magazynowania dla obu próbek wyniosły
![]()
, ![]()
oraz ![]()
.
Statystyka testowa

.
Wartość statystyki testowej:

.
![]()
, ![]()
. Stąd obszar krytyczny
C = ![]()
.
oraz p-wartość testu wynosi ![]()
Zatem, można przyjąć, że nowa technologia zmniejszyła średni czas magazynowania ładunku.
V. Testy o różnicy wartości średnich rozkładów brzegowych.
Niech ![]()
będzie prostą próbą losową z rozkładu dwuwymiarowego. Niech ![]()
tworzą prostą próbę losową z rozkładu normalnego o nieznanej średniej ![]()
.
Hipoteza zerowa: ![]()
,
Hipotezy alternatywne możliwe:
![]()
,
![]()
(c) ![]()
.
Statystyka testowa:

.
Jeśli ![]()
prawdziwa, to ![]()
.
Zatem, obszary krytyczne takie same jak przy testowaniu hipotez o wartości średniej jednej populacji normalnej przy nieznanym odchyleniu standardowym.
Przykład. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z pacjentów. Otrzymano następujące wyniki:
Pacjent: 1 2 3 4 5 6 7
Przed : 210 180 260 270 190 250 180
Po : 180 160 220 260 200 230 180
Czy można twierdzić, na poziomie istotności 0,05, że lek powoduje zmniejszenie wartości średniej ciśnienia?
( podać odpowiednie założenia ).
1. ![]()
![]()
![]()
2. ![]()
![]()
![]()
3. Statystyka testowa: 
.
4. ![]()
30, 20, 40, 10, -10, 20, 0, ![]()
, ![]()
= 15,9,
n = 7,

5. ![]()
![]()
![]()
,
![]()
6. 2,24 >1,94, więc odrzucamy hipotezę zerową.
Odpowiedź. Można twierdzić, że lek obniżył wartość średnią ciśnienia w populacji pacjentów, na poziomie istotności 0,05.
VI. Testowanie hipotezy o równości wariancji dwóch rozkładów normalnych.
Niech ![]()
oraz ![]()
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych ![]()
oraz ![]()
, odpowiednio,
![]()
.
Statystyka testowa:

Jeśli ![]()
prawdziwa, to ![]()
F Snedecora o ![]()
stopniami swobody.
(a) ![]()
,
![]()
,
![]()
.
W przypadkach (a), (b), (c) odrzucamy hipotezę zerową, na poziomie istotności ![]()
, jeśli obliczona wartość statystyki F Snedecora f spełnia nierówności, odpowiednio:
(a) f ![]()
,
(b) f ![]()
(c) f ![]()
lub f ![]()
,