Hipotezy statystyczne

Autor: Janusz Górczyński

Hipotezy parametryczne

Przykład 1.
Interesuje nas wydajność pracy pracowników
pewnego zakładu produkcyjnego. Zakładamy, że
modelem tej cechy może być zmienna losowa
normalna o nieznanych parametrach m i .
Przypuszczamy,

że

średnia

wydajność

(w populacji) jest równa znanej wartości m

Tym

samym

sformułowaliśmy

hipotezę

statystyczną dotyczącą parametru m:

H m m

: 

Autor: Janusz Górczyński

Weryfikacja hipotez
statystycznych (c.d.)





x m





x m

 

Przy konstrukcji testu skorzystamy z faktu, że
statystyka:

ma, przy prawdziwości H

:m=m

, rozkład t-

Studenta z liczbą stopni swobody v = n - 1.
Załóżmy, że H

:m=m

jest prawdziwa.

Jeżeli tak, to m



= 0 oraz

(ponieważ ). Tym samym wartość
statystyki t powinna niewiele odbiegać od zera
(jeżeli H

jest prawdziwa).

Autor: Janusz Górczyński

Weryfikacja hipotez
statystycznych (c.d.)

m m







P t t

(

)







W sytuacji, gdy wartości statystyki t będą
odbiegać od zera dość znacznie, to powinniśmy
zacząć wątpić w prawdziwość naszego założenia
(o tym, że ).

Pozostaje do rozstrzygnięcia kwestia, kiedy
można uznać, że wyniki naszej próby świadczą
przeciwko prawdziwości hipo-tezy zerowej.
Wykorzystamy do tego celu fakt, że dla każdego

znajdziemy taką wartość , dla której
spełniona jest równość

Autor: Janusz Górczyński

Weryfikacja hipotez
statystycznych (c.d.)



(

;

) (

;

)

  



 



(

;

)

 t



Tym samym wartość wyznacza nam
obszar krytyczny dla naszej hipotezy H

Jeżeli wartość empiryczna statystyki t znajdzie
się w tym obszarze, to H

musimy odrzucić

jako zbyt mało prawdopodobną.

Obszar jest obszarem
dopuszczalnym dla H

0 ,

mówimy, że wyniki naszej

próby nie przeczą hipotezie zerowej. Proszę
zauważyć, że nie jest to równoważne zdaniu, że
hipoteza zerowa jest prawdziwa! (my jej tylko nie
możemy odrzucić).

Autor: Janusz Górczyński

Błędy weryfikacji
cd.

Brak podstaw

do odrzucenia

Odrzucenie

prawdziwa

P-stwo

P-stwo
Błąd I rodzaju

fałszywa

P-stwo
Błąd II rodzaju

P-stwo
Moc testu











Autor: Janusz Górczyński

Hipoteza o średniej
generalnej m

H m m

: 

H m m

: 

v n



,   1

Niech zmienna losowa X ma rozkład normalny o
nieznanych parametrach



Na podstawie n-

elementowej próby losowej chcemy zweryfikować

hipotezę zerową

wobec alternatywy

Procedura testowa:

1. Ustalamy poziom istotności 

2. Obliczamy wartość empiryczną statystyki t-

Studenta

3. Odczytujemy z tablic statystycznych wartość

krytyczną statystyki

emp





Autor: Janusz Górczyński

Hipoteza o średniej
generalnej m (c.d)

Wnioskowanie:
Jeżeli , to H

odrzucamy na

korzyść H

Jeżeli , to nie mamy podstaw do
odrzucenia H

emp





emp





Autor: Janusz Górczyński

Hipoteza o średniej
generalnej m (c.d.)

H m m

: 

H m m

: 

H m m

: 

H m m

: 

H m m

: 

H m m

: 

(

)

   t



(

)



 

emp

 



emp





Hipoteza może być także

weryfikowana przy inaczej skonstruowanej

hipotezie alternatywnej ( lub

). Procedura weryfikacyjna przebiega

podobnie, zmienia się tylko obszar krytyczny:

Hipoteza
zerowa

Alternatywa
(jednostronna)

Obszar krytyczny

odrzucamy,

jeżeli:

Autor: Janusz Górczyński

Hipoteza o równości dwóch
średnich generalnych

Procedura testowa:
1. Ustalamy poziom istotności 
2. Obliczamy wartość empiryczną statystyki t-
Studenta

3. Odczytujemy z tablic statystycznych wartość
krytyczną statystyki

N m

~ ( ; )



N m

~ ( ; )



H m m



H m m



x x

emp





v n n



,   

Niech oraz . Na

podstawie odpowiednich prób losowych chcemy

zweryfikować hipotezę:
wobec

Autor: Janusz Górczyński

Hipoteza o równości dwóch
średnich generalnych (c.d.)

Wnioskowanie o prawdziwości
wobec

Jeżeli , to H

odrzucamy jako zbyt mało

prawdopodobną.

Jeżeli , to nie mamy podstaw do

odrzucenia H

H m m



H m m



emp





emp





Autor: Janusz Górczyński

Hipoteza o różnicy średnich
generalnych (c.d.)

Niech                              oraz                             . Na
podstawie odpowiednich prób losowych chcemy
zweryfikować hipotezę:
Hipoteza alternatywna może być jednostronna (
               lub                       )
Procedura

testowa

przebiega

podobnie

jak

poprzednio,

zmieniają

się

jedynie

obszary

krytyczne.
Hipoteza zerowa Hipotezy alternatywne

Obszar krytyczny

N m

~ ( ; )



N m

~ ( ; )



H m m



H m m



H m m



H m m



H m m



H m m



(

)

   t



(

)



 

Autor: Janusz Górczyński

Inny sposób weryfikacji hipotezy
o równości średnich. NIR

Hipoteza

przy

jest odrzucana wtedy, gdy

Iloczyn nazywamy najmniejszą
istotną różnicą (least significant difference) i
oznaczamy skrótem NIR (LSD).

H m m



H m m



emp





x x

t s

v r



















t s

v r



Autor: Janusz Górczyński

Najmniejsza istotna różnica

Hipotezę

przy alternatywie

będziemy odrzucać wtedy, gdy:

NIR (LSD) jest taką różnicą wartości danej cechy
w dwóch populacjach, którą jeszcze można uznać
za losową (przypadkową).
Różnice większe od NIR są już spowodowane
własnościami danych populacji (nie są
przypadkowe).

H m m



H m m



NIR





Autor: Janusz Górczyński

Test istotności dla frakcji

Niech zmienna X ma w populacji rozkład zero-

jedynkowy z prawdopodobieństwem sukcesu p.

Parametr ten można interpretować jako wskaźnik

struktury w populacji.
Interesuje nas weryfikacja hipotezy

zerowej:

wobec
Procedura weryfikacyjna wykorzystuje rozkład N(0, 1):

1. Obliczamy gdzie

2. H

odrzucamy, jeżeli

H p p

: 

H p p

: 

p p

emp.



(

)





p

k
n



emp.





Autor: Janusz Górczyński

Test istotności dla różnicy
frakcji

Rozważmy dwie zmienne zero-jedynkowe z

parametrami odpowiednio p

i p

. Interesuje nas

weryfikacja przy alternatywie

Niech oraz oznaczają odpowiednio
frakcje elementów wyróżnionych w obu próbach.

Wiadomo, że

Jeżeli jest prawdziwa, to

gdzie p oznacza wspólną wartość dla obu zmiennych.

H p



H p



p

k
n



p





 ~

;

(

)

(

)

N p

















H p





 ~

; (

)

























Autor: Janusz Górczyński

Test istotności dla różnicy frakcji
(c.d.)

Jako ocenę wspólnego prawdopodobieństwa sukcesu

dla obu zmiennych przyjmuje się wyrażenie:

Ostatecznie statystyka

ma rozkład N(0, 1).
Hipotezę przy

odrzucamy,
jeżeli

p

k k
n n






emp



















(

)

H p



H p



emp.





Autor: Janusz Górczyński

Test istotności dla wariancji

Niech , interesuje nas weryfikacja
hipotezy
przy alternatywie .
W praktyce nie formułuje się H

jako dwustronnej czy

lewostronnej, co wynika z faktu, że duża wariancja jest
niekorzystna.

Weryfikację hipotezy zerowej przeprowadzamy w
oparciu o n-elementową próbę wykorzystując fakt, że
statystyka

ma rozkład z liczbą stopni swobody v
= n – 1.

N m

~ ( ;

)









(

)

 1





Autor: Janusz Górczyński

Test istotności dla wariancji
(c.d.)

Jeżeli prawdziwa jest H

, to statystyka

ma rozkład z liczbą stopni swobody v = n - 1.

Wnioskowanie:
Jeżeli , to H

odrzucamy na

korzyść H

Jeżeli , to nie mamy podstaw

do odrzucenia H

0 .





emp





(

)





emp

v n



 





emp

v n



 

Autor: Janusz Górczyński

Test istotności dla dwóch
wariancji

Niech oraz .
Na podstawie odpowiednich prób losowych chcemy
zweryfikować przy alternatywie

Statystyka

ma rozkład Fishera-Snedecora z liczbami stopni
swobody

oraz

N m

~ ( ;

)



N m

~ ( ;

)













u n

 

v n

 

Autor: Janusz Górczyński

Test istotności dla dwóch
wariancji (c.d.)

Jeżeli jest prawdziwa, to również
statystyka

ma rozkład Fishera-Snedecora z

liczbami stopni

swobody
                  oraz                      .
Z uwagi na konstrukcję tablic statystycznych, które
zawierają wartości  tylko dla prawostronnego obszaru
krytycznego, wartość empiryczną statystyki F
budujemy tak, aby była większa od 1 (w liczniku
umieszczamy większą wariancję z próby).





s
s



u n

 

v n

 

Autor: Janusz Górczyński

Test istotności dla dwóch
wariancji (c.d.)

Wnioskowanie:
1. Obliczamy wartość empiryczną statystyki

2. Dla ustalonego  odczytujemy z tablic wartość

krytyczną

gdzie u i v są odpowiednio liczbami stopni

swobody dla średnich kwadratów w liczniku i
mianowniku

3. Jeżeli , to odrzucamy na

korzyść

s
s

emp



u v



, ,

emp

u v





, ,









Autor: Janusz Górczyński

Test zgodności

Niech hipotezą zerową będzie przypuszczenie,
że cecha X ma w populacji rozkład określony
dystrybuantą F

(x):

wobec
Statystyka

przy prawdziwości H

ma asymptotyczny rozkład

z liczbą stopni swobody v = k -u - 1.



H F x

F x

: ( )

( )



H F x

F x

: ( )

( )











(

)

n n



Autor: Janusz Górczyński

Test zgodności (c.d.)

Wielkość jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.

Wartość empiryczną statystyki

porównujemy z wartością krytyczną
wnioskując analogicznie jak w pozostałych
hipotezach.





emp

n n







(

)



 ,v k u

   1

Autor: Janusz Górczyński

Test zgodności Chi-kwadrat

Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość

))

;

(





Która jest teoretycznym
prawdopodobieństwem wystąpienia
obserwacji w j-tym przedziale przy założeniu
prawdziwości H0.

Autor: Janusz Górczyński

Test 

zgodności kilku

rozkładów

Obserwujemy  tę  samą  cechę  w  kilku  populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są  takie  same  (co  pociąga  za  sobą  równość
parametrów!).
Jeżeli  dystrybuantę  danej  cechy  w  i-tej  populacji
oznaczymy jako F

, to hipoteza zerowa ma postać:

Zastosowanie testu 

wymaga zestawienia próby w

postaci tabeli dwukierunkowej. W jednym kierunku
umieszczamy poziomy danej cechy, w drugim
populacje.

H F

...

  

Autor: Janusz Górczyński

Test 

zgodności kilku

rozkładów (c.d.)

Klasy

Numer populacji

cechy X

....

....

Autor: Janusz Górczyński

Test 

zgodności kilku

rozkładów (c.d.)

Statystyka testowa ma postać:

gdzie

Przy prawdziwości H

statystyka ta ma rozkład



Pearsona z liczbą stopni swobody v=(k-1)(r-1).

Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.















n n







Autor: Janusz Górczyński

Podejmowanie decyzji
weryfikacyjnych na podstawie
krytycznego poziomu istotności

Dotychczas

podejmowaliśmy

decyzje

weryfikacyjne  poprzez  zbadanie,  czy  wartość
empiryczna  statystyki  testowej  znajduje  się  w
obszarze  krytycznym  danej  hipotezy  (przy  z  góry
ustalonym poziomie istotności ).
W  pakietach  statystycznych  stosuje  się  inne
podejście  polegające  na  obliczeniu  dla
konkretnej

statystyki

próby

prawdopodobieństwa odrzucenia hipotezy
zerowej.

Prześledźmy

przykładzie

weryfikacji hipotezy

H m m wobec H m m





Autor: Janusz Górczyński

Krytyczny poziom istotności
(c.d.)

Dla wartości empirycznej statystyki t

emp

wyznaczonej

na podstawie n-elemnetowej próby obliczane jest
prawdo-podobieństwo otrzymania wartości statystyki
testującej co najmniej tak dużej, jak ta uzyskana z
próby, czyli

Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .

Jeżeli , to

odrzucamy

Jeżeli , to nie mamy podstaw do odrzucenia
H

p P t t

emp





(

)

p



p



Document Outline