background image

Statystyka II-4

1

Testowanie hipotez statystycznych 

(1)

• Drugim (obok teorii estymacji) ważnym działem 

wnioskowania statystycznego jest testowanie hipotez 

statystycznych, obejmu-jące zasady i metody 

sprawdzania określonych przypuszczeń (założeń), 

dotyczących parametrów lub postaci rozkładu cech 

statystycznych populacji generalnej na podstawie 

wyników z próby. Hipotezą statystyczną nazywamy każdy 

sąd o zbiorowości generalnej, wydany bez 

przeprowadzenia badania całkowitego. Prawdziwość 

hipotezy statystycznej orzeka się na podstawie próby 

losowej.

• Hipotezy mogą być parametryczne, gdy dotyczą wartości 

odpowiednich parametrów statystycznych populacji 

generalnej, takich jak wartość przeciętna, wariancja czy 

wskaźnik struktury, lub nieparametryczne, gdy dotyczą 

np. postaci rozkładu cechy statystycznej, współzależności 

cech lub losowości próby.

background image

Statystyka II-4

2

Testowanie hipotez statystycznych 

(2)

• Hipotezą zerową H

0

 nazywamy hipotezę sprawdzaną 

(testowaną, weryfikowaną).

• Hipotezą alternatywną H

1

 nazywamy hipotezę, którą 

jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę H

0

.

• Test statystyczny jest to reguła postępowania, która 

przyporządkowuje wynikom próby losowej decyzję 

przyjęcia lub odrzucenia hipotezy H

0

.

• Bląd I rodzaju polega na odrzuceniu hipotezy H

0

mimo że 

jest ona prawdziwa.

• Poziomem istotności  nazywamy prawdopodobieństwo 

popełnienia błędu I rodzaju. Wartości  są bliskie zera i na 

ogół są równe 0,01; 0,02; 0,05; 0,1.

• Bląd II rodzaju polega na przyjęciu hipotezy H

0

gdy jest 

ona fałszywa. Prawdopodobieństwo popełnienia tego błędu 

oznacza się przez . Dobry test statystyczny powinien mieć 

tę własność, że  również powinno być bliskie zera. 

background image

Statystyka II-4

3

Testowanie hipotez statystycznych 

(3)

• W statystycznej kontroli jakości (SKJ)  określane jest 

często jako ryzyko producenta,  zaś jako ryzyko odbiorcy. 

Wartości  i  są wzajemnie powiązane i zmniejszanie jednej 

z nich powoduje zwiększenie drugiej.

• Pewnym kompromisem są tzw. testy istotności, które dla 

zadanego z góry poziomu istotności  zapewniają możliwie 

najmniejszą wartość prawdopodobieństwa 

• Sprawdzianem hipotezy nazywamy taką statystykę (o 

znanym rozkładzie), której wartość t

e

policzona na 

podstawie próby losowej, pozwala na podjecie decyzji, czy 
odrzucić hipotezę H

0

Dla hipotez parametrycznych 

sprawdzianami są estymatory odpowiednich parametrów, 
natomiast dla hipotez nieparametrycznych rolę 
sprawdzianów pełnią mierniki rozbieżności między 
rozkładem empirycznym a teoretycznym, sformułowanym w 
hipotezie H

0

.

background image

Statystyka II-4

4

Testowanie hipotez statystycznych 

(4)

Ilustracja graficzna wielkości  i 

background image

Statystyka II-4

5

Testowanie hipotez statystycznych 

(5)

• Zbiorem krytycznym Z nazywamy zbiór tych 

wartości sprawdzianu hipotezy, które przemawiają 
za odrzuceniem hipotezy H

0

.

• Zbiór może być w zależności od postaci hipotezy 

alternatywnej zbiorem jednostronnym 
(prawostronnym lub lewostronnym) albo zbiorem 
dwustronnym. 
Mówimy wtedy również, że test 
statystyczny jest jednostronny (prawostronny, 
lewostronny) lub dwustronny. Rozkład sprawdzianu 
hipotezy określa, z jakich tablic należy odczytać 
wartość krytyczną t

 wyznaczającą zbiór Z, a zatem 

zbiór zależy również od liczebności próby n, od 
tego, czy znamy parametry (m lub 

w zbiorowości 

generalnej oraz od poziomu istotności .

background image

Statystyka II-4

6

Testowanie hipotezy o wartości 

przeciętnej (1)

Konstrukcję testu statystycznego omówimy na 

przykła-dzie. Zakłada się, że długość życia opon ma 

rozkład 

N(m,

)Producent twierdzi, że wartość przeciętna tej 

charakterystyki jest równa 50 tys. km. Na podstawie 

100 losowo wybranych opon otrzymano    = 45 tys. 

km i 

s = 8 tys. km. Czy na poziomie istotności =0,05 

można uważać, że producent ma rację?

1

o

 Sformułowanie hipotezy H

0

 i H

1

 

W testach istotności hipoteza H

0

 jest hipotezą „o 

równoś-ci”. Hipoteza alternatywna H

1

 może być 

prostym zaprzeczeniem H

0

 albo hipotezą „o 

większości” lub „o mniejszości”. W tym przypadku:

H

0

m = 50

 H

1

m

 50

W testach istotności wartość  jest z góry zadana

x

background image

Statystyka II-4

7

Testowanie hipotezy o wartości 

przeciętnej (2)

• 2

o

 Zakładając, że długość życia opon ma rozkład 

N(m,

) wybór sprawdzianu hipotezy zależy od 

liczebności próby n oraz od tego, czy parametr 

 

w zbiorowości generalnej jest znany: jeśli 

 jest znane i n30 lub 

 jest znane i n>30 lub

 jest nieznane i n>30, ale wówczas 

 

 S

to sprawdzianem hipotezy H

0

 jest statystyka:

o rozkładzie N(0,1).

• Gdy 

 jest nieznane i 30, to sprawdzianem 

hipotezy jest

        o rozkładzie Studenta z (n-1) st.swobody 

n

m

X

T

1

1

n

S

m

X

T

n

T

e

=(45-

50)/8·100=-6,25

background image

Statystyka II-4

8

Testowanie hipotezy o wartości 

przeciętnej (3)

• 3

o

 Wyznaczanie zbioru krytycznego

Wartość krytyczną t

 odczytujemy w danym przykładzie 

z tablic funkcji (t) w ten sposób, że przy zbiorze 

dwustron-nym (t

)=(1- )/2, a przy jednostronnym 

(t

)=1/2- . Jeżeli relacja wyznaczająca zbiór 

krytyczny jest spełniona, czyli wartość t

 wpada w zbiór 

krytyczny, to hipotezę H

0

 należy odrzucić. W 

przeciwnym przypadku nie ma podstaw do odrzucenia 
H

0

. W przypadku przyjęcia sprawdzianu hipotezy T

n-1

 

wartość krytyczną t

 odczytujemy z tablic rozkładu 

Studenta dla n-1 stopni swobody i: a)P(t

)=  przy 

zbiorze jednostronnym; 
b) P(t

)= 2 przy zbiorach dwustronnych. W 

przykładzie H

1

 50, więc zbiór krytyczny jest 

dwustronny.

background image

Statystyka II-4

9

Testowanie hipotezy o wartości 

przeciętnej (4)

Zbiory krytyczne w 
zależności od postaci 
hipotezy 
alternatywnej 

background image

Statystyka II-4

10

Testowanie hipotez 

parametrycznych

• W przypadku testowania hipotezy H

0

m = m

0

 wobec hipotezy 

alternatyw-nej postaci H

1

: m 

 m

0

 można podejmować decyzję o 

odrzuceniu (lub nie) H

na podstawie przedziału ufności 

wyznaczonego dla parametru m na poziomie ufności l-.
Jeśli wartość m

0

 wpada do przedziału ufności, to nie ma podstaw do 

odrzucenia H

0

; jeśli nie, to H

0

 należy odrzucić, ponieważ zbiór leżący 

poza przedziałem ufności jest zbiorem krytycznym.

• Korzystając z gotowych pakietów statystycznych, takich jak np. 

„Statgra-phics", otrzymujemy wśród wyników, na wydrukach, 

wartość określaną jako „P-value". Wartość ta jest równa 

prawdopodobieństwu zajścia odpowiednich zdarzeń: a) P

V

 = P(T>t

e

przy testach dwustronnych,

b) P

V

 = P(T>t

e

) przy testach prawostronnych, c) P

v

=P(T< -t

e

) przy 

testach lewostronnych, gdzie T — oznacza sprawdzian hipotezy, t

e

 — 

wartość sprawdzianu policzoną na podstawie wyników z próby. 

Jeśli wartość obliczonego prawdopodobieństwa P jest nie większa od 

zadanego poziomu istotności  (P

v

  ), to hipotezę H

0

 należy 

odrzucić na korzyść odpowiedniej hipotezy alternatywnej. W 

przeciwnym wypadku, gdy 

P

v

 > , nie ma podstaw do odrzucenia H

0

.

background image

Podsumowanie przykładu

• W rozpatrywanym przykładzie H

1

m ≠ 50, więc 

zbiór krytyczny jest dwustronny. Sprawdzianem 
hipotezy jest

(t

) = (1 – 0,05)/2 = 0,95/2 = 0,475

stąd t

 = 1,95

• W przykładzie wyznaczyliśmy wartość t

e

 = -6,25. 

Wynika stąd, że t

e

 wpada w zbiór krytyczny, należy 

zatem odrzucić hipotezę H

i w konsekwencji 

przyjąć hipotezę alternatywną H

1

. Zatem producent 

opon nie ma racji twierdząc, że przeciętna długość 
życia opon wynosi 50 tys. km.

 

Statystyka II-4

11

background image

Podsumowanie

• W przypadku testowania hipotezy H

0

m ≠ 

m

0

 można podejmować decyzję o 

odrzuceniu (lub nie) H

0

 na podstawie 

przedziału ufności wyznaczonego dla 
parametru m na poziomie ufności 1 - . Jeśli 

wartość m

0

 wpada do przedziału ufności, to 

nie ma podstaw do odrzucenia H

0

; jeśli nie, 

to H

0

 należy odrzucić, ponieważ zbiór 

leżący poza przedziałem ufności jest 
zbiorem krytycznym.

Statystyka II-4

12

background image

P-value

• Korzystając z gotowych pakietów statystycznych, np. pakietu 

„Statistica”, na wydrukach wyników otrzymujemy wartość 
określaną jako „P-value”. Wartość ta jest równa 
prawdopodobieństwu zajścia odpowiednich zdarzeń:

a) P

v

 = P(|T| > t

e

) przy testach dwustronnych,

b) P

v

 = P(T > t

e

) przy testach prawostronnych,

c) P

v

 = P(T < -t

e

) przy testach lewostronnych,

gdzie T – oznacza sprawdzian hipotezy, t

e

 –wartość 

sprawdzianu T policzoną na podstawie wyników z próby.
Jeśli wartość obliczonego prawdopodobieństwa P jest nie 
większa od zadanego poziomu istotności  (P

v

 ≤ ), to 

hipotezę H

0

 należy odrzucić na korzyść odpowiedniej hipotezy 

alternatywnej. W przeciwnym przypadku, gdy P

v

 > , nie ma 

podstaw do odrzucenia H

0

.

Statystyka II-4

13

background image

Testowanie hipotezy o 

równości dwóch wartości 

przeciętnych

• Dane są dwie zbiorowości generalne o 

rozkładach normalnych N(m

1

, 

1

) i N(m

2

2

). Chcemy zweryfikować hipotezę H

0

m

1

 

m

2

 wobec hipotezy H

1

m

1

 ≠ m

(lub H

1

m

1

 < m

albo H

1

m

1

 > m

2

). Niech n

1

n

2

 

oznaczają wielkości prób prostych, 
wylosowanych z każdej zbiorowości , a        
      oraz                 oznaczają odpowiednio 
średnie arytmetyczne i wariancje z prób.

Statystyka II-4

14

2

1

X

X

2

)

2

(

2

)

1

(

S

i

S

background image

Testowanie hipotezy o 

równości dwóch wartości 

przeciętnych (2)

• W zależności od założeń 

dotyczących zbiorowości 
generalnych oraz od liczebności 
prób, sprawdzian hipotezy H

0

 ma 

różną postać i jest związany z 
rozkładem normalnym lub 
rozkładem Studenta. 

Statystyka II-4

15

background image

Testowanie hipotezy o 

równości dwóch wartości 

przeciętnych (3)

• Jeżeli 

1

2

 znane i n

1

 ≤ 30, n

2

 ≤ 30 lub

1

2

 znane i n

1

 > 30, n

2

 > 30 lub

1

2

 nieznane i n

1

 > 30, n

2

 > 30 i 

przyjmujemy, że 

      , to 

sprawdzian hipotezy ma postać:

Statystyka II-4

16

2

)

2

(

2

1

2

)

1

(

2

1

,

S

S

2

2

2

1

2

1

2

1

n

n

X

X

T

Rozkład statystyki przy 
założeniu prawdziwości 
H

0

, jest N(0, 1). 

background image

Statystyka II-4

17

Hipotezy nieparametryczne (1)

• Nieparametryczne testy istotności dzielimy na trzy zasadnicze 

grupy: testy zgodności, testy niezależności oraz testy 

losowości próby. Testy nieparametryczne, w przeciwieństwie 

do testów parametrycznych, mają tę zaletę, że nie wymagają 

założeń w odniesieniu do postaci rozkładu cechy w zbiorowości 

generalnej. 

• Do najczęściej stosowanych testów nieparametrycznych należy 

test zgodności chi-kwadrat (

2

). Test zgodności 

2

 służy do 

weryfikowania hipotezy, że obserwowana cecha 

zbiorowości generalnej ma określony typ rozkładu, np. 

dwumianowy, Poissona, normalny itd. Poniżej podajemy kilka 

sposobów formułowania takiej hipotezy:
a.  H

0

: cecha ma rozkład określony dystrybuantą F(x) = F

0

(x).

b.  H

0

: cecha ma rozkład N(m,

).

c.  H

0

: cecha ma rozkład (100, 5).

d.  H

0

: cecha ma rozkład Poissona.

e.  H

0

: cecha ma rozkład Poissona z parametrem m = 2.

background image

Statystyka II-4

18

Hipotezy nieparametryczne (2)

• W celu jednoznacznego określenia rozkładu teoretycznego 

(hipote-tycznego) w danej ich klasie niejednokrotnie należy 
najpierw na pod-stawie próby oszacować odpowiednie 
parametry. Dla zweryfikowania hipotezy przedstawionej w b) 
należy oszacować 

 w d) parametr m; w c) i e) parametry 

są podane. W omawianych przykładach hipoteza 
alternatywna jest prostym zaprzeczeniem hipotezy zerowej. 
Test zgodności 

2

 można stosować, jeśli:

1° dane pochodzą z dużej n-elementowej próby wylosowanej 
w sposób niezależny,
2° dane są przedstawione w postaci szeregu rozdzielczego o 
przedziałach klasowych, o liczebnościach przedziałów n

1

n

2

,..., n

r

 spełniających warunek n

n

+...+ n

= n. Na ogół 

przyjmuje się, że n

j

  5, j = l, 2,..., r,

3° rozkład hipotetyczny (sprecyzowany w H

0

może być 

zarówno rozkładem typu ciągłego, jak i skokowego.

background image

Statystyka II-4

19

Hipotezy nieparametryczne (2)

• Sprawdzianem hipotezy H

0

 jest statystyka

• Statystyka ta ma, przy założeniu prawdziwości hipotezy H

0

rozkład 

o k = (r-s-1) stopniach swobody, przy czym s oznacza 

liczbę parametrów, które należy wstępnie wyznaczyć na podstawie 

próby; r — liczbę przedziałów klasowych.

• We wzorze (*) p

i

 oznacza prawdopodobieństwo, że cecha 

przyjmuje wartość należącą do i-tego przedziału klasowego (gdy 

rozkład cechy jest zgodny z H

0

), np

i

zaś oznacza liczbę jednostek, 

które powinny znaleźć się w i-tym przedziale, przy założeniu, że 

cecha ma rozkład zgodny z hipotetycznym. Określa się je jako 

liczebności teoretyczne. Wartość empiryczną statystyki (*) 

oznaczamy przez 

e2

. Statystyka 

2

 jest miarą rozbieżności między 

rozkładem empirycznym a teoretycznym, a zatem zbyt duże 

wartości 

2

 powodują odrzucenie H

0

. Z tego względu relacja 

wyznaczająca zbiór krytyczny ma postać

gdzie 

2

 oznacza  wartość  krytyczną  odczytaną  z  tablic.

(*)

1

2

r

i

i

i

i

np

np

n

2

2

P

background image

Statystyka II-4

20

Test zgodności -Kołmogorowa (1)

• Test służy do weryfikowania hipotezy, że cecha X 

ma w zbiorowości generalnej określony rozkład 
typu ciągłego; najczęsciej jest to rozkład 
normalny. Warunki dotyczące danych z próby są 
takie same, jak w teście 

2

. Hipotezy H

0

 i H

1

 

formułuje się następująco:
H

0

F(x) = F

0

(x)

H

1

F(x)  F

0

(x)

Sprawdzian hipotezy ma postać:

F(x) oznacza dystrybuantę hipotetyczną 
(teoretyczną), a F*(x) – dystrybuantę empiryczną

)

(

*

)

(

sup

x

F

x

F

D

D

n

x

n

n

background image

Statystyka II-4

21

Test zgodności -Kołmogorowa (1)

• Wartość dystrybuanty empirycznej dla danego x 

oblicza się z zależności: F*(x)=n

isk

/n, w której n

isk 

jest skumulowaną liczebnością, odpowiadającą 
wartościom cechy nie większym od x.

• Statystyka  przy założeniu prawdziwości H

0

 ma 

asymptotyczny rozkład - Kołmogorowa. Z uwagi 

na fakt, iż D

n

 mierzy rozbieżność między 

dystrybuantą teoretyczną i empiryczną, zbiór 
krytyczny będą tworzyły tylko zbyt duże wartości 
, tak więc będzie to zbiór prawostronny 

określony równością:

  

odczytuje się z tablic, przy czym Q(

) = 

P


Document Outline