background image

 

37

   

4. WERYFIKACJA  HIPOTEZ 

 
4.1. Wiadomości wstępne 

 
Niech dana będzie próbka 

n

x

...,

,

1

 z rozkładu absolutnie ciągłego o gęstości 

nieznanej 

)

y

f

. Wektor losowy 

)

...,

,

(

1

n

x

x

x

 będziemy nazywali wektorem obser-

wacji, a zbiór jego wszystkich możliwych wartości – przestrzenią próbek. Naszym 
celem jest sprawdzanie (weryfikacja) hipotezy głównej (zerowej) 

0

H

, polegającej na 

tym,  że 

)

(

)

(

0

y

f

y

f

,  gdzie 

)

(

0

y

f

  jest  daną  z  góry  gęstością  (tj. 

0

)

(

0

y

f

 1

)

(

0

dy

y

f

). Hipoteza zerowa może być określona także w inny sposób. Ponieważ 

ZL 

i

x

  są  niezależne,  to  gęstość  wektora  losowego  x  jest  równa 

)

(x

f

 

)

(

)...

(

)

(

2

1

n

x

f

x

f

x

f

. A więc hipoteza zerowa polega na tym, że w przestrzeni pró-

bek  X  wektor  x  spełnia  rozkład  o  gęstości 

)

(

)

...,

,

(

)

(

0

1

x

x

f

x

x

f

f

n

,  gdzie 

)

(

)...

(

)

(

)

(

0

2

0

1

0

0

n

x

f

x

f

x

f

f

x

. Symbolicznie  hipotezę zerową będziemy, więc, zapi-

sywali w postaci 

:

0

H

    

)

(

)

(

0

y

f

y

f

,    albo w postaci     

:

0

H

    

)

(

)

(

0

x

x

f

f

Rozpatrywana  hipoteza  zerowa  jest  prosta,  ponieważ  rozkład  o  gęstości 

)

(

0

y

f

 

jest  określony  jednoznacznie.  W  tym  przypadku,  gdy  hipoteza 

0

H

  wyraża  ten  fakt, 

że rozkład o gęstości nieznanej 

)

y

f

 należy do pewnej klasy zawierającej więcej niż 

jeden  rozkład,  nazywamy  ją  hipotezą  złożoną.  Np.  hipoteza  polegająca  na  tym,  że 
próbka 

n

x

...,

,

1

  należy  do  rozkładu  normalnego,  jest  złożona,  ponieważ  klasa  roz-

kładów normalnych jest zbiorem wszystkich rozkładów o gęstości 

)

(

2

,

y

f

a

2

2

2

)

(

2

1

a

y

e

, gdzie 

R

a

0

Załóżmy, że chcemy zweryfikować hipotezę prostą 

0

H

 przeciw hipotezy alter-

natywnej 

1

H

.  Zakładamy  również,  że  prawdziwa  jest  jedna  i  tylko  jedna  z  hipotez 

0

H

  i 

1

H

.  Najpierw  zbadamy  przypadek  prostych  hipotez 

:

0

H

)

(

)

(

0

x

x

f

f

               

(

)

(

)

(

0

y

f

y

f

)  i 

:

1

H

)

(

)

(

1

x

x

f

f

  (

)

(

)

(

1

y

f

y

f

).  Tu 

)

(

1

y

f

  jest  pewną  gęstością 

różną od 

)

(

0

y

f

)

(

)...

(

)

(

)

(

1

2

1

1

1

1

n

x

f

x

f

x

f

f

x

. 

Budowa kryterium dla weryfikacji hipotezy zerowej polega na wyborze w prze-

strzeni próbek obszaru krytycznego K, takiego, że jeżeli wektor obserwacji x

K

, to 

hipotezę 

0

H

 odrzucamy  (czyli przyjmujemy  hipotezę alternatywną 

1

H

). Natomiast, 

jeżeli 

K

X

K

\

x

, to przyjmujemy hipotezę 

0

H

 (odrzucamy 

1

H

).  

background image

 

38

Przyjmując albo odrzucając hipotezę zerową możemy popełnić błędy dwóch ro-

dzajów. 

1. Błąd pierwszego rodzaju popełniamy w przypadku, gdy odrzucamy prawdzi-

wą hipotezę zerową 

0

H

. Prawdopodobieństwo błędu pierwszego rodzaju wynosi 

K

d

f

H

K

x

x

x

P

)

(

}

prawdziwa

jest 

 

{

0

0

Błąd pierwszego rodzaju nazywa się również poziomem istotności kryterium. 
2.

 

Błąd  drugiego  rodzaju  popełniamy  w  przypadku,  gdy  przyjmujemy  hipotezę 

zerową 

0

H

,  chociaż  nie  jest  ona  prawdziwa.  Prawdopodobieństwo  błędu  drugiego 

rodzaju wynosi 

K

d

f

H

K

x

x

x

P

)

(

}

prawdziwa

jest 

 

{

1

1

Rozpatrywane całki tu rozumiemy jako n-krotne, tj. 

n

dx

dx

d

...

1

x

Kryterium dla weryfikacji hipotezy byłoby idealne, gdyby prawdopodobieństwa 

błędów obu rodzajów były równe 0. Niestety nie jest to możliwe wobec niepewności 
spowodowanej  przypadkowością  wyników  prowadzonych  doświadczeń.  Zmniejsza-
jąc prawdopodobieństwo błędu 1-go rodzaju przy ustalonej liczności próbki, my jed-
nocześnie zwiększamy prawdopodobieństwo błędu 2-go rodzaju, odwrotnie, zmniej-
szając  prawdopodobieństwo  błędu  2-go  rodzaju,  jednocześnie  zwiększamy  prawdo-
podobieństwo  błędu  1-go  rodzaju.  Istotnie,  zmniejszenie  np.  prawdopodobieństwa 
błędu 1-go rodzaju jest równoważne zmniejszeniu obszaru K, co prowadzi do zmniej-
szenia  pierwszej  z  wypisanych  całek.  W  takich  warunkach  jednak  zwiększa  się  ob-
szar 

K

X

K

\

,  co  z  kolei  prowadzi  do  zwiększenia  drugiej  całki.  Otrzymana 

sprzeczność  wymaga  oczywiście  rozstrzygnięcia  kompromisowego,  tj.  takiego,  przy 
którym oba prawdopodobieństwa byłyby niezbyt duże. Podejście klasyczne polega na 
wyborze obszaru krytycznego w taki sposób, aby prawdopodobieństwo błędu 2-go 
rodzaju było minimalne pod warunkiem, że prawdopodobieństwo błędu 1-go rodzaju 
(poziom istotności) nie przekracza pewnego poziomu krytycznego 

0

.  

 

Definicja 1. Liczba 

K

d

f

H

K

H

K

x

x

x

P

x

P

)

(

}

prawdziwa

jest 

 

{

}

prawdziwa

jest 

 

{

1

1

1

1

1

 

nazywa  się  mocą  kryterium.  Kryterium,  którego  moc  jest  maksymalna,  nazywa  się 
kryterium o największej mocy. 

 
Minimalizacja prawdopodobieństwa błędu  2-go rodzaju jest oczywiście  równo-

ważna do maksymalizacji mocy kryterium.  

Zagadnienie znalezienia kryterium o największej mocy da się rozwiązać bardzo 

rzadko.  Dlatego  w  ciągu  dalszym  zajmiemy  się  prostymi  zagadnieniami,  które  nie 
uwzględniają pojęcia błędu 2-go rodzaju.  

 

background image

 

39

4.2. Testy istotności. Kryterium χ

2

 Pearsona 

 
Jeżeli mamy tylko hipotezę zerową i nie ma żadnej alternatywy lub alternatywa 

jest bardzo złożona, to można zapomnieć o prawdopodobieństwie błędu 2-go rodzaju 
i  budować  kryterium,  biorąc  pod  uwagę  wyłącznie  prawdopodobieństwo  błędu  1-go 
rodzaju.  Ponieważ,  jak  wiemy,  prawdopodobieństwo  błędu  1-go  rodzaju  nazywa  się 
poziomem istotności, w rozpatrywanym przypadku hipoteza do sprawdzania nazywa 
się hipotezą istotności, a odpowiednie kryteria dla jej weryfikacji – testami istotności
Takie  kryteria  są  oczywiście  niezawodne  w  mniejszym  stopniu  niż  kryteria  o  naj-
większej mocy. Wybierając poziom istotności 

 (najczęściej 

05

,

0

 lub 

01

,

0

), 

znajdujemy obszar krytyczny korzystając z warunku 

}

{

0

H

K

x

P

gdzie 

0

H

  jest  hipotezą  do  sprawdzania.  Jeżeli  obecne  dane  statystyczne  (wartości 

próbki x) są takie, że 

K

x

, to przy założeniu, że hipoteza 

0

H

 jest prawdziwa, uwa-

żamy,  że  otrzymane  dane  próbki  stanowią  zdarzenie  o  bardzo  małym  prawdopodo-
bieństwie 

. Stąd wynika, że nie możemy uwierzyć w prawdziwość hipotezy 

0

H

, tj. 

hipotezę 

0

H

 należy odrzucić. Jeżeli natomiast okaże się, że 

K

x

, to przy założeniu 

prawdziwości 

0

H

  otrzymano,  iż  dane  próbki  x  stanowią  zdarzenie  mające  duże 

prawdopodobieństwo 

1

.  Wówczas  dochodzimy  do  wniosku,  że  otrzymane  dane 

statystyczne  nie  są  sprzeczne  z  hipotezą 

0

H

. Nie  oznacza  to,  że  wskazaną  hipotezę 

należy  przyjąć.  Aby  mieć  pewność,  co  do  jej  prawdziwości,  należy  sprawdzić  ją  na 
dostatecznie  wielkiej  ilości  próbek.  Jeżeli  wszystkie  otrzymane  wyniki  nie  stanowią 
sprzeczności z 

0

H

, to hipotezę tę można przyjąć. Na tym polega główna wada rozpa-

trywanego podejścia, związana z ignorowaniem prawdopodobieństwa błędu 2-go ro-
dzaju. 

 
Kryteria  porównania  parametrów  dwóch  próbek.  Niech 

1

...,

,

1

n

x

x

oraz 

2

...,

,

1

n

y

y

 będą dwoma próbkami  niezależnymi z rozkładów 

2

1

1

, 

a

N

 i 

2

2

2

, 

a

N

 od-

powiednio (próbki te są niezależne na mocy niezależności ZL 

1

...,

,

1

n

x

x

2

...,

,

1

n

y

y

). 

1) Niech 

2

1

 i 

2

2

 są znane. Należy zweryfikować hipotezę 

2

1

0

:

a

a

H

Ponieważ ZL 

x

 i 

y

 są niezależne  i  mają rozkłady 

1

2

1

1

,

n

a

N

 i 

2

2

2

2

,

n

a

N

 od-

powiednio,  to  ZL 

y

x

  ma  rozkład  normalny  z  parametrami 

1

2

)

(

a

a

x

y

E

2

2

2

1

2

1

)

(

n

n

x

y

x

y

D

D

D

,  tj. 

y

x

  ma  rozkład 

2

2

2

1

2

1

1

2

,

n

n

a

a

N

.  Wów-

czas  ZL 

2

2

2

1

2

1

1

2

)

(

n

n

a

a

x

y

  ma  rozkład 

1

,

0

N

.  Przy  założeniu  prawdziwości 

0

H

 

background image

 

40

otrzymujemy, więc, że ZL 

2

2

2

1

2

1

0

0

n

n

x

y

H

 ma rozkład 

1

,

0

N

. Jest jasne, że 

im bliżej siebie są wartości 

1

a

 i 

2

a

, tym mniejsza jest wartość bezwzględna statystyki 

.  Jako  obszar  krytyczny  należy,  więc,  wybrać  zbiór 

}

|

|

|

:

{

0

H

C

K

 x

.  Jeżeli 

 

jest poziomem istotności kryterium, to stałą wybieramy z warunku 

))

(

1

(

2

}

|

{|

1

}

|

{|

}

|

{|

}

{

1

,

0

0

0

0

0

C

C

C

H

C

H

K

P

P

P

x

P

skąd korzystając z tablic znajdujemy jako pierwiastek równania 

2

1

)

(

1

,

0

C

Kryterium weryfikacji 

0

H

 ma, więc, postać następującą: 

jeżeli 

C

 |

|

0

, to hipotezę 

0

H

 odrzucamy, 

jeżeli 

C

 |

|

0

, to hipoteza 

0

H

 nie jest sprzeczna względem wyników doświad-

czeń (danych próbki). 

2)  Niech 

1

a

  i 

2

a

  są  nieznane.  Należy  zweryfikować  hipotezę 

2

2

2

1

0

:

H

Dla estymatorów wariancji nieobciążonych 

1

1

2

1

2

0

)

(

1

1

n

i

i

x

x

x

n

s

 i 

2

1

2

2

2

0

)

(

1

1

n

i

i

y

y

y

n

s

 

mamy 

1

1

2

1

2

1

2

0

1

n

s

n

x

1

2

2

1

2

2

2

0

2

n

s

n

y

Przedstawione tu ZL są niezależne, ponieważ odnoszą się do niezależnych pró-

bek. Wówczas przy założeniu prawdziwości hipotezy 

0

H

 stosunek 

1

1

2

2

1

1

2

1

2

0

2

0

2

1

n

n

s

s

n

n

y

x

 

ma rozkład Fishera o 

1

1

n

1

2

n

 stopniach swobody (patrz p. 3.2), a stosunek 

1

1

1

2

1

2

2

1

2

0

2

0

1

2

n

n

s

s

n

n

x

y

 

ma rozkład Fishera o 

1

2

n

1

1

n

 stopniach swobody. Przyjęto jest w jakości staty-

styki kryterium korzystać ze stosunku, w którym licznik jest większy niż mianownik. 

background image

 

41

Niech 

)

,

max(

2

0

2

0

2

01

y

x

s

s

s

)

,

min(

2

0

2

0

2

02

y

x

s

s

s

.  Wprowadźmy  ZL 

2

02

2

01

s

s

.  Przy  za-

łożeniu  prawdziwości  hipotezy 

0

H

  ZL 

0

0

H

  ma  rozkład 

2

1

k

k

F

,  gdzie 

1

k

1

1

 n

2

k

1

2

 n

, gdy 

2

0

2

0

y

x

s

s

, oraz 

1

k

1

2

 n

2

k

1

1

 n

, gdy 

2

0

2

0

x

y

s

s

. Wy-

bierzmy  liczby 

1

F

  i 

2

F

  (korzystając  z  tablicy  rozkładu  Fishera)  tak,  aby  spełniony 

był warunek 

2

}

{

}

{

2

0

1

0

F

F

P

P

gdzie 

 jest poziomem istotności kryterium. Jest oczywiste, że ZL 

0

1 

 ma rozkład 

1

2

k

k

F

, skąd wynika, że 

2

1

1

}

{

1

0

1

0

F

F

P

P

Korzystając z tablicy rozkładu Fishera, znajdujemy 

2

F

 i 

1

F

 jako odpowiednie 

kwantyle: 

2

,

,

2

1

2

k

k

F

F

2

,

,

1

1

2

1

k

k

F

F

Wybierzmy obszar krytyczny: 

}

 

albo

 

:

{

2

1

,

2

1

F

F

K

K

F

F

x

Mamy wówczas 

}

 

albo

 

{

}

 

albo

 

{

}

{

2

0

1

0

0

2

1

0

F

F

H

F

F

H

K

P

P

x

P

 

2

2

}

{

}

{

2

0

1

0

F

F

P

P

Kryterium weryfikacji hipotezy 

2

2

2

1

0

:

H

 ma, więc, postać: 

jeżeli 

1

0

F

 albo 

2

0

F

, to hipotezę 

0

H

 odrzucamy; 

jeżeli 

2

0

1

F

F

, to hipoteza 

0

H

 nie jest sprzeczna względem danych próbki. 

 
Kryterium  χ

2

  Pearsona  w  schemacie  wielomianowym.  Rozważmy  n  iden-

tycznych doświadczeń niezależnych, w każdym z których zachodzi jedno i tylko jed-
no  z  k  zdarzeń  rozłącznych 

k

A

...,

,

1

.  Prawdopodobieństwa  zajścia  zdarzeń  w  po-

szczególnych doświadczeniach są równe 

1

1

1

}

{

)

(

p

A

A

p

 P

, ..., 

k

k

k

p

A

A

p

}

{

)

(

P

 (

1

1

k

i

i

p

). 

Oznaczmy  przez 

i

  liczbę  zajścia  zdarzenia 

i

A

  w  n  doświadczeniach  (

,

,

k

 

n

k

i

i

1

). Utwórzmy statystykę 

k

i

i

i

i

np

np

1

2

2

)

(

K. Pearson udowodnił twierdzenie, z którego wynika, że 

background image

 

42

}

{

}

{

lim

2

1

2

t

t

k

n

P

P

gdzie 

2

1

k

 jest ZL, mająca rozkład 

2

 o 

1

k

 stopniach swobody. 

Możemy, więc, uważać, że przy dużej  liczności próbki n  ZL 

2

 zachowuje się 

w przybliżeniu tak samo, jak ZL 

2

1

k

Załóżmy, że na podstawie wyników niezależnych doświadczeń należy zwery-

fikować hipotezę 

0

0

1

1

0

...,

,

:

k

k

p

p

p

p

H

gdzie 

0

0

1

...,

,

k

p

p

  są  dane  liczby  nieujemne  takie,  że 

1

...

0

0

1

k

p

p

.  Ponieważ  dla 

dużych na podstawie prawa wielkich liczb mamy 

i

i

p

n

, tj. 

0

i

i

np

, to przy 

założeniu prawdziwości 

0

H

 wartości statystyki 

2

 nie  mogą być zbyt duże. Obszar 

krytyczny 

p

K

  należy,  więc,  wybrać  w  taki  sposób,  aby  hipoteza 

0

H

  została  odrzu-

cona  gdy  wartość  statystyki 

2

  przekroczy  pewną  wielkość  graniczną.  Dlatego 

wieźmy 

}

:

{

2
kr.

2

 x

p

K

.  Wybierzmy  poziom  istotności 

.  Niech 

0

2

2
0

H

 

k

i

i

i

i

np

np

1

0

2

0

)

(

. Wybierzmy 

2
kr.

 w taki sposób, aby 

}

{

}

{

}

{

2
kr.

2
0

0

2
kr.

2

0

P

P

x

P

H

H

K

p

Jak wynika z rezultatu  K.  Pearsona, ostatnią  równość  możemy zastąpić  równo-

ścią przybliżoną 

}

{

2
kr.

2

1

k

P

. Wówczas korzystając z tablic rozkładu 

2

  mo-

żemy znaleźć wartość przybliżoną 

)

,

1

(

2

2
kr.

k

Kryterium weryfikacji hipotezy 

0

H

 ma więc postać następującą: 

jeżeli 

)

,

1

(

2

2
0

k

, to hipotezę 

0

H

 odrzucamy; 

jeżeli 

)

,

1

(

2

2
0

k

,  to  hipoteza 

0

H

  nie  jest  sprzeczna  wynikom  doświad-

czeń. 

Warto jeszcze raz podkreślić, że kryterium tę należy stosować tylko dla próbek 

o dużej liczności. 

 
4.3. Kryteria zgodności 

 
Niech 

n

x

...,

,

1

  będzie  próbką  z  rozkładu  P  o  dystrybuancie  nieznanej 

)

(x

F

Należy zweryfikować hipotezę 

)

(

)

(

:

0

0

x

F

x

F

H

, gdzie 

)

(

0

x

F

 jest daną z góry dys-

trybuantą  (tj. 

)

(

0

x

F

  jest  niemalejąca,  lewostronnie  ciągła  oraz 

0

)

(

0



F

1

)

(

0



F

). Hipoteza o takiej postaci  nazywa się hipotezą zgodności, a kryteria jej 

weryfikacji – kryteriami zgodności

background image

 

43

Najczęściej kryteria zgodności są budowane w sposób  następujący. Jak wiemy, 

dystrybuanta teoretyczna  F  i dystrybuanta  empiryczna 

*

n

F

 są bliskie siebie przy du-

żych  n. Wybierzmy pewną  miarę odchylenia 

)

...,

,

(

)

,

(

1

*

n

n

n

n

n

x

x

F

F

 funkcji 

*

n

F

 od funkcji F. Wybór taki nie jest jednoznaczny, w zależności od sposobu wyboru 

uzyskujemy  różne  kryteria  zgodności.  Załóżmy,  że  udało  się  znaleźć  rozkład  gra-
niczny  ZL 

n

  gdy 

n

.  ZL  o  takim  rozkładzie  oznaczmy  przez 

.  Obszar  kry-

tyczny 

F

K

  wybieramy  w  sposób  następujący: 

}

:

{

kr.

 x

F

K

.  Znając  poziom 

istotności 

 znajdziemy następnie 

kr.

 z równania 

}

{

}

{

}

{

kr.

0

0

kr.

0

P

P

x

P

H

H

K

F

gdzie 

0

0

H

jest wartością miary granicznej przy warunku prawdziwości hipote-

zy 

0

H

.  Kryterium  dla  weryfikacji  hipotezy 

0

H

  budujemy,  więc,  w  sposób  standar-

dowy: 

jeżeli 

kr.

0

, to hipotezę 

0

H

 odrzucamy; 

jeżeli 

kr.

0

, to uważamy, że hipoteza 

0

H

 odpowiada danym próbki. 

Warto  zauważyć,  że  kryteria  zgodności  stanowią  przypadek  szczególny  testów 

istotności, ponieważ nie uwzględniają prawdopodobieństwa błędu 2-go rodzaju. 

 
Kryterium  χ

2

  Pearsona  jako  kryterium  zgodności.  Niech 

n

x

...,

,

1

  będzie 

próbką z rozkładu o dystrybuancie nieznanej 

)

(x

F

. Należy zweryfikować hipotezę 

)

(

)

(

:

0

0

x

F

x

F

H

, gdzie 

)

(

0

x

F

 jest daną z  góry dystrybuantą. Dzielmy prostą rze-

czywistą  R  na  k  rozłącznych  przedziałów 

)

;

(

1

0

1

z

z



)

;

[

2

1

2

z

z

)

;

[

3

2

3

z

z

, ..., 

)

;

[

1



k

k

k

z

z

. Oznaczmy przez 

i

A

 zdarzenie polegające na 

tym,  że  wartość  ZL  teoretycznej 

  trafi  do  przedziału 

i

,  wówczas  mamy 

i

p

 

)

(

)

(

}

{

)

(

1

i

i

i

i

z

F

z

F

A

p

P

k

i

,

1

.  Oznaczmy  przez 

i

  liczbę  wartości 

próbki  co  trafili  do  przedziału 

i

,  tj.  liczbę  zajścia  zdarzenia 

i

A

  w  n  doświadcze-

niach. 

Załóżmy, że hipoteza 

0

H

 jest prawdziwa, tj. 

0

F

. Tym bardziej więc praw-

dziwa jest  hipoteza 

0

0

1

1

0

...,

,

:

k

k

p

p

p

p

H

, gdzie 

)

(

)

(

)

(

1

0

0

0

1

0

0

1

z

F

z

F

z

F

p

)

(

)

(

1

0

2

0

0

2

z

F

z

F

p

, ..., 

0

k

p

)

(

1

)

(

)

(

1

0

1

0

0

k

k

k

z

F

z

F

z

F

.  

Wówczas  zagadnienie  weryfikacji  hipotezy 

0

H

  sprowadza  się  do  weryfikacji 

hipotezy  sprawdzania  odpowiednich  prawdopodobieństw  w  schemacie  wielomiano-

wym.  Utwórzmy  statystykę 

k

i

i

i

i

np

np

1

2

2

)

(

,  której  rozkład  graniczny  przy 

n

 na  mocy twierdzenia  Pearsona zgadza się z rozkładem 

2

 o 

1

k

 stopniach 

background image

 

44

swobody.  Obliczamy,  więc, 

)

(

)

(

1

0

0

0

i

i

i

z

F

z

F

p

k

i

,

1

,  następnie  obliczamy 

wartość statystyki 

2

 przy założeniu prawdziwości hipotezy 

0

H

k

i

i

i

i

H

np

np

1

0

2

0

2

2
0

)

(

0

Znając  poziom  istotności 

,  znajdujemy  korzystając  z  tablic  rozkładu 

2

  od-

powiedni  kwantyl 

)

,

1

(

2

 k

.  Kryterium  weryfikacji  hipotezy 

0

H

  wygląda,  więc, 

następującą: 

jeżeli 

)

,

1

(

2

2
0

k

, to hipotezę 

0

H

 odrzucamy; 

jeżeli 

)

,

1

(

2

2
0

k

, to uważamy, że hipoteza 

0

H

 odpowiada danym próbki. 

 

Uwaga 1. W danym przypadku miarą odchylenia 

*

n

F

 od służy 

k

i

i

i

i

n

np

np

F

F

1

2

*

2

)

(

)

,

(

 
Uwaga 2. Na ile części i w jaki sposób należy dzielić prostą rzeczywistą? Istnie-

je  wiele  rekomendacji  co  do  tego  pytania.  M.  Kendall  i  J.  Stewart  proponują  skom-
plikowaną procedurą, w której przedziały wybierają w taki sposób, aby prawdopodo-

bieństwa  teoretyczne 

0

i

p

  były  równe  siebie 

k

p

p

k

1

...

0

0

1

.  Zwykle  postępują  w 

sposób prostszy, dzieląc przedział [

)

(

)

1

(

;

n

x

x

) na dostatecznie wielką liczbę przedzia-

łów  o  tej  samej  długości,  następnie  zakładają,  że 

2

,  ..., 

1

k

  są  częściami  we-

wnętrznymi takiego podziału, jako 

1

 wybierają sumę przedziału 

)

;

(

)

1

(

x



 i pierw-

szego  przedziału  otrzymanego  przy  podziale  [

)

(

)

1

(

;

n

x

x

),  jako 

n

  wybierają  sumę 

ostatniego otrzymanego przy podziale [

)

(

)

1

(

;

n

x

x

) przedziału i przedziału 

)

;

[

n

x

Polecono,  aby  dla  każdego 

i

  była  spełniona  nierówność 

5

0

i

np

.  Należy, 

więc, opracować algorytm zmiany podziału na 

i

 w tym przypadku, gdy podana nie-

równość nie jest spełniona dla wszystkich przedziałów. Podział prostej rzeczywistej i 
wspomniany algorytm należy opracować przed tym, jak będą znane dane próbki. Sto-
sowanie  podziału  i  algorytmy  do  konkretnej  próbki  prowadzi  do  tego,  że  końce  z

 

otrzymanych przedziałów będą funkcjami od 

n

x

...,

,

1

, tj. zmiennymi losowymi, na-

tomiast  twierdzenie  Pearsona  jest  prawdziwe  tylko  w  przypadku  podziału  prostej  z 
ustalonymi  końcami  przedziałów  (nie  zależnie  od  danych  próbki).  Załóżmy,  że  po-
przednie prosta rzeczywista została podzielona w podany wyżej sposób. Przykładem 

algorytmu  prawidłowego  podziału  spełniającego  warunek 

5

0

i

np

  jest  następujący: 

jeżeli  wskazany  warunek  jest  spełniony  w  przedziale 

1

,  ten  przedział  nie  ulega 

zmianie,  w  przypadku  przeciwnym  łączymy  ten  przedział  z 

2

.  Jeżeli  w  nowym 

background image

 

45

otrzymanym  przedziale  dany  warunek  wciąż  nie  będzie  spełniony,  łączymy  razem  

1

2

  i 

3

  itd.  dopóki  nierówność  nie  będzie  spełniona.  Otrzymujemy  w  końcu 

danej  procedury  nowy  przedział 

1

.  Dalej  bierzemy  następny  przedział  (po  nowym 

1

) i postępujemy w podobny sposób, łącząc go w razie potrzeby z następnymi prze-

działami, itd. Przy takim postępowaniu liczba przedziałów otrzymanych przy począt-
kowym podziale prostej albo zmniejsza się, albo zostanie bez zmian. 

 

Zauważmy,  że  z  kryterium 

2

  należy  korzystać  w  przypadku  próbek  o  dużej 

liczności.  Autorzy  rozważne polecają korzystać z tego kryterium,  gdy 

150

n

. Bar-

dziej odważne autorzy korzystają z niego, gdy 

30

n

  
Uwaga 3. Podejrzewamy, że ZL teoretyczna 

 spełnia rozkład normalny, które-

go parametry są nieznane. Wtedy słuszna jest weryfikacja hipotezy 

 

 

 ZL

:

0

H

ma rozkład 

2

0

s

x

N

Czy  możemy dla jej weryfikacji korzystać z kryterium 

2

? Można dowieść, że 

w  tym  przypadku  całą  procedura  pozostaje  w  mocy  z  wyjątkiem  tego,  że  wielkość 

)

,

1

(

2

 k

 należy zastąpić przez 

)

,

3

(

2

 k

. W przypadku ogólnym, jeżeli prób-

kę  tworzymy  przy  założeniu,  że  ZL  teoretyczna  ma  rozkład  o  dystrybuancie 

)

...,

,

(

1

0

m

x

F

, co zależy od parametrów nieznanych, to najpierw należy wyzna-

czyć  ich  estymatory 

m

ˆ

...,

,

ˆ

1

  (np.  za  pomocą  metody  największej  wiarygodności). 

Następnie  należy zweryfikować  hipotezę 

)

ˆ

...,

,

ˆ

(

)

(

 :

1

0

0

m

x

F

x

F

H

. Wówczas re-

zultat Pearsona pozostaje w mocy z wyjątkiem tego, że rozkładem granicznym staty-
styki 

k

i

i

i

i

np

np

1

2

2

)

(

 

będzie  rozkład 

2

  o 

1

 m

k

  stopniach  swobody.  Kryterium  Pearsona  w  danym 

przypadku  można,  więc,  stosować,  tylko  że  liczba  stopni  swobody  przy  obliczaniu 
odpowiedniej kwantyli zmniejsza się o m. Oczywiście, w przypadku tym liczba czę-
ści rozbicia prostej rzeczywistej musi być większa niż m

 

Kryterium zgodności ω

2

Stosowanie kryterium 

2

 polega na podziale prostej 

rzeczywistej na części w pewnym stopniu w sposób dowolny, co prowadzi do utraty 
części informacji a więc do tego, że wynik stosowania danego kryterium  może zale-
żeć od sposobu podziału. Rozważmy teraz kryterium swobodny od wskazanej wady. 

Przez H. Cramera, R. Mizesa i N. V. Smirnova wprowadzono następującą miarę 

odchylenia dystrybuanty empirycznej od dystrybuanty teoretycznej: 

background image

 

46



)

(

|

)

(

)

(

|

)

,

(

*

*

x

dK

x

F

x

F

F

F

n

n

gdzie 

)

(x

K

  jest  w  pewnym  sensie  dowolną  funkcją  niemalejącą.  N.  V.  Smirnov  w 

jakości 

)

(x

K

 zaproponował wziąć funkcję 

)

(x

F

, co prowadzi do miary 



)

(

|

)

(

)

(

|

*

2

x

dF

x

F

x

F

n

Jeżeli w ostatni wzór podstawić postać dystrybuanty empirycznej 

,

gdy 

   

,

1

.

..........

..........

..........

,

gdy 

  

,

2

,

gdy 

  

,

1

,

gdy 

  

,

0

)

(

)

(

)

3

(

)

2

(

)

2

(

)

1

(

)

1

(

*

n

n

x

x

x

x

x

n

x

x

x

n

x

x

x

F

 

to po obliczeniach (oblicz samodzielnie) otrzymujemy 

n

k

k

n

k

x

F

n

n

1

2

)

(

2

2

2

1

2

)

(

1

12

1

N.  V.  Smirnov  udowodnił,  że  w  przypadku  ciągłej  funkcji 

)

(x

F

  dla 

2

 n

W

n

 

istnieje granica 

}

{

}

{

lim

x

W

x

W

n

n

P

P

której wartość nie zależy od F. 

Istnieją  tablicy  rozkładu  ZL  granicznej  W,  z  których  możemy  znając  poziom 

istotności 

 wyznaczyć punkt krytyczny 

W

 spełniający warunek 

}

{

W

W

P

Niech poziom istotności 

 jest znany. Znajdziemy 

W

. Następnie obliczamy 

2

1

)

(

0

2

2

2
0

0

2

1

2

)

(

1

12

1

0

n

k

k

H

n

n

k

x

F

n

n

n

n

n

W

Kryterium weryfikacji hipotezy 

0

H

 wygląda następującą: 

jeżeli 

 W

W

n0

, to hipotezę 

)

(

)

(

0

x

F

x

F

 odrzucamy, 

jeżeli 

 W

W

n0

, to hipoteza 

)

(

)

(

0

x

F

x

F

 nie jest sprzeczna z danymi próbki.