background image

2013-05-14 

Metody   probabilistyczne 

 
 
 

Weryfikacja hipotez statystycznych 

Hipotezy nieparametryczne 

Część 2 

42 

Test sumy rang Kruskala Wallisa  

(rozwinięcie testu U Manna-Whitneya) 

Jeden z wygodniejszych i dość precyzyjnych testów nieparametrycznych 

dla wielu prób. 

Zastępuje, w pewnym zakresie, test analizy wariancji dla średnich 

(nie wymaga, aby populacje miały rozkład zbliżony do normalnego). 

 
Model 

– skala porządkowa 2 i więcej prób niezależnych 

Założenia

danych jest k 

populacji generalnych o dowolnych rozkładach z ciągłymi 

dystrybuantami F

1

(x), F

2

(x), ..., F

k

(x), 

z każdej populacji wylosowano niezależnie n

i

 

elementów do próby  

(i = 1, 2, ..., k), 

 
Formułowanie  hipotezy:
 

należy sprawdzić hipotezę, że wszystkie próby pochodzą z jednej 
populacji
H

0

 : F

1

(x) = F

2

(x)= ...= F

k

(x). 

 
Sposób postępowania:
 

wszystkim wynikom prób należy nadać rangi od 1 do n

dla każdej próby oddzielnie wyznacza się sumy rang R

i

background image

2013-05-14 

43 

Test sumy rang Kruskala Wallisa  

(rozwinięcie testu U Manna-Whitneya) 

Sprawdzian 

– wartość  statystyki: 

 

 

gdzie:             - oczekiwana suma rang,  
 

– liczba niezależnych prób, 

 

R

i

 

– suma rang i-tej próby, 

 

n

i

 

– liczebność i-tej próby  

 

Wnioskowanie: 

jeżeli hipoteza H

0

 

jest prawdziwa, to statystyka ta ma asymptotyczny rozkład 

2

 

k-1 stopniach swobody, 

jeżeli zachodzi nierówność 

2

 

≥ 

2

 

to hipotezę H

0

 odrzucamy  

– prawostronny obszar krytyczny 

 

Jeżeli występują  rangi wiązane:   

 
 
gdzie: t 

– liczba obiektów powiązanych daną rangą.  

2

1

2

2

1

1

1

12





n

n

R

n

n

n

i

i

k

i

i

1

3

1

12

1

2

2

n

n

R

n

n

k

i

i

i

2

1 /

n

n

i

k

i

i

n

n

1

 

n

n

t

t

n

n

R

n

n

k

i

i

i

3

3

1

2

2

1

1

3

1

12

można sprowadzić  do postaci prostszej: 

44 

Test sumy rang Kruskala Wallisa 

– skala porządkowa  

– 2 i więcej prób niezależnych - przykład 

Na poziomie istotności =0,05 należy ocenić zgodność ocen funkcjonowania 
transportu zbiorowego przez respondentów o różnym poziomie 
wykształcenia. 

Wykształcenie 

Rangi łączone 

Ś 

Ś 

54 

17 

13 

20 

33 

10 

60 

11 

22 

42 

47 

37 

15 

17 

13 

63 

26 

36 

24 

12 

40 

12 

61 

14 

23 

49 

22 

28 

18 

50 

43 

56 

19 

16 

21 

33 

27 

10 

19 

Suma R

121 

68 

111 

n

Suma R

i

/n

i  

2091,6  513,78  1540.1 

9

,

7

1

24

3

8

111

9

68

7

121

)

1

24

(

*

24

12

2

2

2

2





1

3

1

12

1

2

2

n

n

R

n

n

k

i

i

i

H

0

: oceny nie 

różnią się istotnie 

H

1

: oceny różnią się istotnie 

χ

2

0,05,(3-1)

=5,991 

Wniosek: 

H

0

 

należy odrzucić. 

Oceny różnią się istotnie 

background image

2013-05-14 

45 

Test sumy rang Kruskala Wallisa 

– skala porządkowa  

– 2 i więcej prób niezależnych - przykład 

Na poziomie istotności =0,05 należy ocenić zgodność ocen funkcjonowania 
transportu zbiorowego przez respondentów o różnym poziomie 
wykształcenia. 

Wykształcenie 

Rangi łączone 

Ś 

Ś 

54 

17 

13 

20 

33 

10 

60 

11 

22 

42 

47 

37 

15 

17 

13 

63 

26 

36 

24 

12 

40 

12 

61 

14 

23 

49 

22 

28 

18 

50 

43 

56 

19 

16 

21 

33 

27 

10 

19 

Suma R

121 

68 

111 

n

Suma R

i

/n

i  

2091,6  513,78  1540.1 

9

,

7

1

24

3

8

111

9

68

7

121

)

1

24

(

*

24

12

2

2

2

2





1

3

1

12

1

2

2

n

n

R

n

n

k

i

i

i

H

0

: oceny nie 

różnią się istotnie 

H

1

: oceny różnią się istotnie 

χ

2

0,05,(3-1)

=5,991 

Wniosek: 

H

0

 

należy odrzucić. 

Oceny różnią się istotnie 

46 

Test  mediany  

Stosuje się dla sprawdzania hipotezy, że dwie (lub więcej) próby pochodzą z 

jednej populacji, ale nie ma przyporządkowania wynikom jednej próby 

wyników drugiej próby. 

 
Model  - 

skala porządkowa - 2 i więcej prób niezależnych 

Założenia

dane są dwie populacje generalne o rozkładach z dowolnymi dystrybuantami 
F

1

(x) i F

2

(x), 

pobrano losowo dwie (trzy lub więcej) prób o liczebnościach n

1

 i n

(n

… )

 

(liczebności stosunkowo duże), 

Formułowanie  hipotezy: 

należy sprawdzić hipotezę, że obie próby pochodzą z jednej populacji;  
H

0

 : F

1

(x) = F

2

(x). 

 
Sposób postępowania:
 

z wyników obu prób utworzyć jeden ciąg niemalejący, ustawiając wyniki w 

kolejności rosnącej, 

wyznaczyć medianę me

pogrupować wyniki w tablicę: 

Wyniki 

> me 

≤ me 

Próba  1 
Próba  2 
Próba  3 

background image

2013-05-14 

47 

Test  mediany - 

skala porządkowa  

– 2 i więcej prób niezależnych 

Sprawdzian 

– statystyka: 

 

 

 

traktując tablicę wyników jak tablicę niezależności obliczyć wartość 
statystyki 

2

 

 

Wnioskowanie: 

odczytać z tablic rozkładu 

2

 

wartość krytyczną dla 

2

  

dla (r-1)*(s-

1) stopni swobody i zadanego poziomu istotności 

jeżeli zachodzi nierówność 

2

 >= 

2

 

to hipotezę H

0

 odrzucamy 

– prawostronny obszar krytyczny 

s

j

ij

ij

ij

r

i

n

n

n

1

'

2

'

1

2

48 

Test  mediany - 

skala porządkowa  

– 2 i więcej prób niezależnych - przykład 

Zbadać na poziomie istotności α=0,05 zależność czasu przejazdu linii  
w zależności od dnia tygodnia. 

Rozkład liczebności w punkcie mediany  M

e

 = 10: 

 

 

 

 

 

 

 

 

Wyniki 

> me 

≤ me 

Razem 

Roboczy 

11 

15 

Sobota 

14 

Niedziela 

10 

11 

Razem 

21 

19 

40 

556

,

10

225

,

5

40

11

19

1

 

...

 

125

,

7

40

15

19

11

875

,

7

40

15

21

4

2

2

1

2

'

2

'

1

2

s

j

ij

ij

ij

r

i

n

n

n

  

991

,

5

2

1

2

1

3

;

5

,

0

χ

2

 > χ

α

2

  

Wniosek: 

Hipotezę o niezależności czasu trwania kursu 

od dnia tygodnia należy odrzucić 

background image

2013-05-14 

49 

Testy zgodności  

 

Dwie próby zależne 

 

Test McNemara, 

Test znaków

Test znaków rangowanych Wilcoxona, 

 

50 

Próby zależne 

 

Charakteryzują się powtarzaniem pomiarów: 

przed i po zastosowaniu jakiegoś środka reklamowego, 

przed i po eksperymencie, 

 

Opisują sytuacje, gdy opinie jednych grup zależą od innych. 
 

Muszą być dokonywane na tych samych obiektach => próby są 
jednakowo liczne, 

background image

2013-05-14 

51 

Test McNemara 

Model  

– 2 próby zależne – skala nominalna 

 

 

Założenia: 

dane są dwie populacje generalne o dowolnych rozkładach badanej cechy, 

wylosowano dwie próby o licznościach odpowiednio n, 

Formułowanie  hipotezy: 

H

0

: nie zanotowano zmiany przed i po eksperymencie, 

 
Sposób postępowania: 

zbudować tablicę 4-polową 
  

obliczyć wartość statystyki χ

2

 
  

Wnioskowanie: 

zbudować prawostronny obszar krytyczny testu tak, aby: P{χ

2

≥χ

α

2

}=α 

dla stopni swobody  s=(k-1)*(r-1)=1 

 

jeżeli χ

≥ χ

α

2

, to hipotezę H

0

 

należy odrzucić, 

jeżeli χ

χ

α

2

, brak podstaw do odrzucenia hipotezy H

0

przed 

po 

nie 

A 

B 

tak 

C 

D 

B

C

B

C

2

2

1

52 

Test McNemara - 

przykład 

Zbadano opinie 100 pasażerów PKP. 20 osób deklarowało zakup nowego 

produktu, po reklamie zainteresowanie wzrosło do 60 osób.

 

Na poziomie 

istotności α=0,05 zweryfikować hipotezę, czy reklama wpłynęła na wzrost 

zakupów.

 

Hipoteza: reklama nie ma wpływu na zakupy produktu. 

 

Wniosek: 

H

0

 

należy odrzucić. Reklama 

wpłynęła istotnie na wzrost zakupów 

s=(2-1)*(2-1)=1  - liczba stopni swobody 
χ

2

0,05,1

=3,841 

przed 

po 

nie 

80 

40 

120 

tak 

20 

60 

80 

100 

100 

200 

 

02

,

6

40

20

1

40

20

1

2

2

2

B

C

B

C

background image

2013-05-14 

53 

Test znaków 

Służy do testowania hipotezy, że dwie próby pochodzą z jednej populacji. 

Ograniczenie 

– wyniki porównywanych dwu jednakowo licznych prób 

stanowią pary odpowiadających sobie wzajemnie liczb. 

 
Model 

– skala porządkowa – 2 próby zależne 

Założenia

dane są dwie populacje generalne o ciągłych dystrybuantach,  

wylosowano jednakową liczbę parami odpowiadających sobie n elementów, 

Formułowanie  hipotezy: 

należy sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji, 

tzn. hipotezę  H

0

 : F

1

(x) = F

2

(x)   wobec H

1

 : F

1

(x

) ≠ F

2

(x). 

Sposób postępowania: 

należy zbadać znak różnicy par wyników w obu próbach i określić liczbę r 

tych znaków, których jest mniej, 

Wnioskowanie: 

z tablic 

rozkładu liczby znaków odczytać dla ustalonego poziomu istotności 

 

i dla liczby par wyników n taką wartość r

, że P{ r ≤ r

α,n 

}= α  

– obszar krytyczny lewostronny

jeżeli r ≤ r

α,n

, to hipotezę H

0

 

należy odrzucić. 

54 

Test znaków - przykład 

Dla oceny wpływu szkolenia na technikę jazdy wylosowano 14 kierowców . 
Wyniki przedstawiono w tablicy: 

 

 

 

 

 

 

Na poziomie istotności α = 0,05 ocenić czy szkolenie miało wpływ na 
technikę jazdy. 

H

0

: technika jazdy przed i po szkoleniu nie uległa zmianie 

Dane:  n = 14, n

+

 = 10,  n

-

 = 3 => r = 3, 

r

0,05,14

 = 2   

r > r

α 

Przed 

50 

20 

25 

80 

50 

70 

70 

25 

70 

65 

80 

10 

60 

50 

Po 

60 

40 

40 

60 

40 

80 

80 

30 

90 

70 

60 

20 

80 

50 

Wniosek 

Nie ma podstaw do odrzucenia 

hipotezy o jednakowej technice jazdy 

przed i po szkoleniu. 

background image

2013-05-14 

55 

Test rangowanych znaków Wilcoxona   

Istotą testu jest rangowanie – nadanie kolejnych numerów, według 

rosnących wartości różnic dodatnich oraz ujemnych branych oddzielnie

Model 

– skala porządkowa – 2 próby zależne 

Założenia: 

dane są dwie populacje generalne o ciągłych dystrybuantach F

1

(x) i F

2

(x), 

wylosowano jednakową liczbę n elementów do dwu prób, których wyniki 
odpowiadają sobie parami, 

Formułowanie  hipotezy: 

należy zweryfikować hipotezę, że obie próby pochodzą z tej samej 
populacji, tzn. hipotezę H

0

 : F

1

(x) = F

2

(x). 

 
Sposób postępowania:
 

należy obliczyć różnice wyników obu prób dla wszystkich par wyników, 

nadać wartościom bezwzględnym różnic numery poczynając od 1 dla 
najmniejszej wartości, 

zapisać rangi w dwóch grupach, oddzielnie dla różnic dodatnich oraz 
ujemnych, 

sumując rangi w obu grupach uzyskuje się sumę rang R+ dla różnic 
dodatnich i sumę rang R- dla różnic ujemnych, 

56 

Test rangowanych znaków Wilcoxona   

– skala porządkowa – 2 próby zależne 

Sprawdzian  - statystyka 

znaleźć wartość statystyki R, jako mniejszą z tych dwu sum rang,  
tzn: R = min{ R+ ; R- }, 

 

Wnioskowanie: 

Obszar krytyczny lewostronny: 

P{ R ≤ R

 } = 

α 

Jeżeli R ≤ R

α

, to hipotezę H

0

 

należy odrzucić.  

 

 
Jeżeli n>25 należy skorzystać z granicznego rozkładu normalnego N( μ

R

R

 ), 

gdzie:  

 

 

Statystyka:  

4

1

n

n

R

 

24

1

2

1

n

n

n

R

R

R

R

U

background image

2013-05-14 

57 

Test rangowanych znaków Wilcoxona   

– skala porządkowa – 2 próby zależne - przykład 

Na poziomie istotności α = 0,05 ocenić wpływ reklamy na sprzedaż nowego 
produktu. W tabeli przedstawiono wyniki oceny 11 respondentów 
przedstawiono w tabeli. 

 

 

 

 

 

 

 

 

 

∑R+ = 26,    ∑R- = 29  => min{R+, R-} = 26 

Z tablic znaków rangowanych dla n=11  i α = 0,05   R

α

 = 11 

Przed 

15 

20 

11 

25 

32 

18 

22 

25 

30 

Σ 

Po 

18 

15 

12 

15 

16 

22 

26 

20 

20 

20 

30 

znaki 

wartość 

-5 

-3 

-6 

-2 

-5 

Rangi+ 

3,5 

5,5 

5,5 

10 

1,5 

26 

Rangi- 

7,5 

3,5 

1,5 

7,5 

29 

Wniosek 

Nie ma podstaw do odrzucenia H

0

.  

Reklama nie wpłynęła na wzrost sprzedaży. 

58 

Testy zgodności  

 

Trzy i więcej prób zależnych 

 

Test Q Cochrana, 

Test ANOVA Friedmana z rangami, 

 

background image

2013-05-14 

10 

59 

Test  Q Cochrana  

Uogólnienie testu McNemary. 

Stosuje się dla sprawdzania hipotezy: 

o postawach pod wpływem wielokrotnie powtarzanego bodźca, albo  

dla dokonania dychotomicznego podziału zbiorowości respondentów 

odpowiadających „tak” lub „nie” na kolejne pytania. 

Zmienna dychotomiczna 

przyjmuje wartości 1 lub 0. 

 
Model  -  skala nominalna  - 

2 i więcej prób zależnych 

Założenia

wyniki obserwacji (odpowiedzi na kolejne pytania) zapisać w tablicy o liczbie 

wierszy odpowiadającej liczbie przebadanych obiektów i liczbie kolumn 

równej liczbie pomiarów zmiennej zależnej, 

liczba wierszy powinna być duża. 

 

Formułowanie  hipotezy: 

należy sprawdzić hipotezę, że próby pochodzą z jednej populacji;  
H

0

 : F

1

(x) = F

2

(x

) = … F

n

(x). 

60 

Test  Q Cochrana -  skala nominalna  

– 2 i więcej prób zależnych 

Statystyka: 

 
 
 
 

gdzie: C

j

 

– liczba jedynek j-tej kolumnie, 

 

 

C

sr

 

– średnia z C

j

,  

 

 

R

i

 

– liczba jedynek w i-tym wierszu, 

 

 

– liczba pomiarów zmiennej zależnej, 

 

 

– liczba obiektów. 

 

Wnioskowanie: 

odczytać z tablic rozkładu 

2

 

wartość krytyczną dla 

α

2

 dla (k-1) stopni 

swobody i zadanego poziomu istotności 

jeżeli zachodzi nierówność 

2

 

≥ 

α

2

 

to hipotezę H

0

 odrzucamy. 

P{

2

 

≥ 

α

2

}=α   - prawostronny obszar krytyczny. 

n

i

i

n

i

i

k

j

k

j

j

j

n

n

i

i

k

j

sr

j

R

R

k

C

C

k

k

R

k

R

C

C

k

k

Q

1

2

1

1

2

1

2

1

1

2

1

1

background image

2013-05-14 

11 

61 

Test  Q Cochrana -  skala nominalna  

– 2 i więcej prób zależnych - przykład 

Zbadano wpływ reklamy na zmiany sprzedaży w 10 sklepach, na podstawie 

3 pomiarów: przed, w trakcie i po akcji reklamowej.  

Poziom istotności α = 0,05. Oznaczenia: 0 – spadek, 1 – wzrost sprzedaży. 

H

0

: reklama nie wpłynęła na wielkość sprzedaży. 

Lp. 

przed 

w czasie 

po 

Razem 

R

i

10 

∑ 

10 

20 

44 

C

j

64 

100 

168 

α = 0,05, 

 

k=3,  

χ

α

2

= 5,991 

n

i

i

n

i

i

k

j

k

j

j

j

R

R

k

C

C

k

k

Q

1

2

1

1

2

1

2

1

13

16

208

44

20

3

20

168

3

1

3

2

Q

Wniosek: 

H

0

 

należy odrzucić. 

Reklama istotnie wpłynęła na 

zmiany w wielkości sprzedaży 

62 

Test  ANOVA Friedmana z rangami 

Rozwinięcie testu Wilcoxona. Jest on nieparametryczną alternatywą analizy 
wariancji dla klasyfikacji pojedynczej z powtarzanymi pomiarami zmiennej 
zależnej.  

Służy do sprawdzania hipotezy, czy k≥2 prób losowych zależnych pochodzi 
z jednej populacji. 

Rozkład populacji może być dowolny, ale ciągły. 

 

Model -  

skala porządkowa – 2 i więcej prób zależnych 

Założenia

wyniki obserwacji (odpowiedzi na kolejne pytania) zapisać w tablicy o liczbie 
wierszy odpowiadającej liczbie przebadanych obiektów i liczbie kolumn 
równej liczbie pomiarów zmiennej zależnej. 

 
Formułowanie  hipotezy:
 

należy sprawdzić hipotezę, że wszystkie próby pochodzą z jednej populacji;  
H

0

 : F

1

(x) = F

2

(x

) = … = F

k

(x). 

background image

2013-05-14 

12 

63 

Test  ANOVA Friedmana z rangami-  

skala porządkowa  

– 2 i więcej prób zależnych 

Statystyka: 

 

 

gdzie: R

j

 

– suma rang dla j-tego pomiaru, 

 

 

– liczba porównywanych elementów, 

 

 

– liczba pomiarów, 

Wnioskowanie: 

odczytać z tablic rozkładu 

2

 

wartość krytyczną dla 

α

2

 dla (k-1) stopni swobody 

i zadanego poziomu istotności 

jeżeli zachodzi nierówność 

2

 >= 

α

2

 

to hipotezę H

0

 odrzucamy, 

jeżeli zachodzi nierówność 

2

 < 

α

2

 to nie ma podstaw do odrzucenia hipotezy, 

że k prób (k≥2) losowych pochodzi z jednej populacji. 

Jeżeli występują rangi wiązane:   
 

 

gdzie:  

 

– t

j

 - 

liczba rang w każdej grupie rang powiązanych dla i-tego wiersza. 

1

3

1

12

1

2

2

k

n

R

k

k

n

k

j

j

1

1

1

3

1

12

2

1

1

2

2

k

nk

T

k

n

R

k

nk

r

i

i

k

j

j

i

i

i

t

t

T

3

64 

Test  ANOVA Friedmana z rangami-  

skala porządkowa  

– 2 i więcej prób zależnych 

Na czterech  automatach  produkowano  uszczelki.  W sposób  losowy  wybrano  dni 
tygodnia  i w pewnym  miesiącu  ustalono  liczbę  uszczelek  wadliwych  z każdego 
automatu.  Zweryfikować  hipotezę,  że automaty  istotnie  różnią  się ze wzgl.na  liczbę 
produkowanych  wadliwych  uszczelek. 

Automat 

Rangi 

i 

1  2  3  4 

1 

2 

3 

4 

1  5  3  4  5 

3,5 

3,5 

2  4  7  5  5 

2,5 

2,5 

3  6  5  3  7 

4  6  6  6  7 

5  9  9  5  6 

3,5 

3,5 

6  7  8  6  8 

3,5 

3,5 

R

j

 

15 

16 

9,5 

19,5 

R

j

225  256  90,25  380,25  951,5 

n=6,  k=4,  

α=0,05  χ

,k-1

2

=7,815 

1

1

1

3

1

12

2

1

1

2

2

k

nk

T

k

n

R

k

nk

r

i

i

k

j

j

t

T

i

 

24 

48 

942

,

5

1

4

4

6

48

1

1

4

6

3

5

,

951

1

4

4

6

12

2

2

Wniosek: 

Nie ma podstaw do odrzucenia H

0

 

Automaty nie odbiegają istotnie od 

siebie w produkcji wadliwych 

uszczelek. 

 

Rangi dla każdego pomiaru 

i

i

i

t

t

T

3

background image

2013-05-14 

13 

65 

Test  ANOVA Friedmana z rangami-  

skala porządkowa  

– 2 i więcej prób zależnych 

Na czterech  automatach  produkowano  uszczelki.  W sposób  losowy  wybrano  dni 
tygodnia  i w pewnym  miesiącu  ustalono  liczbę  uszczelek  wadliwych  z każdego 
automatu.  Zweryfikować  hipotezę,  że automaty  istotnie  różnią  się ze wzgl.na  liczbę 
produkowanych  wadliwych  uszczelek. 

Automat 

Rangi 

i 

1  2  3  4 

1 

2 

3 

4 

1  5  3  4  5 

3,5 

3,5 

2  4  7  5  5 

2,5 

2,5 

3  6  5  3  7 

4  6  6  6  7 

5  9  9  5  6 

3,5 

3,5 

6  7  8  6  8 

3,5 

3,5 

R

j

 

15 

16 

9,5 

19,5 

R

j

225  256  90,25  380,25  951,5 

n=6,  k=4,  

α=0,05  χ

,k-1

2

=7,815 

1

1

1

3

1

12

2

1

1

2

2

k

nk

T

k

n

R

k

nk

r

i

i

k

j

j

t

T

i

 

24 

48 

942

,

5

1

4

4

6

48

1

1

4

6

3

5

,

951

1

4

4

6

12

2

2

Wniosek: 

Nie ma podstaw do odrzucenia H

0

 

Automaty nie odbiegają istotnie od 

siebie w produkcji wadliwych 

uszczelek.