plik

2013-05-14

Test sumy rang Kruskala Wallisa

(rozwinięcie testu U Manna-Whitneya)

Sprawdzian

– wartość statystyki:



gdzie: - oczekiwana suma rang,

– liczba niezależnych prób,

– suma rang i-tej próby,

– liczebność i-tej próby

Wnioskowanie:



jeżeli hipoteza H

jest prawdziwa, to statystyka ta ma asymptotyczny rozkład



o k-1 stopniach swobody,



jeżeli zachodzi nierówność



≥





to hipotezę H

odrzucamy

– prawostronny obszar krytyczny

Jeżeli występują rangi wiązane:

gdzie: t

– liczba obiektów powiązanych daną rangą.

























































1 /















 

















można sprowadzić do postaci prostszej:

Test sumy rang Kruskala Wallisa

– skala porządkowa

– 2 i więcej prób niezależnych - przykład



Na poziomie istotności =0,05 należy ocenić zgodność ocen funkcjonowania
transportu zbiorowego przez respondentów o różnym poziomie
wykształcenia.

Wykształcenie

Rangi łączone

Suma R

121

111

Suma R

2091,6 513,78 1540.1





111

121

)

(















































: oceny nie

różnią się istotnie

: oceny różnią się istotnie

0,05,(3-1)

=5,991

Wniosek:

należy odrzucić.

Oceny różnią się istotnie

2013-05-14

Test sumy rang Kruskala Wallisa

– skala porządkowa

– 2 i więcej prób niezależnych - przykład



Na poziomie istotności =0,05 należy ocenić zgodność ocen funkcjonowania
transportu zbiorowego przez respondentów o różnym poziomie
wykształcenia.

Wykształcenie

Rangi łączone

Suma R

121

111

Suma R

2091,6 513,78 1540.1





111

121

)

(















































: oceny nie

różnią się istotnie

: oceny różnią się istotnie

0,05,(3-1)

=5,991

Wniosek:

należy odrzucić.

Oceny różnią się istotnie

Test mediany



Stosuje się dla sprawdzania hipotezy, że dwie (lub więcej) próby pochodzą z

jednej populacji, ale nie ma przyporządkowania wynikom jednej próby

wyników drugiej próby.

Model -

skala porządkowa - 2 i więcej prób niezależnych

Założenia:



dane są dwie populacje generalne o rozkładach z dowolnymi dystrybuantami
F

(x) i F

(x),



pobrano losowo dwie (trzy lub więcej) prób o liczebnościach n

i n

… )

(liczebności stosunkowo duże),

Formułowanie hipotezy:



należy sprawdzić hipotezę, że obie próby pochodzą z jednej populacji;
H

: F

(x) = F

(x).

Sposób postępowania:



z wyników obu prób utworzyć jeden ciąg niemalejący, ustawiając wyniki w

kolejności rosnącej,



wyznaczyć medianę me,



pogrupować wyniki w tablicę:

Wyniki

> me

≤ me

Próba  1
Próba  2
Próba  3

2013-05-14

Test mediany -

skala porządkowa

– 2 i więcej prób niezależnych



Sprawdzian

– statystyka:



traktując tablicę wyników jak tablicę niezależności obliczyć wartość
statystyki



Wnioskowanie:



odczytać z tablic rozkładu



wartość krytyczną dla





dla (r-1)*(s-

1) stopni swobody i zadanego poziomu istotności





jeżeli zachodzi nierówność





to hipotezę H

odrzucamy

– prawostronny obszar krytyczny















Test mediany -

skala porządkowa

– 2 i więcej prób niezależnych - przykład



Zbadać na poziomie istotności α=0,05 zależność czasu przejazdu linii
w zależności od dnia tygodnia.



Rozkład liczebności w punkcie mediany M

= 10:

Wyniki

> me

≤ me

Razem

Roboczy

Sobota

Niedziela

Razem





556

225

...

125

875



































































  

991

;







> χ

Wniosek:

Hipotezę o niezależności czasu trwania kursu

od dnia tygodnia należy odrzucić

2013-05-14

Test McNemara

Model

– 2 próby zależne – skala nominalna

Założenia:



dane są dwie populacje generalne o dowolnych rozkładach badanej cechy,



wylosowano dwie próby o licznościach odpowiednio n,

Formułowanie hipotezy:



: nie zanotowano zmiany przed i po eksperymencie,

Sposób postępowania:



zbudować tablicę 4-polową



obliczyć wartość statystyki χ

Wnioskowanie:



zbudować prawostronny obszar krytyczny testu tak, aby: P{χ

≥χ

}=α

dla stopni swobody s=(k-1)*(r-1)=1



jeżeli χ

≥ χ

, to hipotezę H

należy odrzucić,



jeżeli χ

, brak podstaw do odrzucenia hipotezy H

przed

nie

tak













Test McNemara -

przykład



Zbadano opinie 100 pasażerów PKP. 20 osób deklarowało zakup nowego

produktu, po reklamie zainteresowanie wzrosło do 60 osób.

Na poziomie

istotności α=0,05 zweryfikować hipotezę, czy reklama wpłynęła na wzrost

zakupów.



Hipoteza: reklama nie ma wpływu na zakupy produktu.

Wniosek:

należy odrzucić. Reklama

wpłynęła istotnie na wzrost zakupów

s=(2-1)*(2-1)=1 - liczba stopni swobody
χ

0,05,1

=3,841

przed

nie

120

tak

100

200



 



















2013-05-14

Test znaków

Służy do testowania hipotezy, że dwie próby pochodzą z jednej populacji.



Ograniczenie

– wyniki porównywanych dwu jednakowo licznych prób

stanowią pary odpowiadających sobie wzajemnie liczb.

Model

– skala porządkowa – 2 próby zależne

Założenia:



dane są dwie populacje generalne o ciągłych dystrybuantach,



wylosowano jednakową liczbę parami odpowiadających sobie n elementów,

Formułowanie hipotezy:



należy sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji,

tzn. hipotezę H

: F

(x) = F

(x) wobec H

: F

) ≠ F

(x).

Sposób postępowania:



należy zbadać znak różnicy par wyników w obu próbach i określić liczbę r

tych znaków, których jest mniej,

Wnioskowanie:



z tablic

rozkładu liczby znaków odczytać dla ustalonego poziomu istotności



i dla liczby par wyników n taką wartość r



, że P{ r ≤ r

α,n

}= α

– obszar krytyczny lewostronny,



jeżeli r ≤ r

α,n

, to hipotezę H

należy odrzucić.

Test znaków - przykład



Dla oceny wpływu szkolenia na technikę jazdy wylosowano 14 kierowców .
Wyniki przedstawiono w tablicy:



Na poziomie istotności α = 0,05 ocenić czy szkolenie miało wpływ na
technikę jazdy.



: technika jazdy przed i po szkoleniu nie uległa zmianie



Dane: n = 14, n

= 10, n

= 3 => r = 3,



0,05,14

= 2



r > r

Przed

Wniosek

Nie ma podstaw do odrzucenia

hipotezy o jednakowej technice jazdy

przed i po szkoleniu.

2013-05-14

Test rangowanych znaków Wilcoxona

Istotą testu jest rangowanie – nadanie kolejnych numerów, według

rosnących wartości różnic dodatnich oraz ujemnych branych oddzielnie.

Model

– skala porządkowa – 2 próby zależne

Założenia:



dane są dwie populacje generalne o ciągłych dystrybuantach F

(x) i F

(x),



wylosowano jednakową liczbę n elementów do dwu prób, których wyniki
odpowiadają sobie parami,

Formułowanie hipotezy:



należy zweryfikować hipotezę, że obie próby pochodzą z tej samej
populacji, tzn. hipotezę H

: F

(x) = F

(x).

Sposób postępowania:



należy obliczyć różnice wyników obu prób dla wszystkich par wyników,



nadać wartościom bezwzględnym różnic numery poczynając od 1 dla
najmniejszej wartości,



zapisać rangi w dwóch grupach, oddzielnie dla różnic dodatnich oraz
ujemnych,



sumując rangi w obu grupach uzyskuje się sumę rang R+ dla różnic
dodatnich i sumę rang R- dla różnic ujemnych,

Test rangowanych znaków Wilcoxona

– skala porządkowa – 2 próby zależne

Sprawdzian - statystyka



znaleźć wartość statystyki R, jako mniejszą z tych dwu sum rang,
tzn: R = min{ R+ ; R- },

Wnioskowanie:



Obszar krytyczny lewostronny:

P{ R ≤ R



} =



Jeżeli R ≤ R

, to hipotezę H

należy odrzucić.

Jeżeli n>25 należy skorzystać z granicznego rozkładu normalnego N( μ

,σ

gdzie:

Statystyka:















 





















2013-05-14

Test rangowanych znaków Wilcoxona

– skala porządkowa – 2 próby zależne - przykład



Na poziomie istotności α = 0,05 ocenić wpływ reklamy na sprzedaż nowego
produktu. W tabeli przedstawiono wyniki oceny 11 respondentów
przedstawiono w tabeli.



∑R+ = 26, ∑R- = 29 => min{R+, R-} = 26



Z tablic znaków rangowanych dla n=11 i α = 0,05 R

= 11

Przed

znaki

wartość

-5

-3

-6

-2

-5

Rangi+

3,5

5,5

1,5

Rangi-

7,5

3,5

1,5

7,5

Wniosek

Nie ma podstaw do odrzucenia H

Reklama nie wpłynęła na wzrost sprzedaży.

Testy zgodności

Trzy i więcej prób zależnych



Test Q Cochrana,



Test ANOVA Friedmana z rangami,

2013-05-14

Test Q Cochrana



Uogólnienie testu McNemary.



Stosuje się dla sprawdzania hipotezy:



o postawach pod wpływem wielokrotnie powtarzanego bodźca, albo



dla dokonania dychotomicznego podziału zbiorowości respondentów

odpowiadających „tak” lub „nie” na kolejne pytania.



Zmienna dychotomiczna

przyjmuje wartości 1 lub 0.

Model - skala nominalna -

2 i więcej prób zależnych

Założenia:



wyniki obserwacji (odpowiedzi na kolejne pytania) zapisać w tablicy o liczbie

wierszy odpowiadającej liczbie przebadanych obiektów i liczbie kolumn

równej liczbie pomiarów zmiennej zależnej,



liczba wierszy powinna być duża.

Formułowanie hipotezy:



należy sprawdzić hipotezę, że próby pochodzą z jednej populacji;
H

: F

(x) = F

) = … F

(x).

Test Q Cochrana - skala nominalna

– 2 i więcej prób zależnych

Statystyka:

gdzie: C

– liczba jedynek j-tej kolumnie,

– średnia z C

– liczba jedynek w i-tym wierszu,

– liczba pomiarów zmiennej zależnej,

– liczba obiektów.

Wnioskowanie:



odczytać z tablic rozkładu



wartość krytyczną dla



dla (k-1) stopni

swobody i zadanego poziomu istotności





jeżeli zachodzi nierówność



≥



to hipotezę H

odrzucamy.





≥



}=α - prawostronny obszar krytyczny.



































































2013-05-14

Test Q Cochrana - skala nominalna

– 2 i więcej prób zależnych - przykład



Zbadano wpływ reklamy na zmiany sprzedaży w 10 sklepach, na podstawie

3 pomiarów: przed, w trakcie i po akcji reklamowej.

Poziom istotności α = 0,05. Oznaczenia: 0 – spadek, 1 – wzrost sprzedaży.



: reklama nie wpłynęła na wielkość sprzedaży.

Lp.

przed

w czasie

Razem

∑

100

168

α = 0,05,

k=3,

= 5,991















































208

168















Wniosek:

należy odrzucić.

Reklama istotnie wpłynęła na

zmiany w wielkości sprzedaży

Test ANOVA Friedmana z rangami



Rozwinięcie testu Wilcoxona. Jest on nieparametryczną alternatywą analizy
wariancji dla klasyfikacji pojedynczej z powtarzanymi pomiarami zmiennej
zależnej.



Służy do sprawdzania hipotezy, czy k≥2 prób losowych zależnych pochodzi
z jednej populacji.



Rozkład populacji może być dowolny, ale ciągły.

Model -

skala porządkowa – 2 i więcej prób zależnych

Założenia:



wyniki obserwacji (odpowiedzi na kolejne pytania) zapisać w tablicy o liczbie
wierszy odpowiadającej liczbie przebadanych obiektów i liczbie kolumn
równej liczbie pomiarów zmiennej zależnej.

Formułowanie hipotezy:



należy sprawdzić hipotezę, że wszystkie próby pochodzą z jednej populacji;
H

: F

(x) = F

) = … = F

(x).

2013-05-14

Test ANOVA Friedmana z rangami-

skala porządkowa

– 2 i więcej prób zależnych

Statystyka:

gdzie: R

– suma rang dla j-tego pomiaru,

– liczba porównywanych elementów,

– liczba pomiarów,

Wnioskowanie:



odczytać z tablic rozkładu



wartość krytyczną dla



dla (k-1) stopni swobody

i zadanego poziomu istotności





jeżeli zachodzi nierówność



to hipotezę H

odrzucamy,



jeżeli zachodzi nierówność



to nie ma podstaw do odrzucenia hipotezy,

że k prób (k≥2) losowych pochodzi z jednej populacji.

Jeżeli występują rangi wiązane:

gdzie:

– t

liczba rang w każdej grupie rang powiązanych dla i-tego wiersza.





























































Test ANOVA Friedmana z rangami-

skala porządkowa

– 2 i więcej prób zależnych



Na czterech  automatach  produkowano  uszczelki.  W sposób  losowy  wybrano  dni
tygodnia  i w pewnym  miesiącu  ustalono  liczbę  uszczelek  wadliwych  z każdego
automatu.  Zweryfikować  hipotezę,  że automaty  istotnie  różnią  się ze wzgl.na  liczbę
produkowanych  wadliwych  uszczelek.

Automat

Rangi

1 2 3 4

1 5 3 4 5

3,5

2 4 7 5 5

2,5

3 6 5 3 7

4 6 6 6 7

5 9 9 5 6

3,5

6 7 8 6 8

3,5

9,5

19,5

225 256 90,25 380,25 951,5

n=6, k=4,

α=0,05 χ



,k-1

=7,815









































942

951























Wniosek:

Nie ma podstaw do odrzucenia H

Automaty nie odbiegają istotnie od

siebie w produkcji wadliwych

uszczelek.

Rangi dla każdego pomiaru







2013-05-14

Test ANOVA Friedmana z rangami-

skala porządkowa

– 2 i więcej prób zależnych



Automat

Rangi

1 2 3 4

1 5 3 4 5

3,5

2 4 7 5 5

2,5

3 6 5 3 7

4 6 6 6 7

5 9 9 5 6

3,5

6 7 8 6 8

3,5

9,5

19,5

225 256 90,25 380,25 951,5

n=6, k=4,

α=0,05 χ



,k-1

=7,815









































942

951























Wniosek:

Nie ma podstaw do odrzucenia H

Automaty nie odbiegają istotnie od

siebie w produkcji wadliwych

uszczelek.