background image

Jednoczynnikowa analiza 

wariancji – podejście 

eksploracyjne a podejście 

konfirmacyjne

Wykład 3

background image

Badanie 1 – 

z Nieformalnego Słownika XXI wieku. 

• After (ka): impreza, a raczej miejsce zgonu najbardziej 

zagorzałych imprezowiczów. miejsce otwierane zazwyczaj w 

godzinach wczesno porannych (4-6 rano), gdzie 

nieprzytomna młodzież czeka, aż będzie mogła wyglądać na 

tyle normalnie, aby wrócić do swoich domów

• Before(ka): To rodzaj aktywności "przed", czyli spotkanie w 

gronie uczestników planowanego wyjścia, nim wyruszymy na 

podbój lokalnych imprezowni. Często odbywa się w domu lub 

innym przyjemnym lokalu. Jest miłym złego początkiem   i 

często kończy się afterkiem. Zdarza się często, że beforka 

zamienia się przedwcześnie w afterkę, co bywa kłopotliwe 

zwłaszcza dla osoby udzielającej miejsca na taką beforkę.  

• Clubbing – nocna piesza wędrówka w terenie miejskim, 

zwykle od klubu do klubu, połączona zwykle ze wzrostem 

poziomu endorfin w mózgu na skutek rozmaitych aktywności 

fizycznych (w tym tańca) oraz zażywania rozmaitych 

substancji (w tym kanapek)

background image

Badanie 1 – poziom endorfin

• Badacz postanowił sprawdzić, kiedy poziom 

endorfin jest najwyższy. Zastosował więc 

obserwację uczestniczącą i zmierzył 

endorfiny będą na jednej beforce, jednej 

afterce oraz podczas clubbingu. Ponieważ 

poziom endorfin oznacza się w krwi, badacz 

postanowił nie być okrrrrrutnym wampirem i 

dokonywał tylko jednego pomiaru  danej 

osoby (wyodrębnił więc trzy grupy osób). 

• Zmienne: niezależna – rodzaj imprezy, 

zależna – poziom endorfin. Grupy były mało 

liczne (każda 10 osób). 

background image

Dane i wykonanie analizy 

wariancji

Definiujemy zmienne – 

czynnik to zmienna 

jakościowa – zmienna 

zależna musi być ilościowa

background image

Wyniki

Test jednorodności wariancji

endorfiny

3,459

2

27

,046

Test Levene'a

df1

df2

Istotność

Jednoczynnikowa ANOVA

endorfiny

3726,667

2 1863,333

3,612

,041

13929,200

27

515,896

17655,867

29

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

endorfiny

10 102,6000
10 119,6000 119,6000
10

129,6000

,106

,334

10 102,6000
10 119,6000 119,6000
10

129,6000

,106

,334

impreza
beforka
afterka
clubbing
Istotność
beforka
afterka
clubbing
Istotność

Test
Studenta-Newmana-
Keulsa

a

Test Duncana

a

N

1

2

Podzbiór dla alfa = .05

Wyświetlane są średnie dla grup jednorodnych.

Wykorzystywana jest średnia harmoniczna wielkości próby = 10,000.

a. 

Testujemy założenie o jednorodności wariancji

Wariancje niejednorodne 

Są różnice! 

F(2, 27)=3,612; p<0,05

Testy post hoc pokazują, że osoby na beforce

 mają niższy poziom endorfin 

niż Ci podczas clubbingu

background image

Opisujemy wyniki – Badanie 1A

Rodzaj imprezy

beforka

clubbing

afterka

Średni poziom 

endorfin

 

102,6

a

129,6 

b

119,6 

ab

W opisie wyników 
wykonujemy tabelkę ze 
średnimi i indeksujemy je

Grupa badanych z afterki ma średni 

poziom endrofin nie różniący się od 

pozostałych grup więc jest oznaczona 

podwójnym indeksem

background image

Beforka po afterce? – Dlaczego dobrze 

jest oglądać zmienne PRZED analizą?

background image

Oglądamy wykres 

skrzynkowy

Testy normalności rozkładu

,155

10

,200*

,969

10

,886

,196

10

,200*

,946

10

,626

,308

10

,008

,693

10

,001

impreza
beforka
clubbing
afterka

endorfiny

Statystyka

df

Istotność Statystyka

df

Istotność

Kołmogorow-Smirnow

a

Shapiro-Wilk

Dolna granica rzeczywistej istotności.

*. 

Z poprawką istotności Lillieforsa

a. 

Uwaga na dewiantów

background image

Usuwamy dewianta

Testy normalności rozkładu

,155

10

,200*

,969

10

,886

,196

10

,200*

,946

10

,626

,178

9

,200*

,965

9

,846

impreza
beforka
clubbing
afterka

endorfiny

Statystyka

df

Istotność Statystyka

df

Istotność

Kołmogorow-Smirnow

a

Shapiro-Wilk

Dolna granica rzeczywistej istotności.

*. 

Z poprawką istotności Lillieforsa

a. 

background image

Wyniki po usunięciu dewianta

Test jednorodności wariancji

endorfiny

7,417

2

26

,003

Test Levene'a

df1

df2

Istotność

Jednoczynnikowa ANOVA

endorfiny

4962,028

2 2481,014

22,192

,000

2906,800

26

111,800

7868,828

28

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

endorfiny

10 102,6000
10

129,6000

9

130,6667

1,000

,826

10 102,6000
10

129,6000

9

130,6667

1,000

,826

10 102,6000
10

129,6000

9

130,6667

1,000

,976

impreza
beforka
clubbing
afterka
Istotność
beforka
clubbing
afterka
Istotność
beforka
clubbing
afterka
Istotność

Test
Studenta-Newmana-
Keulsa

a,b

Test Duncana

a,b

Test Scheffe

a,b

N

1

2

Podzbiór dla alfa = .05

Wyświetlane są średnie dla grup jednorodnych.

Wykorzystywana jest średnia harmoniczna wielkości próby = 9,643.

a. 

Liczebności grup nie są równe. Użyta została średnia harmoniczna
liczebności grup. Poziom błędu I rodzaju nie jest zagwarantowany.

b. 

Testujemy założenie o jednorodności wariancji

Wariancje wciąż niejednorodne 

Są różnice! 

F(2, 26)=22,192; p<0,05

Efekt znacznie silniejszy!!

Testy post hoc pokazują inny wzorzec.

Osoby na beforce

 mają niższy poziom endorfin 

niż Ci podczas clubbingu i afterki. 

background image

Opisujemy wyniki – Badanie 1B

Rodzaj imprezy

beforka

clubbing

afterka

Średni poziom 

endorfin

 

102,6

a

129,6

b

130,6

b

W opisie wyników 
wykonujemy tabelkę ze 
średnimi i indeksujemy 
je.

Grupa badanych z afterki ma średni 

poziom endrofin nie różniący się od 

pozostałych grup więc jest oznaczona 

podwójnym indeksem

background image

Istotność  i jej związek z liczbą osób 

badanych

Im więcej osób badanych tym mniejszy 
poziom istotności. Tak więc sam poziom 
istotności nie jest dobrą miarą porównań 
badań robionych na różnych ilościach osób 
badanych. 

Aby porównywać wyniki pochodzące z 
różnych badań potrzebna jest statystyka 
niezależna od liczby osób.

background image

R

2

 – procent wyjaśnionej wariancji

R

2

 = SS między/ SS całkowita

R

2

 

Mając zatem standardowy zapis APA możemy 
obliczyć ile wynosi R

2

, które informuje nas jaki 

zakres zmienności zmiennej zależnej wyjaśnia 
nasz czynnik - zależy nam oczywiście na tym, 
żeby czynnik wyjaśniał jak najwięcej wariancji, 
czyli 100%. 
Przykład:  F (2, 90)= 4; p<0,05

(F) (df 
między) 

(F) (df między) + df 
wewnątrz

background image

Siła efektu

R

2

=0,21 

21% wyjaśnionej wariancji

R

2

=0,60 

60% wyjaśnionej wariancji

Badanie 1A

F(2, 27)=3,612; p<0,05

Badanie 1B

F(2, 26)=22,192; p<0,05

W badaniu po usunięciu dewianta maleje ilość wariancji całkowitej – 
tej którą chcemy wyjaśnić. Na tym tle udaje nam się wyjaśnić więcej 
niż przed usunięciem dewianta. 

background image

Istotność  i jej związek z liczbą osób badanych- 

wydruki

R

2

= SS między/ SS całkowita

Wydruk 1 - 30 osób: R

2

=3726/17655=0,21    21%

Wydruk 2 – 71 osób R

2

=11180/52967=0,21   21%

Jednoczynnikowa ANOVA

endorfiny

11180,000

2 5590,000

11,638

,000

41787,600

87

480,317

52967,600

89

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Jednoczynnikowa ANOVA

endorfiny

3726,667

2 1863,333

3,612

,041

13929,200

27

515,896

17655,867

29

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Dane 

rzeczywiste

Dane 

skopiowane

background image

Hipoteza dotycząca różnic między więcej niż dwiema grupami

Wystąpią różnice w wydajności pracy w zależności od rodzaju 

muzyki prezentowanej w czasie wykonywania zadania

Hipoteza 

niekierunkowa:

Wystąpią różnice...

Wybór: analiza 
wariancji

Hipoteza 

kierunkowa:

Słuchający muzyki 

klasycznej będą bardziej 

wydajni

Testy post hoc

Porównania a 

posteriori

Znany 

kształt 

zależnoś

ci

Nieznany 

kształt 

zależności

Wielomiany  

Porównania 

planowane – 

kontrasty

Porównania a priori

background image

Porównania a posteriori a porównania 

priori

• Porównania a posteriori (testy post hoc

są techniką eksploracyjną, gdy okaże się, 

że są różnice eksplorujemy je za pomocą 

testów post hoc.

– O ich przeprowadzaniu badacz decyduje po 

wstępnej analizie danych, która może mu 

wskazać celowość takich porównań. 

• Porównania a priori (zwane też 

porównaniami planowanymi), planuje się 

przed przeprowadzeniem eksperymentu. 

– Bezpośrednio związane z teorią, na której 

opiera się eksperyment. 

background image

Całkowita wariancja naszych danych

Wariancja wyjaśniona 

Wariancja międzygrupowa

Wariancja kontrolowana

Wariancja niewyjaśniona 

Wariancja wewnątrzgrupowa

Wariancja błędu

Logika analizy wariancji

background image

• Prawie w każdym eksperymencie mamy grupę 

kontrolną, dlatego

– prawie zawsze wykonywanie kontrastów zaczynamy 

od porównania grupy kontrolnej z 
eksperymentalnymi (chyba, że mamy inne hipotezy)

Logika kontrastów

Wariancja międzygrupowa

Trzy grupy: E1, E2 i K1

Wariancja E1, E2

Wariancja 

K1

Porównani
e 1

background image

Definiowanie kontrastów poprzez 

wagi.

W przykładowym eksperymencie mamy 3 grupy. 

Chcemy porównać grupy 1 i 2 z trzecią. 

Hipoteza zerowa musi zakładać, że średnie są 

sobie równe. Załóżmy, że hipoteza ta jest 

prawdziwa a wszystkie średnie mają wartość 

równą 10.

M1 i M2 przeciwstawiamy M3
Program statystyczny potrzebuje jednak zapisu 

matematycznego. 

A zatem próbujemy zapisać hipotezę zerową w 

postaci (10 + 10) – 10 = 0

To niestety matematycznie nie jest prawda. 

Musimy zatem dodać wagi kontrastu.

(1* 10 + 1*10) - 2 *10 = 0

background image

Definiowanie kontrastów poprzez 

wagi

Wobec tego nadajemy każdej grupie odpowiednie wagi 

posługując się następującymi zasadami:

1. Grupy, które tworzą jedną paczkę średnich mają 

współczynniki kontrastu o tym samym znaku i tej 

samej wartości

2. Musimy skontrastować te grupy, które porównujemy 

– nadajemy im wagi o przeciwnych znakach.

3. Suma wag w każdym porównaniu musi wynosić 

zero.

4. Grupy, które pomijamy otrzymują wagę równą zero. 

background image

Wariancja wyjaśniona przez eksperyment

Trzy grupy: E1, E2 i K1

Wariancja wyjaśniona 

przez E1, E2

+

Wariancja 

wyjaśniona przez K1

-

Wariancja 

wyjaśniona 

przez E1

Wariancja 

wyjaśniona 

przez E2

Porównani
e 1

Porównani
e 2

E1: +1      E2: 
+1

K1: -2

(+1)+ (+1)+(-2) 
= 0

E1: +1                   
E2: -1

K1: 0

+

-

(+1)+ (-1)+(0) = 
0

background image

Przykład

• W badaniu nad skutecznością czekolady środka 

podnoszącego sprawność umysłową przeprowadzono 

badanie, w którym porównywano osoby przyjmujące 

niskie i wysokie dawki specyfiku z grupą kontrolną 

oraz placebo.

• Jakie wagi dla pierwszego kontrastu porównującego 

obie grupy eksperymentalne z dwiema kontrolnymi?

Grupa E1       Grupa E2

Wysokie dawki  Niskie dawki

Grupa K1    Grupa K1

    Nic          Placebo

vs
.

+1                        +1                               -1                        -1        
    kontrast 1

background image

Jakie dalsze porównania 

możliwe?

Grupa E1       Grupa E2

Wysokie dawki  Niskie dawki

Grupa K1    Grupa K1

    Nic          Placebo

vs
.

+1                                -1                               0                         
0       kontrast 2

Grupa E2

Niskie dawki

Grupa E1

Wysokie dawki

vs
.

Grupa K1

Placebo

Grupa K1 

Nic

vs
.

0                                0                               +1                            
-1     kontrast 3

background image

Mamy pięć grup
Jak zdefiniować kontrast, gdy chcemy 

porównać grupę drugą z trzecią i piątą?

0,   2,   -1,   0,   -1

0,   4,   -2,   0,   -2

0,   -1,   0,5,   0,   0,5

0,   -10,   5,   0,   5

background image

Ortogonalność kontrastów

• Jak sprawdzić czy kolejne wykonywane 

porównania są od siebie wzajemnie 

niezależne, czyli ortogonalne

• Przemnażamy przez siebie współczynniki 

kontrastu odpowiednio dla każdej grupy

• Suma iloczynów powinna wynosić zero – 

jeśli nie, kontrasty nie są ortogonalne 

background image

Czy poniższe kontrasty są 

niezależne?

Porównujemy średnie pochodzące z 

czterech grup: osób lubiących jazz, 

muzykę klasyczną, rock i pop pod 

względem ekstrawersji

Jeżeli pierwszy kontrast:
1,  1,  1,  -3 

(która grupa jest przeciwstawiana 

którym?)

To pozostałe, które są ortogonalne:
1,  1, -2,  0
1, -1,  0,  0

background image

Przykład 1

• 1,   1,   1,  -1,5,  -1,5    

(trzy pierwsze z dwiema 

ostatnimi)

• -1,  1,   0,     0,      0
    -1   1    0      0       0    iloczyny
Suma iloczynów: 0

Przykład 2

• 2,   0,   -1,   -1
• 1,   -1,   0,    0
    2    0     0     0         iloczyny
Suma iloczynów: 2

Niezależn

e

Nie są 

niezależne

background image

Jeżeli będziemy w ten sposób 

postępować (czyli wykonywać 
porównania niezależne), to liczba 
możliwych (niezależnych, 
ortogonalnych) kontrastów wyniesie:

   

k-1

k oznacza liczbę grup

background image

Podsumowanie

Zawsze wybieramy sensowne porównania – 
• możemy bowiem porównywać tylko dwie „porcje” 

wariancji (gdy w „porcji” więcej niż jedna grupa – 

porównujemy średnią z tych grup)

• Jeżeli wykonujemy więcej niż jeden kontrast – 

porównania powinny być niezależne (ortogonalne)

Porównywane grupy mają 

przeciwny znak

 

współczynnika

Wartości współczynników dla średnich w tej samej 

podgrupie muszą być 

takie same

Grupy, które są 

wyłączone

 z porównań mają 

wagę zero

Suma współczynników

 w danym kontraście zawsze 

równa 

zero

background image

Mnożenie / dodawanie

• Analiza kontrastów pozwala przemnażać 

średnie przez pewne współczynniki, ale nie ma 

możliwości dodawania niczego do średnich. 

• Możemy sprawdzać, czy dochód mężczyzn jest 

2 razy większy niż dochód kobiet, ale nie 

sprawdzamy (przy użyciu kontrastów), czy 

mężczyźni zarabiają o 500 złotych więcej niż 

kobiety. 

background image

Jak definiować w SPSS?

Współczynniki 
kontrastu 
wprowadzamy 
kolejno klikając 
DODAJ

background image

Wydruk

Współczynniki kontrastu

-1

0

1

Kontrast
1

niska

ekspresy

wnosc

przeciętna

ekspresyw

nosc

wysoka

ekspresy

wnosc

EE

Testy kontrastu

-2,8935

1,21084

-2,390

264

,018

-2,8935

1,24807

-2,318

123,797

,022

Kontrast
1

1

Założenie o
równości wariancji
Brak założenia o
równości wariancji

PASYWNY

Wartość

kontrastu

Błąd

standardowy

t

df

Istotność

(dwustronna)

Test jednorodności wariancji

PASYWNY

,134

2

264

,875

Test Levene'a

df1

df2

Istotność

Test Levene’a wskazuje, że 
wariancje są homogeniczne, więc 
wydruk odczytujemy z górnego 
wiersza. Wynik zapisujemy tak, jak 
standardowy test t Studenta 
t(264)=2,39; p<0,05. Teraz jeszcze 
informacja o średnich, by 
zinterpretować wynik.

Statystyki opisowe

PASYWNY

29,6935

28,2286

26,8000
28,2210

niska ekspresywnosc
przeciętna
ekspresywnosc
wysoka ekspresywnosc
Ogółem

Średnia

background image

Statystyki opisowe

KAS

24,9710

25,2500

26,3043
25,4371

niska ekspresywnosc
przeciętna
ekspresywnosc
wysoka ekspresywnosc
Ogółem

Średnia

• Analiza wariancji 

nie pokazała 
istotnych wyników 
a kontrast 
porównujący dwie 
skrajne grupy tak!

Współczynniki kontrastu

-1

0

1

Kontrast
1

niska

ekspresy

wnosc

przeciętna

ekspresyw

nosc

wysoka

ekspresy

wnosc

EE

Testy kontrastu

1,3333

,67801

1,967

283

,050

1,3333

,67100

1,987

136,000

,049

Kontrast
1

1

Założenie o
równości wariancji
Brak założenia o
równości wariancji

KAS

Wartość

kontrastu

Błąd

standardowy

t

df

Istotność

(dwustronna)

Jednoczynnikowa ANOVA

KAS

72,066

2

36,033

2,272

,105

4488,301

283

15,860

4560,367

285

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Test jednorodności wariancji

KAS

,021

2

283

,979

Test Levene'a

df1

df2

Istotność

background image

Statystyki opisowe

KAS

24,9710

25,2500

26,3043
25,4371

niska ekspresywnosc
przeciętna
ekspresywnosc
wysoka ekspresywnosc
Ogółem

Średnia

Jak jest liczona statystyka t?

Aby obliczyć statystykę t trzeba 

podzielić wartość kontrastu 
przez błąd standardowy. 
Wartość kontrastu jest liczona 
w ten sposób, że średnie 
grupowe są mnożone przez 
współczynniki kontrastu a 
następnie sumowane.

24,97 * (-1) + 25,25 * 0 + 26,3 * 

1=

26,3 - 24,97 = 1,333

Współczynniki kontrastu

-1

0

1

Kontrast
1

niska

ekspresy

wnosc

przeciętna

ekspresyw

nosc

wysoka

ekspresy

wnosc

EE

Testy kontrastu

1,3333

,67801

1,967

283

,050

1,3333

,67100

1,987

136,000

,049

Kontrast
1

1

Założenie o
równości wariancji
Brak założenia o
równości wariancji

KAS

Wartość

kontrastu

Błąd

standardowy

t

df

Istotność

(dwustronna)

background image

• Problem badawczy
Czy można na pierwszy rzut oka określić kto jest 

twórczy a kto nie?  Badania Galtona (wiek XIX)

• Badacz zmierzył badanym ochotnikom obwód 

głowy oraz iloraz inteligencji testem Ravena. 
Poszukiwał różnic między osobami o małej i 
dużej głowie w zakresie inteligencji. 

Kiedy Anova jest lepsza 

od testu t-Studenta?

background image

Zmienne i schemat badania

• Zmienna niezależna – wielkość głowy
Pomiar – może być różny – ilościowy, gdy w centymetrach, porządkowy, gdy podzielimy 

ludzi na dwie lub trzy grupy ze względu na wielkość głowy

• Zmienna zależna 
Pomiar - gdy iloraz inteligencji mierzony w punktach skali mamy do czynienia ze skalą 

ilościową, jeśli przeliczymy wyniki surowe na steny redukujemy skalę do porządkowej

• Schemat międzygrupowy
Mierzymy obwód głowy a potem na jego podstawie dzielimy ludzi do grup. Można to zrobić 

na różne sposoby:

• Podział na dwie grupy po medianie  - wykonujemy wtedy test t-Studenta

• Podział na trzy grupy – tercyle  - dwie możliwości obliczeń:

– porównanie skrajnych grup testem T-Studenta

– porównanie wszystkich trzech grup Anovą

background image

Pierwszy wariant obliczeń

Podział na równoliczne grupy - Ntyle

Dzielimy osoby badane 
na trzy grupy – osoby o 
małej, przeciętnie dużej 
oraz dużej głowie.

background image

Pierwszy wariant obliczeń – Test t-

Studenta

Obawiając się, że wyniki mogą nie być 

wyraziste kontrastujemy tylko 
skrajne grupy – osoby o małej i dużej 
głowie

• Obliczamy test t-Studenta dla prób 

niezależnych

background image

Test t-Studenta – porównujemy dwie skrajne grupy – osoby o 

małej i dużej głowie pod względem ilorazu inteligencji 

Brak istotnych statystycznie różnic

 

Test dla prób niezależnych

,012

,913

,612

14

,550

,612

13,998

,550

Założono równość
wariancji
Nie założono
równości wariancji

IQ

F

Istotność

Test Levene'a

jednorodności

wariancji

t

df

Istotność

(dwustronna)

Test t równości średnich

Statystyki dla grup

8 102,8750
8 102,2500

NTILES of GLOWA
1
3

IQ

N

Średnia

Osoby o małej 

głowie

Osoby o dużej 

głowie

background image

Robimy analizę wariancji gdzie czynnikiem jest wielkość 

głowy a zmienną zależną iloraz inteligencji. Jeśli weźmiemy 

pod uwagę 

trzy grupy

 zobaczymy, że związek jest 

krzywoliniowy i dlatego nie okazał się istotny w teście t. 

Jednoczynnikowa ANOVA

IQ

3285,083

2 1642,542

45,611

,000

756,250

21

36,012

4041,333

23

Między grupami
Wewnątrz grup
Ogółem

Suma

kwadratów

df

Średni

kwadrat

F

Istotność


Document Outline