background image

Metodologia ze statystyką: 

kurs podstawowy

wykład 5

background image

Eksperyment jednozmiennowy z 

powtarzaniem pomiarów na więcej niż 

dwóch poziomach. Jednoczynnikowa 

analiza wariancji dla prób zależnych. 

Porównania planowane i porównania post 

hoc.

Współczynniki korelacji. Związek miedzy 

współczynnikiem korelacji a testem t-

Studenta. Interpretacja współczynnika 

korelacji w kategoriach procentu wariancji 

wspólnej. Badania korelacyjne a 

korelacyjna analiza danych. Test chi-

kwadrat i wprowadzenie to testów 

nieparametrycznych. 

background image

Eksperyment jednozmiennowy 

z powtarzaniem pomiarów na 

więcej niż dwóch poziomach 

Te same odmiany co w przypadku 
dwóch poziomów

Te same mocne i słabe strony co w 
przypadku dwóch poziomów

background image

PRZYPOMNIENIE

Eksperyment jednozmiennowy 

z powtarzaniem pomiarów: 

Odmiany

Poziom zmiennej niezależnej manipulowany 

losowo wewnątrz osób (np ocena bodzców 

znanych i nieznanych prezentowanych w losowej 

kolejności) 

Counterbalansing-zrównoważenie między 

osobami (np dla jednej połowy badanych najpierw 

frustracja a dla drugiej połowy najpierw brak 

frustracje)

Matching czyli dobór parami (dla każdej osoby z 

grupy eksperymentalnej pomiar jest 

„powtórzony” na jak najbardziej podobnej do 

niej osobie z grupy kontrolnej)

background image

PRZYPOMNIENIE 

Mocne strony badań z 

powtarzanymi pomiarami 

Zmniejszenie lub wyeliminowanie 
wariancji błędu spowodowanej 
różnicami indywidualnymi. 

W rezultacie wzrost mocy testu 
statystycznego (zmniejszenie ryzyka 
błędu drugiego rodzaju) 

background image

PRZYPOMNIENIE

 

Słabe strony badań z powtarzanymi 

pomiarami: kolejność losowa lub 

counterbalansing

 Trudna do zastosowania gdy efekt 
manipulacji jest długotrwały

Zwiększone prawdopodobieństwo 
odgadnięcia hipotezy

background image

PRZYPOMNIENIE

 

Słabe strony badań z powtarzanymi 

pomiarami: Matching

 Pracochłonna dla badacza

Arbitralność kryteriów doboru par

background image

Eksperyment jednozmiennowy 

z powtarzaniem pomiarów na 

więcej niż dwóch poziomach: 

Analiza 

Jednoczynnikowa analiza 
wariancji dla prób zależnych

 

background image

Analiza wariancji z powtarzanymi 

pomiarami: dwie odmiany

Multivariate solution (Testy 

wielu zmiennych)

Univariate solution (Testy 

efektów 

wewnątrzobiektowych)

W przypadku gdy zmienna 

ma tylko dwa poziomy wyniki 

takie same

background image

Porównania planowane

Z góry ustalone

Często używa sie testu t

Zwykle stosuje sie je po stwierdzeniu 
istotnego F  

Alternatywa dla analizy wariancji?

background image

Porównania post hoc

Wszystko ze wszystkim

Zwykle stosuje sie je po stwierdzeniu 
istotnego F  

Alternatywa dla analizy wariancji?

background image

Porównania post hoc

Istnieje wiele testów post hoc. Najczęściej 
używane to test LSD, test Tukey’a, test 
Scheffe, test Bonferroniego i test Duncana.

Test Duncana jest szczególnie liberalny i 
może prowadzić do błędu 1 rodzaju.

Test LSD jest także bardzo liberalny ale 
stosuje sie go zwykle jedynie w przypadku 
3 grup.

Test Scheffe jest szczególnie 
konserwatywny.

background image

Test t a test F

W przypadku dwóch grup

 F=t

2

background image

Wyniki standardowe 

(standaryzowane) – wartości “z” 

      z

i

 = (x

– M)/SD 

      M   – średnia (mean)
     SD – odchylenie standardowe 

(standard deviation)

      wartość standaryzowana (“z”) 

danego wyniku “x” =  wynik surowy 
(x

i

) minus średnia (M) dzielone przez 

odchylenie standardowe (SD) 

background image

Procenty wyników pod krzywą 

normalną (M=0; SD=1)

background image

Właściwości wyników standardowych 

“z”

          średnia wyników „z” = 0; wariancja = 1
 
         wyniki surowe bliskie średniej M dają 

wyniki „z” bliskie wartości “0”,

         wyniki dokładnie równe średniej są 

równe zeru.

           wyniki surowe mniejsze od średniej M 

dają ujemne wartości „z „ 

         wyniki surowe większe od średniej M 

daja dodatnie wartości „z”

background image

Standardyzacja umożliwia porównania na tle 

grupy

Anna i Marek zdawali egzamin z 

Metodologii ze Statystyką u różnych 
profesorów. Anna otrzymała ocenę 5 
z egzaminu (średnia ocen w jej 
grupie 4,5; odchylenie standardowe  
ocen 2). Marek otrzymał ocenę 3,5 z 
egzaminu (średnia ocen w jego 
grupie 2,5; odchylenie standardowe 
ocen 1). Który ze studentów wypadł 
lepiej na tle swojej grupy?

background image

Standardyzacja umożliwia porównania na tle 

grupy

Ania: x=5,0 (M= 4,5; S=2); 
z=(5,0-4,5) /2 = 0,25
Marek x= 3,5 (M= 2,5; S=1); 
z=(3,5-2,5)/1 = 1,00

background image

Standardyzacja umożliwia porównania na tle 

grupy

Tomek: x=3,0 (M= 4,0; S=1,0); 
z=(3,0-4,0) /1 = -1,0
Krysia: x= 3,5 (M= 4,5; S=2); 
z=(3,5-4,5)/2 = -0,50

background image

Korelacja 

miara  statystyczna  określająca 

siłę  związku  między  zmiennymi, 

mieszcząca się w graniach (-1, 1)

background image

Korelacja dodatnia

wzrostowi  jednej  zmiennej  np. 

stopnie  towarzyszy  wzrost 
innej 

zmiennej 

np. 

samoocena

background image

Korelacja ujemna

wzrostowi  jednej  zmiennej 

np. 

stopnie 

towarzyszy 

spadek  innej  zmiennej  np. 
nadużywanie alkoholu

background image

Brak korelacji

Zmienne 

sa 

ze 

soba 

niepowiązane  np.  stopnie  a 
numer buta, 

współczynnik  korelacji  jest 

bliski zera (nieistotny)

background image

Związek krzywoliniowy

Np. związek między pobudzeniem a 
poziomem wykonania zadania: w 
miarę wzrostu pobudzenia wykonanie 
jest coraz lepsze, osiąga maksimum 
po czy zaczyna się pogarszać

Współczynnik korelacji (liniowej) 
będzie bliski zera (nieistotny)

background image

Obliczanie współczynnika 

korelacji r Pearsona

r =  ZX ZY / N

r - współczynnik korelacji Pearsona

ZX - wartość z dla każdego 
przypadku dla zmiennej x

ZY - wartość z dla każdego 
przypadku dla zmiennej y

N - liczba przypadków (liczba par 
obserwacji)

background image

Istotność statystyczna 

współczynnika korelacji

Ten sam współczynnik korelacji może 
być lub nie być statystycznie istotny 
w zależności od wielkości próby (od 
ilości par obserwacji)

Im większa próba tym bardziej 
istotny dany współczynnik korelacji

Poziom istotności odczytujemy z 
tabeli w podręczniku statystyki lub z 
wydruku SPSS

background image

Korelacja a rodzaj skali 

pomiarowej

r Pearsona zakłada pomiar obu 

zmiennych na skali przedziałowej

Gdy jedna zmienna jest na skali 

nominalnej i jest dychotomiczna 

(płeć) wyniki takie same jak przy 

teście t

współczynnik korelacji rang 

Spermana zakłada pomiar na skali 

porządkowej

Chi kwadrat zakłada pomiar obu 

zmiennych na skali nominalnej

background image

Korelacja a trafność 

wewnętrzna

badanie korelacyjne vs. 
eksperyment

analiza korelacyjna vs. 
porownanie grup

background image

Współczynnik determinacji 

r

2

  proporcja zmienności jednej zmiennej 

dająca się przewidzieć na podstawie 
informacji o poziomie drugiej 
zmiennej

r

x 100 = procent wariancji 

wspólnej

background image

IQ a średnia ocen

Współczynnik korelacji między 
ocenami a ilorazem inteligencji 
r=0,50. W jakiej mierze da sie 
przewidzieć średnią ocen na 
podstawie IQ (lub odwrotnie)

r

2= 

0,50

2

=0,25

25% wspólnej wariancji 

background image

Badanie zależności między 

dwiema zmiennymi 

mierzonymi na skali 

nominalnej: test Chi-kwadrat

background image

Czy istnieje zależność między 

płcią a wyborem miejsca w 

klasie

Tabela krzyżowa PLEC * MIEJSCE

26

20

46

12

35

47

38

55

93

Liczebność
Liczebność
Liczebność

kobieta
mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem

Aby sprawdzić czy uzyskany patern 
wyników nie powstał przez przypadek (czy 
jest statystycznie istotny) stosujemy test 
Chi-kwadrat

background image

Informacje konieczne do 

obliczenia wartości Chi-

kwadrat

fo   -  liczebności 
zaobserwowane (dla każdej 
kratki tabeli)

background image

Liczebności zaobserwowane a 

liczebności oczekiwane

fo   -  liczebności 

zaobserwowane: ile obserwacji 

(ile osób) znalazło się w każdej z 

czterech kratek tabeli

fe  - liczebności oczekiwane: ile 

obserwacji (ile osób) powinno się 

było znaleźć w każdej z czterech 

kratek tabeli gdyby zmienne płeć 

i wybór miejsca były od siebie 

niezależne

background image

Obliczanie liczebności 

oczekiwanych f

e

Liczebność wiersza / Całkowita 
liczebność x Liczebność kolumny

Np. Oczekiwana liczebność kobiet 
siedzących z przodu to

ilość kobiet / ilość studentów x ilość 
studentów siedzących z przodu

background image

Liczebności zaobserwowane i 

liczebności oczekiwane

Tabela krzyżowa PLEC * MIEJSCE

26

20

46

18,8

27,2

46,0

12

35

47

19,2

27,8

47,0

38

55

93

38,0

55,0

93,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

kobieta

mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem

background image

Płeć a wybór miejsca w klasie: Wyniki 

obliczeń

Te s ty Chi-kw a dra t

9,239

b

1

,002

8,001

1

,005

9,414

1

,002

,003

,002

9,140

1

,003

93

Ch i-kwad rat
Pearsona
Poprawka na
ciąg łoś ć

a

Iloraz wiaryg od noś ci
Dokład ny tes t
Fis hera
Test związku
liniowego
N Ważn ych
obserwacji

Wartoś ć

d f

Istotn ość

asymp totycz

n a

(d wus tronn

a)

Istotnoś ć

d okładna

(dwu stron n

a)

Is totność

dokład na

(jed nostr

on na)

Ob liczone wyłączn ie d la tabeli 2x2.

a.  

,0% komórek (0) ma liczebn oś ć oczekiwaną mn iejs zą niż 5.  Min imaln a liczeb noś ć
oczekiwan a wyn osi 18,80.

b.  

Sprawdzić czy ilość ważnych obserwacji jest co najmniej 

20, jeśli tak można użyć testu Chi-kwadrat

Gdyby ilość obserwacji była niższa niż 20, należałoby 

użyć dokładnego testu Fishera

Uwaga: Podejście tradycyjne zezwala na użycie test 

Chi-kwadrat jedynie gdy żadna z liczebności 

oczekiwanych nie jest niższa niż 5, nawet gdy całkowita 

ilość ważnych obserwacji jest wyższa niż 20

background image

Ważne elementy poprzedniej 

tabeli

Testy Chi-kwadrat

9,239

1

,002

93

Chi-kwadrat
Pearsona
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczna

(dwustronna)

Odczytać poziom istotności dla testu Chi-

kwadrat

Jeśli istotność niższa niż 0,05 to znaczy, że 
zależność między płcią studenta w 
wyborem miejsca w klasie jest istotna 
(mało prawdopodobne by pojawiła się 
przez przypadek)

background image

Informacje konieczne do 

obliczenia wartości Chi-

kwadrat

fo   -  liczebności 
zaobserwowane (dla każdej 
kratki tabeli)

background image

Liczebności zaobserwowane a 

liczebności oczekiwane

fo   -  liczebności 

zaobserwowane: ile obserwacji 

(ile osób) znalazło się w każdej z 

czterech kratek tabeli

fe  - liczebności oczekiwane: ile 

obserwacji (ile osób) powinno się 

było znaleźć w każdej z czterech 

kratek tabeli gdyby zmienne płeć 

i wybór miejsca były od siebie 

niezależne

background image

Obliczanie liczebności 

oczekiwanych f

e

Liczebność wiersza / Całkowita 
liczebność x Liczebność kolumny

Np. Oczekiwana liczebność kobiet 
siedzących z przodu to

ilość kobiet / ilość studentów x ilość 
studentów siedzących z przodu

background image

Czy jest istotny związek w 

populacji?

Obliczanie Chi-kwadrat

 

2   - wartość statystyki Chi-kwadrat

fo   -  liczebność zaobserwowana

fe   -  liczebność oczekiwana

2 może się wahać od 0 do 

nieskończoności

Poziom istotności odczytać można z tabeli 

istotności lub z wydruku SPSS

 

2

   =    (f

o

 – f

e

)

2

 / f

e

background image

Obliczanie Chi - kwadrat:

Sekret dla leniwych

 

Dla tabel 2 x 2  kwadraty różnicy 

(fo – fe)

2 

 

są takie same w każdej 

kratce tabeli

 

2

   =    (f

o

 – f

e

)

2

 / f

e

background image

Stopnie swobody dla testu Chi-

kwadrat

Przy odczytywaniu z tabeli 

istotności potrzebna informacja o 

ilości stopni swobody (df)

Df to iloczyn ilości wierszy – 1 

oraz ilości kolumn – 1 w tabeli 

danych dla których obliczono 

Chi-kwadrat

W naszym przypadku df = (2-1) x 

(2-1) = 1

background image

Jak silny jest związek?

Obliczanie współczynnika 

korelacji Phi dla tabeli 2x2

 

 -  wartość statystyki  Phi

2

   - wartość statystyki Chi-

kwadrat

  -  liczebność próby

 może się wahać od 0 do 1

 

    = (

2

/N) 

background image

Płeć a wybór miejsca w klasie:

Współczynnik siły związku Phi

Miary symetryczne

,315

,002

,315

,002

93

Phi
V Kramera

Nominalna przez
Nominalna

N Ważnych obserwacji

Wartość

Istotność

przybliżona

Współczynnik Phi interpretować można podobnie 
jak r Pearsona i obliczyć współczynnik 
determinacji

0,315

2

=0,09

Wybór miejsca w klasie związany jest z płcią w 
sposób istotny ale bardzo nieznaczny

background image

Czy mnie jeszcze pamiętasz?

Demonstracja „Związek miedzy 
wynikiem rozmowy kwalifikacyjnej z 
kandydatem do pracy a późniejszą 
jakością pracy”

Czy obliczenia statystyczne da się 
zastąpić statystyczną intuicją?

background image

Pytanie:

Czy ogólne wrażenie z rozmowy 
wstępnej z kandydatem do pracy 
pomaga przewidzieć późniejszą 
jakość pracy kandydata?

background image

Kandydat 1

Wynik rozmowy 

wstępnej

Jakość pracy

Pozytywny (+)

Wysoka (+)

background image

Czy dane 20 kandydatów wskazują, że  

warto używać wyników rozmowy 

kwalifikacyjnej przy przyjmowaniu do 

pracy?

Jak silny związek?

0,0 – zupełny brak 

związku

0,2 - słaby związek

0,5 – średni związek

0,8 – silny związek

1,0 – pełny związek

background image

Jak silny związek?

Pozytywny  wynik 

rozmowy:

N=16

Prawd. że będą dobrze 

pracować 12:16=0,75

Negatywny wynik 

rozmowy:

N=4

Prawd. że będą dobrze 

pracować 3:4=0,75

Wniosek: 

Brak związku!

(Korelacja 

pozorna)

Rozmowa

 

+

Rozmowa

 

-

Praca 

+

12

3

Praca

 

-

4

1

background image

Korelacja pozorna

Spostrzeganie związku miedzy 
zmiennymi gdy w rzeczywistości 
żaden związek nie zachodzi

Występuje szczególnie gdy w obrębie 
każdej ze zmiennych jedna z 
kategorii jest szczególnie liczna

Zapobieganie korelacjom pozornym: 
obliczyć wskaźnik siły związku 
(korelacji)

background image

Tabela krzyżowa PRACA * ROZMOWA

1

4

5

1,0

4,0

5,0

3

12

15

3,0

12,0

15,0

4

16

20

4,0

16,0

20,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

,00

1,00

PRACA

Ogółem

,00

1,00

ROZMOWA

Ogółem

background image

Testy Chi-kwadrat

,000

b

1

1,000

,000

1

1,000

,000

1

1,000

1,000

,751

,000

1

1,000

20

Chi-kwadrat
Pearsona
Poprawka na
ciągłość

a

Iloraz wiarygodności
Dokładny test
Fishera
Test związku
liniowego
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczn

a

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

a)

Obliczone wyłącznie dla tabeli 2x2.

a. 

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

b. 

background image

Dokładny test Fishera

Bardziej konserwatywny niż test Chi – 
kwadrat (może zwiększać 
prawdopodobieństwo błędu drugiego 
rodzaju)

Bardziej pracochłonne obliczenia

Powinien być używany zamiast testu Chi-
kwadrat gdy....

podejście tradycyjne: co najmniej jedna z 
liczebności oczekiwanych jest niższa niż 5

podejście nowsze: całkowita liczebność jest 
niższa niż 20

background image

Testy Chi-kwadrat

,000

b

1

1,000

1,000

,751

20

Chi-kwadrat
Pearsona
Dokładny test
Fishera
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczn

a

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

a)

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

b. 

background image

Nietypowe zastosowania testu 

Chi - kwadrat

Może być używany zamiast testu Studenta dla 

prób niezależnych (np. dzielimy badanych na 4 

grupy w zależności od manipulacji 

eksperymentalnej i od uzyskania w zmiennej 

zależnej wyniku powyżej lub poniżej mediany)

Może być używany zamiast współczynnika 

korelacji Pearsona (np. dzielimy badanych na 4 

grupy w zależności od uzyskania wyników 

powyżej lub poniżej mediany w każdej z dwóch 

mierzonych zmiennych)

Zaletą takich zastosowań jest prostota, wadą jest 

mniejsza moc testu (większe 

prawdopodobieństwo błędu drugiego rodzaju)

background image

Chi - kwadrat: 

Informacje dodatkowe

Jest tzw. testem nieparametrycznym, 
nie opiera się na założeniu o 
normalności rozkładu

Może być używany do tabel 
większych niż 2 x 2 (więcej niż dwa 
poziomy zmiennej lub / i więcej niż 
dwie zmienne)

Dane w poszczególnych kratkach 
tabeli muszą być od siebie 
niezależne!

background image

Niektóre inne testy 

nieparametryczne

Test U Manna-Whitney’a – podobny do 
testu t Studenta dla prób niezależnych ale  
zmienna zależna ma postać rang

Test Wilcoxona oraz test znaków - podobne 
do testu t Studenta dla prób zależnych ale  
zmienna zależna ma postać rang

Współczynnik korelacji rang Spearmana – 
podobny do współczynnika korelacji 
Pearsona ale obie zmienne mają postać 
rang

background image

W przeciwieństwie do testu Chi – kwadrat, 
inne testy nieparametryczne są obecnie 
stosunkowo rzadko używane

Testy nieparametryczne są z reguły 
prostsze w użyciu

Mają zwykle niższą moc niż odpowiednie 
testy parametryczne 

Gdy odstępstwa od założeń testów 
parametrycznych są bardzo znaczne, 
testy nieparametryczne mogą mieć 
wyższą moc niż odpowiednie testy 
parametryczne


Document Outline