Metodologia ze statystyką:

kurs podstawowy

wykład 5



Eksperyment jednozmiennowy z

powtarzaniem pomiarów na więcej niż

dwóch poziomach. Jednoczynnikowa

analiza wariancji dla prób zależnych.

Porównania planowane i porównania post

hoc.



Współczynniki korelacji. Związek miedzy

współczynnikiem korelacji a testem t-

Studenta. Interpretacja współczynnika

korelacji w kategoriach procentu wariancji

wspólnej. Badania korelacyjne a

korelacyjna analiza danych. Test chi-

kwadrat i wprowadzenie to testów

nieparametrycznych.

Eksperyment jednozmiennowy

z powtarzaniem pomiarów na

więcej niż dwóch poziomach



Te same odmiany co w przypadku
dwóch poziomów



Te same mocne i słabe strony co w
przypadku dwóch poziomów

PRZYPOMNIENIE

Eksperyment jednozmiennowy

z powtarzaniem pomiarów:

Odmiany



Poziom zmiennej niezależnej manipulowany

losowo wewnątrz osób (np ocena bodzców

znanych i nieznanych prezentowanych w losowej

kolejności)



Counterbalansing-zrównoważenie między

osobami (np dla jednej połowy badanych najpierw

frustracja a dla drugiej połowy najpierw brak

frustracje)



Matching czyli dobór parami (dla każdej osoby z

grupy eksperymentalnej pomiar jest

„powtórzony” na jak najbardziej podobnej do

niej osobie z grupy kontrolnej)

PRZYPOMNIENIE

Mocne strony badań z

powtarzanymi pomiarami



Zmniejszenie lub wyeliminowanie
wariancji błędu spowodowanej
różnicami indywidualnymi.



W rezultacie wzrost mocy testu
statystycznego (zmniejszenie ryzyka
błędu drugiego rodzaju)

PRZYPOMNIENIE

Słabe strony badań z powtarzanymi

pomiarami: kolejność losowa lub

counterbalansing



Trudna do zastosowania gdy efekt
manipulacji jest długotrwały



Zwiększone prawdopodobieństwo
odgadnięcia hipotezy

PRZYPOMNIENIE

Słabe strony badań z powtarzanymi

pomiarami: Matching



Pracochłonna dla badacza



Arbitralność kryteriów doboru par

Eksperyment jednozmiennowy

z powtarzaniem pomiarów na

więcej niż dwóch poziomach:

Analiza



Jednoczynnikowa analiza
wariancji dla prób zależnych

Analiza wariancji z powtarzanymi

pomiarami: dwie odmiany



Multivariate solution (Testy

wielu zmiennych)



Univariate solution (Testy

efektów

wewnątrzobiektowych)



W przypadku gdy zmienna

ma tylko dwa poziomy wyniki

takie same

Porównania planowane



Z góry ustalone



Często używa sie testu t



Zwykle stosuje sie je po stwierdzeniu
istotnego F



Alternatywa dla analizy wariancji?

Porównania post hoc



Wszystko ze wszystkim



Zwykle stosuje sie je po stwierdzeniu
istotnego F



Alternatywa dla analizy wariancji?

Porównania post hoc



Istnieje wiele testów post hoc. Najczęściej
używane to test LSD, test Tukey’a, test
Scheffe, test Bonferroniego i test Duncana.



Test Duncana jest szczególnie liberalny i
może prowadzić do błędu 1 rodzaju.



Test LSD jest także bardzo liberalny ale
stosuje sie go zwykle jedynie w przypadku
3 grup.



Test Scheffe jest szczególnie
konserwatywny.

Test t a test F



W przypadku dwóch grup

F=t

Wyniki standardowe

(standaryzowane) – wartości “z”

= (x

– M)/SD

M – średnia (mean)
SD – odchylenie standardowe

(standard deviation)

wartość standaryzowana (“z”)

danego wyniku “x” = wynik surowy
(x

) minus średnia (M) dzielone przez

odchylenie standardowe (SD)

Procenty wyników pod krzywą

normalną (M=0; SD=1)

Właściwości wyników standardowych

“z”

średnia wyników „z” = 0; wariancja = 1

wyniki surowe bliskie średniej M dają

wyniki „z” bliskie wartości “0”,

wyniki dokładnie równe średniej są

równe zeru.

wyniki surowe mniejsze od średniej M

dają ujemne wartości „z „

wyniki surowe większe od średniej M

daja dodatnie wartości „z”

Standardyzacja umożliwia porównania na tle

grupy

Anna i Marek zdawali egzamin z

Metodologii ze Statystyką u różnych
profesorów. Anna otrzymała ocenę 5
z egzaminu (średnia ocen w jej
grupie 4,5; odchylenie standardowe
ocen 2). Marek otrzymał ocenę 3,5 z
egzaminu (średnia ocen w jego
grupie 2,5; odchylenie standardowe
ocen 1). Który ze studentów wypadł
lepiej na tle swojej grupy?

Standardyzacja umożliwia porównania na tle

grupy

Ania: x=5,0 (M= 4,5; S=2);
z=(5,0-4,5) /2 = 0,25
Marek x= 3,5 (M= 2,5; S=1);
z=(3,5-2,5)/1 = 1,00

Standardyzacja umożliwia porównania na tle

grupy

Tomek: x=3,0 (M= 4,0; S=1,0);
z=(3,0-4,0) /1 = -1,0
Krysia: x= 3,5 (M= 4,5; S=2);
z=(3,5-4,5)/2 = -0,50

Korelacja



miara statystyczna określająca

siłę związku między zmiennymi,

mieszcząca się w graniach (-1, 1)

Korelacja dodatnia

wzrostowi jednej zmiennej np.

stopnie towarzyszy wzrost
innej

zmiennej

np.

samoocena

Korelacja ujemna

wzrostowi jednej zmiennej

np.

stopnie

towarzyszy

spadek innej zmiennej np.
nadużywanie alkoholu

Brak korelacji

Zmienne

soba

niepowiązane np. stopnie a
numer buta,

współczynnik korelacji jest

bliski zera (nieistotny)

Związek krzywoliniowy



Np. związek między pobudzeniem a
poziomem wykonania zadania: w
miarę wzrostu pobudzenia wykonanie
jest coraz lepsze, osiąga maksimum
po czy zaczyna się pogarszać



Współczynnik korelacji (liniowej)
będzie bliski zera (nieistotny)

Obliczanie współczynnika

korelacji r Pearsona



r =  ZX ZY / N



r - współczynnik korelacji Pearsona



ZX - wartość z dla każdego
przypadku dla zmiennej x



ZY - wartość z dla każdego
przypadku dla zmiennej y



N - liczba przypadków (liczba par
obserwacji)

Istotność statystyczna

współczynnika korelacji



Ten sam współczynnik korelacji może
być lub nie być statystycznie istotny
w zależności od wielkości próby (od
ilości par obserwacji)



Im większa próba tym bardziej
istotny dany współczynnik korelacji



Poziom istotności odczytujemy z
tabeli w podręczniku statystyki lub z
wydruku SPSS

Korelacja a rodzaj skali

pomiarowej



r Pearsona zakłada pomiar obu

zmiennych na skali przedziałowej



Gdy jedna zmienna jest na skali

nominalnej i jest dychotomiczna

(płeć) wyniki takie same jak przy

teście t



współczynnik korelacji rang

Spermana zakłada pomiar na skali

porządkowej



Chi kwadrat zakłada pomiar obu

zmiennych na skali nominalnej

Korelacja a trafność

wewnętrzna



badanie korelacyjne vs.
eksperyment



analiza korelacyjna vs.
porownanie grup

Współczynnik determinacji

proporcja zmienności jednej zmiennej

dająca się przewidzieć na podstawie
informacji o poziomie drugiej
zmiennej

x 100 = procent wariancji

wspólnej

IQ a średnia ocen



Współczynnik korelacji między
ocenami a ilorazem inteligencji
r=0,50. W jakiej mierze da sie
przewidzieć średnią ocen na
podstawie IQ (lub odwrotnie)



0,50

=0,25



25% wspólnej wariancji

Badanie zależności między

dwiema zmiennymi

mierzonymi na skali

nominalnej: test Chi-kwadrat

Czy istnieje zależność między

płcią a wyborem miejsca w

klasie

Tabela krzyżowa PLEC * MIEJSCE

Liczebność
Liczebność
Liczebność

kobieta
mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem



Aby sprawdzić czy uzyskany patern
wyników nie powstał przez przypadek (czy
jest statystycznie istotny) stosujemy test
Chi-kwadrat

Informacje konieczne do

obliczenia wartości Chi-

kwadrat



fo - liczebności
zaobserwowane (dla każdej
kratki tabeli)

Liczebności zaobserwowane a

liczebności oczekiwane



fo - liczebności

zaobserwowane: ile obserwacji

(ile osób) znalazło się w każdej z

czterech kratek tabeli



fe - liczebności oczekiwane: ile

obserwacji (ile osób) powinno się

było znaleźć w każdej z czterech

kratek tabeli gdyby zmienne płeć

i wybór miejsca były od siebie

niezależne

Obliczanie liczebności

oczekiwanych f



Liczebność wiersza / Całkowita
liczebność x Liczebność kolumny



Np. Oczekiwana liczebność kobiet
siedzących z przodu to



ilość kobiet / ilość studentów x ilość
studentów siedzących z przodu

Liczebności zaobserwowane i

liczebności oczekiwane

Tabela krzyżowa PLEC * MIEJSCE

18,8

27,2

46,0

19,2

27,8

47,0

38,0

55,0

93,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

kobieta

mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem

Płeć a wybór miejsca w klasie: Wyniki

obliczeń

Te s ty Chi-kw a dra t

9,239

,002

8,001

,005

9,414

,002

,003

,002

9,140

,003

Ch i-kwad rat
Pearsona
Poprawka na
ciąg łoś ć

Iloraz wiaryg od noś ci
Dokład ny tes t
Fis hera
Test związku
liniowego
N Ważn ych
obserwacji

Wartoś ć

d f

Istotn ość

asymp totycz

n a

(d wus tronn

Istotnoś ć

d okładna

(dwu stron n

Is totność

dokład na

(jed nostr

on na)

Ob liczone wyłączn ie d la tabeli 2x2.

,0% komórek (0) ma liczebn oś ć oczekiwaną mn iejs zą niż 5. Min imaln a liczeb noś ć
oczekiwan a wyn osi 18,80.



Sprawdzić czy ilość ważnych obserwacji jest co najmniej

20, jeśli tak można użyć testu Chi-kwadrat



Gdyby ilość obserwacji była niższa niż 20, należałoby

użyć dokładnego testu Fishera



Uwaga: Podejście tradycyjne zezwala na użycie test

Chi-kwadrat jedynie gdy żadna z liczebności

oczekiwanych nie jest niższa niż 5, nawet gdy całkowita

ilość ważnych obserwacji jest wyższa niż 20

Ważne elementy poprzedniej

tabeli

Testy Chi-kwadrat

9,239

,002

Chi-kwadrat
Pearsona
N Ważnych
obserwacji

Wartość

Istotność

asymptotyczna

(dwustronna)

Odczytać poziom istotności dla testu Chi-

kwadrat



Jeśli istotność niższa niż 0,05 to znaczy, że
zależność między płcią studenta w
wyborem miejsca w klasie jest istotna
(mało prawdopodobne by pojawiła się
przez przypadek)

Informacje konieczne do

obliczenia wartości Chi-

kwadrat



fo - liczebności
zaobserwowane (dla każdej
kratki tabeli)

Liczebności zaobserwowane a

liczebności oczekiwane



fo - liczebności

zaobserwowane: ile obserwacji

(ile osób) znalazło się w każdej z

czterech kratek tabeli



fe - liczebności oczekiwane: ile

obserwacji (ile osób) powinno się

było znaleźć w każdej z czterech

kratek tabeli gdyby zmienne płeć

i wybór miejsca były od siebie

niezależne

Obliczanie liczebności

oczekiwanych f



Liczebność wiersza / Całkowita
liczebność x Liczebność kolumny



Np. Oczekiwana liczebność kobiet
siedzących z przodu to



ilość kobiet / ilość studentów x ilość
studentów siedzących z przodu

Czy jest istotny związek w

populacji?

Obliczanie Chi-kwadrat



2 - wartość statystyki Chi-kwadrat



fo - liczebność zaobserwowana



fe - liczebność oczekiwana



2 może się wahać od 0 do

nieskończoności



Poziom istotności odczytać można z tabeli

istotności lub z wydruku SPSS



=  (f

– f

)

/ f

Obliczanie Chi - kwadrat:

Sekret dla leniwych



Dla tabel 2 x 2 kwadraty różnicy

(fo – fe)

są takie same w każdej

kratce tabeli



=  (f

– f

)

/ f

Stopnie swobody dla testu Chi-

kwadrat



Przy odczytywaniu z tabeli

istotności potrzebna informacja o

ilości stopni swobody (df)



Df to iloczyn ilości wierszy – 1

oraz ilości kolumn – 1 w tabeli

danych dla których obliczono

Chi-kwadrat



W naszym przypadku df = (2-1) x

(2-1) = 1

Jak silny jest związek?

Obliczanie współczynnika

korelacji Phi dla tabeli 2x2



 - wartość statystyki Phi





- wartość statystyki Chi-

kwadrat



N - liczebność próby



 może się wahać od 0 do 1

 = (

/N)

Płeć a wybór miejsca w klasie:

Współczynnik siły związku Phi

Miary symetryczne

,315

,002

,315

,002

Phi
V Kramera

Nominalna przez
Nominalna

N Ważnych obserwacji

Wartość

Istotność

przybliżona



Współczynnik Phi interpretować można podobnie
jak r Pearsona i obliczyć współczynnik
determinacji



0,315

=0,09



Wybór miejsca w klasie związany jest z płcią w
sposób istotny ale bardzo nieznaczny

Czy mnie jeszcze pamiętasz?



Demonstracja „Związek miedzy
wynikiem rozmowy kwalifikacyjnej z
kandydatem do pracy a późniejszą
jakością pracy”



Czy obliczenia statystyczne da się
zastąpić statystyczną intuicją?

Pytanie:



Czy ogólne wrażenie z rozmowy
wstępnej z kandydatem do pracy
pomaga przewidzieć późniejszą
jakość pracy kandydata?

Kandydat 1

Wynik rozmowy

wstępnej

Jakość pracy

Pozytywny (+)

Wysoka (+)

Czy dane 20 kandydatów wskazują, że

warto używać wyników rozmowy

kwalifikacyjnej przy przyjmowaniu do

pracy?



Jak silny związek?



0,0 – zupełny brak

związku



0,2 - słaby związek



0,5 – średni związek



0,8 – silny związek



1,0 – pełny związek

Jak silny związek?



Pozytywny wynik

rozmowy:



N=16



Prawd. że będą dobrze

pracować 12:16=0,75



Negatywny wynik

rozmowy:



N=4



Prawd. że będą dobrze

pracować 3:4=0,75



Wniosek:

Brak związku!

(Korelacja

pozorna)

Rozmowa

Praca

Korelacja pozorna



Spostrzeganie związku miedzy
zmiennymi gdy w rzeczywistości
żaden związek nie zachodzi



Występuje szczególnie gdy w obrębie
każdej ze zmiennych jedna z
kategorii jest szczególnie liczna



Zapobieganie korelacjom pozornym:
obliczyć wskaźnik siły związku
(korelacji)

Tabela krzyżowa PRACA * ROZMOWA

1,0

4,0

5,0

3,0

12,0

15,0

4,0

16,0

20,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

,00

1,00

PRACA

Ogółem

,00

1,00

ROZMOWA

Ogółem

Testy Chi-kwadrat

,000

1,000

,000

1,000

,000

1,000

,751

,000

1,000

Chi-kwadrat
Pearsona
Poprawka na
ciągłość

Iloraz wiarygodności
Dokładny test
Fishera
Test związku
liniowego
N Ważnych
obserwacji

Wartość

Istotność

asymptotyczn

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

Obliczone wyłącznie dla tabeli 2x2.

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

Dokładny test Fishera



Bardziej konserwatywny niż test Chi –
kwadrat (może zwiększać
prawdopodobieństwo błędu drugiego
rodzaju)



Bardziej pracochłonne obliczenia



Powinien być używany zamiast testu Chi-
kwadrat gdy....



podejście tradycyjne: co najmniej jedna z
liczebności oczekiwanych jest niższa niż 5



podejście nowsze: całkowita liczebność jest
niższa niż 20

Testy Chi-kwadrat

,000

1,000

,751

Chi-kwadrat
Pearsona
Dokładny test
Fishera
N Ważnych
obserwacji

Wartość

Istotność

asymptotyczn

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

Nietypowe zastosowania testu

Chi - kwadrat



Może być używany zamiast testu Studenta dla

prób niezależnych (np. dzielimy badanych na 4

grupy w zależności od manipulacji

eksperymentalnej i od uzyskania w zmiennej

zależnej wyniku powyżej lub poniżej mediany)



Może być używany zamiast współczynnika

korelacji Pearsona (np. dzielimy badanych na 4

grupy w zależności od uzyskania wyników

powyżej lub poniżej mediany w każdej z dwóch

mierzonych zmiennych)



Zaletą takich zastosowań jest prostota, wadą jest

mniejsza moc testu (większe

prawdopodobieństwo błędu drugiego rodzaju)

Chi - kwadrat:

Informacje dodatkowe



Jest tzw. testem nieparametrycznym,
nie opiera się na założeniu o
normalności rozkładu



Może być używany do tabel
większych niż 2 x 2 (więcej niż dwa
poziomy zmiennej lub / i więcej niż
dwie zmienne)



Dane w poszczególnych kratkach
tabeli muszą być od siebie
niezależne!

Niektóre inne testy

nieparametryczne



Test U Manna-Whitney’a – podobny do
testu t Studenta dla prób niezależnych ale
zmienna zależna ma postać rang



Test Wilcoxona oraz test znaków - podobne
do testu t Studenta dla prób zależnych ale
zmienna zależna ma postać rang



Współczynnik korelacji rang Spearmana –
podobny do współczynnika korelacji
Pearsona ale obie zmienne mają postać
rang



W przeciwieństwie do testu Chi – kwadrat,
inne testy nieparametryczne są obecnie
stosunkowo rzadko używane



Testy nieparametryczne są z reguły
prostsze w użyciu



Mają zwykle niższą moc niż odpowiednie
testy parametryczne



Gdy odstępstwa od założeń testów
parametrycznych są bardzo znaczne,
testy nieparametryczne mogą mieć
wyższą moc niż odpowiednie testy
parametryczne

Document Outline