background image

 

 

Analiza Dyskryminacyjna

wprowadzenie

background image

 

 

Idea

Wykorzystywana do przewidywania 

przynależności do kategorii/grup na 

podstawie jednego bądź więcej 

predyktorów

Predyktor: zmienna ciągła

Zmienna zależna: kategorialna

Odwrotność analizy wariancji

background image

 

 

Analiza wariancji

Interesujemy się tym, czy grupy różnią się 

od siebie istotnie pod względem 

zmiennej zależnej (ANOVA)

liniowo powiązanych ze sobą zmiennych 

zależnych (MANOVA)

Jeśli jest to prawdą to w drugą stronę też 

można przewidywać:

Te same zmienne zależne można 

wykorzystać do przewidywania 

przynależności do poszczególnych grup

background image

 

 

Co nas nurtuje?

Jaki jest najlepszy predyktor 
zaklasyfikowania osoby do danej 
grupy. 

Jak jest najlepsza kombinacja 
predyktorów pozwalająca przewidzieć 
znalezienie się uczestnika badania w 
danej grupie?

background image

 

 

Co nas nurtuje?

Pedagogów może zastanawiać, jakie czynniki 
sprawiają, że niektórzy studenci psychologii 
decydują się kontynuować naukę na studiach 
doktoranckich, inni znajdują pracę w biznesie, a inni 
znajdują pracę w terapii. 

Badając szereg zmiennych przed ukończeniem 
studiów możemy dzięki analizie dyskryminacyjnej 
odpowiedzieć na pytanie, która z tych zmiennych 
lub jaka kombinacja predyktorów najlepiej 
przewiduje wybór drogi życiowej po studiach. 

background image

 

 

Co się kryje za grupami?

Z matematycznego punktu widzenia analiza wariancji i 

analiza dyskryminacyjna są podobne, ale na co innego kładą 

nacisk

Jeżeli grupy różnią się istotnie statystycznie pod względem 

jakiejś zmiennej to oznacza, że zmienna to dobrze rozdziela 

(discriminate) badanych. 

w AD skupiamy się na pokategoryzowaniu ludzi do grup i 

sprawdzamy jak dobrze/źle udało się nam dokonać 

klasyfikacji 

interesujemy się tym, 

jak można rozróżnić grupy 

między sobą

– Jacy ludzie trafiają do jednej a jacy do drugiej 

kategorii

 

a nie czy te różnice są istotne statystycznie

 

background image

 

 

Co się kryje za grupami?

Mierzymy samoocenę w grupie 20 mężczyzn i 20 kobiet.

Mężczyźni posiadają zazwyczaj wyższą samoocenę niż 
kobiety, więc uzyskamy istotną statystycznie różnicę między 
średnimi w poprównywanych grupach. 

Oznacza to, że z prawdopodobieństwem większym niż 
przypadkowe możemy wnioskować, że osoba posiadająca 
wysoki wynik w skali samooceny  należy do grupy mężczyzn, 
a osoba posiadająca wynik niski należy do grupy kobiet. 

PRZYKŁAD

background image

 

 

so far, so good...

Podstawowa idea analizy dyskryminacyjnej to 
sprawdzenie czy grupy różnią się pod 
względem wyróżnionych zmiennych/zmiennej, 

a następnie wykorzystaniu tej 
zmiennej/zmiennych do przewidywania 
przynależności do grup, np. w przypadku 
nowych uczestników badania. 

background image

 

 

Więcej niż jeden predyktor

Najczęściej analizę dyskryminacyjną 
stosujemy wtedy, kiedy chcemy 
sprawdzić, która z wielu zbadanych 
zmiennych najlepiej przewiduje 
przynależność do różnych grup. 

W tym wypadku AD podobna jest do 
MANOVy

background image

 

 

Więcej niż jeden predyktor

Jeżeli mamy większą liczbę 
predyktorów to chcemy zbudować 
model na podstawie, którego 
będziemy mogli w najlepszy sposób 
przewidzieć przynależność 
poszczególnych przypadków do grup.

background image

 

 

Cel

Głównym celem jest:

znalezienie wymiarów na których grupy różnią 

się między sobą

stworzenie funkcji klasyfikacyjnych 

Czy przynależność do grup może być 

trafnie przewidziana na podstawie 

zestawu predyktorów?

Czy to w której grupie jest dana osóbka 

może być wyjaśnione na postawie np. 

tego co myśli o …

background image

 

 

Analiza dyskryminacyjna dla dwóch grup

Nazywana liniową analizą 
dyskryminacyjną Fishera. 

Podobna do wielokrotnej analizy regresji. 
Jeżeli zakodujemy wartości zmiennej 
grupującej jako 1 i 2, a następnie 
potraktujemy tą zmienną jako zależną w 
wielokrotnej analizie regresji to uzyskany 
wynik będzie podobny do wyniku AD. 

background image

 

 

Analiza dyskryminacyjna dla dwóch grup

Model jaki jest dopasowywany w tej analizie 
jest prostym równaniem liniowym

gdzie, a to stała, b

1

 do b

n

 wartości współczynników regresji.

Interpretując wyniki porównujemy współczynniki 

β. Te zmienne, które mają największe te 
współczynniki wyjaśniają najbardziej rozdział 
uczestników do grup. 

Grupa=a+b

1

x

1

+b

2

x

2

. . .+b

n

x

n

FUNKCJA DYSKRYMINACYJNA

background image

 

 

Analiza dyskryminacyjna dla większej liczby 

grup

Możemy oszacować i przetestować 
więcej niż jedna funkcję 
dyskryminacyjną. 

wybieramy między którymi grupami 
chcemy rozróżniać uczestników badania

• np. jeżeli mamy 3 grupy to możemy 

oszacować funkcje dyskryminacyjne 1) 
pomiędzy grupą 2 i 3 oraz 2) pomiędzy 
grupami 1 vs łącznie 2 i 3.

background image

 

 

Wymiary/ funkcje dyskryminacyjne

Na ilu wymiarach grupy różnią się od siebie?  

Ile sensownych funkcji możemy wyodrębnić – 

liniowych kombinacji predyktorów

Testujemy istotność każdej z nich

 

Zwykle udaje się wyodrębnić jedną, dwie sensowne 
funkcje, reszta nie jest warta zachodu 

 

Funkcje są ortogonalne (niezależne) – ich wkład w 

rozróżnienie między grupami nie nachodzi na siebie.

Liczba wymiarów (funkcji dyskryminacyjnych) jest 

równa liczbie grup-1 lub liczbie predyktorów w 

zależności, która z wartości jest mniejsza

background image

 

 

Analiza dyskryminacyjna dla większej liczby 

grup

Funkcje dyskryminacyjne dla różnych kombinacji 
grup, w popularnych pakietach statystycznych, są 
wyliczane automatycznie. 

pierwsza funkcja oznacza największe 
rozróżnienie między grupami, kolejna mniejsze, 
itd. 

Obliczeniowo oszacowanie funkcji odbywa się za 
pomocą kanonicznej analizy korelacji, która 
oszacowuje funkcje dyskryminacyjne oraz ich 
wartości własne. 

background image

 

 

Korelacja kanoniczna 

Pozwala sprawdzić związek pomiędzy 
dwoma zestawami zmiennych. 

np. zestaw czynników ryzyka vs zestaw 
objawów chorobowych

background image

 

 

Wartości własne funkcji

Każdej funkcji przypisane są wartości 

własne (eigenvalues)

Wskazują jak dobrze dana funkcja różnicuje 

między grupami

Im większa wartość własna tym lepiej/trafniej 

jesteśmy w stanie przypisać osoby do grup

Wartość własna 

• proporcja sumy kwadratów międzygrupowej do 

wewnątrzgrupowej (ANOVA), gdzie funkcja 

dyskryminacyjna jest zmienną zależną a niezależną 

grupy jako poziomy czynnika

background image

 

 

Trzeba się zastanowić …

Czy wyodrębnione funkcje 

dyskryminacyjne są 

interpretowalne i sensowne 

Jakie są korelacje pomiędzy 

funkcjami dyskryminacyjnymi a 

każdym z predyktorów?

background image

 

 

pytania

Czy na podstawie tych funkcji moglibyśmy 

zaklasyfikować nowe osóbki do grup?

Jak dokładni jesteśmy w klasyfikowaniu

Jeśli się mylimy, to czy jest jakaś 

tendencyjność w pomyłkach?

Jak silny jest związek między 

przynależnością do grup a predyktorami? 

background image

 

 

Przykład

background image

 

 

background image

 

 

background image

 

 

background image

 

 

background image

 

 

background image

 

 

Statystyki dla grup

44,296

9,87933

27 27,000

2,9517

,64832

27 27,000

5,5556

1,78311

27 27,000

68,259

9,02387

27 27,000

51,837 12,15756

43 43,000

3,1318

,55756

43 43,000

6,4419

1,63740

43 43,000

79,860

9,97039

43 43,000

55,111

8,64317

54 54,000

2,7612

,47821

54 54,000

5,5741

1,65520

54 54,000

69,204

9,23770

54 54,000

51,621 10,97417

124 124,00

2,9312

,56603

124 124,00

5,8710

1,71539

124 124,00

72,694 10,74931

124 124,00

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

Ogółem

Średnia

Odchylenie

standardowe

Nieważone

Ważone

N Ważnych (usuwanie

obserwacjami)

background image

 

 

Testy równości średnich grupowych

,858 10,040

2

121

,000

,916

5,533

2

121

,005

,941

3,813

2

121

,025

,761 19,004

2

121

,000

przyjacielski

oceny

historia_pracy

test

Lambda

Wilksa

F

df1

df2

Istotność

background image

 

 

Wyniki testu

26,716

1,265

20

28454

,190

M Boxa

Przybliżenie

df1

df2

Istotność

F

Testuje hipotezę zerową o równości
macierzy kowariancji w populacji.

background image

 

 

Wartości własne

,343

a

60,4

60,4

,506

,225

a

39,6

100,0

,429

Funkcja
1

2

Wartość

własna

% wariancji

%

skumulowany

Korelacja

kanoniczna

W analizie użyto pierwszych 2 funkcji dyskryminacyjnych.

a. 

background image

 

 

Lambda Wilksa

,608

59,527

8

,000

,816

24,243

3

,000

Test funkcji
1 przez 2

2

Lambda

Wilksa

Chi-kwadrat

df

Istotność

background image

 

 

Analiza dyskryminacyjna dla większej liczby 

grup. 

Interpretacja funkcji kanonicznych.

Uzyskaliśmy dwie funkcje istotne 
statystycznie. 

Jednak nie wiemy między, którymi  
grupami funkcje te dokonują 
rozróżnień. 

background image

 

 

Analiza dyskryminacyjna dla większej liczby 

grup. 

Interpretacja funkcji kanonicznych.

W wynikach uzyskamy wartości b i β 
dla każdej zmiennej w każdej funkcji 
dyskryminacyjnej. 

Im wartość standaryzowana 
współczynnik kanonicznej funkcji 
dyskryminacyjnej jest większa tym 
większy wkład w rozróżnienie między 
grupami w danej funkcji. 

background image

 

 

Współczynniki niewystandaryzowane (b

funkcji dyskryminacyjnych

Współczynniki kanonicznych funkcji dyskryminacyjnych

-,008

,093

,162 -1,031
,164

,024

,094

,026

-7,798 -3,816

przyjacielski

oceny

historia_pracy

test

(Stała)

1

2

Funkcja

Współczynniki niestandaryzowane.

background image

 

 

Standaryzowane współczynniki  (β

funkcji kanonicznych

Standaryzowane współczynniki

kanonicznych funkcji dyskryminacyjnych

-,087

,955

,088

-,563

,275

,040

,884

,245

przyjacielski

oceny

historia_pracy

test

1

2

Funkcja

background image

 

 

Macierz struktury czynników

Innym sposobem interpretacji, która zmienna 
jest istotna w danej funkcji jest interpretacja 
macierzy czynników. 

jest to macierz pokazująca współczynniki 
korelacji pomiędzy poszczególnymi 
predyktorami a wyodrębnionymi funkcjami. 

analogiczna do macierzy ładunków w 
analizie czynnikowej. 

background image

 

 

Macierz struktury czynników

Macierz struktury

,953*

,105

,467*

-,272

,428*

,020

,012

,859*

test

oceny

historia_pracy

przyjacielski

1

2

Funkcja

Połączone korelacje wewnątrzgrupowe pomiędzy zmiennymi
dyskryminującymi i standaryzowanymi kanonicznymi
funkcjami dyskryminacyjnymi. Zmienne są uporządkowane
według wartości bezwzględnej korelacji w obrębie funkcji.

Największa wartość bezwzględna korelacji pomiędzy
każdą zmienną i dowolną funkcją dyskryminacyjną.

*. 

background image

 

 

Standaryzowane współczynniki czy 

ładunki czynnikowe? 

Najważniejsza różnica:

standaryzowane współczynniki – 
wskazują na unikalny wkład każdego 
predyktora do funkcji (podobne do 
korelacji cząstkowych) 

ładunki czynnikowe – proste korelacje 
pomiędzy predyktorami i funkcją 
(funkcjami).

Wykorzystujemy je do różnych celów. 

background image

 

 

Kolejne kroki w analizie dyskryminacyjnej

Sprawdź, które funkcje są istotne statystycznie

rozważaj w dalszych analizach wyłącznie te istotne

Następnie patrzymy na standaryzowane 
współczynniki funkcji 

im wyższe współczynniki tym większy unikalny wkład 
predyktora w rozróżnienie między grupami

W celu znalezienia znaczenia istotnych funkcji 
patrzymy na macierz ładunków czynnikowych

predyktory najbardziej skorelowane z funkcją nadają jej 
znaczenie

Patrzymy na średnie dla poszczególnych funkcji w 
grupach

pozwala to wykryć między którymi grupami rozróżniają 
poszczególne funkcje.

background image

 

 

Średnie dla poszczególnych funkcji w 

grupach

Funkcje w środkach ciężkości grup

-,401

-,826

,794

,013

-,432

,403

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

1

2

Funkcja

Niestandaryzowane kanoniczne funkcje
dyskryminacyjne ocenione w średnich dla grup.

background image

 

 

-3

-2

-1

0

1

2

3

4

Funkcja 1

-3

-2

-1

0

1

2

3

F

u

n

k

c

ja

 2

słaby pracownik

indywidualna gwiazda

zespołowiec

pracownik

słaby pracownik
indywidualna 

gwiazda

zespołowiec

Środek ciężkości 
grupy

Kanoniczne funkcje dyskryminacyjne

background image

 

 

background image

 

 

Wyniki klasyfikacji

b,c

12

5

10

27

4

27

12

43

4

7

43

54

44,4

18,5

37,0

100,0

9,3

62,8

27,9

100,0

7,4

13,0

79,6

100,0

10

5

12

27

5

25

13

43

5

7

42

54

37,0

18,5

44,4

100,0

11,6

58,1

30,2

100,0

9,3

13,0

77,8

100,0

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

Liczebność

%

Liczebność

%

Oryginalne

Sprawdzane krzyżowo

a

słaby

pracownik

indywidualna

gwiazda

zespołowiec

Przewidywana przynależność do grupy

Ogółem

Sprawdzanie krzyżowe jest wykonywane jedynie dla analizowanych obserwacji. W procesie sprawdzania, każda
obserwacja jest klasyfikowana przez funkcję wykorzystującą wszystkie obserwacje, za wyjątkiem danej obserwacji.

a. 

66,1% pierwotnie pogrupowanych obserwacji zostało prawidłowo sklasyfikowanych.

b. 

62,1% obserwacji sprawdzanych krzyżowo zostało prawidłowo sklasyfikowanych.

c. 

background image

 

 

background image

 

 

background image

 

 

background image

 

 

background image

 

 

Miary symetryczne

,460

,066

7,074

,000

124

Kappa

Miara zgodności

N Ważnych obserwacji

Wartość

Asymptotyczny

błąd

standardowy

a

Przybliżone T

b

Istotność

przybliżona

Nie zakładając hipotezy zerowej.

a. 

Użyto asymptotycznego błądu standardowego, przy założeniu hipotezy zerowej.

b. 

background image

 

 

Standardy prezentacji wyników

Podajemy dla wszystkich istotnych funkcji wartość λ, χ

2

 i jej 

istotność statystyczną 

λ = 0,61; χ

2

(8, N=124) = 59,53; p<0,01

Wyniki wskazują, że predyktory różnicowały przynależność 
do trzech grup. 

Ponadto wyodrębniono druga funkcję, która niezależnie od 
pierwszej pozwalała różnicować istotnie między grupami

•  λ = 0,82; χ

2

(3, N=124) = 24,24; p<0,01

Prezentujemy tabele z korelacjami pomiędzy predyktorami i 
funkcjami oraz wystandaryzowane współczynniki. 

Prezentujemy i interpretujemy średnie wartości dla 
poszczególnych funkcji w grupach.

Podajemy procent poprawnie zaklasyfikowanych uczestników 
badania. 

background image

 

 

założenia

Rozkład normalny

rozkłady poszczególnych zmiennych są zbliżone do rozkładu 
normalnego

Homogeniczność wariancji/kowariancji

macierze wariancji/kowariancji są homogeniczne w poszczególnych 
grupach

najlepiej sprawdzić to za pomocą wykresów rozrzutu

Korelacje pomiędzy średnimi i wariancjami

średnie zmiennych w grupach nie mogą być skorelowane 
wariancjami

pojawia się najczęściej jeżeli w jednej z grup istnieje kilka wyników 
skrajnych, które zmieniają średni i wariancję.

Zmienne nie mogą być zupełnie redundantne

taka sytuacja może wystąpić jeżeli jedna ze zmiennych jest np. 
wskaźnikiem sumarycznym wyciągniętym z trzech innych zmiennych 
branych pod uwagę w analizie.

background image

 

 

Podsumowanie

Analizę dyskryminacyjną używamy 
jeżeli jeżeli chcemy:

znaleźć zmienne, które wyróżniają 
naturalnie” pojawiające się grupy,

klasyfikować przypadki do różnych grup z 
trafnością lepszą niż przypadkowa.

background image

 

 

koniec