background image

Psychometria 2010

Wykład 2

Klasyczna teoria 

testu

background image

Whatever exists, exists in some 

amount." 

E. L. Thorndike.

background image

Założenia klasycznej teorii testu 

(Gulliksen, 1950)

• do psychologii można zaadaptować model 

pomiaru pochodzący z fizyki 

• podobnie jak każdy obiekt fizyczny ma 

określone wartości swoich cech fizycznych, 

niezależne od aktu pomiaru i natury 

narzędzia badawczego, tak każdy człowiek 

ma nieznane prawdziwe wartości cech 

psychologicznych

• podczas pomiaru obserwujemy wartości 

prawdziwe mierzonej cechy, zakłócone 

błędem równym różnicy miedzy 

obserwowaną wartością wyniku pomiaru a 

nieobserwowalną wartością prawdziwą 

mierzonej cechy

background image

Rzetelność

• Klasyczna teoria testu (Gulliksen, 1950) 

– „psychometryczne opracowanie 
problemu rzetelności i błędu pomiaru”

• Rzetelność jest miarą dokładności 

pomiaru

background image

X

t

 = X

 + X

e

,

      

gdzie:

 X

t

: wynik otrzymany

X

: wynik prawdziwy

X

e

: składnik błędu

background image

2

2

t

tt

s

s

r

tt

r

gdzie:
r

tt 

rzetelność

2

  - wariancja wyników 

prawdziwych
s

2

  - wariancja wyników 

otrzymanych

var

t

  = var 

 

var

e

background image

Wynik prawdziwy 

(Gulliksen, 1950)

• Wynik prawdziwy to granica, do 

jakiej zmierza przeciętna wyników 
i-tej osoby w danej liczbie testów 
równoległych, jeśli ta liczba 
wzrasta nieograniczenie

background image

Wynik prawdziwy 

(Guilford, 1954)

• średnia z nieskończenie wielu 

badań tym samym testem

• wynik danej osoby otrzymany w 

idealnych warunkach idealnym 
narzędziem pomiarowym

background image

Składnik błędu (Guilford, 

1954)

• różnica między wynikiem 

prawdziwym a wynikiem 
otrzymanym

• wartość dodatnia lub ujemna 

będąca funkcją warunków 
testowania konkretnej osoby w 
konkretnym badaniu

background image

„Błąd” pomiaru

• Pojęcie ”błędu” nie zawsze 

powinno być rozumiane dosłownie, 

jako niedokładność

• W metodologii ogólnej: „błąd” to 

niedokładność plus wszystko to, 

czego nie badamy

• W psychometrii: fluktuacja cechy 

może nie być błędem, lecz 

przedmiotem pomiaru

• Dwie najbardziej stałe cechy w 

psychologii: IQ i… podatność 

hipnotyczna

background image

Założenia klasycznej teorii 

testów

• Średnia arytmetyczna błędów 

wynosi zero

• Korelacja wyniku prawdziwego i 

składnika błędu jest zerowa

• Korelacja składników błędu dwóch 

testów równoległych (czyli dwóch 
kolejnych pomiarów) jest zerowa

• Korelacja składników błędu w 

teście i reteście tym samym 
testem jest zerowa

background image

• Z założenia o istnieniu wyniku 

prawdziwego, niezależnego od 

aktu pomiaru, oraz z założenia o 

losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno 

w dwóch kolejnych pomiarach 

przynieść takie same wyniki

– różnice między wynikami dwóch 

kolejnych pomiarów są odbiciem 

błędów pomiaru i mogą służyć do 

jego szacowania

– (podobnie zachowają się wersje 

idealnie równoległe)

background image

• Błędy systematyczne 

(skorelowane)

• Błędy losowe (nieskorelowane)

– Klasyczna teoria testu i wskaźniki 

rzetelności dotyczą wyłącznie błędów 
losowych

background image

Szacowanie składnika 

błędu

• Z założenia o istnieniu wyniku 

prawdziwego, niezależnego od aktu 

pomiaru, oraz z założenia o losowości 

błędów, wynika, że:

– idealne narzędzie badawcze powinno w 

dwóch kolejnych pomiarach przynieść 

takie same wyniki

– różnice między wynikami dwóch 

kolejnych pomiarów są odbiciem błędów 

pomiaru i mogą służyć do jego 

szacowania

– (podobnie zachowają się wersje idealnie 

równoległe)

background image

• Rzetelność jest zatem równa 

teoretycznej wartości współczynnika 

korelacji w dwóch kolejnych badaniach 

(twierdzenie przydatne empirycznie)

• Rzetelność jest też równa kwadratowi 

korelacji między wynikiem prawdziwym 

a wynikiem otrzymanym (twierdzenie 

mniej przydatne empirycznie)

• Najprościej mówiąc, test rzetelny to 

taki, którego wyniki korelują wysoko z 

sobą przy powtórzeniu badania

background image

Interpretacja 

współczynników 

rzetelności

• rzetelność = powtarzalność (stabilność) 

wyników testowych (przy założeniu stałości 
cechy)

• rzetelność = kwadrat korelacji między 

wynikami prawdziwymi a wynikami 
uzyskanymi  w teście

• rzetelność = odsetek wariancji wyników 

prawdziwych w wynikach otrzymanych

• rzetelność = procent wariancji wyników w 

teście generowany przez wyniki prawdziwe

• rzetelność = korelacja między testami 

równoległymi

• np. alfa Cronbacha = 0,82: 82% wyników w 

teście można przypisać wynikom prawdziwym, 
18%: składnikowi błędu

background image

Długość testu a jego 

rzetelność

• Im dłuższy test (im więcej pozycji 

zawiera) tym jest rzetelniejszy, to 
jest, tym mniejszym jest obciążony 
błędem

• Im więcej składowych znajduje się 

w teście, tym bliższy jest on 
wynikowi prawdziwemu na mocy 
definicji stwierdzającej, że wynik 
prawdziwy to średnia z 
nieskończenie wielu testów 
równoległych

background image

• Rzetelność a wskaźniki rzetelności
• Bezpośrednie badanie rzetelności:

– kalibracja
– seria pomiarów

(w psychologii ani jedno, ani drugie nie jest 

możliwe)

• Pośrednie badanie rzetelności: 

wskaźniki rzetelności

background image

Krytyka aksjomatyki 

Gulliksena

• Thorndike (1964): ponieważ wyniki 

prawdziwe nie są mierzalne 
bezpośrednio, są one mitem i nie 
mogą mieć znaczenia teoretycznego

– przyjęcie tego poglądu odrzucałoby całą 

statystykę inferencyjną, która dotyczy 
głównie szacowania nieobserwowalnych 
parametrów

– wyniki prawdziwe nie są mierzalne 

bezpośrednio, ale są szacowalne, z 
błędem nie wykluczającym teoretycznej 
ani praktycznej użyteczności

background image

Krytyka aksjomatyki 

Gulliksena

• Poważniejszy zarzut (Lord i 

Novick, 1968): nieweryfikowalność 
założenia o losowości błędu 
pomiaru, czyli postulatu, że średni 
błąd wynosi zero. Stopień 
prawdziwości tego założenia nie 
jest szacowalny (w 
przeciwieństwie do 
nieobserwowalnych parametrów)

background image

• Rzetelność odnosi się do:

– stabilności
– równoważności
– spójności

wyników testowych.

background image

Rzetelność – właściwość 

testu 

czy zbioru wyników?

• Rzetelność jest właściwością zbioru 

wyników uzyskanego na konkretnej 

populacji, a nie testu

• Stwierdzenie: „rzetelność testu X 

wynosi 0,87” jest skrótem 

myślowym

• Oszacowanie rzetelności testu może 

się różnić w różnych populacjach, 

np. IQ szacowane w próbie pobranej 

z populacji generalnej i z populacji 

studentów

background image

• Wszystkie metody szacowania 

rzetelności oparte są na badaniu 
zgodności między zbiorami 
wyników, dotyczących tej samej 
cechy

background image

• Współczynniki rzetelności, jak 

wszystkie miary oparte na 
korelacji, są wrażliwe na wielkość 
wariancji w próbie

• Mogą być generalizowane tylko na 

tę populację, z której pobrano 
próbę

background image

 YIELD1 vs. YIELD2

Wsp. korelacji = ,74

 YIELD1

 Y

IE

LD

2

-2

0

2

4

6

8

10

12

14

-2

0

2

4

6

8

10

12

14


Document Outline