background image

Psychometria 2009

Wykład 2

Klasyczna teoria 

testu

background image

Whatever exists, exists in some 

amount." 

E. L. Thorndike.

background image

Założenia klasycznej teorii testu 

(Gulliksen, 1950)

• do psychologii można zaadaptować model pomiaru 

pochodzący z fizyki 

• podobnie jak każdy obiekt fizyczny ma określone 

wartości swoich cech fizycznych, niezależne od aktu 

pomiaru i natury narzędzia badawczego, tak każdy 

człowiek ma nieznane prawdziwe wartości cech 

psychologicznych

• podczas pomiaru obserwujemy wartości prawdziwe 

mierzonej cechy, zakłócone błędem równym różnicy 

miedzy obserwowaną wartością wyniku pomiaru a 

nieobserwowalną wartością prawdziwą mierzonej 

cechy

background image

Rzetelność

• Klasyczna teoria testu (Gulliksen, 1950) 

– „psychometryczne opracowanie 
problemu rzetelności i błędu pomiaru”

• Rzetelność jest miarą dokładności 

pomiaru

background image

X

t

 = X

 + X

e

,

      

gdzie:

 X

t

: wynik otrzymany

X

: wynik prawdziwy

X

e

: składnik błędu

background image

2

2

t

tt

s

s

r

gdzie:

r

tt 

rzetelność

2

  

wariancja wyników 

prawdziwych

s

2

  - wariancja wyników 

otrzymanych

var

t

  = var 

 

var

e

background image

Wynik prawdziwy 

(Gulliksen, 1950)

• Wynik prawdziwy to granica, do 

jakiej zmierza przeciętna wyników 
i-tej osoby w danej liczbie testów 
równoległych, jeśli ta liczba 
wzrasta nieograniczenie

background image

Wynik prawdziwy 

(Guilford, 1954)

• średnia z nieskończenie wielu 

badań tym samym testem

• wynik danej osoby otrzymany w 

idealnych warunkach idealnym 
narzędziem pomiarowym

background image

Składnik błędu (Guilford, 

1954)

• różnica między wynikiem 

prawdziwym a wynikiem 
otrzymanym

• wartość dodatnia lub ujemna 

będąca funkcją warunków 
testowania konkretnej osoby w 
konkretnym badaniu

background image

„Błąd” pomiaru

• Pojęcie ”błędu” nie zawsze powinno być 

rozumiane dosłownie, jako niedokładność

• W metodologii ogólnej: „błąd” to 

niedokładność plus wszystko to, czego 

nie badamy

• W psychometrii: fluktuacja cechy może 

nie być błędem, lecz przedmiotem 

pomiaru

• Dwie najbardziej stałe cechy w 

psychologii: IQ i… podatność hipnotyczna

background image

Założenia klasycznej teorii 

testów

• Średnia arytmetyczna błędów wynosi 

zero

• Korelacja wyniku prawdziwego i 

składnika błędu jest zerowa

• Korelacja składników błędu dwóch 

testów równoległych (czyli dwóch 
kolejnych pomiarów) jest zerowa

• Korelacja składników błędu w teście i 

reteście tym samym testem jest zerowa

background image

• Z założenia o istnieniu wyniku 

prawdziwego, niezależnego od aktu 

pomiaru, oraz z założenia o 

losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno 

w dwóch kolejnych pomiarach 

przynieść takie same wyniki

– różnice między wynikami dwóch 

kolejnych pomiarów są odbiciem 

błędów pomiaru i mogą służyć do jego 

szacowania

– (podobnie zachowają się wersje 

idealnie równoległe)

background image

• Błędy systematyczne 

(skorelowane)

• Błędy losowe (nieskorelowane)

– Klasyczna teoria testu i wskaźniki 

rzetelności dotyczą wyłącznie błędów 
losowych

background image

Szacowanie składnika 

błędu

• Z założenia o istnieniu wyniku prawdziwego, 

niezależnego od aktu pomiaru, oraz z 

założenia o losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno w dwóch 

kolejnych pomiarach przynieść takie same wyniki

– różnice między wynikami dwóch kolejnych 

pomiarów są odbiciem błędów pomiaru i mogą 

służyć do jego szacowania

– (podobnie zachowają się wersje idealnie 

równoległe)

background image

• Rzetelność jest zatem równa teoretycznej 

wartości współczynnika korelacji w dwóch 

kolejnych badaniach (twierdzenie przydatne 

empirycznie)

• Rzetelność jest też równa kwadratowi 

korelacji między wynikiem prawdziwym a 

wynikiem otrzymanym (twierdzenie mniej 

przydatne empirycznie)

• Najprościej mówiąc, test rzetelny to taki, 

którego wyniki korelują wysoko z sobą przy 

powtórzeniu badania

background image

Długość testu a jego 

rzetelność

• Im dłuższy test (im więcej pozycji 

zawiera) tym jest rzetelniejszy, to jest, 
tym mniejszym jest obciążony błędem

• Im więcej składowych znajduje się w 

teście, tym bliższy jest on wynikowi 
prawdziwemu na mocy definicji 
stwierdzającej, że wynik prawdziwy to 
średnia z nieskończenie wielu testów 
równoległych

background image

• Rzetelność a wskaźniki rzetelności
• Bezpośrednie badanie rzetelności:

– kalibracja
– seria pomiarów

(w psychologii ani jedno, ani drugie nie jest 

możliwe)

• Pośrednie badanie rzetelności: 

wskaźniki rzetelności

background image
background image

Krytyka aksjomatyki 

Gulliksena

• Thorndike (1964): ponieważ wyniki 

prawdziwe nie są mierzalne bezpośrednio, 
są one mitem i nie mogą mieć znaczenia 
teoretycznego

– przyjęcie tego poglądu odrzucałoby całą 

statystykę inferencyjną, która dotyczy głównie 
szacowania nieobserwowalnych parametrów

– wyniki prawdziwe nie są mierzalne 

bezpośrednio, ale są szacowalne, z błędem nie 
wykluczającym teoretycznej ani praktycznej 
użyteczności

background image

Krytyka aksjomatyki 

Gulliksena

• Poważniejszy zarzut (Lord i Novick, 

1968): nieweryfikowalność założenia 
o losowości błędu pomiaru, czyli 
postulatu, że średni błąd wynosi 
zero. Stopień prawdziwości tego 
założenia nie jest szacowalny (w 
przeciwieństwie do 
nieobserwowalnych parametrów)

background image

• Rzetelność odnosi się do:

– stabilności
– równoważności
– spójności

wyników testowych.

background image

Rzetelność – właściwość 

testu 

czy zbioru wyników?

• Rzetelność jest właściwością zbioru 

wyników uzyskanego na konkretnej 

populacji, a nie testu

• Stwierdzenie: „rzetelność testu X 

wynosi 0,87” jest skrótem myślowym

• Oszacowanie rzetelności testu może 

się różnić w różnych populacjach, np. 

IQ szacowane w próbie pobranej z 

populacji generalnej i z populacji 

studentów

background image

• Wszystkie metody szacowania 

rzetelności oparte są na badaniu 
zgodności między zbiorami 
wyników, dotyczących tej samej 
cechy

background image

• Współczynniki rzetelności, jak 

wszystkie miary oparte na 
korelacji, są wrażliwe na wielkość 
wariancji w próbie

• Mogą być generalizowane tylko na 

tę populację, z której pobrano 
próbę

background image

 YIELD1 vs. YIELD2

Wsp. korelacji = ,74

 YIELD1

 Y

IE

LD

2

-2

0

2

4

6

8

10

12

14

-2

0

2

4

6

8

10

12

14


Document Outline