plik

Założenia klasycznej teorii testu

(Gulliksen, 1950)

• do psychologii można zaadaptować model

pomiaru pochodzący z fizyki

• podobnie jak każdy obiekt fizyczny ma

określone wartości swoich cech fizycznych,

niezależne od aktu pomiaru i natury

narzędzia badawczego, tak każdy człowiek

ma nieznane prawdziwe wartości cech

psychologicznych

• podczas pomiaru obserwujemy wartości

prawdziwe mierzonej cechy, zakłócone

błędem równym różnicy miedzy

obserwowaną wartością wyniku pomiaru a

nieobserwowalną wartością prawdziwą

mierzonej cechy

Rzetelność

• Klasyczna teoria testu (Gulliksen, 1950)

– „psychometryczne opracowanie
problemu rzetelności i błędu pomiaru”

• Rzetelność jest miarą dokładności

pomiaru

= X



+ X

gdzie:

: wynik otrzymany



: wynik prawdziwy

: składnik błędu







gdzie:
r

- rzetelność



- wariancja wyników

prawdziwych
s

- wariancja wyników

otrzymanych

var

= var



+ var

Wynik prawdziwy

(Gulliksen, 1950)

• Wynik prawdziwy to granica, do

jakiej zmierza przeciętna wyników
i-tej osoby w danej liczbie testów
równoległych, jeśli ta liczba
wzrasta nieograniczenie

Wynik prawdziwy

(Guilford, 1954)

• średnia z nieskończenie wielu

badań tym samym testem

• wynik danej osoby otrzymany w

idealnych warunkach idealnym
narzędziem pomiarowym

Składnik błędu (Guilford,

1954)

• różnica między wynikiem

prawdziwym a wynikiem
otrzymanym

• wartość dodatnia lub ujemna

będąca funkcją warunków
testowania konkretnej osoby w
konkretnym badaniu

„Błąd” pomiaru

• Pojęcie ”błędu” nie zawsze

powinno być rozumiane dosłownie,

jako niedokładność

• W metodologii ogólnej: „błąd” to

niedokładność plus wszystko to,

czego nie badamy

• W psychometrii: fluktuacja cechy

może nie być błędem, lecz

przedmiotem pomiaru

• Dwie najbardziej stałe cechy w

psychologii: IQ i… podatność

hipnotyczna

Założenia klasycznej teorii

testów

• Średnia arytmetyczna błędów

wynosi zero

• Korelacja wyniku prawdziwego i

składnika błędu jest zerowa

• Korelacja składników błędu dwóch

testów równoległych (czyli dwóch
kolejnych pomiarów) jest zerowa

• Korelacja składników błędu w

teście i reteście tym samym
testem jest zerowa

• Z założenia o istnieniu wyniku

prawdziwego, niezależnego od

aktu pomiaru, oraz z założenia o

losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno

w dwóch kolejnych pomiarach

przynieść takie same wyniki

– różnice między wynikami dwóch

kolejnych pomiarów są odbiciem

błędów pomiaru i mogą służyć do

jego szacowania

– (podobnie zachowają się wersje

idealnie równoległe)

• Błędy systematyczne

(skorelowane)

• Błędy losowe (nieskorelowane)

– Klasyczna teoria testu i wskaźniki

rzetelności dotyczą wyłącznie błędów
losowych

Szacowanie składnika

błędu

• Z założenia o istnieniu wyniku

prawdziwego, niezależnego od aktu

pomiaru, oraz z założenia o losowości

błędów, wynika, że:

– idealne narzędzie badawcze powinno w

dwóch kolejnych pomiarach przynieść

takie same wyniki

– różnice między wynikami dwóch

kolejnych pomiarów są odbiciem błędów

pomiaru i mogą służyć do jego

szacowania

– (podobnie zachowają się wersje idealnie

równoległe)

• Rzetelność jest zatem równa

teoretycznej wartości współczynnika

korelacji w dwóch kolejnych badaniach

(twierdzenie przydatne empirycznie)

• Rzetelność jest też równa kwadratowi

korelacji między wynikiem prawdziwym

a wynikiem otrzymanym (twierdzenie

mniej przydatne empirycznie)

• Najprościej mówiąc, test rzetelny to

taki, którego wyniki korelują wysoko z

sobą przy powtórzeniu badania

Interpretacja

współczynników

rzetelności

• rzetelność = powtarzalność (stabilność)

wyników testowych (przy założeniu stałości
cechy)

• rzetelność = kwadrat korelacji między

wynikami prawdziwymi a wynikami
uzyskanymi w teście

• rzetelność = odsetek wariancji wyników

prawdziwych w wynikach otrzymanych

• rzetelność = procent wariancji wyników w

teście generowany przez wyniki prawdziwe

• rzetelność = korelacja między testami

równoległymi

• np. alfa Cronbacha = 0,82: 82% wyników w

teście można przypisać wynikom prawdziwym,
18%: składnikowi błędu

Długość testu a jego

rzetelność

• Im dłuższy test (im więcej pozycji

zawiera) tym jest rzetelniejszy, to
jest, tym mniejszym jest obciążony
błędem

• Im więcej składowych znajduje się

w teście, tym bliższy jest on
wynikowi prawdziwemu na mocy
definicji stwierdzającej, że wynik
prawdziwy to średnia z
nieskończenie wielu testów
równoległych

• Rzetelność a wskaźniki rzetelności
• Bezpośrednie badanie rzetelności:

– kalibracja
– seria pomiarów

(w psychologii ani jedno, ani drugie nie jest

możliwe)

• Pośrednie badanie rzetelności:

wskaźniki rzetelności

Krytyka aksjomatyki

Gulliksena

• Thorndike (1964): ponieważ wyniki

prawdziwe nie są mierzalne
bezpośrednio, są one mitem i nie
mogą mieć znaczenia teoretycznego

– przyjęcie tego poglądu odrzucałoby całą

statystykę inferencyjną, która dotyczy
głównie szacowania nieobserwowalnych
parametrów

– wyniki prawdziwe nie są mierzalne

bezpośrednio, ale są szacowalne, z
błędem nie wykluczającym teoretycznej
ani praktycznej użyteczności

Krytyka aksjomatyki

Gulliksena

• Poważniejszy zarzut (Lord i

Novick, 1968): nieweryfikowalność
założenia o losowości błędu
pomiaru, czyli postulatu, że średni
błąd wynosi zero. Stopień
prawdziwości tego założenia nie
jest szacowalny (w
przeciwieństwie do
nieobserwowalnych parametrów)