background image

Psychometria 2009

Wykład 7

Teoria odpowiedzi na 

pytania testu 

(Item Response Theory)

background image

Dwie idee podstawowe IRT 

(Item Response Theory

• Istnieje cecha latentna (ukryta), i 

istnieje jej natężenie (podobnie 

zakładała klasyczna teoria testu, KTT)

– w IRT, natężenie cechy latentnej 

symbolizowane jest literą θ (theta)

• Istnieje określone prawdopobieństwo 

określonej odpowiedzi na daną 

pozycję, przy określonym natężeniu 

cechy (odmiennie niż w KTT)

background image

Stolicą Australii jest: Sydney (Tak/Nie)

Stolicą Australii jest: Canberra (Tak/Nie)

background image

• Alternatywną nazwą dla Item 

Response Theory mogłoby być więc: 
Probabilistic Test Theory 

background image

Założenia IRT

• Jedna cecha latentna wyjaśnia kowariancje 

między pozycjami (założenie 
jednowymiarowości, unidimensionality)

– tzn., jeśli kontrolowałoby się wspólną wariancję 

generowaną przez cechę latentną, to itemy 
przestaną korelować

• założenie to w 100% w praktyce nigdy nie jest 

spełnione

• Łagodniejsza wersja: Jedna cecha latentna 

dominuje jako wyznacznik kowariancji 
itemów

background image

• Relacja między natężeniem cechy 

(theta) a prawdopodobieństwem 
określonej odpowiedzi ma obliczalny 
matematycznie kształt

background image
background image
background image

b – trudność pozycji. W KTT ≈ proporcja poprawnych 
odpowiedzi

background image

a – moc dyskryminacyjna pozycji. W KTT ≈ korelacja item-
total

background image

c – parametr zgadywania. W KTT ≈ prawdopodobieństwo 
trafienia przypadkowego

background image
background image

• Obliczanie a, b i c: tzw. kalibracja

– iteracyjny proces dochodzenia do wartości a, 

b i c na podstawie wyników uzyskanych na 
odpowiednio dużej próbie

• Parametry a, b i c są niezmienne między 

populacjami

• Nie znaczy to, że typ populacji nie jest 

ważny dla wyników kalibracji

– populacje wyselekcjonowane pod względem 

natężenia cechy utrudnią lub uniemożliwią 
kalibrację

– podobny problem jest też w KTT (im mniejsza 

wariancja, tym mniejsza korelacja i tym niższe 
np. oszacowanie rzetelności

background image

IRT a analiza rzetelności

• Odmienność podejścia IRT:

– rzetelność rozumiana jako zdolność do 

redukowania niepewności

– analiza rzetelności na poziomie 

poszczególnych pozycji, nie całości testu 

(pewien odpowiednik w KTT: analiza 

mocy dyskryminacyjnej)

– rzetelność pozycji może być różna dla 

różnych wartości (na gruncie KTT jest to 

herezja)

background image
background image
background image

Stronniczość

• W KTT – stronniczość całego testu, 

rzadziej analizuje się stronniczość 

pozycji, choć jest to możliwe

• W IRT: stronniczość na poziomie 

poszczególnych pozycji:

– jeśli parametry krzywych dla danej 

pozycji są różne dla różnych populacji, to 

pozycja ta jest stronnicza

– Podobnie jak w KTT, tak i w IRT nie 

wiadomo, czy stronniczość wynika z np. 

różnic genetycznych między populacjami, 

czy np. z czynników kulturowych

background image

Wynik końcowy w IRT

• nie jest „sumą” wyników dla 

poszególnych pozycji

• można użyć tylko części pozycji 

(niemożliwe w KTT)

• można użyć tailored testing: łatwiejsze 

pozycje dla osób o niższym natężeniu 
cechy, trudniejsze dla osób o wyższym 
natężeniu cechy) (herezja na gruncie 
KTT)

background image

Tailored testing

• Jeśli osoba zaliczy pierwszą pozycję o 

średniej trudności, dajemy jej trudniejszą

• Jeśli ją zaliczy, jeszcze trudniejszą
• … i tak dalej, aż nie zaliczy pozycji, wtedy 

łatwiejszą

• Z każdą kolejną pozycją maleje niepewność i 

węższe są oszacowane przedziały ufności

• Postępowanie kończymy, kiedy przedziały 

ufności są tak wąskie, jak sobie tego 
życzyliśmy

background image

Tailored testing

• Można stosować podzbiór pozycji 

- np. różnym studentom dawać 

różne pytania z puli ogólnej, 

unikając powtarzalności. 

• Studentom o różnym poziomie 

przygotownia można dawać 

pytania o różnej trudności - 

lepiej przygotowanym - trudne, 

gorzej przygotowanym - łatwe.

background image

Model Rascha 

• Uproszczona wersja IRT
• Tylko parametr b - trudność pozycji
• Zakłada, że zgadywanie i 

dyskryminacja nie mają znaczenia, 
albo pozycje złe pod względem 
zgadywania i dyskryminacji odrzuca 
się

background image

Jak to liczyć

• brak procedur w SPSS i STATISTIKA

http://edres.org/irt/

– Baker, Frank (2001). The Basics of Item 

Response Theory. ERIC Clearinghouse on 
Assessment and Evaluation, University 
of Maryland, College Park, MD.


Document Outline