Wskaźniki i pomiar w
psychologii
Klasyfikacje, techniki,
problemy
Co jest przedmiotem
pomiaru?
• Samoopis i introspekcja (typowe testy osobowości,
protokoły rozwiązywania problemów)
• Metody projekcyjne
• Wskaźniki behawioralne – zachowanie (habituacja,
preferencje wzrokowe, udzielenie pomocy)
• Wskaźniki wykonaniowe (czas reakcji*, liczba
poprawnych odpowiedzi)
• Wskaźniki psychofizyczne (reakcja na określone
właściwości fizyczne bodźca, np. próg
różnicowania wysokości dźwięku)
• Wskaźniki fizjologiczne (RSG, ERP, pomiar
ciśnienia krwi, obrazowanie aktywności mózgu)
• Wskaźniki demograficzne
• Wskaźniki anatomiczno/fizjologiczne
Sposób zbierania danych /
technika pomiaru
• Swobodna narracja, samoopis
• Rozmowa, wywiad niestrukturalizowany
• Obserwacja zachowań swobodnych
• Techniki projekcyjne
• Wywiad strukturalizowany
• Zadania i pytania otwarte (z nieograniczoną liczbą
możliwych odpowiedzi)
• Obserwacja reakcji na określony typ sytuacji
• Zadania i pytania zamknięte (ograniczona liczba
możliwych odpowiedzi
• Skale ocen i testy niestandaryzowane (wiele pozycji)
• Skale ocen i testy standaryzowane
• Pomiar fizyczny za pomocą wyskalowanego
narzędzia (czas reakcji, ERP, RSG)
Wybrane wskaźniki i metody
pomiarowe
• Techniki:
– Czas reakcji (RT)
– Potencjały wywołane (ERP)
– Współczesne techniki obrazowania aktywności kory
mózgowej (fMRI, PET i in.)
– Habituacja
– Skale postaw i inne techniki pomiaru postaw
– Test apercepcji tematycznej (TAT)
– Test wechslera
• Problemy:
– Problem trafności i rzetelności a moc rozdzielcza
wskaźnika
– Problem istnienia reprezentacji liczbowej
Trafność narzędzia
pomiarowego
• Czy narzędzie pomiarowe / wskaźnik
istotnie mierzy właściwą zmienną
(indicatum)
– Trafność teoretyczna (na ile test wynika z
definicji i praw wiążących daną zmienną w teorii
/ paradygmacie)
– Trafność empiryczna
• Diagnostyczna (na ile pomiar jest zgodny z innymi
kryteriami / metodami określania zmiennej)
• Prognostyczna (na ile wynik pomiaru pozwala
przewidywać konsekwencje danej wartości zmiennej)
– Trafność ekologiczna (na ile wartość zmiennej
ujawniona w pomiarze może być uogólniana na
sytuacje rzeczywiste)
Rzetelność narzędzia
pomiarowego
• Niezawodność, dokładność pomiaru – jaką
część zróżnicowania wyników pomiaru
można wyjaśnić rzeczywistym
zróżnicowaniem badanej zmiennej
– Powtarzalność wyniku pomiaru
– Zgodność pomiaru uzyskanego za pomocą
równoważnych metod
• Trafność i rzetelność metody determinują
jej moc rozdzielczą
Problem istnienia
reprezentacji
• Pomiar jako reprezentacja zmiennej w
określonym systemie formalnym
(kategorialnym, porządkowym, liczbowym)
– Czy wartości „rzeczywistej” zmiennej można
odwzorować na właściwości danego systemu
formalnego (np. rozłączność klas w klasyfikacji
zupełnej; jaki porządek?; stała jednostka
stopniowania zmiennej?
– Czy system formalny związany z narzędziem
pomiarowym reprezentuje zmienną?
→ trafność narzędzia
Czas reakcji (RT) jako miara
złożoności procesu mentalnego
• Założenia
– Operacje umysłowe (a) należą do określonego
systemu formalnego (wskazanego przez teorię)
oraz (b) są realizowane przez struktury neuronowe
mózgu. System formalny określa porządek
wykonywania operacji, a neuronalna podstawa
określa mierzalny czas trwania → proces złożony z
większej liczby operacji będzie wymagał dłuższych
czasów reakcji
• Przykład
– Liczba koniecznych operacji syntaktycznych a czas
rozumienia zdania
Czas reakcji – c.d.
• Trafność i rzetelność
– Czy trafne jest założenie o sekwencyjnym
wykonywaniu operacji składniowych?
– Jakie inne czynniki wpływają na czas reakcji
• Osobnicze (szybkość przetwarzania informacji, zasoby
uwagi)
• Inne konieczne procesy między bodźcem a reakcją
(reakcja receptora, analiza wzrokowa, reakcja
motoryczna)
• Nabyta sprawność i typowość operacji (neuronalne
reprezentacje operacji częstszych, bardziej typowych są
łatwiej aktywowane)
• Zwiększanie rzetelności metody pomiaru RT
• Warunek jak najszybszej reakcji (trafność ekologiczna?)
• Metoda subtrakcji vs. metoda czynników addytywnych
• Czas reakcji vs. jakość wykonania
• Eliminacja błędów grubych
Czas reakcji – c.d.
• Problem reprezentacji
– Pomiar czasu wyskalowany jest z dokładnością narzędzia
(takt zegara, częstotliwość odświeżania ekranu, na którym
prezentowane są bodźce, częstotliwość próbkowania klucza
reakcji), zwykle 0,001 – 0,001 s.
– Czas reakcji pojedynczego neuronu wynosi od kilku do
kilkudziesięciu ms.
– Czas prostych reakcji (jest/nie ma) wynosi minimum ok. 150
ms, a reakcji z wyborem 230 ms. (zwykle ponad 300 ms.)
– Różne operacje (np. negacja vs. zmiana strony biernej na
czynną) mogą różnić się czasem
→ Jaka różnica czasów reakcji świadczy o przyroście
liczby opercji umysłowych? Co reprezentują czasy
poniżej czasów reakcji prostych?
Potencjały wywołane (ERP)
• Założenia: takie jak przy RT plus słabe założenie o
lokalizacji mózgowej procesu
• Sposób pomiaru: pomiar potencjałów elektrycznych
na skórze głowy za pomocą dużej liczby elektrod
skorelowany z prezentacją bodźca. Ustalanie
przybliżonej lokalizacji mózgowego źródła potencjału
metodą statystyczną. Notacja: znak potencjału (P+,
N-) i czas pojawienia się w ms. (np. P300 – potencjał
dodatni pojawiający się 300 ms po prezentacji
bodźca)
• Rzetelność:
– w porównaniu z RT metoda pozwala wyodrębnić składniki
procesu przetwarzania bodźca i uchwycić procesy równoległe
– niezwiązana z bodźcem aktywność mózgu zakłóca pomiar –
konieczność uśredniania wyników z b. dużej liczby prób
– niska rozdzielczość przestrzenna
Obrazowanie aktywności
mózgu
• Założenia:
– różne procesy umysłowe aktywują różne struktury
neuronalne
– W aktywnych rejonach mózgu zwiększa się przepływ krwi i
absorpcja substancji odżywczych
• Metody pomiaru:
– PET detekcja pozytonów emitowanych przez rozpady
markera (doczepionego do glukozy)
– fMRI detekcja fali elektromagnetycznej wywołanej
rezonansem cząsteczek wody w silnym polu magnetycznym
• Rzetelność:
– Niska rozdzielczość czasowa
– Pomiar w niewygodnych i nienaturalnych warunkach
• Trafność teoretyczna i zagadnienie reprezentacji
– Czy różnice we wzorcach pobudzenia mózgu reprezentują
jakościowo odmienne procesy mentalne?
Dwa systemy myślenia – badanie za
pomocą fMRI
(za:
Habituacja
• Założenia:
– zasoby uwagi poświęcane bodźcowi
spadają wraz z jego znajomością
– Bodźce poznawczo podobne do wcześniej
prezentowanych będą traktowane jako
bardziej znajome niż bodźce poznawczo
niezgodne z poprzednio prezentowanymi
– Prezentacja nieznanego bodźca powoduje
wznowienie uwagi
• Przykład: Leslie (1984)
Skale postaw
• Definicja – postawa emocja, sąd poznawczy i
zachowanie
• Pomiar
– Różne wzorce jako wyraz nasilenia postawy (skala
Thurstone’a)
– Ocena nasilenia/prawdopodobieństwa danego wzorca (skala
Likerta)
• Rzetelność i trafność:
– Wieloetapowa procedura tworzenia skali (generowanie
pozycji, ocena przez sędziów kompetentnych, wybór pozycji
różnicujących itd.)
– Rotacja biegunów skali
• Problem reprezentacji:
– Jaką skalę pomiarową reprezentuje suma rang?
– Jak skala ta odwzorowuje się na rzeczywiste natężenie
postawy?
Skala Likerta
Ilekroć widzę kosmitę spluwam przez lewe ramię:
|______________|_______________|_______________|______________|
Zawsze
Często
Czasem
Rzadko
Nigdy
Kosmici są brudni
|______________|_______________|_______________|______________|
Całkowicie
Raczej
Nie mam
Raczej nie
Całkowicie
się zgadzam
się zgadzam
zdania
zgadzam się nie
zgadzam
się
Skala Thurstone’a
|_____|_____|_____|_____|_____|_____|_____|_____|_____|_____|
1
2 3 4 5
6
7
8 9 10
11
1.
Kiedy widzę kosmitę, rzucam się na niego z siekierą
2.
Kiedy widzę kosmitę, spluwam przez lewe ramię
3.
Kiedy widzę kosmitę, zawiadamiam policję
…
6.
Kiedy widzę kosmitę spokojnie przechodzę obok niego
…
11. Kiedy widzę kosmitę, zapraszam go na rodzinny obiad
Metody projekcyjne - TAT
• Założenia: problemy i konflikty (również
nieświadome) wpływają na percepcje
rzeczywistości → ujawniają się w
interpretacji wieloznacznych scen
• Pomiar: opowiadanie na bazie rysunku
przedstawiającego niejednoznaczną scenę
z obszaru potencjalnego konfliktu (np.
dorosłego i dziecko w nieokreślonej relacji)
• Trafność: czy opowiadanie jest rzeczywiście
projekcją wewnętrznych stanów badanego?
• Problem reprezentacji: Jaki system
kategorii?
Testy „inwentarzowe”
• Test
– W szerokim sensie: każdy akt pomiaru
– W wąskim sensie (test psychologiczny): wystandaryzowana
metoda pomiaru złożona z wielu pozycji (inwentarz – wiele
cech lub wymiarów mierzonych równocześnie)
• Standaryzacja: metoda statystycznego dopasowania
punktacji testowej do rozkładu wyników w populacji
– Badania standaryzacyjne na bardzo dużych próbach
dobranych według specjalnych schematów warstwowo-
losowych
• Problem reprezentacji: na ile wynik w teście (pozycja
względem statystycznych miar populacji: średniej,
mediany, odchylenia standardowego) oddaje
rzeczywiste nasilenie cechy?