background image

11.3.3. Metody i techniki diagnostyczne w świetle badań

Szybki postęp wiedzy naukowej w ostatnich latach umożliwia tworzenie 

doskonalszych procedur diagnostycznych i stałe podnoszenie standardów diagnozy.  Sprawia 

też jednak, że wiele klasycznych twierdzeń i obyczajów w praktyce diagnozowania traci 

aktualność, a uznane narzędzia diagnostyczne okazują się mieć poważne wady.  W niniejszym 

podrozdziale przedstawimy sposoby oceniania narzędzi diagnostycznych na podstawie testów 

empirycznych, a także przedstawimy niektóre wnioski, płynące z tego typu badań. 

11.3.3.1. O potrzebie krytycznego spojrzenia na techniki i metody 

diagnostyczne 

W swym popularnym podręczniku diagnozy psychologicznej Gary Groth-Marnat (2003) 

wyróżnia trzy główne metody diagnozowania: wywiad, obserwowanie zachowania i 

testowanie. Chcąc najogólniej je scharakteryzować, można powiedzieć, że wywiad polega na 

rozmawianiu z osobą badaną, obserwacja – na zaplanowanym rejestrowaniu jej określonych 

zachowań, a testowanie – na stawianiu jej wobec różnego rodzaju zadań. Jest to klasyczny 

podział metod diagnostycznych, wydaje się jednak, że współcześnie te kategorie tracą ostrość 

i można zasadnie pytać, czy jest sens posługiwać się nimi nadal. Czy rzeczywiście są testami 

wszystkie techniki diagnostyczne, których nie sposób uznać za wywiad ani obserwację? I czy 

z kolei pewne procedury wywiadu lub obserwacji nie mogłyby zostać nazwane testami? 

Przypomnijmy na początek, że pojęcie testu psychologicznego (zob. także rozdział 10) jest 

ściśle określone (patrz ramka 11.9). 

Ramka 11.9. 

Definicja testu

Test psychologiczny

 

jest specyficzną procedurą diagnozowania. Może to być zbiór zadań lub pytań, 

które w standardowych warunkach wywołują określone rodzaje zachowań i dostarczają wyników o 

pożądanych właściwościach psychometrycznych (Hornowska, 2001; Paluchowski, 2001). Test jako 

procedura zbierania danych, musi spełniać następujące warunki:

1.       standaryzacja (taki sam przebieg badania, materiał, instrukcja itp. dla każdej osoby badanej); 

2.       obiektywność (sposób obliczania/interpretacji wyniku na tyle jednoznaczny, że każdy diagnosta 

dochodzi do tych samych rezultatów); 

3.       

 

normalizacja (znane są średnie wyniki, jakie wiele innych osób uzyskało w tym zadaniu). 

Testy stosowane w praktyce powinny także mieć udowodnioną empirycznie trafność i rzetelność, które 

da się określić tylko dla procedur, spełniających dwa pierwsze z powyższych warunków

background image

Testem jak najbardziej może być procedura obserwacyjna lub procedura wywiadu, jeśli tylko 

jest wystandaryzowana, zobiektywizowana, posiada normy i znana są jej trafność i rzetelność. 

Z takim stanowiskiem spotykamy się w innym współczesnym podręczniku diagnozy 

psychologicznej. Daniel Segal i Frederick Coolidge (2003) zaliczając ustrukturalizowane i 

częściowo ustrukturalizowane procedury wywiadu do testów obiektywnych, wyjaśniają, że 

„choć klasycznie nie uważano ich za obiektywne testy, jednak są nimi, skoro zawierają 

jednoznaczne, standardowe pytania, podawane w określonym porządku, a odpowiedzi są 

kodowane w określony sposób” (Segal i Frederick, 2003, s. 4-5). Teoretycznie nic nie stoi na 

przeszkodzie, by dowolne zadanie, pytanie czy ich zestaw opracować w formie testu – 

potrzebne jest tylko zainwestowanie w to badawczego wysiłku. 

Z drugiej strony nie wszystko, co na test wygląda, jest nim w istocie. W kolorowych 

tygodnikach, a niekiedy nawet w poważnych wydawnictwach można spotkać się z zestawami 

zadań, które jakoby mają wykazać różne skłonności wykonującej je osoby. Jeśli jednak „test” 

nie spełnia wymienionych wyżej warunków, a żadne badania na temat jego trafności i 

rzetelności nie były przeprowadzane, albo też przeprowadzono ich za mało, wybiórczo lub w 

inny sposób nie dopełniono procedur naukowych, to twierdzenia o związku pewnych 

właściwości psychicznych z wynikami w takim zadaniu są jedynie prywatnymi wierzeniami 

zwolenników takich zadań. Nie ma przy tym żadnego znaczenia, czy w nazwie zadania 

występuje słowo „test”. Słowo to nie jest terminem prawnie zastrzeżonym, w związku z czym 

każdy może je nadać dowolnemu zadaniu własnego pomysłu. 

Nie są też testami niektóre – całkiem liczne - instrumenty, tworzone ad hoc w organizacjach 

na potrzeby selekcji, rekrutacji lub oceny pracowników. Jak pisze Lutz  Homke (2002) siły 

rynku wymuszają szybkie decyzje i menażerowie naciskają nierzadko, aby w krótkim czasie 

zdiagnozować interesujące ich zjawisko. Jednak narzędzia tworzone doraźnie zazwyczaj nie 

mają podbudowy ani teoretycznej, ani empirycznej (trafność!), ich wartość więc bywa 

wątpliwa. Nie chcemy tu jednak dyskredytować nowych narzędzi diagnostycznych, które nie 

spełniają wymagań tylko dlatego, że są w trakcie badań. Fakt, że test na przykład nie ma 

jeszcze norm, nie musi oznaczać, że jest nieprzydatny – można stosować go w badaniach 

naukowych lub do porównywania między sobą wielu badanych osób czy grup, nie wolno 

natomiast przy braku norm dla testu formułować na jego podstawie diagnozy indywidualnej. 

Słowo „test” figuruje też w nazwach niektórych uznanych narzędzi diagnostycznych, 

które z pewnością testami nie są. Na przykład Test Apercepcji Tematycznej w wąskim 

rozumieniu jest nazwą własną techniki projekcyjnej autorstwa Henry Murraya (1943), która 

nie spełnia kryteriów testu. Psycholodzy stosują też – na mocy utrwalonego obyczaju - termin 

background image

„Test Apercepcji Tematycznej” w szerszym znaczeniu, mając na myśli rodzinę technik 

projekcyjnych, z których niektóre są testami w najściślejszym sensie psychometrycznym, ale 

inne z pewnością nie. Nie znaczy to, że wszystkie z tej ostatniej kategorii są bez wartości dla 

diagnozy, jednak należy stosować je inaczej i do innych celów, niż testy (por. Stemplewska-

Żakowicz, 2004a). 

Są jednak i takie techniki, które – choć w nazwie mają słowo „test”, to nie tylko nie są 

testami, ale w ogóle nie powinny być używane w diagnozie psychologicznej, ponieważ 

badania dowiodły, że są nietrafne. Na liście zdyskredytowanych narzędzi diagnostycznych, 

którą na podstawie opinii 101 ekspertów stworzyli John Norcross, Gerald Kocher i Ariel 

Garofalo  (2006), dwa pierwsze miejsca zajmują Test Kolorów Lűschera i Test Szondiego 

jako techniki badania osobowości (zob. podrozdział 11.3.3.2). Co ciekawe, słowo „test” 

figuruje w nazwie wielu technik, łagodnie mówiąc, mało ścisłych, natomiast techniki, które 

prawdziwie są testami, często nazywają się inaczej (np. skala, zestaw). Ponieważ zarówno 

nazwy, jak i ogólne klasyfikacje mogą być mylące, najpewniejszym sposobem rozpoznania, 

czym jest dana technika diagnostyczna i jaka jest jej wartość, jest samodzielna ocena, na ile 

spełnia ona standardy psychometryczne i jakie dane

 

zebrano o

 

jej trafności, rzetelności i 

praktycznej efektywności. A jeśli sami psycholodzy nie dokonają krytycznej oceny 

stosowanych przez siebie metod, może się zdarzyć, że zastąpią ich w tym -  i zawstydzą 

zarazem - profesjonaliści z innych dziedzin, co spotkało pewnego biegłego sądowego z 

dziedziny medycyny i stało się powodem sformułowania tak zwanych „kryteriów Dauberta” 

(patrz ramka 11.10).  

Ramka 11.10

Kryteria Dauberta 

W roku 1993 przed Sądem Najwyższym Stanów Zjednoczonych  toczyła się sprawa "Daubert vs 

Merrell Dow  Pharmaceuticals Inc.", w której William Daubert i inni wystąpili przeciwko firmie 

farmaceutycznej o odszkodowanie za upośledzenia noworodków, spowodowane przez zażywanie 

leku o nazwie Bendectin przez matki w ciąży. Sąd orzekł, że brak jest naukowych dowodów na 

związek między zażywaniem leku a uszkodzeniem płodu. Kryteria, którymi się kierował oceniając 

wiarygodność opinii biegłych, stały się znane jako „kryteria Dauberta” i na mocy precedensowego 

prawa Stanów Zjednoczonych stanowią obecnie dla sędziów wskazówki, jak podejmować decyzje o 

dopuszczeniu dowodu z opinii biegłego (często psychologa). 

background image

 

Kryteria Dauberta są dobrze spełnione przez techniki diagnostyczne, wypracowane lub 

zweryfikowane w ramach nurtu EBA (Faigman i Monahan, 2005).

11.3.3.2. Ocena narzędzi diagnostycznych z perspektywy EBA 

Charakterystycznym rysem EBA jest akcent położony na wiarygodne techniki pomiaru. Aby 

określone narzędzie diagnostyczne zostało na gruncie EBA uznane za wiarygodne, jego 

parametry psychometryczne muszą być przekonujące (por. też Brzeziński, 1996). Wydaje się 

to oczywiste. Mniej znane polskim psychologom są natomiast szczegółowe pojęcia i 

statystyki, stosowane w praktyce do szacowania trafności diagnostycznej narzędzia, a 

wywiedzione z zastosowania twierdzenia Bayesa i teorii decyzji (por. Anastasi i Urbina, 1999; 

Paluchowski 2001) do zagadnień diagnozy psychologicznej. 

Wykorzystanie w psychologii podejścia Bayesa zaproponowali Paul Meehl i Albert 

Rosen (1955), co zaowocowało dalszymi badaniami i koncepcjami (Cronbach i Gleser, 1957; 

Grove, 2006; Mash i Hunsley, 2005), stanowiącymi dziś element kanonu wiedzy na temat 

praktyki diagnostycznej (APA - Division 12: Presidential Task Force, 1999). Podejście to 

stanowi także w dużym stopniu realizację postulatów Meehla na temat sformalizowania reguł 

podejmowania decyzji klinicznych. Dokładniej, chodzi o oszacowanie prawdopodobieństwa, 

z jakim diagnosta może orzekać o zaistnieniu pewnego zjawiska lub o stwierdzeniu pewnej 

właściwości u diagnozowanej osoby na podstawie zaobserwowanego wskaźnika  tego 

Kryteria Dauberta to w gruncie rzeczy – jak piszą William Grove i Christopher Barden (1999, s. 226) – 

podstawowe zasady naukowego poznania,  sformułowane jako 6 pytań o wskaźniki naukowej 

rzetelności. 

1.         Czy teoria lub technika, stanowiąca podstawę dowodu, jest sprawdzalna? 

2.         Czy istotnie została sprawdzona za pomocą trafnych i rzetelnych procedur i czy wynik 

tych badań był pozytywny? 

3.         Czy została poddana tzw. ślepej recenzji (peer review)? 

4.         Jak duże jest ryzyko, że teoria jest błędna? Jaki jest błąd pomiaru techniki? 

5.         Czy zostały ustanowione standardy dla stosowania danej techniki?

6.         Czy dana teoria lub technika jest ogólnie akceptowana przez odpowiednie środowisko 

naukowców? 

background image

zjawiska lub właściwości. Na przykład, na ile pewne jest rozpoznanie określonego zaburzenia 

psychicznego na podstawie stwierdzenia jego objawu, albo orzekanie o specyficznych 

uzdolnieniach u osoby, która dobrze wypadła w zadaniu testowym, wymagającym 

wykorzystania tych uzdolnień. 

Problem nie jest banalny, ponieważ wskaźniki empiryczne – jak to wyjaśnił polskim 

badaczom Stefan Nowak (1965) - miewają różną moc rozdzielczą i wyjątkowo tylko osiągają 

wartość jedności. Realnym problemem diagnostycznym są wobec tego wątpliwości, 

przykładowo, co do tego, z jaką pewnością można rozpoznać schizofrenię u pacjenta, który 

relacjonuje poczucie depersonalizacji i omamy słuchowe. Wprawdzie oba te objawy są 

charakterystyczne dla schizofrenii, jednak przytrafiają się niekiedy także ludziom zdrowym. 

Jak więc mamy uzyskać pewność, że w tym przypadku jest to – lub nie jest – choroba 

psychiczna? (zob, tabela 11.2). 

Nie da się odgadnąć odpowiedzi na to pytanie. Również doświadczenie kliniczne 

może być bardzo mylące, ponieważ psycholog nie powinien zakładać, że klienci, z którymi 

miał dotąd do czynienia w swojej praktyce, stanowili próbę reprezentatywną i że jednakowo 

dobrze ich wszystkich zapamiętał. Tylko badania empiryczne mogą dostarczyć tu wytycznych 

do wnioskowania. Dla każdego wskaźnika trzeba empirycznie określić prawdopodobieństwo 

trafnego rozpoznania na jego podstawie diagnozowanego zjawiska lub właściwości, a także 

ryzyko popełnienia przy tym błędu. Innymi słowy, trzeba określić warunkowe 

prawdopodobieństwo zaistnienia kryterium (w naszym przykładzie: schizofrenii u danej 

osoby), gdy spełniony jest warunek dotyczący predyktora (gdy występuje dany objaw). 

Tabela 11.2. Hipotetyczne wyniki badania wartości poczucia depersonalizacji jako predyktora 
(wskaźnika) schizofrenii

Predyktor (wskaźnik): 

poczucie depersonalizacji

Kryterium (diagnozowane zjawisko): schizofrenia

zdiagnozowano schizofrenię

nie zdiagnozowano 
schizofrenii

występuje poczucie 
depersonalizacji

30

(a)

15

(b)

nie występuje poczucie 
depersonalizacji

10

(c)

35

(d)

Do tego właśnie pomocne okazało się twierdzenie Bayesa, na którym opierają się 

stosowane dziś sposoby oceniania narzędzi diagnostycznych. Miarą trafności narzędzia są 

empiryczne współczynniki, dotyczące proporcji trafnych i nietrafnych diagnoz, postawionych 

na podstawie tego narzędzia. W tabeli 11.3 zestawiliśmy podstawowe pojęcia, dotyczące tak 

rozumianej trafności diagnostycznej:

background image

Tabela 11.3. Podstawowe pojęcia dotyczące trafności diagnostycznej predyktora (wskaźnika).

Pojęcie

Znaczenie pojęcia

Przykład (por. tabela 11.2)

diagnozowane zjawisko 
(kryterium)  – schizofrenia 

wskaźnik (predyktor)  – poczucie 
depersonalizacji

Proporcja podstawowa 
(base rate) diagnozowanego 
zjawiska (kryterium) 

Częstość występowania 
diagnozowanego zjawiska 
(kryterium) w populacji 

Odsetek w populacji osób chorych na 
schizofrenię 
(a)+(c)/[(a)+(b)+(c)+(d)]

Czułość (sensitivity
wskaźnika (predyktora). 
Inaczej: trafne wskazania 
(true-positives

Warunkowe 
prawdopodobieństwo 
wystąpienia predyktora, gdy 
wystąpiło kryterium

Odsetek osób doświadczających 
poczucia depersonalizacji wśród 
chorych na schizofrenię. 
(a)/[(a)+(c)]=0,75

Swoistość (specificity
wskaźnika (predyktora) 
Inaczej: trafne odrzucenia 
(true-negatives

Warunkowe 
prawdopodobieństwo nie 
wystąpienia predyktora, gdy 
nie wystąpiło kryterium. 

Odsetek osób nie doświadczających 
poczucia depersonalizacji wśród 
zdrowych
(d)/[(b)+(d)]=0,70

Moc prognozy pozytywnej, 
PPP
 (positive prediction 
power
)

Warunkowe 
prawdopodobieństwo 
wystąpienia kryterium, gdy 
wystąpił predyktor 

Odsetek  chorych na schizofrenię 
wśród osób doświadczających 
poczucia depersonalizacji. 
(a)/[(a)+(b)]=0,67

Moc prognozy negatywnej, 
NPP
 (negative prediction 
power

Warunkowe 
prawdopodobieństwo nie 
wystąpienia kryterium, gdy 
nie wystąpił predyktor 

Odsetek zdrowych wśród osób nie 
doświadczających poczucia 
depersonalizacji
(d)/[(c)+(d)]=0,78

Błędne wskazania (false-
positivse
)

Proporcja błędnie 
wskazanych przez predyktor 
przypadków wystąpienia 
kryterium 

Odsetek osób, które okazały się 
zdrowe, wśród wszystkich osób, 
doświadczających poczucia 
depersonalizacji 
(b)/[(a)+(b)]=0,33

Błędne odrzucenia (false-
negatives
)

Proporcja błędnie 
wskazanych przez predyktor 
przypadków nie wystąpienia 
kryterium 

Odsetek osób, które okazały się chore 
na schizofrenię wśród wszystkich 
osób, nie doświadczających poczucia 
depersonalizacji  
(c)/[(c)+(d)]=0,22

Efektywność (eficiency
wskaźnika (predyktora)
Inaczej: proporcja trafień 
(hit rate)

Proporcja trafnych predykcji 
(wskazań i odrzuceń razem) 
we wszystkich predykcjach 
(trafnych i błędnych razem)

Łączny odsetek osób, które okazały się 
chore na schizofrenię i doświadczały 
depersonalizacji oraz tych, które 
okazały się zdrowe i nie doświadczały 
depersonalizacji, w grupie wszystkich 
osób, dla których formułowano te 
przewidywania.
[(a)+(d)]/[(a)+ (b)+(c)+(d)]=0,75

Bardzo przydatne przy ocenie trafności danego wskaźnika lub testu są wykresy 

związku między odsetkiem wyników prawdziwie i fałszywie dodatnich, nazywane krzywymi 

ROC (receiver operating characteristic curve). O ile nam wiadomo, w polskiej literaturze 

background image

psychologicznej nie ma na razie opracowań na ten temat, zainteresowanych Czytelników 

zachęcamy więc do sięgnięcia do prac angielskojęzycznych (Grove, 2006: Swets, Dawes i 

Monahan, 2000;) lub polskojęzycznych  z pokrewnej dziedziny EBM czyli medycyny opartej 

na dowodach empirycznych (Jaeschke, Cook i Guyatt, 1998b; Smoleń , 2003). 

Kwestie dobroci psychometrycznej narzędzia diagnostycznego nie są oczywiście 

nowością w psychologii, ani też nie są specyficzne tylko dla EBA, jednak – co może już być 

uznane za pewną nowość w praktyce psychologicznej – bezwarunkowe obstawanie przy 

standardach psychometrii ma tutaj charakter fundamentalny. W ocenie przydatności narzędzia 

do konkretnych celów diagnostycznych przykłada się też wielką wagę do tego, czy istnieją 

badania walidacyjne i normalizacyjne, dokonane w odniesieniu do tego właśnie celu 

diagnostycznego i tej konkretnej populacji, z której pochodzi osoba, mająca być 

diagnozowana danym narzędziem. 

Ta rygorystyczna postawa doprowadziła do intensywnej debaty, jaką odbyto w 

ostatnich latach w kwestii wiarygodności różnych narzędzi diagnostycznych, w tym 

zwłaszcza technik projekcyjnych (Lillienfeld, Wood i Garb, 2000/2002; Hibbard, 2003; por. 

Stemplewska-Żakowicz, 2004b). Jednym z jej efektów jest niemal powszechna dziś zgoda 

wśród psychologów co do tego, że pewne narzędzia diagnostyczne w świetle współcześnie 

dostępnych danych empirycznych należy uznać za zdyskredytowane i zaprzestać ich 

stosowania (Norcross, Kocher i Garofalo, 2006). Listę sześciu pierwszych pozycji 

zdyskredytowanych narzędzi diagnostycznych stworzoną na podstawie opinii 101 

psychologów-ekspertów (Norcross, Kocher i Garofalo, 2006, s. 520) przestawiono niżej. Przy 

każdej pozycji podano cel diagnostyczny, do którego przydatność danej techniki była 

oceniana. 

background image

     

Niech nas zatem nie zmyli fakt, że jakieś narzędzia są od dawna stosowane w praktyce, uczy 

się o nich studentów, a nawet znajdują się w ofercie wydawnictw, zajmujących się testami 

psychologicznymi. Jak piszą Norcross, Kocher i Garofalo (2006, s. 522): 

Psychologia nieustannie dokonuje autopoprawek, ponieważ jej podstawą (w większym 

stopniu, niż innych profesji) są dowody empiryczne. Dokonaliśmy – jako dyscyplina – 

znaczącego postępu w odróżnianiu nauki od pseudonauki w praktyce psychologicznej.

1.1.1.Narzędzia diagnostyczne i strategie diagnozowania 

Rzetelne narzędzia diagnostyczne to podstawa EBA, ale – jak podkreśla wielu 

autorów (por. Fernández-Ballesteros, De Bruyn, Godoy, Hornke, i in.,  2001; Krishnamurthy, 

VandeCreek, Kaslow, Tazeau i in., 2004) - diagnozowanie to coś więcej niż stosowanie testów 

i innych technik diagnostycznych. Przeprowadzanie badania pojedynczym narzędziem 

diagnostycznym to zadanie – rzec można - poziomu podstawowego w diagnozowaniu. 

Proponujemy wyróżnić dwa kolejne poziomy o większym stopniu złożoności. Poziom 

pośredni to wybór i zrealizowanie strategii diagnozowania konkretnej właściwości lub 

zjawiska (np. kompetencji społecznych pracownika, uzdolnień ucznia czy ryzyka 

samobójstwa pacjenta). Najbardziej złożony jest poziom całościowy czyli integracja 

wszystkich zadań z poziomu pośredniego i skuteczna realizacja całego procesu 

diagnozowania zgodnie z przyjętą strukturą.  Relacja między zadaniami z tych trzech 

Ramka 11.11

Narzędzia diagnostyczne uznane za zdyskredytowane (opis w tekście) 

 Test Kolorów Lűschera  (diagnoza osobowości), 

 Test  Szondiego (diagnoza osobowości), 

  grafologiczna analiza pisma (diagnoza osobowości), 

Wzrokowo-Motoryczny Test Gestalt Lauretty Bender (wykrywanie uszkodzeń 

neuropsychologicznych, diagnoza osobowości), 

technika „Enneagram” (diagnoza osobowości) 

stosowanie anatomicznie dokładnych lalek (wykrywanie nadużyć seksualnych u 

dzieci). 

background image

poziomów jest hierarchiczna. Przeprowadzenie badania konkretną  techniką diagnostyczną 

(np. kwestionariuszem BDI ) jest elementem wybranej strategii rozpoznania pewnego 

zjawiska (np. oszacowania ryzyka samobójstwa), a ta z kolei stanowi część całościowego 

procesu diagnostycznego, którego celem jest rozwiązanie postawionego problemu  (np. jaki 

rodzaj pomocy psychologicznej jest odpowiedni dla osoby X.?) 

Obecnie zadania z dwóch niższych poziomów złożoności są lepiej opracowane 

empirycznie, niż zagadnienia dotyczące struktury procesu diagnozowania jako całości (o co 

upominał się Meehl).  Przegląd prac, w których jako słowo kluczowe figuruje „EBA”, 

pokazuje, że w ostatnich latach przeprowadzono cały szereg prac badawczych, poświęconych 

technikom i strategiom wiarygodnego diagnozowania różnych szczegółowych konstruktów, 

istotnych w praktyce psychologicznej. Na przykład  w pracy Phillipa M. Kleespies i Elizabeth 

L. Dettmer (2000) wszechstronnie omówiono strategię szacowania ryzyka zachowań 

samobójczych. Omówimy tę pracę nieco szerzej, ponieważ ilustruje ona, czym  w praktyce 

jest oparta na dowodach empirycznych strategia diagnozowania określonego zjawiska lub 

właściwości 

Szczególnych trudności nastręcza diagnostom szacowanie prawdopodobieństwa 

zjawisk, które są wyjątkowo rzadkie czyli – by zastosować nowe pojęcie z tabeli 11.3 -  ich 

proporcja podstawowa jest bardzo niska. Do takich należą (na szczęście!) samobójstwa. W 

latach 1995-1999 ich częstość wynosiła w Polsce 14,9 przypadków, a w USA 11,3 

przypadków na 100 tysięcy mieszkańców

1

. Oznacza to, że statystycznie polski psycholog 

może zetknąć się z problemem dokonanego samobójstwa w przybliżeniu raz na 7000 osób, 

które konsultuje, a psycholog amerykański nawet nieco rzadziej. Jednak każdy psycholog 

pragnie oczywiście nie zetknąć się z tym ani razu – zapobieganie ewentualnemu samobójstwu 

to przecież jeden z celów jego pracy!  Jak jednak określić, którego spośród 7000 tysięcy 

klientów trzeba otoczyć szczególną opieką z powodu groźby samobójstwa z jego strony? 

Trudność tego problemu Kleespies i Dettmer (op. cit.) ilustrują następująco: wyobraźmy 

sobie, że pewien diagnosta dysponuje absolutnie wyjątkową zdolnością określania ryzyka 

samobójstwa z 99% czułością i 99% swoistością.  Oznacza to (por. tabela 11.3), że wśród 

100 000 pacjentów trafnie rozpozna on 99 000 tych, którzy w przyszłości nie popełnią 

samobójstwa, a pozostałych 1000 osób zaliczy do grupy podwyższonego ryzyka.  Proporcja 

podstawowa jednak mówi, że przyszłych samobójców jest w tej grupie tak naprawdę tylko 

około 11 (w USA) lub 15 (w Polsce). Nawet jeśli nasz diagnosta ma do czynienia z samymi 

1

 Dane oryginalnie zamieszczone przez autorów (dotyczące tylko USA), zamieniliśmy tu na analogiczne, podane 

przez Marię Jarosz (2005), ponieważ te ostatnie pochodzą  z badan międzynarodowych i obejmują dodatkowo 
wskaźnik odnoszący się do Polski. 

background image

tylko pacjentami psychiatrycznymi, wśród których odsetek samobójstw jest wyższy, to w 

grupie wytypowanych 1000 osób z podwyższonym ryzykiem samobójstwa znajdzie się 60 

przyszłych  samobójców i aż 940 osób, które zostały wytypowane „na wyrost” i stanowią 

błędne wskazania (false-positives).  

Przykłady te pokazują, jak wiele znaczy proporcja podstawowa – to ona wyznacza, o 

jakich w gruncie rzeczy liczbach mówimy, szacując czułość i swoistość testu. Widzimy też, 

jaka jest skala trudności w diagnozowaniu rzadkich zjawisk, takich jak ryzyko samobójstwa. 

Nawet gdybyśmy dysponowali fantastyczną precyzją, która jest nie do osiągnięcia przez 

współczesne  narzędzia diagnostyczne, i tak zjawisko samobójstwa pozostawałoby 

praktycznie nieprzewidywalne, konkludują Kleespies i Dettmer (op. cit.). Zarazem w tych 

nielicznych  sytuacjach, gdy jednak staje się ono realną groźbą, którą pacjent może 

zrealizować w ciągu najbliższych godzin lub dni, wymaga to natychmiastowych działań 

psychologa.  Wszystko to, jak piszą autorzy, każe myśleć o skromniejszych niż jedno 

wyspecjalizowane narzędzie sposobach oceniania ryzyka samobójstwa na potrzeby skutecznej 

praktyki psychologicznej. 

Kleespies i Dettmer (op. cit.) dokonali przeglądu kilkudziesięciu badań empirycznych, 

dotyczących  samobójstw dokonanych. Były to badania post mortem, w których na podstawie 

zachowanej dokumentacji określano różne psychospołeczne i psychopatologiczne 

właściwości osób zmarłych i sprawdzano, które z tych właściwości w sposób istotny 

różnicowały osoby zmarłe w wyniku samobójstwa i zmarłe z innych przyczyn. Okazało się, 

że choć różnic tych było sporo, to nie sposób ułożyć ich w uniwersalną formułę predykcji, 

ponieważ pewne czynniki mają znaczenie tylko dla niektórych grup osób, inne zaś zaczynają 

odgrywać jakąkolwiek rolę dopiero zestawione razem, a nie same w sobie.  Kleespies i 

Dettmer (op. cit.) dokonali drobiazgowej kategoryzacji wszystkich tych czynników ze 

względu na wyniki badań nad ich znaczeniem dla samobójstw i powiązania z innymi 

czynnikami. Ostatecznie wyłoniło się z tego pięć profili, wyróżnionych ze względu na 

podstawowe zaburzenie psychiczne, rozpoznane u danej osoby. Wyniki te prezentuje tabela 

11.31: 

background image

Tabela 11.31. Czynniki empirycznie związane z ostrym ryzykiem samobójstwa (zaczerpnięto 

z Kleespies i Dettmer,  2000, str.1113). 

Rozpoznanie

Współwystęp
owanie 
innych 
zaburzeń

Czynniki 
zaostrzające

Osobowość

Stres

Czynniki 
ułatwiające

Tło historyczne 
lub środowiskowe 

depresja

nadużywanie 
alkoholu

aktualny 
epizod 
dwubiegunow
ej choroby 
afektywnej

nasilona 
anhedonia

bezsenność

obniżona 
koncentracja

nasilony lęk

ataki paniki

cechy 
obsesyjno-
kompulsyw
ne

brak w domu 
dzieci w 
wieku 
poniżej 18 lat

obecny epizod 
depresji jest co 
najwyżej trzecim w 
ciągu życia

brak przyjaciół w 
okresie dorastania

nadużywanie 
substancji

depresja

niedawna 
utrata 
ważnego 
emocjonaln
ie związku

nadużywanie 
alkoholu przez 
długi czas

trudności 
interpersonalne w 
jakimś okresie 
życia

schizofrenia

utrata nadziei

wrogość

depresja

wyobrażenia 
paranoidalne

cechy 
obsesyjno-
kompulsyw
ne

podwyższo
ny poziom 
subiektywn
ego 
distressu

negatywna 
postawa 
wobec 
leczenia

podwyższona 
świadomość 
upośledzając
ych skutków 
choroby

wiek pomiędzy 20 a 
40 lat

wczesny początek 
schizofrenii

wysoka inteligencja 
lub wykształcenie

dużo krótkich 
hospitalizacji 

poważne próby 
samobójcze w 
przeszłości

zaburzenie 
stresu 
pourazowego 

współwystępo
wanie innych 
zaburzeń

poczucie winy 
(np. za 
działania w 
czasie walki 
lub za fakt 
przeżycia)

epizod utraty 
kontroli podczas 
walki 

zaburzenia 
osobowości: 
antyspołeczna
, pograniczna 
lub 
zaburzenia 
zachowania

zaburzenia 
afektywne

nadużywanie 
substancji

słaba 
regulacja 
afektu (tylko 
przy 
zaburzeniach 
zachowania)

doznanie nadużyć 
fizycznych lub 
seksualnych w 
jakimś okresie 
życia (tylko przy 
zaburzeniach 
zachowania)

background image

Posługiwanie się profilami z tabeli 11.31 przez diagnostę polega na sprawdzaniu, na 

ile każdy z nich pasuje do konkretnej osoby, u której diagnozujemy ryzyko samobójstwa. W 

razie stwierdzenia pewnego podobieństwa pod niektórymi względami, diagnosta wie, jakie 

inne okoliczności lub właściwości tej osoby powinien rozpoznać. Na przykład Adam, którego 

przypadek opisaliśmy wcześniej, zdaje się spełniać wiele warunków, charakterystycznych dla 

profilu pierwszego: wykazuje objawy depresji i nadużywa alkoholu. Jednak, jak 

wspominaliśmy wyżej, na podstawie wstępnej rozmowy nie stawia się rozpoznania – na razie 

diagnosta ma jedynie hipotezy na temat depresji i uzależnienia Adama i obecnie 

najpilniejszym zadaniem jest ich weryfikacja,  w czym pomogą mu wyspecjalizowane 

narzędzia diagnostyczne – najlepiej te, które poddano wszechstronnej ocenie w ramach EBA 

(por. Joiner, Walker, Pettit, Perez i Cukrowicz, 2005 na temat diagnozy depresji oraz  Babor, 

de la Fuente, Saunders, Grant, 1996; Taracha, Habrat, Smela, Gruszyński, 2002 w kwestii 

oceny uzależnienia od alkoholu). Gdyby weryfikacja tych hipotez wypadła pozytywnie, profil 

pierwszy z tabeli 11.31  poprowadzi diagnostę do kolejnych czynników ryzyka, które należy 

zdiagnozować, aby na ich podstawie ocenić ryzyko samobójstwa. Na przykład, Adam 

relacjonował obniżoną koncentrację, nie wiadomo jednak, czy dotyczą go także pozostałe 

czynniki zaostrzające: anhedonia (utrata zdolności doświadczania przyjemności), bezsenność, 

lęk i ataki paniki – pomiar tych zmiennych stanowi więc kolejne zadanie diagnostyczne. 

Generalnie w EBA istnieją opracowania na temat optymalnych dla różnych populacji i 

w różnych kontekstach metod i strategii diagnozowania wielu różnych konstruktów 

psychologicznych, prócz wymienionych wcześniej są to między innymi zaburzenia 

osobowości (Widiger, Samuel, 2005),  lęk i zaburzenia z nim związane (Antony, Orsillo i 

Roemer, 2001; Antony i Rowa, 2005) czy brak satysfakcji ze związku u dorosłych (Snyder, 

Heyman i Haynes, 2005), a także autyzm i zespół Aspergera (Ozonoff, Goodlin-Jones i 

Solomon, 2005) czy ADHD u dzieci i młodzieży (Pelham, Fabiano i Massetti, 2005).  

Trzeba też jasno stwierdzić, że młody nurt EBA nie jest oczywiście źródłem 

wszystkich wiarygodnych i empirycznie ugruntowanych technik diagnostycznych, nie ma też 

monopolu na ich ocenianie. Istnieje wiele procedur diagnostycznych, stworzonych wcześniej i 

nie mających w nazwie hasła „EBA” , jednak po przeanalizowaniu okazują się jak najbardziej 

spełniać postulaty diagnozy opartej na dowodach empirycznych. Tytułem przykładu można tu 

wymienić procedury diagnozowania kompetencji osobistych oraz projekcyjne sposoby 

pomiaru motywacji, stworzone  przez Davida McClellanda i rozwijane następnie przez jego 

background image

współpracowników

2

 (Smith, 1992; Spencer i Spencer, 1993), a na gruncie psychologii 

polskiej – podejście Jana Strelaua  i współpracowników do diagnozy temperamentu (Strelau i 

Zawadzki, 1998; Zawadzki i Strelau , 1997). Strategie te i techniki diagnostyczne zostały 

opracowane w sposób, który może uchodzić za wzorcowy z punktu widzenia standardów 

diagnozy opartej na dowodach empirycznych. Niektóre z tych dawniejszych technik i strategii 

zostały już explicite docenione w pracach z nurtu EBA, inne zapewne doczekają się tego 

później. 

Zachęcamy też Czytelników do samodzielnego poddawania różnych technik i strategii 

diagnostycznych ocenie według standardów praktyki opartej na dowodach empirycznych. 

Charakterystycznym rysem EBA jest wezwanie praktyków do stania się po trosze badaczami 

we własnej praktyce. Diagnosta, który stoi przed konkretnym problemem czy decyzją 

diagnostyczną, postąpi bowiem najlepiej – w myśl zaleceń EBA -  jeśli dokona krytycznego 

przeglądu prac badawczych na temat, którego dotyczy jego problem lub decyzja i wybierze na 

tej podstawie sposób postępowania, który najlepiej odpowiada specyfice przypadku i 

indywidualności diagnozowanej osoby. W ten sposób wypełni ideę EBA, która – jak 

pisaliśmy na wstępie tego rozdziału – polega na integrowaniu najlepszych dostępnych 

wyników badań naukowych z biegłością praktyczną, w zgodzie z indywidualnymi 

wartościami, kultura i preferencjami osoby diagnozowanej. 

2

 W języku polskim z eksperymentami Mc Clellanda i współpracowników, prowadzonymi w tzw. paradygmacie 

wzbudzania, można zapoznać się w pracy Katarzyny Stemplewskiej-Żakowicz (2004), natomiast o 
diagnozowaniu kompetencji bliżej pisze Tamara Kasprzyk (2005).


Document Outline