1

11.3.3. Metody i techniki diagnostyczne w świetle badań

Szybki postęp wiedzy naukowej w ostatnich latach umożliwia tworzenie

doskonalszych procedur diagnostycznych i stałe podnoszenie standardów diagnozy. Sprawia

też jednak, że wiele klasycznych twierdzeń i obyczajów w praktyce diagnozowania traci

aktualność, a uznane narzędzia diagnostyczne okazują się mieć poważne wady. W niniejszym

podrozdziale przedstawimy sposoby oceniania narzędzi diagnostycznych na podstawie testów

empirycznych, a także przedstawimy niektóre wnioski, płynące z tego typu badań.

11.3.3.1. O potrzebie krytycznego spojrzenia na techniki i metody

diagnostyczne

W swym popularnym podręczniku diagnozy psychologicznej Gary Groth-Marnat (2003)

wyróżnia trzy główne metody diagnozowania: wywiad, obserwowanie zachowania i

testowanie. Chcąc najogólniej je scharakteryzować, można powiedzieć, że wywiad polega na

rozmawianiu z osobą badaną, obserwacja – na zaplanowanym rejestrowaniu jej określonych

zachowań, a testowanie – na stawianiu jej wobec różnego rodzaju zadań. Jest to klasyczny

podział metod diagnostycznych, wydaje się jednak, że współcześnie te kategorie tracą ostrość

i można zasadnie pytać, czy jest sens posługiwać się nimi nadal. Czy rzeczywiście są testami

wszystkie techniki diagnostyczne, których nie sposób uznać za wywiad ani obserwację? I czy

z kolei pewne procedury wywiadu lub obserwacji nie mogłyby zostać nazwane testami?

Przypomnijmy na początek, że pojęcie testu psychologicznego (zob. także rozdział 10) jest

ściśle określone (patrz ramka 11.9).

Ramka 11.9.

Definicja testu

Test psychologiczny

jest specyficzną procedurą diagnozowania. Może to być zbiór zadań lub pytań,

które w standardowych warunkach wywołują określone rodzaje zachowań i dostarczają wyników o

pożądanych właściwościach psychometrycznych (Hornowska, 2001; Paluchowski, 2001). Test jako

procedura zbierania danych, musi spełniać następujące warunki:

1. standaryzacja (taki sam przebieg badania, materiał, instrukcja itp. dla każdej osoby badanej);

2. obiektywność (sposób obliczania/interpretacji wyniku na tyle jednoznaczny, że każdy diagnosta

dochodzi do tych samych rezultatów);

normalizacja (znane są średnie wyniki, jakie wiele innych osób uzyskało w tym zadaniu).

Testy stosowane w praktyce powinny także mieć udowodnioną empirycznie trafność i rzetelność, które

da się określić tylko dla procedur, spełniających dwa pierwsze z powyższych warunków

Testem jak najbardziej może być procedura obserwacyjna lub procedura wywiadu, jeśli tylko

jest wystandaryzowana, zobiektywizowana, posiada normy i znana są jej trafność i rzetelność.

Z takim stanowiskiem spotykamy się w innym współczesnym podręczniku diagnozy

psychologicznej. Daniel Segal i Frederick Coolidge (2003) zaliczając ustrukturalizowane i

częściowo ustrukturalizowane procedury wywiadu do testów obiektywnych, wyjaśniają, że

„choć klasycznie nie uważano ich za obiektywne testy, jednak są nimi, skoro zawierają

jednoznaczne, standardowe pytania, podawane w określonym porządku, a odpowiedzi są

kodowane w określony sposób” (Segal i Frederick, 2003, s. 4-5). Teoretycznie nic nie stoi na

przeszkodzie, by dowolne zadanie, pytanie czy ich zestaw opracować w formie testu –

potrzebne jest tylko zainwestowanie w to badawczego wysiłku.

Z drugiej strony nie wszystko, co na test wygląda, jest nim w istocie. W kolorowych

tygodnikach, a niekiedy nawet w poważnych wydawnictwach można spotkać się z zestawami

zadań, które jakoby mają wykazać różne skłonności wykonującej je osoby. Jeśli jednak „test”

nie spełnia wymienionych wyżej warunków, a żadne badania na temat jego trafności i

rzetelności nie były przeprowadzane, albo też przeprowadzono ich za mało, wybiórczo lub w

inny sposób nie dopełniono procedur naukowych, to twierdzenia o związku pewnych

właściwości psychicznych z wynikami w takim zadaniu są jedynie prywatnymi wierzeniami

zwolenników takich zadań. Nie ma przy tym żadnego znaczenia, czy w nazwie zadania

występuje słowo „test”. Słowo to nie jest terminem prawnie zastrzeżonym, w związku z czym

każdy może je nadać dowolnemu zadaniu własnego pomysłu.

Nie są też testami niektóre – całkiem liczne - instrumenty, tworzone ad hoc w organizacjach

na potrzeby selekcji, rekrutacji lub oceny pracowników. Jak pisze Lutz Homke (2002) siły

rynku wymuszają szybkie decyzje i menażerowie naciskają nierzadko, aby w krótkim czasie

zdiagnozować interesujące ich zjawisko. Jednak narzędzia tworzone doraźnie zazwyczaj nie

mają podbudowy ani teoretycznej, ani empirycznej (trafność!), ich wartość więc bywa

wątpliwa. Nie chcemy tu jednak dyskredytować nowych narzędzi diagnostycznych, które nie

spełniają wymagań tylko dlatego, że są w trakcie badań. Fakt, że test na przykład nie ma

jeszcze norm, nie musi oznaczać, że jest nieprzydatny – można stosować go w badaniach

naukowych lub do porównywania między sobą wielu badanych osób czy grup, nie wolno

natomiast przy braku norm dla testu formułować na jego podstawie diagnozy indywidualnej.

Słowo „test” figuruje też w nazwach niektórych uznanych narzędzi diagnostycznych,

które z pewnością testami nie są. Na przykład Test Apercepcji Tematycznej w wąskim

rozumieniu jest nazwą własną techniki projekcyjnej autorstwa Henry Murraya (1943), która

nie spełnia kryteriów testu. Psycholodzy stosują też – na mocy utrwalonego obyczaju - termin

„Test Apercepcji Tematycznej” w szerszym znaczeniu, mając na myśli rodzinę technik

projekcyjnych, z których niektóre są testami w najściślejszym sensie psychometrycznym, ale

inne z pewnością nie. Nie znaczy to, że wszystkie z tej ostatniej kategorii są bez wartości dla

diagnozy, jednak należy stosować je inaczej i do innych celów, niż testy (por. Stemplewska-

Żakowicz, 2004a).

Są jednak i takie techniki, które – choć w nazwie mają słowo „test”, to nie tylko nie są

testami, ale w ogóle nie powinny być używane w diagnozie psychologicznej, ponieważ

badania dowiodły, że są nietrafne. Na liście zdyskredytowanych narzędzi diagnostycznych,

którą na podstawie opinii 101 ekspertów stworzyli John Norcross, Gerald Kocher i Ariel

Garofalo (2006), dwa pierwsze miejsca zajmują Test Kolorów Lűschera i Test Szondiego

jako techniki badania osobowości (zob. podrozdział 11.3.3.2). Co ciekawe, słowo „test”

figuruje w nazwie wielu technik, łagodnie mówiąc, mało ścisłych, natomiast techniki, które

prawdziwie są testami, często nazywają się inaczej (np. skala, zestaw). Ponieważ zarówno

nazwy, jak i ogólne klasyfikacje mogą być mylące, najpewniejszym sposobem rozpoznania,

czym jest dana technika diagnostyczna i jaka jest jej wartość, jest samodzielna ocena, na ile

spełnia ona standardy psychometryczne i jakie dane

zebrano o

jej trafności, rzetelności i

praktycznej efektywności. A jeśli sami psycholodzy nie dokonają krytycznej oceny

stosowanych przez siebie metod, może się zdarzyć, że zastąpią ich w tym - i zawstydzą

zarazem - profesjonaliści z innych dziedzin, co spotkało pewnego biegłego sądowego z

dziedziny medycyny i stało się powodem sformułowania tak zwanych „kryteriów Dauberta”

(patrz ramka 11.10).

Ramka 11.10

Kryteria Dauberta

W roku 1993 przed Sądem Najwyższym Stanów Zjednoczonych toczyła się sprawa "Daubert vs

Merrell Dow Pharmaceuticals Inc.", w której William Daubert i inni wystąpili przeciwko firmie

farmaceutycznej o odszkodowanie za upośledzenia noworodków, spowodowane przez zażywanie

leku o nazwie Bendectin przez matki w ciąży. Sąd orzekł, że brak jest naukowych dowodów na

związek między zażywaniem leku a uszkodzeniem płodu. Kryteria, którymi się kierował oceniając

wiarygodność opinii biegłych, stały się znane jako „kryteria Dauberta” i na mocy precedensowego

prawa Stanów Zjednoczonych stanowią obecnie dla sędziów wskazówki, jak podejmować decyzje o

dopuszczeniu dowodu z opinii biegłego (często psychologa).

Kryteria Dauberta są dobrze spełnione przez techniki diagnostyczne, wypracowane lub

zweryfikowane w ramach nurtu EBA (Faigman i Monahan, 2005).

11.3.3.2. Ocena narzędzi diagnostycznych z perspektywy EBA

Charakterystycznym rysem EBA jest akcent położony na wiarygodne techniki pomiaru. Aby

określone narzędzie diagnostyczne zostało na gruncie EBA uznane za wiarygodne, jego

parametry psychometryczne muszą być przekonujące (por. też Brzeziński, 1996). Wydaje się

to oczywiste. Mniej znane polskim psychologom są natomiast szczegółowe pojęcia i

statystyki, stosowane w praktyce do szacowania trafności diagnostycznej narzędzia, a

wywiedzione z zastosowania twierdzenia Bayesa i teorii decyzji (por. Anastasi i Urbina, 1999;

Paluchowski 2001) do zagadnień diagnozy psychologicznej.

Wykorzystanie w psychologii podejścia Bayesa zaproponowali Paul Meehl i Albert

Rosen (1955), co zaowocowało dalszymi badaniami i koncepcjami (Cronbach i Gleser, 1957;

Grove, 2006; Mash i Hunsley, 2005), stanowiącymi dziś element kanonu wiedzy na temat

praktyki diagnostycznej (APA - Division 12: Presidential Task Force, 1999). Podejście to

stanowi także w dużym stopniu realizację postulatów Meehla na temat sformalizowania reguł

podejmowania decyzji klinicznych. Dokładniej, chodzi o oszacowanie prawdopodobieństwa,

z jakim diagnosta może orzekać o zaistnieniu pewnego zjawiska lub o stwierdzeniu pewnej

właściwości u diagnozowanej osoby na podstawie zaobserwowanego wskaźnika tego

Kryteria Dauberta to w gruncie rzeczy – jak piszą William Grove i Christopher Barden (1999, s. 226) –

podstawowe zasady naukowego poznania, sformułowane jako 6 pytań o wskaźniki naukowej

rzetelności.

1. Czy teoria lub technika, stanowiąca podstawę dowodu, jest sprawdzalna?

2. Czy istotnie została sprawdzona za pomocą trafnych i rzetelnych procedur i czy wynik

tych badań był pozytywny?

3. Czy została poddana tzw. ślepej recenzji (peer review)?

4. Jak duże jest ryzyko, że teoria jest błędna? Jaki jest błąd pomiaru techniki?

5. Czy zostały ustanowione standardy dla stosowania danej techniki?

6. Czy dana teoria lub technika jest ogólnie akceptowana przez odpowiednie środowisko

naukowców?

zjawiska lub właściwości. Na przykład, na ile pewne jest rozpoznanie określonego zaburzenia

psychicznego na podstawie stwierdzenia jego objawu, albo orzekanie o specyficznych

uzdolnieniach u osoby, która dobrze wypadła w zadaniu testowym, wymagającym

wykorzystania tych uzdolnień.

Problem nie jest banalny, ponieważ wskaźniki empiryczne – jak to wyjaśnił polskim

badaczom Stefan Nowak (1965) - miewają różną moc rozdzielczą i wyjątkowo tylko osiągają

wartość jedności. Realnym problemem diagnostycznym są wobec tego wątpliwości,

przykładowo, co do tego, z jaką pewnością można rozpoznać schizofrenię u pacjenta, który

relacjonuje poczucie depersonalizacji i omamy słuchowe. Wprawdzie oba te objawy są

charakterystyczne dla schizofrenii, jednak przytrafiają się niekiedy także ludziom zdrowym.

Jak więc mamy uzyskać pewność, że w tym przypadku jest to – lub nie jest – choroba

psychiczna? (zob, tabela 11.2).

Nie da się odgadnąć odpowiedzi na to pytanie. Również doświadczenie kliniczne

może być bardzo mylące, ponieważ psycholog nie powinien zakładać, że klienci, z którymi

miał dotąd do czynienia w swojej praktyce, stanowili próbę reprezentatywną i że jednakowo

dobrze ich wszystkich zapamiętał. Tylko badania empiryczne mogą dostarczyć tu wytycznych

do wnioskowania. Dla każdego wskaźnika trzeba empirycznie określić prawdopodobieństwo

trafnego rozpoznania na jego podstawie diagnozowanego zjawiska lub właściwości, a także

ryzyko popełnienia przy tym błędu. Innymi słowy, trzeba określić warunkowe

prawdopodobieństwo zaistnienia kryterium (w naszym przykładzie: schizofrenii u danej

osoby), gdy spełniony jest warunek dotyczący predyktora (gdy występuje dany objaw).

Tabela 11.2. Hipotetyczne wyniki badania wartości poczucia depersonalizacji jako predyktora
(wskaźnika) schizofrenii

Predyktor (wskaźnik):

poczucie depersonalizacji

Kryterium (diagnozowane zjawisko): schizofrenia

zdiagnozowano schizofrenię

nie zdiagnozowano
schizofrenii

występuje poczucie
depersonalizacji

(a)

(b)

nie występuje poczucie
depersonalizacji

(c)

(d)

Do tego właśnie pomocne okazało się twierdzenie Bayesa, na którym opierają się

stosowane dziś sposoby oceniania narzędzi diagnostycznych. Miarą trafności narzędzia są

empiryczne współczynniki, dotyczące proporcji trafnych i nietrafnych diagnoz, postawionych

na podstawie tego narzędzia. W tabeli 11.3 zestawiliśmy podstawowe pojęcia, dotyczące tak

rozumianej trafności diagnostycznej:

Tabela 11.3. Podstawowe pojęcia dotyczące trafności diagnostycznej predyktora (wskaźnika).

Pojęcie

Znaczenie pojęcia

Przykład (por. tabela 11.2)

•

diagnozowane zjawisko
(kryterium) – schizofrenia

•

wskaźnik (predyktor) – poczucie
depersonalizacji

Proporcja podstawowa
(base rate) diagnozowanego
zjawiska (kryterium)

Częstość występowania
diagnozowanego zjawiska
(kryterium) w populacji

Odsetek w populacji osób chorych na
schizofrenię
(a)+(c)/[(a)+(b)+(c)+(d)]

Czułość (sensitivity)
wskaźnika (predyktora).
Inaczej: trafne wskazania
(true-positives)

Warunkowe
prawdopodobieństwo
wystąpienia predyktora, gdy
wystąpiło kryterium

Odsetek osób doświadczających
poczucia depersonalizacji wśród
chorych na schizofrenię.
(a)/[(a)+(c)]=0,75

Swoistość (specificity)
wskaźnika (predyktora)
Inaczej: trafne odrzucenia
(true-negatives)

Warunkowe
prawdopodobieństwo nie
wystąpienia predyktora, gdy
nie wystąpiło kryterium.

Odsetek osób nie doświadczających
poczucia depersonalizacji wśród
zdrowych
(d)/[(b)+(d)]=0,70

Moc prognozy pozytywnej,
PPP (positive prediction
power)

Warunkowe
prawdopodobieństwo
wystąpienia kryterium, gdy
wystąpił predyktor

Odsetek chorych na schizofrenię
wśród osób doświadczających
poczucia depersonalizacji.
(a)/[(a)+(b)]=0,67

Moc prognozy negatywnej,
NPP (negative prediction
power)

Warunkowe
prawdopodobieństwo nie
wystąpienia kryterium, gdy
nie wystąpił predyktor

Odsetek zdrowych wśród osób nie
doświadczających poczucia
depersonalizacji
(d)/[(c)+(d)]=0,78

Błędne wskazania (false-
positivse)

Proporcja błędnie
wskazanych przez predyktor
przypadków wystąpienia
kryterium

Odsetek osób, które okazały się
zdrowe, wśród wszystkich osób,
doświadczających poczucia
depersonalizacji
(b)/[(a)+(b)]=0,33

Błędne odrzucenia (false-
negatives)

Proporcja błędnie
wskazanych przez predyktor
przypadków nie wystąpienia
kryterium

Odsetek osób, które okazały się chore
na schizofrenię wśród wszystkich
osób, nie doświadczających poczucia
depersonalizacji
(c)/[(c)+(d)]=0,22

Efektywność (eficiency)
wskaźnika (predyktora)
Inaczej: proporcja trafień
(hit rate)

Proporcja trafnych predykcji
(wskazań i odrzuceń razem)
we wszystkich predykcjach
(trafnych i błędnych razem)

Łączny odsetek osób, które okazały się
chore na schizofrenię i doświadczały
depersonalizacji oraz tych, które
okazały się zdrowe i nie doświadczały
depersonalizacji, w grupie wszystkich
osób, dla których formułowano te
przewidywania.
[(a)+(d)]/[(a)+ (b)+(c)+(d)]=0,75

Bardzo przydatne przy ocenie trafności danego wskaźnika lub testu są wykresy

związku między odsetkiem wyników prawdziwie i fałszywie dodatnich, nazywane krzywymi

ROC (receiver operating characteristic curve). O ile nam wiadomo, w polskiej literaturze

psychologicznej nie ma na razie opracowań na ten temat, zainteresowanych Czytelników

zachęcamy więc do sięgnięcia do prac angielskojęzycznych (Grove, 2006: Swets, Dawes i

Monahan, 2000;) lub polskojęzycznych z pokrewnej dziedziny EBM czyli medycyny opartej

na dowodach empirycznych (Jaeschke, Cook i Guyatt, 1998b; Smoleń , 2003).

Kwestie dobroci psychometrycznej narzędzia diagnostycznego nie są oczywiście

nowością w psychologii, ani też nie są specyficzne tylko dla EBA, jednak – co może już być

uznane za pewną nowość w praktyce psychologicznej – bezwarunkowe obstawanie przy

standardach psychometrii ma tutaj charakter fundamentalny. W ocenie przydatności narzędzia

do konkretnych celów diagnostycznych przykłada się też wielką wagę do tego, czy istnieją

badania walidacyjne i normalizacyjne, dokonane w odniesieniu do tego właśnie celu

diagnostycznego i tej konkretnej populacji, z której pochodzi osoba, mająca być

diagnozowana danym narzędziem.

Ta rygorystyczna postawa doprowadziła do intensywnej debaty, jaką odbyto w

ostatnich latach w kwestii wiarygodności różnych narzędzi diagnostycznych, w tym

zwłaszcza technik projekcyjnych (Lillienfeld, Wood i Garb, 2000/2002; Hibbard, 2003; por.

Stemplewska-Żakowicz, 2004b). Jednym z jej efektów jest niemal powszechna dziś zgoda

wśród psychologów co do tego, że pewne narzędzia diagnostyczne w świetle współcześnie

dostępnych danych empirycznych należy uznać za zdyskredytowane i zaprzestać ich

stosowania (Norcross, Kocher i Garofalo, 2006). Listę sześciu pierwszych pozycji

zdyskredytowanych narzędzi diagnostycznych stworzoną na podstawie opinii 101

psychologów-ekspertów (Norcross, Kocher i Garofalo, 2006, s. 520) przestawiono niżej. Przy

każdej pozycji podano cel diagnostyczny, do którego przydatność danej techniki była

oceniana.

Niech nas zatem nie zmyli fakt, że jakieś narzędzia są od dawna stosowane w praktyce, uczy

się o nich studentów, a nawet znajdują się w ofercie wydawnictw, zajmujących się testami

psychologicznymi. Jak piszą Norcross, Kocher i Garofalo (2006, s. 522):

Psychologia nieustannie dokonuje autopoprawek, ponieważ jej podstawą (w większym

stopniu, niż innych profesji) są dowody empiryczne. Dokonaliśmy – jako dyscyplina –

znaczącego postępu w odróżnianiu nauki od pseudonauki w praktyce psychologicznej.

1.1.1.Narzędzia diagnostyczne i strategie diagnozowania

Rzetelne narzędzia diagnostyczne to podstawa EBA, ale – jak podkreśla wielu

autorów (por. Fernández-Ballesteros, De Bruyn, Godoy, Hornke, i in., 2001; Krishnamurthy,

VandeCreek, Kaslow, Tazeau i in., 2004) - diagnozowanie to coś więcej niż stosowanie testów

i innych technik diagnostycznych. Przeprowadzanie badania pojedynczym narzędziem

diagnostycznym to zadanie – rzec można - poziomu podstawowego w diagnozowaniu.

Proponujemy wyróżnić dwa kolejne poziomy o większym stopniu złożoności. Poziom

pośredni to wybór i zrealizowanie strategii diagnozowania konkretnej właściwości lub

zjawiska (np. kompetencji społecznych pracownika, uzdolnień ucznia czy ryzyka

samobójstwa pacjenta). Najbardziej złożony jest poziom całościowy czyli integracja

wszystkich zadań z poziomu pośredniego i skuteczna realizacja całego procesu

diagnozowania zgodnie z przyjętą strukturą. Relacja między zadaniami z tych trzech

Ramka 11.11

Narzędzia diagnostyczne uznane za zdyskredytowane (opis w tekście)

 Test Kolorów Lűschera (diagnoza osobowości),

 Test Szondiego (diagnoza osobowości),

 grafologiczna analiza pisma (diagnoza osobowości),



Wzrokowo-Motoryczny Test Gestalt Lauretty Bender (wykrywanie uszkodzeń

neuropsychologicznych, diagnoza osobowości),



technika „Enneagram” (diagnoza osobowości)



stosowanie anatomicznie dokładnych lalek (wykrywanie nadużyć seksualnych u

dzieci).

poziomów jest hierarchiczna. Przeprowadzenie badania konkretną techniką diagnostyczną

(np. kwestionariuszem BDI ) jest elementem wybranej strategii rozpoznania pewnego

zjawiska (np. oszacowania ryzyka samobójstwa), a ta z kolei stanowi część całościowego

procesu diagnostycznego, którego celem jest rozwiązanie postawionego problemu (np. jaki

rodzaj pomocy psychologicznej jest odpowiedni dla osoby X.?)

Obecnie zadania z dwóch niższych poziomów złożoności są lepiej opracowane

empirycznie, niż zagadnienia dotyczące struktury procesu diagnozowania jako całości (o co

upominał się Meehl). Przegląd prac, w których jako słowo kluczowe figuruje „EBA”,

pokazuje, że w ostatnich latach przeprowadzono cały szereg prac badawczych, poświęconych

technikom i strategiom wiarygodnego diagnozowania różnych szczegółowych konstruktów,

istotnych w praktyce psychologicznej. Na przykład w pracy Phillipa M. Kleespies i Elizabeth

L. Dettmer (2000) wszechstronnie omówiono strategię szacowania ryzyka zachowań

samobójczych. Omówimy tę pracę nieco szerzej, ponieważ ilustruje ona, czym w praktyce

jest oparta na dowodach empirycznych strategia diagnozowania określonego zjawiska lub

właściwości

Szczególnych trudności nastręcza diagnostom szacowanie prawdopodobieństwa

zjawisk, które są wyjątkowo rzadkie czyli – by zastosować nowe pojęcie z tabeli 11.3 - ich

proporcja podstawowa jest bardzo niska. Do takich należą (na szczęście!) samobójstwa. W

latach 1995-1999 ich częstość wynosiła w Polsce 14,9 przypadków, a w USA 11,3

przypadków na 100 tysięcy mieszkańców

. Oznacza to, że statystycznie polski psycholog

może zetknąć się z problemem dokonanego samobójstwa w przybliżeniu raz na 7000 osób,

które konsultuje, a psycholog amerykański nawet nieco rzadziej. Jednak każdy psycholog

pragnie oczywiście nie zetknąć się z tym ani razu – zapobieganie ewentualnemu samobójstwu

to przecież jeden z celów jego pracy! Jak jednak określić, którego spośród 7000 tysięcy

klientów trzeba otoczyć szczególną opieką z powodu groźby samobójstwa z jego strony?

Trudność tego problemu Kleespies i Dettmer (op. cit.) ilustrują następująco: wyobraźmy

sobie, że pewien diagnosta dysponuje absolutnie wyjątkową zdolnością określania ryzyka

samobójstwa z 99% czułością i 99% swoistością. Oznacza to (por. tabela 11.3), że wśród

100 000 pacjentów trafnie rozpozna on 99 000 tych, którzy w przyszłości nie popełnią

samobójstwa, a pozostałych 1000 osób zaliczy do grupy podwyższonego ryzyka. Proporcja

podstawowa jednak mówi, że przyszłych samobójców jest w tej grupie tak naprawdę tylko

około 11 (w USA) lub 15 (w Polsce). Nawet jeśli nasz diagnosta ma do czynienia z samymi

Dane oryginalnie zamieszczone przez autorów (dotyczące tylko USA), zamieniliśmy tu na analogiczne, podane

przez Marię Jarosz (2005), ponieważ te ostatnie pochodzą z badan międzynarodowych i obejmują dodatkowo
wskaźnik odnoszący się do Polski.

tylko pacjentami psychiatrycznymi, wśród których odsetek samobójstw jest wyższy, to w

grupie wytypowanych 1000 osób z podwyższonym ryzykiem samobójstwa znajdzie się 60

przyszłych samobójców i aż 940 osób, które zostały wytypowane „na wyrost” i stanowią

błędne wskazania (false-positives).

Przykłady te pokazują, jak wiele znaczy proporcja podstawowa – to ona wyznacza, o

jakich w gruncie rzeczy liczbach mówimy, szacując czułość i swoistość testu. Widzimy też,

jaka jest skala trudności w diagnozowaniu rzadkich zjawisk, takich jak ryzyko samobójstwa.

Nawet gdybyśmy dysponowali fantastyczną precyzją, która jest nie do osiągnięcia przez

współczesne narzędzia diagnostyczne, i tak zjawisko samobójstwa pozostawałoby

praktycznie nieprzewidywalne, konkludują Kleespies i Dettmer (op. cit.). Zarazem w tych

nielicznych sytuacjach, gdy jednak staje się ono realną groźbą, którą pacjent może

zrealizować w ciągu najbliższych godzin lub dni, wymaga to natychmiastowych działań

psychologa. Wszystko to, jak piszą autorzy, każe myśleć o skromniejszych niż jedno

wyspecjalizowane narzędzie sposobach oceniania ryzyka samobójstwa na potrzeby skutecznej

praktyki psychologicznej.

Kleespies i Dettmer (op. cit.) dokonali przeglądu kilkudziesięciu badań empirycznych,

dotyczących samobójstw dokonanych. Były to badania post mortem, w których na podstawie

zachowanej dokumentacji określano różne psychospołeczne i psychopatologiczne

właściwości osób zmarłych i sprawdzano, które z tych właściwości w sposób istotny

różnicowały osoby zmarłe w wyniku samobójstwa i zmarłe z innych przyczyn. Okazało się,

że choć różnic tych było sporo, to nie sposób ułożyć ich w uniwersalną formułę predykcji,

ponieważ pewne czynniki mają znaczenie tylko dla niektórych grup osób, inne zaś zaczynają

odgrywać jakąkolwiek rolę dopiero zestawione razem, a nie same w sobie. Kleespies i

Dettmer (op. cit.) dokonali drobiazgowej kategoryzacji wszystkich tych czynników ze

względu na wyniki badań nad ich znaczeniem dla samobójstw i powiązania z innymi

czynnikami. Ostatecznie wyłoniło się z tego pięć profili, wyróżnionych ze względu na

podstawowe zaburzenie psychiczne, rozpoznane u danej osoby. Wyniki te prezentuje tabela

11.31:

Tabela 11.31. Czynniki empirycznie związane z ostrym ryzykiem samobójstwa (zaczerpnięto

z Kleespies i Dettmer, 2000, str.1113).

Rozpoznanie

Współwystęp
owanie
innych
zaburzeń

Czynniki
zaostrzające

Osobowość

Stres

Czynniki
ułatwiające

Tło historyczne
lub środowiskowe

depresja

nadużywanie
alkoholu

aktualny
epizod
dwubiegunow
ej choroby
afektywnej

nasilona
anhedonia

bezsenność

obniżona
koncentracja

nasilony lęk

ataki paniki

cechy
obsesyjno-
kompulsyw
ne

brak w domu
dzieci w
wieku
poniżej 18 lat

obecny epizod
depresji jest co
najwyżej trzecim w
ciągu życia

brak przyjaciół w
okresie dorastania

nadużywanie
substancji

depresja

niedawna
utrata
ważnego
emocjonaln
ie związku

nadużywanie
alkoholu przez
długi czas

trudności
interpersonalne w
jakimś okresie
życia

schizofrenia

utrata nadziei

wrogość

depresja

wyobrażenia
paranoidalne

cechy
obsesyjno-
kompulsyw
ne

podwyższo
ny poziom
subiektywn
ego
distressu

negatywna
postawa
wobec
leczenia

podwyższona
świadomość
upośledzając
ych skutków
choroby

wiek pomiędzy 20 a
40 lat

wczesny początek
schizofrenii

wysoka inteligencja
lub wykształcenie

dużo krótkich
hospitalizacji

poważne próby
samobójcze w
przeszłości

zaburzenie
stresu
pourazowego

współwystępo
wanie innych
zaburzeń

poczucie winy
(np. za
działania w
czasie walki
lub za fakt
przeżycia)

epizod utraty
kontroli podczas
walki

zaburzenia
osobowości:
antyspołeczna
, pograniczna
lub
zaburzenia
zachowania

zaburzenia
afektywne

nadużywanie
substancji

słaba
regulacja
afektu (tylko
przy
zaburzeniach
zachowania)

doznanie nadużyć
fizycznych lub
seksualnych w
jakimś okresie
życia (tylko przy
zaburzeniach
zachowania)

Posługiwanie się profilami z tabeli 11.31 przez diagnostę polega na sprawdzaniu, na

ile każdy z nich pasuje do konkretnej osoby, u której diagnozujemy ryzyko samobójstwa. W

razie stwierdzenia pewnego podobieństwa pod niektórymi względami, diagnosta wie, jakie

inne okoliczności lub właściwości tej osoby powinien rozpoznać. Na przykład Adam, którego

przypadek opisaliśmy wcześniej, zdaje się spełniać wiele warunków, charakterystycznych dla

profilu pierwszego: wykazuje objawy depresji i nadużywa alkoholu. Jednak, jak

wspominaliśmy wyżej, na podstawie wstępnej rozmowy nie stawia się rozpoznania – na razie

diagnosta ma jedynie hipotezy na temat depresji i uzależnienia Adama i obecnie

najpilniejszym zadaniem jest ich weryfikacja, w czym pomogą mu wyspecjalizowane

narzędzia diagnostyczne – najlepiej te, które poddano wszechstronnej ocenie w ramach EBA

(por. Joiner, Walker, Pettit, Perez i Cukrowicz, 2005 na temat diagnozy depresji oraz Babor,

de la Fuente, Saunders, Grant, 1996; Taracha, Habrat, Smela, Gruszyński, 2002 w kwestii

oceny uzależnienia od alkoholu). Gdyby weryfikacja tych hipotez wypadła pozytywnie, profil

pierwszy z tabeli 11.31 poprowadzi diagnostę do kolejnych czynników ryzyka, które należy

zdiagnozować, aby na ich podstawie ocenić ryzyko samobójstwa. Na przykład, Adam

relacjonował obniżoną koncentrację, nie wiadomo jednak, czy dotyczą go także pozostałe

czynniki zaostrzające: anhedonia (utrata zdolności doświadczania przyjemności), bezsenność,

lęk i ataki paniki – pomiar tych zmiennych stanowi więc kolejne zadanie diagnostyczne.

Generalnie w EBA istnieją opracowania na temat optymalnych dla różnych populacji i

w różnych kontekstach metod i strategii diagnozowania wielu różnych konstruktów

psychologicznych, prócz wymienionych wcześniej są to między innymi zaburzenia

osobowości (Widiger, Samuel, 2005), lęk i zaburzenia z nim związane (Antony, Orsillo i

Roemer, 2001; Antony i Rowa, 2005) czy brak satysfakcji ze związku u dorosłych (Snyder,

Heyman i Haynes, 2005), a także autyzm i zespół Aspergera (Ozonoff, Goodlin-Jones i

Solomon, 2005) czy ADHD u dzieci i młodzieży (Pelham, Fabiano i Massetti, 2005).

Trzeba też jasno stwierdzić, że młody nurt EBA nie jest oczywiście źródłem

wszystkich wiarygodnych i empirycznie ugruntowanych technik diagnostycznych, nie ma też

monopolu na ich ocenianie. Istnieje wiele procedur diagnostycznych, stworzonych wcześniej i

nie mających w nazwie hasła „EBA” , jednak po przeanalizowaniu okazują się jak najbardziej

spełniać postulaty diagnozy opartej na dowodach empirycznych. Tytułem przykładu można tu

wymienić procedury diagnozowania kompetencji osobistych oraz projekcyjne sposoby

pomiaru motywacji, stworzone przez Davida McClellanda i rozwijane następnie przez jego

współpracowników

(Smith, 1992; Spencer i Spencer, 1993), a na gruncie psychologii

polskiej – podejście Jana Strelaua i współpracowników do diagnozy temperamentu (Strelau i

Zawadzki, 1998; Zawadzki i Strelau , 1997). Strategie te i techniki diagnostyczne zostały

opracowane w sposób, który może uchodzić za wzorcowy z punktu widzenia standardów

diagnozy opartej na dowodach empirycznych. Niektóre z tych dawniejszych technik i strategii

zostały już explicite docenione w pracach z nurtu EBA, inne zapewne doczekają się tego

później.

Zachęcamy też Czytelników do samodzielnego poddawania różnych technik i strategii

diagnostycznych ocenie według standardów praktyki opartej na dowodach empirycznych.

Charakterystycznym rysem EBA jest wezwanie praktyków do stania się po trosze badaczami

we własnej praktyce. Diagnosta, który stoi przed konkretnym problemem czy decyzją

diagnostyczną, postąpi bowiem najlepiej – w myśl zaleceń EBA - jeśli dokona krytycznego

przeglądu prac badawczych na temat, którego dotyczy jego problem lub decyzja i wybierze na

tej podstawie sposób postępowania, który najlepiej odpowiada specyfice przypadku i

indywidualności diagnozowanej osoby. W ten sposób wypełni ideę EBA, która – jak

pisaliśmy na wstępie tego rozdziału – polega na integrowaniu najlepszych dostępnych

wyników badań naukowych z biegłością praktyczną, w zgodzie z indywidualnymi

wartościami, kultura i preferencjami osoby diagnozowanej.

W języku polskim z eksperymentami Mc Clellanda i współpracowników, prowadzonymi w tzw. paradygmacie

wzbudzania, można zapoznać się w pracy Katarzyny Stemplewskiej-Żakowicz (2004), natomiast o
diagnozowaniu kompetencji bliżej pisze Tamara Kasprzyk (2005).

Document Outline