testowanie hipotez.zajęcia7, Psychologia, SPSS


II. Podstawowe pojęcia wnioskowania statystycznego:

(na podstawie: Aronson & Aronson „Statistics for Psychology” rozd. 6, 1999)

Wprowadzenie do testowania hipotez

Testowanie hipotez to systematyczna procedura służąca do oceny, czy rezultaty eksperymentu (przeprowadzonego na próbie) popierają określoną teorię lub praktyczną innowację (które będą odnosić się do całej populacji). Wielu studentom trudno jest dobrze zrozumieć i opanować podstawowy sposób myślenia związany z testowaniem hipotez. Dlatego podstawowe i nowe pojęcia z tego zakresu będą wprowadzane na bardzo prostych, czasem z konieczności dziwacznych przykładach badań na jednej osobie.

PRZYKŁAD TESTOWANIA HIPOTEZY

W ramach dużego projektu badawczego małym dzieciom podawano specjalną odżywkę i obserwowano ich rozwój w ciągu pierwszych dwu lat życia. Mniej niż 2% dzieci (dalej niż dwa odchylenia standardowe poniżej średniej) zaczyna chodzić w wieku 8 miesięcy.

W oparciu o nowe teorie pewien badacz wywnioskował, że gdyby oczyścić tę odżywkę i stworzyć na jej podstawie odżywkę o większej zawartości składnika Turbo, miałoby to ogromny wpływ na rozwój dzieci: te, które otrzymywałyby „oczyszczoną” odżywkę, zaczęłyby chodzić znacznie wcześniej (zakładamy tu, że jest absolutnie pewne, że przez proces oczyszczania odżywka nie stałaby się szkodliwa). Jednak takie oczyszczanie odżywki jest bardzo kosztowne. Zatem zespół badawczy decyduje się na zastosowanie tylko jednej dawki dla jednego dziecka. Losowo wybierają jedno dziecko, które otrzymuje wysoce oczyszczoną dawkę odżywki i obserwują jego rozwój. Jakie wyniki powinny doprowadzić badaczy do wniosku, że Oczyszczona Turbo-Odżywka pomaga dziecku wcześniej chodzić?

To jest przykład testowania hipotezy. Badacze chcą wyciągnąć wniosek dotyczący teorii, że Oczyszczona Turbo-Odżywka pozwala dzieciom na szybszą naukę chodzenia, opierając się na informacjach uzyskanych w próbie (w tym przykładzie - w badaniu jednego dziecka.)

RDZEŃ LOGIKI TESTOWANIA HIPOTEZ

Istnieje pewien standardowy sposób podchodzenia do testowania hipotez (pozwolimy tu sobie na pewne generalne uproszczenie, aby podkreślić rdzeń tego postępowania). Badacz zacznie myśleć w sposób następujący. Normalnie prawdopodobieństwo tego, że dziecko zacznie chodzić w wieku 8 miesięcy lub wcześniej, jest mniejsze niż 2%. Zatem jeśli dziecko przez nas badane zacznie chodzić w takim wieku, będziemy mogli odrzucić tezę, że specjalnie Oczyszczona Turbo-Odżywka nie ma wpływu. A jeśli odrzucimy tę tezę, to musimy przyjąć tezę przeciwną, czyli że Oczyszczona Turbo-Odżywka ma wpływ.

Po sformułowaniu tych warunków, które pozwalają zdecydować, czy specjalna procedura oczyszczania ma jakiś wpływ na działanie odżywki, badacz może przeprowadzić badanie: zaobserwować, jak wcześnie zacznie chodzić dziecko, które otrzyma Oczyszczoną Turbo-Odżywkę, i na tej podstawie sformułować wnioski.

Ten okrężny sposób rozumowania - założyć to, czego nie przewidujemy - jest samym rdzeniem wnioskowania statystycznego w psychologii. Przypomina to trochę podwójne przeczenie. Ważną przyczyną dla tekiego sposobu rozumowania jest to, że to właśnie dla hipotezy o braku różnic możemy uzyskać potrzebne informacje. W naszym przykładzie badacze wiedzą, jak wcześnie dzieci zaczynają chodzić, kiedy nie dostają Oczyszczonej Turbo-Odżywki - będzie to zgodne ze znanym już rozkładem wieku, w jakim dzieci zaczynają chodzić.

Okazuje się także, że bez tak pokrętnego podejścia problem często wcale nie może zostać rozwiązany. W naszym przykładzie sama obserwacja dziecka po podaniu Oczyszczonej Turbo-Odżywki nie prowadzi do żadnych wniosków na temat ewentualnego przyspieszenia w jego rozwoju. Później przekonacie się, że jest to kwestia dosyć powszechna. Praktycznie we wszystkich badaniach psychologicznych, także w eksperymentach, dochodzimy do ostatecznych wniosków poprzez ocenę prawdopodobieństwa uzyskania wyników eksperymentu nie potwierdzających naszego sposobu myślenia i naszych hipotez.

PROCES TESTOWANIA HIPOTEZY

Teraz przeanalizujemy dokładnie kolejne etapy testowania hipotezy wprowadzając przy tym odpowiednie pojęcia statystyczne.

Krok 1. Przekształcenie pytań w hipotezy badawcze oraz hipoteza zerowa o populacjach

Na początek zauważmy, że badacze są zainteresowani dziećmi w ogóle, nie tylko tym jednym przypadkiem, a zatem warto sformułować pytanie w kategoriach populacji. W naszym przykładzie możemy dla potrzeb analizy myśleć o wszystkich dzieciach jako należących do jednej z dwu grup:

populacja 1: dzieci, które biorą Oczyszczoną Turbo-Odżywkę

populacja 2: dzieci, które nie biorą Oczyszczonej Turbo-Odżywki

(chociaż znamy tylko jedno dziecko z populacji 1, reprezentuje ona wszystkie nienarodzone dzieci, wobec których badacze chcą zastosować swoje wyniki.)

Przewidywanie badacza, oparte na pewnej teorii, mówi, że dzieci z populacji 1 (które biorą) zaczną chodzić wcześniej niż dzieci z populacji 2 (które nie biorą). Takie stwierdzenie, dotyczące przewidzianej przez teorię (lub doświadczenie) relacji między populacjami, nazywamy hipotezą badawczą.

Jeśli jednak to przewidywanie jest błędne, wydarzy się inna sytuacja: dzieci z populacji 1 nie będą chodzić wcześniej niż dzieci z populacji 2. To przewidywanie przeciwne mówi, że nie będzie różnic: dzieci z obu populacji będą zaczynały chodzić w takim samym czasie. Takie stwierdzenie, dotyczące przeciwnego do wynikającego z teorii przewidywania relacji między populacjami, nazywamy hipotezą zerową. Nazwa ta oznacza, że przewiduje ona brak różnic (różnicę zerową) między populacjami. Oczywiście jeśli hipoteza badawcza zakłada kierunek relacji (tzn. w której populacji wyniki są lepsze), to hipoteza zerowa obejmuje także przeciwny kierunek relacji.

Zauważmy, że hipoteza badawcza i hipoteza zerowa są sobie przeciwne i wzajemnie się wyłączają - jeśli jedna jest prawdziwa, druga musi być nieprawdą. Ta opozycja jest sercem testowania hipotez. Z tego właśnie powodu hipotezę badawczą, która przecież mówi o tym, że miejsce mają rzeczy przeciwne do sformułowanych w hipotezie zerowej, nazywana jest „hipotezą alternatywną”. Wygląda to trochę ironicznie: z naszego punktu widzenia najważniejsza jest hipoteza badawcza, ale z punktu widzenia procedury testowania hipotez jedyną jej rolą jest bycie hipotezą alternatywną.

Krok 2. Określanie cech rozkładu porównawczego

Teraz, gdy już przekształciliśmy pytania w możliwość wyboru pomiędzy hipotezą zerową a badawczą, rozważymy, jak informacje uzyskane w próbie możemy odnieść do tych dwu hipotez. Znając wynik uzyskany w próbie (w naszym przykładzie jeden wynik) zadajemy sobie teraz pytanie: jakie jest prawdopodobieństwo otrzymania takiego wyniku, gdy hipoteza zerowa jest prawdziwa?

Odpowiedź leży w założeniu, że próba została wybrana z rozkładu, który odpowiada sytuacji, gdy hipoteza zerowa jest prawdziwa. W naszym przykładzie cechy tego rozkładu są znane: ma określoną średnią i odchylenie standardowe, a oprócz tego (jak zakłada się w większości przypadków) ma rozkład normalny. Na tej podstawie możemy obliczyć prawdopodobieństwo tego, że dowolna próba została wzięta z tego właśnie rozkładu.

W naszym przykładzie, jeśli hipoteza zerowa jest prawdziwa, to badane dziecko pochodzi z populacji o rozkładzie normalnym ze średnią 14 miesięcy i odchyleniem standardowym 3 miesiące. Jest tak, ponieważ jeżeli hipoteza zerowa jest prawdziwa, to populacje 1 i 2 są takie same i mają takie same, znane nam cechy populacji 2. Pozwala nam to podać dokładne prawdopodobieństwo wybrania próby z dowolnej części tego rozkładu. Na przykład prawdopodobieństwo wybrania dziecka, które zacznie chodzić w wieku 14 miesięcy lub wcześniej, wynosi 50%; dziecka, które zacznie chodzić w wieku 11 miesięcy lub wcześniej wynosi 16% itd.

Rozkład reprezentujący sytuację, w której hipoteza zerowa jest prawdziwa, nazywamy rozkładem porównawczym (czasem nazywa się też „modelem statystycznym” lub „rozkładem z próby”, co omówimy innym razem). W naszym przykładzie rozkład porównawczy to rozkład populacji 2, tej, w której nie zastosowano oddziaływania eksperymentalnego.

Krok 3. Określanie wartości krytycznej, poza którą hipoteza zerowa powinna być odrzucona.

W idealnej sytuacji, zanim badacz rozpocznie obserwacje, określa jakie wyniki będą wystarczająco skrajne, aby odrzucić hipotezę zerową. W naszym przykładzie badacz mógłby zadecydować, że jeśli hipoteza zerowa jest prawdziwa (czyli branie odżywki nie ma wpływu na rozwój dziecka), to zaobserwowanie, że dziecko zaczyna chodzić w wieku 8 miesięcy lub wcześniej byłoby czymś szczególnym. Zatem, ponieważ jest to 2 odchylenia standardowe poniżej średniej, chodzenie w wieku 8 miesięcy pojawi się w mniej niż dwu procentach przypadków. Przez badanie rozkładu porównawczego, badacz może zadecydować, nawet przed obserwowaniem dziecka nakarmionego Oczyszczoną Turbo-Odżywką, że jeżeli dziecko zacznie chodzić w wieku 8 miesięcy lub wcześniej, odrzuci hipotezę zerową.

Jednak jeżeli obserwowane dziecko nie zacznie chodzić przed upływem wyznaczonego terminu, badacz nie może przyjąć hipotezy zerowej. Taki wynik - nieodrzucenie hipotezy zerowej - sprawia, że badanie jest niekonkluzywne, tzn. nie pozwala na wyciągnięcie jednoznacznych wniosków. Nie dowodzi niczego.

Badacze na ogół nie podają granicy w postaci liczby jednostek na skali pomiarowej (np. miesięcy) - zamiast tego określają ją podając prawdopodobieństwo i związaną z nim wartość z. W naszym przykładzie badacz zadecydował, że jeśli rezultat będzie mniej prawdopodobny niż 2% (wartość z wyniesie mniej niż -2), odrzuci hipotezę zerową. W tym przypadku wartość krytyczna to 8 miesięcy, czyli z = -2.

Załóżmy, że badacz był jeszcze bardziej ostrożny i przyjął, że odrzuci hipotezę zerową tylko wtedy, gdy prawdopodobieństwo otrzymania danego wyniku będzie wynosiło najwyżej 1%. Powinien wtedy sięgnąć do tablic statystycznych i na ich podstawie stwierdzić, że wartość o prawdopodobieństwie najwyżej 1% przy krzywej normalnej znajduje się poniżej punktu o wartości z = -2.33 (odpowiada to 7 miesiącom w naszym przykładzie). Na rysunku 6-2 zacieniono obszar o prawdopodobieństwie 1%: jeśli wynik uzyskany w próbie należy do tego obszaru, zostanie uznany za tak skrajny, że odrzucimy hipotezę, że pochodzi on z populacji o tym właśnie rozkładzie.

Na ogół w psychologii korzysta się z wartości krytycznej wyznaczającej obszar o prawdopodobieństwie 5%. Zatem hipoteza zerowa zostaje odrzucona, jeśli prawdopodobieństwo uzyskania naszego wyniku przy założonym rozkładzie porównawczym jest mniejsze niż 5%. Zazwyczaj oznacza się takie prawdopodobieństwo jako „p < .05”. Niemniej w niektórych obszarach badawczych, albo gdy badacz jest szczególnie ostrożny, przyjmuje się wartość krytyczną na poziomie 1% (p < .01).

Są to konwencjonalne poziomy istotności statystycznej, opisywane jako poziom istotności .05 i poziom istotności .01. Gdy wartość otrzymana w próbie jest tak skrajna. że odrzucamy hipotezę zerową, mówimy że wynik jest istotny statystycznie. Później dokładniej omówimy jak wybrać poziom istotności statystycznej.

Krok 4. Umieszczenie wyniku uzyskanego w próbie na rozkładzie porównawczym

Określiliśmy już wartość krytyczną z: jeśli nasz wynik znajdzie się w obszarze poza tą wartością, hipoteza zerowa zostanie odrzucona. Teraz musimy przeprowadzić badanie i uzyskać wynik surowy z naszej próby. Następnie obliczyć, jaką ten wynik ma wartość z na rozkładzie porównawczym.

W naszym przykładzie badacz śledził rozwój dziecka, któremu podano Oczyszczoną Turbo-Odżywkę. Dziecko zaczęło chodzić w 6 miesiącu życia. Pamiętamy, że średnia w rozkładzie porównawczym wynosi 14 mies., a odchylenie standardowe - 3 mies. 6 miesięcy to 8 miesięcy poniżej średniej, czyli z = -2.67. Rys 6-3 pokazuje gdzie ta wartość znajduje się na rozkładzie porównawczym.

Krok 5. Zadecydowanie czy odrzucić hipotezę zerową, czy nie

Ten krok jest praktycznie automatyczny: skoro wiemy (a) przy jakiej wartości z odrzucamy hipotezę zerową, a przy jakiej nie (krok 3) i (b) jaką wartość z ma wynik uzyskany przez nas w próbie (krok 4), to wystarczy szybko porównać te wartości. W naszym przykładzie (a) wartość krytyczna z wynosi -2 i odrzucamy hipotezę zerową, jeśli wynik w próbie będzie niżej, oraz (b) wartość z wyniku z próby wynosi - 2.67. Zatem odrzucamy hipotezę zerową. (Nawet gdybyśmy przyjęli poziom istotności 1%, to odrzucilibyśmy hipotezę zerową, (rys. 6-2)bo wartość krytyczna dla 1% wynosi w tym przypadku z = -2.33.)

Skoro odrzuciliśmy hipotezę zerową, pozostaje nam hipoteza badawcza (alternatywna). W takiej sytuacji zespół badawczy może dojść do wniosku, że rezultaty badania popierają hipotezę zerową.

Kilka uwag o odrzuceniu i nieodrzuceniu hipotezy zerowej

Podkreślimy teraz dwie kwestie związane z interpretacją wyników procedury testowania hipotezy. Po pierwsze, nawet jeżeli można odrzucić hipotezę zerową i uzyskać poparcie dla hipotezy badawczej, nie można powiedzieć, że „jest to dowód” hipotezy badawczej, lub że wyniki badania pokazują, że hipoteza badawcza „jest prawdziwa”. Takie wnioski są za daleko posunięte, ponieważ wyniki zawsze opierają się na prawdopodobieństwie związanym z jedną próbą, a odnoszą się do populacji. „Dowód” i „prawdziwy” zarezerwowane są dla logiki i matematyki; użycie tych określeń wobec wniosków z badań naukowych tchnie amatorszczyzną. (Można oczywiście używać ich w rozważaniach hipotetycznych „jeśli hipoteza jest prawdziwa, to...”, ale nie w odniesieniu do wyników badania.)

Po drugie, kiedy wyniki w próbie nie są dość skrajne, aby odrzucić hipotezą zerową, nie mówimy, że wyniki „popierają hipotezę zerową”. Taki wynik oznacza tylko, że badanie jest niekonkluzywne. Chociaż wynik nie jest dość skrajny, aby odrzucić hipotezę zerową, może ona być fałszywa (a hipoteza badawcza prawdziwa). Przypuśćmy, że w naszym badaniu Oczyszczona Turbo-Odżywka miała niewielki, ale faktyczny wpływ. W takiej sytuacji nie moglibyśmy oczekiwać, że dowolne dziecko po otrzymaniu tej odżywki zacznie chodzić dużo wcześniej niż wszystkie pozostałe dzieci. Najlepszą metodą odkrycia takiego niewielkiego wpływu byłoby przeprowadzenie badania na dużej grupie dzieci otrzymujących odżywkę. Jeśli w większości przypadków zaczęłyby one chodzić choć trochę wcześniej niż dzieci, które nie dostały odżywki, możnaby pokazać, że nie da się utrzymać hipotezy zerowej (będziemy o tym jeszcze mówić).

Aby pokazać, że hipoteza zerowa jest prawdziwa, potrzebowalibyśmy wyników potwierdzających założenie, że nie istnieje różnica między populacjami (lub istnieje różnica w odwrotnym kierunku). Jednak zawsze istnieje możliwość, że różnica była, ale mniejsza niż badanie było w stanie wykryć. Dlatego właśnie wyniki nie pozwalające odrzucić hipotezy zerowej są niekonkluzywne. Czasem jednak, jeśli przeprowadzono wiele badań na dużych próbach i z użyciem dokładnych procedur pomiarowych, zebrany materiał może konsekwentnie ułożyć się w poparcie hipotezy zerowej. Może też zdarzyć się, że badacz mówiąc niedbale opisze niemożność odrzucenia hipotezy zerowej jako jej poparcie. Z punktu widzenia statystyki jest to jednak za daleko idący wniosek na podsumowanie jednego badania.

Zestawienie kroków w procedurze testowania hipotezy

Krok 1. Przekształcenie pytań w hipotezy badawcze oraz hipoteza zerowa o populacjach

Krok 2. Określanie cech rozkładu porównawczego

Krok 3. Określanie wartości krytycznej, poza którą hipoteza zerowa powinna być odrzucona.

Krok 4. Umieszczenie wyniku uzyskanego w próbie na rozkładzie porównawczym

Krok 5. Zadecydowanie czy odrzucić hipotezę zerową, czy nie

DRUGI PRZYKŁAD TESTOWANIA HIPOTEZY

Dwaj psychologowie przeprowadzają badanie na temat związku zadowolenia z pozytywnymi wydarzeniami. Twierdzą, że jeśli ludziom przydarzy się coś pozytywnego, są przez to bardzo zadowoleni i to poczucie zostaje im na długo. Aby to sprawdzić planują taki eksperyment: losowo wybiorą dorosłego Amerykanina i dadzą mu 1 milion dolarów. Sześć miesięcy później zmierzą jego zadowolenie. Wiadomo już, że rozkład zadowolenia wśród dorosłych Amerykanów jest taki jak na rys. 6-4. Przy użytym teście średnia wynosi 70, odchylenie standardowe 10 i rozkład jest w przybliżeniu normalny.

Teraz badacze posługują się procedurą testowania hipotez. Zanim wykonają badanie rozważą, jak zadowolona musiałaby być ta osoba, aby mogli odrzucić hipotezę zerową (że otrzymanie takiej ilości pieniędzy nie wpływa na zadowolenie po sześciu miesięcach). Jeśli wynik zadowolenia uzyskany po sześciu miesiącach będzie dostatecznie wysoki, badacze odrzucą hipotezę zerową i dojdą do wniosku, że otrzymanie miliona dolarów zwiększa zadowolenie po sześciu miesiącach. Jeśli jednak wynik nie będzie dość skrajny, nie będzie można odrzucić hipotezy zerowej, a badanie będzie niekonkluzywne.

Krok 1. Przekształcenie pytań w hipotezy badawcze oraz hipoteza zerowa o populacjach

populacja 1: ludzie, którzy 6 miesięcy temu otrzymali 1 mln $

populacja 2: ludzie, którzy 6 miesięcy temu nie otrzymali 1 mln $

Hipoteza badawcza: ludzie w populacji 1 są bardziej zadowoleni niż ludzie w populacji 2

Hipoteza zerowa: Ludzie w populacji 1 nie są bardziej zadowoleni niż ludzie w populacji 2

Krok 2. Określanie cech rozkładu porównawczego

Rozkład zadowolenia w populacji 2, taki sam jak rozkład zadowolenia dorosłych Amerykanów (średnia wynosi 70, odchylenie standardowe 10 i rozkład jest w przybliżeniu normalny).

Krok 3. Określanie wartości krytycznej, poza którą hipoteza zerowa powinna być odrzucona.

Wybrany poziom istotności - 5%

Wg tablic razkładu normalnego z = +1.64

Wartość krytyczna x = 70 + 1.64 x 10 = 86.40

Krok 4. Umieszczenie wyniku uzyskanego w próbie na rozkładzie porównawczym

Wyniki: po sześciu miesiącach badacze zmierzyli poziom zadowolenia badanego (teraz już bogatego). Jego wynik to 80. Wynik ten ma wartość z = +1.

Krok 5. Zadecydowanie czy odrzucić hipotezę zerową, czy nie

80 < 86.40

Hipoteza zerowa nie może zostać odrzucona. Wyniki są niekonkluzywne. Wyniki nie są istotne statystycznie. Rys. 6-5

Może was zainteresować, że Brickman, Coates i Janoff-Bulman (1978) przyprowadzili badanie na podobny temat. Potraktowali zwycięzców loterii jako reprezentantów ludzi, którym nagle zdarzyło się coś bardzo dobrego. Wyniki były podobne do tych w przykładzie: po sześciu miesiącach ci, którzy wygrali, nie byli bardziej zadowoleni niż ci, którzy nie wygrali. Podobnie w drugiej grupie, którą badali: ludzie którzy w wyniku wypadku stali się *paraplegics*, nie byli po sześciu miesiącach mniej zadowoleni od innych. Ponieważ ci badacze badali bardzo duże grupy ludzi i używali różnych miar, te wyniki sugerują, że jeśli ważne zdarzenie nie ma trwałego wpływu na zadowolenie i poczucie szczęścia, nie jest najwyraźniej dość wielkie. Więc wygląda na to, że loteria nie da nam szczęścia.

JEDNO- I DWUSTRONNE TESTOWANIE HIPOTEZ

W dotychczasowych przykładach hipotezy badawcze dotyczyły zawsze sytuacji, w których łatwo było powiedzieć, czy badana populacja powinna mieć wyższe czy niższe wyniki w porównaniu z drugą populacją. W pierwszym przykładzie dziecko, któremu podano Oczyszczoną Turbo-Odżywkę miało zacząć chodzić wcześniej od innych dzieci, a w drugim przykładzie człowiek, który otrzymał 1 mln $ miał być bardziej zadowolony od innych ludzi. W tych badaniach nie bylibyśmy zainteresowani efektami odwrotnymi.

Hipotezy kierunkowe i testy jednostronne

Te badania podają przykłady hipotez kierunkowych. W każdym z tych przykładów badacze zaproponowali kierunek zależności. Większość badań w psychologii zawiera hipotezy kirunkowe.

Kiedy badacz stawia kierunkową hipotezę badawczą, hipoteza zerowa też z konieczności jest kierunkowa. Jeśli hipoteza badawcza mówi, że otrzymanie 1 mln $ czyni ludzi bardziej zadowolonymi, to hipoteza zerowa mówi, że to samo wydarzenie nie ma żadnego wpływu, albo czyni ich mniej zadowolonymi. W takiej sytuacji do odrzucenia hipotezy zerowej wynik uzyskany w próbie musiał się znajdować w górnych 5% rozkładu - w górnym ekstremum krzywej normalnej, tylko po tej stronie. Z tego powodu nazywamy taki test jednostronnym.

Hipotezy niekierunkowe i testy dwustronne

Czasem jednak hipoteza badawcza mówi jedynie tyle, że jedna populacja różni się od drugiej, bez określania kierunku różnicy. Np. psycholog pracowniczy mógłby być zainteresowany wpływem treningu umiejętności społecznych na produktywność. Może być tak, że trening ten poprawi produktywność, gdyż środowisko, w którym odbywa się praca stanie się przyjemniejsze. Może być też tak, że pogorszy produktywność, gdyż zachęci ludzi do kontaktów towarzyskich w miejscu pracy. W takiej sytuacji hipoteza badawcza będzie mówić jedynie o tym, że trening wpływa na produktywność. Hipoteza zerowa zaś, że trening nie ma ani dodatniego ani ujemnego wpływu na produktywność.

Hipotezę badawczą, która mówi o istnieniu różnicy, bez pokazywania jej kierunku, nazywamy hipotezą niekierunkową. Aby ją przetestować, trzeba sprawdzić, czy wynik jest skrajny na którejkolwiek z dwu stron rozkładu porównawczego. Dlatego nazywamy taki test dwustronnym.

Wyznaczanie wartości krytycznych w teście dwustronnym

W takiej sytuacji dochodzi do pewnej zmiany. Załóżmy, że badacz przyjął 5% poziom istotności. W teście jednostronnym hipoteza zerowa zostałaby odrzucona, gdyby wynik uzyskany w próbie znalazł się w odpowiednich skrajnych 5% rozkładu. Ale w teście dwustronnym, jeśli weźmiemy górne 5% rozkładu dla jednego kierunku zależności, a dolne 5% dla drugiego, uzyskamy poziom istotności 10%. Większość naukowców uzna, że jest to za wysoki poziom.

Dlatego w teście dwustronnym dzielimy procent poziomu istotności między dwie strony rozkładu. Przy poziomie 5% odrzucimy hipotezę zerową, jeśli wynik uzyskany w próbie znajdzie się w górnych 2.5% lub w dolnych 2.5% rozkładu. W sumie odrzucimy ją wtedy w 5% rozkładu.

Jeśli rozkład porównawczy jest normalny, a poziom istotności 5%, to przy teście dwustonnym wartości krytyczne znajdują się w z = 1.96 i z = -1.96. W teście jednostronnym wartość krytyczna znajdzie się w z = 1.64 lub -1.64, tylko po jednej stronie rozkładu. Przy poziomie istotności 1% test dwustronny ma wartości krytyczne z = 2.58 i z = -2.58, a test jednostronny wartość krytyczną z = 2.33 lub -2.33. rys 6.6

Kiedy używać testów jedno-, a kiedy dwustronnych.

Kiedy używamy testu jednostronnego, łatwiej odrzucić hipotezę zerową w tym sensie, że wynik uzyskany w próbie może być trochę mniej skrajny, a mimo to istotny statystycznie. Jednak coś za coś: jeśli nasz wynik jest nawet niezwykle skrajny, ale w drugą stronę, nie możemy odrzucić hipotezy zerowej.

Można przyjąć zasadę, że planujemy test jednostronny, gdy mamy wyraźną hipotezę kierunkową, a test dwustronny, gdy mamy wyraźną hipotezę niekierunkową. Ale w praktyce badawczej nie zawsze jest to takie proste. Nawet gdy teoria wyraźnie przewiduje określony wynik, może się okazać, że w naszym badaniu wynik jest dokładnie przeciwny, i przez to nawet bardziej interesujący. (A co jeśli - jak ma to miejsce we wszystkich bajkach o dżinach i rybkach spełniających życzenia - otrzymanie miliona dolarów i możliwość spełniania wszystkich życzeń sprawia, że człowiek staje się bardziej nieszczęśliwy? To byłoby naprawdę interesujące.) Używając testu jednostronnego ponosimy ryzyko zignorowania interesujących wyników.

Z tego powodu niektórzy badacze uważają, że nie powinno się stosować testów jednostronnych, nawet gdy mamy wyraźną hipotezę kierunkową. Dla bezpieczeństwa proponują oni używanie zawsze testów dwustronnych. W większości artykułów naukowych jeśli badacz nie zaznaczy wyraźnie, że użył testu jednostronnego, zakłada się, że mówi o teście dwustronnym.

Warto wszakże pamiętać, że na ogół ostateczna konkluzja z badań nie zależy od rodzaju testu. Wynik najcżęściej jest albo na tyle skrajny, że ujawni to każda procedura, albo na tyle daleki od skrajności, że nie będzie istotny bez względu na procedurę.

A co jeśli wynik nie pozwala na tak jednoznaczne wnioski? Wtedy decyzja badacza co do zastosowania testu jedno- lub dwustronnego jest jeszcze ważniejsza. Powinien on wybrać procedurę, która w warunkach danego badania pozwoli na wyciągnięcie najdokładniejszych i najmniej kontrowersyjnych wniosków. Trzeba wtedy pozwolić wpłynąć naturze - a nie decyzji badacza - na kształt konkluzji. Co ważne, w każdym przypadku, gdzie wynik nie jest całkowicie jednoznaczny, większość badaczy powstrzyma się przed wyciąganiem mocnych wniosków aż do przeprowadzenia następnych badań.

PRZYKŁAD TESTOWANIA HIPOTEZY TESTEM DWUSTRONNYM

Psycholog kliniczny w prywatnym ośrodku terapii psychiatrycznej opracował nową terapię, która ma leczyć depresję znacznie głębiej i skuteczniej niż terapia dotychczas stosowana. Jednak podobnie jak w przypadku każdej terapii nie można wykluczyć, że pacjent będzie miał się gorzej. Zatem badacz postawi hipotezę niekierunkową.

Losowo zostanie wybrany jeden nowy pacjent, wobec którego zostanie zastosowana nowa forma terapii zamiast tradycyjnej. Jego depresja zostanie zmierzona kwestionariuszem MMPI (Minnesota Multiphasic Personality Inventory), który przeprowadza się u wszystkich pacjentów tego ośrodka po 4 tygodniach pobytu. Ponieważ przeprowadza się go od dawna, można zawczasu stworzyć rozkład wyników MMPI u pacjentów depresyjnych po 4 tygodniach pobytu i zwykłej terapii. Jest to rozkład normalny o średniej 69.5 i odchyleniu standardowym 14.1 (co ogólnie przypomina wyniki uzyskane w ogólnonarodowym kwestionariuszu 75.000 pacjentów psychiatrycznych (w USA?) w 1986 roku).

Krok 1. Przekształcenie pytań w hipotezy badawcze oraz hipoteza zerowa o populacjach

populacja 1: pacjenci depresyjni leczeni nową terapią

populacja 2: pacjenci depresyjni leczeni zwyczajową terapią

Hipoteza badawcza: pacjenci w populacji 1 mają inny poziom depresji w MMPI po 4 tygodniach niż pacjenci w populacji 2

Hipoteza zerowa: pacjenci w populacji 1 mają taki sam poziom depresji w MMPI po 4 tygodniach jak pacjenci w populacji 2

Krok 2. Określanie cech rozkładu porównawczego

Rozkład wyników MMPI w populacji 2, taki sam jak rozkład wyników MMPI dotychczasowych pacjentów (średnia wynosi 69.5, odchylenie standardowe 14.1 i rozkład jest w przybliżeniu normalny).

Krok 3. Określanie wartości krytycznej, poza którą hipoteza zerowa powinna być odrzucona.

Wybrany poziom istotności - 5%

Wg tablic rozkładu normalnego z = 1.96 i z = -1.96

(rys. 6-7 i 6-8)

Krok 4. Umieszczenie wyniku uzyskanego w próbie na rozkładzie porównawczym

Wyniki: po czterech tygodniach badacze zmierzyli poziom depresji w MMPI badanego. Jego wynik to 41. Wynik ten ma wartość z = -2.02.

Krok 5. Zadecydowanie czy odrzucić hipotezę zerową, czy nie

-2.02 < -1.96

Wynik jest tak skrajny, że mało prawdopodobne, aby pacjent pochodził z populacji nie różniącej się od populacji 2. Hipoteza zerowa zostaje odrzucona. Wynik wspiera hipotezę badawczą, że nowa terapia zmienia poziom depresji mierzony przez MMPI.

KONTROWERSJE I OGRANICZENIA

Zaznaczyliśmy już, że istnieją pewne kontrowersje co do tego, czy powinno się stosować raczej jedno- czy dwustronne testy w badaniach eksploracyjnych i takich, gdzie wynik może równie dobrze mieć każdy z możliwych kierunków. Ale kiedy istnieje wyraźna podstawa do przewidywania kierunku wyniku, niektórzy psychologowie wolą test jednostronny. Odpowiada on logice sytuacji: testowana jest teoria. A jeśli wyniki wskazują na to, że nie ma różnic między populacjami lub różnica jest w przeciwnym niż przewidywany kierunku, to przekazują tę samą informację: teoria nie została potwierdzona. Jednak gdy wynik wskazuje na przeciwny kierunek zależności niż teoria, jest bardzo interesujący z naukowego punktu widzenia.

TESTY HIPOTEZ OPISYWANE W ARTYKUŁACH NAUKOWYCH

Na ogół testowanie hipotez jest w artykułach naukowych opisywane jest w kontekście jednej z procedur statystycznych. Dla każdego interesującego wyniku badacz zaznacza najpierw, czy był on istotny statystycznie. Potem najczęściej podaje nazwę konkretnej techniki użytej do wyznaczenia prawdopodobieństw, np. test t lub test F. Na koniec zaznacza poziom istotności, „p < .05” lub „p < .01”. Np. Biner (1991) przeprowadził badanie nad wpływem światła na oszacowanie potencjalnie nieprzyjemnych wyników. Relacjonuje swoje wyniki: „Badani wystawieni na jasne światło oceniali potencjalne wyniki jako bardziej nieprzyjemne niż wystawieni na światło przydymione, t(18) = 2.38, p < .05”.

Kiedy badacz zaznacza, że „p < .05”, oznacza to, że prawdopodobieństwo uzyskania takich wyników, jeśli hipoteza zerowa prawdziwa jest bardzo małe - jest mniejsze niż .05 (5%). Jeśli wynik był bliski, ale nieistotny statystycznie na wybranym poziomie, można zaznaczyć, że jest to „trend bliski istotności” z „p <.10”. Jeśli wynik nie jest istotny statystycznie, czasami badacz podaje wartość p, („p < .27”), a czasami zaznacza jedynie „n.i.” czyli „nieistotne”. Jeśli użyto testu jednostronnego, będzie to zaznaczone. W innych przypadkach należy założyć, że mamy do czynienia z testem dwustronnym.

Nawet jeżeli badacz wybrał początkowo jakiś poziom istotności, może zaznaczyć, które wyniki spełniają bardziej rygorystyczne standardy. Wtedy niektóre wyniki będą oznaczone przez „p < .05”, inne przez „p < .01”, jeszcze inne przez „p < .001”.

Zauważmy, że we wszystkich tych przykładach badacze nie zaznaczają hipotezy badawczej ani zerowej, nie opisują też innych kroków tego procesu. Zakłada się bowiem, że czytelnik dobrze to rozumie.

1

5



Wyszukiwarka

Podobne podstrony:
Metody testowania hipotez ewolucyjnych, Psychologia, biologia, ewolucyjna
Metody testowania hipotez ewolucyjnych, Psychologia, biologia, ewolucyjna
Zajęcia 7 Teoria testowania hipotez statystycznych
06 Testowanie hipotez statystycznychid 6412 ppt
Rozwiązania z testowania hipotez nieparametrycznych 3, statystyka
statystyka, Przedzial ufnosci dla m. Testowanie hipotezy dla m., PRZEDZIAŁ UFNOŚCI DLA WARTOŚCI OCZE
1 wzory testowanie hipotezid 10 Nieznany
Ogólne zasady testowania hipotez statystycznych
S3 Metodologia badań psychologicznych ćwiczenia Adrian Wójcik zajęcia 3, psychologia, Metodologia-wy
cw 8 testowanie hipotez dotycz dwóch populacji, Testowanie hipotez dotyczących porównania dwóch popu
Testowanie Hipotez, Testowanie Hipotezy Na Jednej Populacji
S3 Metodologia badań psychologicznych ćwiczenia Adrian Wójcik zajęcia 2, psychologia, Metodologia-wy
Statystyka #6 Testowanie hipotez
PYTANIA TESTOWE-Wrocław-dydaktyka i psychologia, Instruktor nauki jazdy, Własne materiały, Testy
cw 8 testowanie hipotez testy jednostronne, Testowanie hipotez
cw testowanie hipotez2, Ćwiczenia 7
cw 7 testowanie hipotez1, Testowanie hipotez odnoszących się do jednej populacji
S3 Metodologia badań psychologicznych ćwiczenia Adrian Wójcik zajęcia 5, psychologia, Metodologia-wy

więcej podobnych podstron