Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 7)
07.06.2009
WNIOSKOWANIE STATYSTYCZNE
Wnioskowanie statystyczne polega na stosowaniu testów, czyli na podstawie próby losowej, weryfikujemy wnioski o całej populacji.
Bazą teoretyczną wnioskowania statystycznego jest:
Centralne twierdzenie graniczne Linderberga - Levy'ego
Przy liczebność próby m zmieniającej do nieskończoności rozkład
jest zbieżny do rozkładu normalnego ze średnią m (
i odchyleniem standardowym
)
- średnia z próby
- średnia z populacji
S - odchylenie standardowe
- (mała sigma) odchylenie z populacji
n - liczebność z próby
Na podstawie tego twierdzenia przyjmuje się że przy dostatecznie dużej próbie rozkład średniej jest w przybliżeniu normalny.
Testem statystycznym nazywa się procedurę sprawdzania hipotezy statystycznej na podstawie wyników próby losowej.
Hipoteza statystyczna to przypuszczenie, dotyczące rozkładu cechy w populacji lub wartości jego parametrów w populacji.
Hipoteza Zerowa (weryfikowana)
Która dla testów istotności różnic i testów niezależności ma zawsze brzmienie przekorne w stosunku do zamierzeń badawczych, czyli zawsze zakłada brak istotnych różnic w populacji lub brak istotnych zależności cech w populacji.
Hipoteza Alternatywna
To przypuszczenie, które jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę zerowa.
!!! Wynik testu jest zawsze prawdopodobny (nigdy 100%) pewny tzn. jest obciążony błędem wnioskowania.
Kiniuś™
Błąd I rodzaju
Polega na odrzuceniu hipotezy zerowej mimo, że jest ona prawdziwa.
Poziomem istotności p (
) nazywa się prawdopodobieństwo popełnienia błędu I rodzaju.
Wartości p są na ogół
, oznacza to, że jest 5% ryzyko błędu we wnioskowaniu o populacji, czyli w 5 przypadkach na 100, wynik testu ma prawo okazać się fałszywy.
p=0,05 ufność wniosku : 1-p =0,95
Czyli co najmniej 95% prawdopodobieństwa, że dane w populacji będą takie jak w próbie badanej.
Błąd II rodzaju
Polega na przyjęciu hipotezy zerowej, gdy jest ona fałszywa.
Prawdopodobieństwo popełnienia takiego błędu oznacza się
Obszarem krytycznym nazywamy zbiór wartości sprawdzanej hipotezy, które przemawiają za odrzuceniem hipotezy zerowej.
Obszarem przyjęć nazywamy zbiór wartości, które przemawiają za przyjęciem hipotezy zerowej.
Jeżeli średnia z populacji równa jest
czyli wartości powinny się miescić w pewnym obszarze przyjęć.
Kiniuś™
Hipotezy statystyczne mogą być dwustronne (bezwarunkowe)
i jednostronne (kierunkowe).
Obszar krytyczny lewostronny:
wzrost studentów jest mniejszy od średniej populacyjnej.
Obszar krytyczny prawostronny:
Każdy test statystyczny stosowany jest wg. jednolitej procedury, które obejmują następujące etapy:
1) Określenie celu testowania C
Czy chodzi nam o badanie istotności różnic między grupami czy też o badanie zależności cech w obrębie jednej populacji. Dodatkowo określamy rodzaj danych : jakościowe, porządkowe, ilościowe.
2) Sprawdzenie założeń modelowych M
To zbiór warunków które muszą spełniać dane, aby można było zastosować dany test.
Wszystkie testy dzielą się na:
- parametryczne: wymagają rozkładu normalnego w populacji np. testy studenta, test Lavena, analiza wariancji (w każdej postaci) testy szacowania istotności r Persona.
- nieparametryczne: np. test U Mann - Whitney, test Chi2, test szacowania istotności współczynnika korelacji rho Spearmana.
Wszystkie testy dla cech jakościowych i porządkowych są nieparametryczne. Większość testów dla cech ilościowych to testy parametryczne.
Kiniuś™
3) Opis Prób P
Czyli ustalanie jakie dane z próby są potrzebne, aby można było zastosować
wybrany test.
4) Postawienie hipotezy zerowej ewentualnie też hipotezy alternatywnej.
5) Weryfikacja hipotezy zerowej W
Obliczenie wartości testowej t dla danego testu.
Ustalenie parametrów wartości krytycznej, przyjmujemy odpowieni poziom p i df (stopni swobody)
Parametr df - im wyższa liczba stopni swobody tym trudniej jest wykazać istotność wniosków dla małej próby.
Znalezienie wartości krytycznej w tablicach statystycznych.
SWS - sformułowanie wniosku statystycznego
Jeżeli wartość testowa jest mniejsza lub równa od wartości krytycznej to odrzucamy hipotezę zerową i przyjmujemy że wynik testu jest istotny dla populacji.
Jeżeli jest większy lub równy, to jest brak podstaw do odrzucenia hipotezy zerowej i akceptujemy ją.
TEST STUDENTA DLA 1 ŚR.
Ustalenie czy średnia różni się istotnie od przyjętej wartości
przyjmującej pewną konkretną wartość liczbową.
Założenia modelowe:
- 1 populacja
- 1 próba reprezentatywna
- 1 cecha ilościowa wyrażona na skali stosunkowej lub przedziałowej
- rozkład cechy normalny w populacji
Uwaga!
Normalność rozkładu cechy oceniamy:
- przy niektórych cechach np. wzrost wiadomo, że mają rozkład normalny
- można zastosować test zgodności z rozkładem normalnym
- jeżeli nie przyjmuje wartości ekstremalnych to szacuje się, że wartość z próby świadczy o tym że w populacji przyjmuje rozkład normalny
- przy danych liczebnościach prób ( w praktyce >100os.)jeżeli stosujemy jako narzędzie pomiaru wystandaryzowane i znormalizowane testy psychologiczne to w praktyce można przyjąć, że rozkład pomiaru będzie normalny
Kiniuś™
Hipoteza zerowa (dwustronna)
zad.
Producent opon samochodowych podaje `długość życia” opony, ma ono rozkład normalny i opona starcza na 50 tys. km. Na podstawie 26 losowo wybranych opon uzyskamy:
Czy producent ma rację tzn. czy można uznac że średnia z próby nie różni się istotnie od zakładanej średniej populacyjnej?
t = -3,125
średnia rzeczywista różni się od zakładanej
Długość życia opon samochodowych różni się istotnie od zakładanego standardu.
Kiniuś™
Badanie istotności różnic jednej cechy ilościowej dla 2 populacji wymaga zawsze baterii dwóch testów:
- Testu Levena dla sprawdzenia istotności różnic między wariancjami
- Testu Studenta dla 2 prób niezależnych dla sprawdzenia istotności różnic między średnimi
Zad.
Postanowiono sprawdzić czy poziom wyobraźni przestrzennej kobiet i mężczyzn różni się istotnie. Zestawiono wyniki w punktach testu kwadratów.
Dane:
Kobiety Mężczyźni
Czy jest istotna różnica miedzy S2 ? - test Lavena
Czy jest istotna różnica między
? - test Studenta
L = 4 p < 0,006
Jest istotna różnica między wariancjami co oznacza, że rozrzut (rozproszenie) poziomu wyobraźni przestrzennej kobiet różni się istotnie od poziomu zróżnicowania mężczyzn.
Założenia modelowe:
- 2 populacje niezależne
- 2 próby reprezentatywne (po jednej z każdej populacji)
- liczebność prób taka sama lub zbliżona
- mierzymy jedną tą sama cechę ilościową w obu grupach. Pomiar musi być wyrażony na skali stosunkowej lub przedziałowej, pożądane jest, aby był ciągły lub w przybliżeniu ciągły
- rozkład cechy w obu populacjach musi być normalny
-jeżeli wariancje różnią się istotnie ( SA heterogeniczne) bądź nie różnią się istotnie (są homogeniczne) to stosujemy odpowiednią wersję testu studenta.
Kiniuś™
Test studenta dla prób zależnych (Gosseta)
Założenia:
- 1 populacja
- 1 próba reprezentatywna
- liczebność próby dowolna
- 1 cecha ilościowa
- pomiar dwukrotny w odstępie czasowym (dotyczący tego samego i w ten sam sposób)
Zad.
W losowo wybranej grupie kursantów dwukrotnie przeprowadzono kwestionariusz sztywności myślenia (wyniki w pkt). Kwestionariusz był wystandaryzowany i znormalizowany (rozkład normalny) pomiar przeprowadzono przed i po kursie twórczego myślenia. Ustalić czy przebyty kurs wpłynął istotnie na poziom sztywności myślenia.
t = 1,25
p = 0,05
df = N - 1 10-1=9
7
p/2
odrzucamy hipotezę zerową przyjmujemy alternatywną
p/2
Obszar odrzucenia
Obszar przyjęć
t istotne na poziomie 0,05 ; 0,02 ; 0,01 - ryzyka błędu
t na poziomie 0,001 nie istotne (bo 3,745 > 3,125)
wartości t0,09, t0,02 itd. wzięte z tablic statystycznych
Mniejszy rozrzut wyników