Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 7)
07.06.2009
WNIOSKOWANIE STATYSTYCZNE
Wnioskowanie statystyczne polega na stosowaniu testów, czyli na podstawie próby losowej, weryfikujemy wnioski o całej populacji.
Bazą teoretyczną wnioskowania statystycznego jest:
Centralne twierdzenie graniczne Linderberga - Levy'ego
Przy liczebność próby m zmieniającej do nieskończoności rozkład ![]()
jest zbieżny do rozkładu normalnego ze średnią m (![]()
i odchyleniem standardowym![]()
)
![]()
- średnia z próby
![]()
- średnia z populacji
S - odchylenie standardowe
![]()
- (mała sigma) odchylenie z populacji
n - liczebność z próby
Na podstawie tego twierdzenia przyjmuje się że przy dostatecznie dużej próbie rozkład średniej jest w przybliżeniu normalny.
Testem statystycznym nazywa się procedurę sprawdzania hipotezy statystycznej na podstawie wyników próby losowej.
Hipoteza statystyczna to przypuszczenie, dotyczące rozkładu cechy w populacji lub wartości jego parametrów w populacji.
Hipoteza Zerowa (weryfikowana)
Która dla testów istotności różnic i testów niezależności ma zawsze brzmienie przekorne w stosunku do zamierzeń badawczych, czyli zawsze zakłada brak istotnych różnic w populacji lub brak istotnych zależności cech w populacji.
Hipoteza Alternatywna
To przypuszczenie, które jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę zerowa.
!!! Wynik testu jest zawsze prawdopodobny (nigdy 100%) pewny tzn. jest obciążony błędem wnioskowania.
Kiniuś™
Błąd I rodzaju
Polega na odrzuceniu hipotezy zerowej mimo, że jest ona prawdziwa.
Poziomem istotności p (![]()
) nazywa się prawdopodobieństwo popełnienia błędu I rodzaju.
Wartości p są na ogół ![]()
, oznacza to, że jest 5% ryzyko błędu we wnioskowaniu o populacji, czyli w 5 przypadkach na 100, wynik testu ma prawo okazać się fałszywy.
p=0,05 ufność wniosku : 1-p =0,95
Czyli co najmniej 95% prawdopodobieństwa, że dane w populacji będą takie jak w próbie badanej.
Błąd II rodzaju
Polega na przyjęciu hipotezy zerowej, gdy jest ona fałszywa.
Prawdopodobieństwo popełnienia takiego błędu oznacza się ![]()
Obszarem krytycznym nazywamy zbiór wartości sprawdzanej hipotezy, które przemawiają za odrzuceniem hipotezy zerowej.
Obszarem przyjęć nazywamy zbiór wartości, które przemawiają za przyjęciem hipotezy zerowej.

Jeżeli średnia z populacji równa jest ![]()
czyli wartości powinny się miescić w pewnym obszarze przyjęć.
Kiniuś™
Hipotezy statystyczne mogą być dwustronne (bezwarunkowe)
i jednostronne (kierunkowe).
Obszar krytyczny lewostronny:

wzrost studentów jest mniejszy od średniej populacyjnej.
Obszar krytyczny prawostronny:

Każdy test statystyczny stosowany jest wg. jednolitej procedury, które obejmują następujące etapy:
1) Określenie celu testowania C
Czy chodzi nam o badanie istotności różnic między grupami czy też o badanie zależności cech w obrębie jednej populacji. Dodatkowo określamy rodzaj danych : jakościowe, porządkowe, ilościowe.
2) Sprawdzenie założeń modelowych M
To zbiór warunków które muszą spełniać dane, aby można było zastosować dany test.
Wszystkie testy dzielą się na:
- parametryczne: wymagają rozkładu normalnego w populacji np. testy studenta, test Lavena, analiza wariancji (w każdej postaci) testy szacowania istotności r Persona.
- nieparametryczne: np. test U Mann - Whitney, test Chi2, test szacowania istotności współczynnika korelacji rho Spearmana.
Wszystkie testy dla cech jakościowych i porządkowych są nieparametryczne. Większość testów dla cech ilościowych to testy parametryczne.
Kiniuś™
3) Opis Prób P
Czyli ustalanie jakie dane z próby są potrzebne, aby można było zastosować
wybrany test.
4) Postawienie hipotezy zerowej ewentualnie też hipotezy alternatywnej.
5) Weryfikacja hipotezy zerowej W
Obliczenie wartości testowej t dla danego testu.
Ustalenie parametrów wartości krytycznej, przyjmujemy odpowieni poziom p i df (stopni swobody)
Parametr df - im wyższa liczba stopni swobody tym trudniej jest wykazać istotność wniosków dla małej próby.
Znalezienie wartości krytycznej w tablicach statystycznych.
SWS - sformułowanie wniosku statystycznego
Jeżeli wartość testowa jest mniejsza lub równa od wartości krytycznej to odrzucamy hipotezę zerową i przyjmujemy że wynik testu jest istotny dla populacji.
Jeżeli jest większy lub równy, to jest brak podstaw do odrzucenia hipotezy zerowej i akceptujemy ją.
TEST STUDENTA DLA 1 ŚR.
Ustalenie czy średnia różni się istotnie od przyjętej wartości ![]()
przyjmującej pewną konkretną wartość liczbową.
Założenia modelowe:
- 1 populacja
- 1 próba reprezentatywna
- 1 cecha ilościowa wyrażona na skali stosunkowej lub przedziałowej
- rozkład cechy normalny w populacji
Uwaga!
Normalność rozkładu cechy oceniamy:
- przy niektórych cechach np. wzrost wiadomo, że mają rozkład normalny
- można zastosować test zgodności z rozkładem normalnym
- jeżeli nie przyjmuje wartości ekstremalnych to szacuje się, że wartość z próby świadczy o tym że w populacji przyjmuje rozkład normalny
- przy danych liczebnościach prób ( w praktyce >100os.)jeżeli stosujemy jako narzędzie pomiaru wystandaryzowane i znormalizowane testy psychologiczne to w praktyce można przyjąć, że rozkład pomiaru będzie normalny
Kiniuś™
Hipoteza zerowa (dwustronna)

zad.
Producent opon samochodowych podaje `długość życia” opony, ma ono rozkład normalny i opona starcza na 50 tys. km. Na podstawie 26 losowo wybranych opon uzyskamy:
Czy producent ma rację tzn. czy można uznac że średnia z próby nie różni się istotnie od zakładanej średniej populacyjnej?
t = -3,125
średnia rzeczywista różni się od zakładanej
![]()
Długość życia opon samochodowych różni się istotnie od zakładanego standardu.
Kiniuś™
Badanie istotności różnic jednej cechy ilościowej dla 2 populacji wymaga zawsze baterii dwóch testów:
- Testu Levena dla sprawdzenia istotności różnic między wariancjami
- Testu Studenta dla 2 prób niezależnych dla sprawdzenia istotności różnic między średnimi
Zad.
Postanowiono sprawdzić czy poziom wyobraźni przestrzennej kobiet i mężczyzn różni się istotnie. Zestawiono wyniki w punktach testu kwadratów.
Dane:
Kobiety Mężczyźni
Czy jest istotna różnica miedzy S2 ? - test Lavena
Czy jest istotna różnica między ![]()
? - test Studenta
L = 4 p < 0,006
Jest istotna różnica między wariancjami co oznacza, że rozrzut (rozproszenie) poziomu wyobraźni przestrzennej kobiet różni się istotnie od poziomu zróżnicowania mężczyzn.
Założenia modelowe:
- 2 populacje niezależne
- 2 próby reprezentatywne (po jednej z każdej populacji)
- liczebność prób taka sama lub zbliżona
- mierzymy jedną tą sama cechę ilościową w obu grupach. Pomiar musi być wyrażony na skali stosunkowej lub przedziałowej, pożądane jest, aby był ciągły lub w przybliżeniu ciągły
- rozkład cechy w obu populacjach musi być normalny
-jeżeli wariancje różnią się istotnie ( SA heterogeniczne) bądź nie różnią się istotnie (są homogeniczne) to stosujemy odpowiednią wersję testu studenta.
Kiniuś™
Test studenta dla prób zależnych (Gosseta)
Założenia:
- 1 populacja
- 1 próba reprezentatywna
- liczebność próby dowolna
- 1 cecha ilościowa
- pomiar dwukrotny w odstępie czasowym (dotyczący tego samego i w ten sam sposób)
Zad.
W losowo wybranej grupie kursantów dwukrotnie przeprowadzono kwestionariusz sztywności myślenia (wyniki w pkt). Kwestionariusz był wystandaryzowany i znormalizowany (rozkład normalny) pomiar przeprowadzono przed i po kursie twórczego myślenia. Ustalić czy przebyty kurs wpłynął istotnie na poziom sztywności myślenia.
t = 1,25
p = 0,05
df = N - 1 10-1=9

7
![]()


p/2
odrzucamy hipotezę zerową przyjmujemy alternatywną
p/2
Obszar odrzucenia
Obszar przyjęć

t istotne na poziomie 0,05 ; 0,02 ; 0,01 - ryzyka błędu
t na poziomie 0,001 nie istotne (bo 3,745 > 3,125)
wartości t0,09, t0,02 itd. wzięte z tablic statystycznych


Mniejszy rozrzut wyników