Metodologia badań i statystyka

Strategia

badań

Polega na tym, że próba
jest

jednocześnie

populacją.

Oznacza to, że badamy
każdy

element

populacji,

np.

wszystkich

uczniów

danej szkoły.

Strategia badań

pełnych

Strategia badań

reprezentatywnych

Polega na tym, że:

1. Z populacji losujemy

próbę
reprezentatywną.

2. Przeprowadzamy

niej badania.

3. Dokonujemy jej opisu.

4. Za

pomocą

wnioskowania
statystycznego
ustalamy

prawdopodobieństwo, z
jakim możemy odnieść
wyniki

całej

populacji

• Wnioski są

pewne,

dokładne

Próba reprezentatywna

prosta

Powstaje wtedy, gdy każdy
element

populacji

jednakową szansę trafienia do
próby.

Przykład:

losowanie z
urny
(totolotek).

Próba reprezentatywna

systematyczna

Powstaje, gdy do próby
włączamy

n-tą

jednostkę z listy.

Przykład:

dziesiąta

osoba

listy

alfabetycznej.

Próba reprezentatywna

warstwowa

Pobieramy

ją,

gdy

populacja

jest

niejednorodna.

1. Identyfikujemy

istniejące

podgrupy

(warstwy).

2. Losujemy w każdej

warstwie z osobna,
proporcjonalnie do jej
wielkości.

Próba reprezentatywna

zespołowa

Powstaje, gdy losujemy
nie jednostki, ale całe
zespoły

Przykład: w czasie badań
na  uczelni  stwierdzamy,
że  są  tam  studenci
dzienni,  wieczorowi  i
zaoczni.

przykład:

klasy,

szkoły, gminy, parafie...

Cechy ilościowe wyrażone

na skali stosunkowej

(ilorazowej)

Charakteryzują  się  pomiarem  ilościowym  (z
precyzyjną  jednostką  pomiaru)  mierzonym  od
zera  rzeczywistego,  z  dokładnością  do  stałości
ilorazu.

Przykłady:

• czas;
• długość;
• temperatura w skali

Kelvina;

• liczba przeczytanych

książek.

Oznacza to,
że

można

określić
zarówno  o  ile
jednostek
dwie
wielkości  się
różnią,  jak  i
ile  razy  się
różnią.

Cechy ilościowe na skali

interwałowej

(przedziałowej)

Przykłady:

• liczba punktów z

kwestionariusza;

• wysokość nad poziom morza;
• temperatura w skali Celsjusza;
• iloraz inteligencji.

Charakteryzują

się

pomiarem

ilościowym

mierzonym od zera umownego z dokładnością
do przekształcenia liniowego.

Oznacza to, że
zapewnione są
równe
przedziały.

Antyprzykłady:

•oceny szkolne;
•siła wiatru.

Cechy porządkowe

Przykłady:

• pozycja w

rankingu;

• miejsce na mecie;
• stopień

złośliwości;

• poziom bałaganu;
• siła wiatru.

Charakteryzują się pomiarem nie dającym
konkretnej

wartości

liczbowej,

lecz

umożliwiającym ustalenie kolejności.

Operacją pomiarową jest
rangowanie,

czyli

ustalenie

kolejności

wszystkich obiektów w
próbie ze względu na
nasilenie mierzonej cechy.

Cechy porządkowe – podział

stymulant

destymulanty

nominanty

Pozytywnie

wartościowane

jest

największe

nasilenie

cechy.

Pozytywnie

wartościowane

jest

najmniejsze

nasilenie cechy.

Pozytywnie

wartościowane

jest środkowe

nasilenie

cechy.

•uroda;
•poziom

zdolności.

•złośliwość;
•poziom

spróchnienia
zębów.

•stopień

opiekuńczości;

•poziom zadbania

o własne
interesy.

Uwaga na dane

jakościowe!

Brak klasyfikacji

zupełnej

• nieuwzględnienie w

badaniach części
przypadków, np.
odrzucenie danych
niepasujących do
założenia badacza.

Każda sytuacja, w której nie jest zachowana
klasyfikacja zupełna i rozłączna oraz brak jest
odpowiedniej tego interpretacji grozi

poważnym

zafałszowaniem

wyników.

Brak klasyfikacji

rozłącznej

• liczenie tych samych

danych klika razy.

Czy statystyka kłamie?

Nadmierne

uśrednianie

danych

Wynik testu

jest tylko

prawdopodob

Świadome

manipulacje

Statystyka kłamie w takim stopniu, w jakim młotek sam
z siebie wali po palcach. Za wszelkie przekłamania
odpowiedzialna jest nie statystyka, ale ludzie ją
stosujący.

Najczęstsze przyczyny błędów i zafałszowań

Kiedy idę na
spacer z psem,
każdy z nas ma
średnio 3 nogi i
pół ogona.

W badaniach
reprezentatywny
ch zawsze
istnieje ryzyko
błędu.

•zmiana kategorii

w trakcie
badania;

•wybór

niewłaściwej
podstawy
porównań.

Tablica klasyfikacyjna

wybranych wskaźników opisu

statystycznego

wsk.

położenia

rozproszenia

(zróżnicowania

)

skośności,

asymetrii

zależności

jakościowe

porządkow

ilościowe

cechy

• kategoria

modalna (kostka)

• częstość

kategorii
modalnej

• dyspersja

względna
klasyfikacji

–

• współczynnik

siły związku

• mediana

• rozstęp

• współczynnik

korelacji
rangowej

Spearmana

• dominanta

• mediana

• średnia

arytmetyczna

x

• rozstęp
• wariancja

• odchylenie

standardowe

• współczynnik

zmienności

• współczynnik

skośności

• współczynnik

asymetrii

• współczynnik

korelacji
liniowej

Pearsona

Wskaźniki położenia

dla danych

jakościowych

Na przykładzie pytania ankietowego:

Czy podoba Ci się zwyczaj malowania tagów na murach?

Nazw

kostki

bardzo

raczej tak

to zależy

–

nie

– –

zdecydo-

wanie nie

RAZEM

Liczba

osób

N =

140

15 %

5 %

2,1 % 28,6 % 49,3 %

100 %

100

= �

100

140

C =

�

100

140

C =

�

...

Kategoria modalna to kategoria
najliczniejsza

tutaj:

•kategoria modalna to „

” lub

„

zdecydowanie nie

”

•liczebność kategorii modalnej to

•częstość kategorii modalnej:

= 49,3%

Interpretacja C

Ich siła dominacji w próbie jest umiarkowana.

49,3% badanej próby to zdecydowani przeciwnicy
tagów.

Siła dominacji kategorii

modalnej

Wartością maksymalną C

jest zawsze

100%. Wartość minimalna jest zmienna i
zależy

liczby

kategorii.

Wartość

minimalna C

to umowne zero siły

dominacji kategorii modalnej.

min C

50 %

33,3 %

25 %

20 %

16,7 %

14,3 %

12,5 %

11,1 %

10 %

20%

40%

60%

80%

100%

49,3%

słaba

umiarko

-wana

dość

duża

bardzo

duża

Dyspersja względna klasyfikacji

Wskaźnik rozproszenia (zróżnicowania) dla danych

jakościowych

(

)

(

)

[ ]

�

N – liczebność próby

k – liczba kategorii

j – numer kolejnej
kategorii

[] – uporządkowanie

danych ze względu
na wielkość

n – liczebność

poszczególnych kostek

Σ – sumowanie danych

�

– sumowanie od

kategorii drugiej do
ostatniej

gdzie:

Liczenie dyspersji

(

)

(

)

[ ]

�

[j]

6
9

4
0

2
1

5 140

2. Uporządkowanie danych w szereg

nierosnący.

3. Odrzucenie pierwszej kategorii.

4. Podstawienie do wzoru.

(

-1)

140

(

)

140

(

40 + 2

21 + 3

7 +

)

115

140

=
0,41

1. Sprawdzenie zupełności i rozłączności.

Interpretacja dyspersji

h =
0,41

wartość

zróżnicowani

brak

0,01 –

0,20

bardzo słabe

0,21 –

0,40

dość słabe

0,41 –

0,60

umiarkowan

0,61 –

0,80

dość silne

0,81 –

0,99

bardzo silne

pełne

UWAGA !

Zawsze: 0  h  1

Występuje

umiarkowan

zróżnicowanie

ze względu

odpowiedź

na pytanie

ankietowe.

Ćwiczenia

W pewnej szkole zbadano dwie klasy po 30 uczniów.
W każdej uczniów podzielono na 3 kategorie:
uczniowie słabi, przeciętni i zdolni. Otrzymano
wyniki:

Klasa 1

Liczba
osób

Klasa 2

Liczba
osób

1. Wskaż w której z klas występuje większe

zróżnicowanie.

2. Wskaż kategorię modalną, policz i zinterpretuj jej

częstość oraz policz i zinterpretuj dyspersję
klasyfikacji (w każdej z klas z osobna).

Document Outline