background image

Badania reprezentacyjne

Dr hab. inż. Jadwiga Stobiecka

background image

Pojęcia związane z doborem 
próby

Populacja:

generalna/badana

skończona/nieskończona

Operat losowania

Próba

Jednostka  próby/jednostka losowania

Metoda doboru próby (losowa/nielosowa

)

background image

Etapy procesu doboru próby

1. Zdefiniowanie populacji

Element badania

Jednostki populacji

Zakres przestrzenny

Zakres czasowy

2. Określenie operatu losowania

Jednostka losowania

Wykaz jednostek losowania (mapa, plan, wykaz miejscowości, rejestr, książka 

telefoniczna, lista płac)

Właściwości (kompleksowość, adekwatność, wyłączność, dokładność, 

dogodność)

3. Określenie jednostki losowania

Dzielnica, osiedle, ulica, blok mieszkalny

Rodzina, gospodarstwo domowe

Firma, pracownik, osoba

4. Wybór metody doboru próby 

(losowa/nielosowa)

5. Określenie liczebności próby

Cechy mierzalne/niemierzalne

Populacja skończona/nieskończona

background image

Określenie populacji

Wybór operatu losowania

Ocena typu doboru próby

Losowy       
Prosty
Warstwowy
Zespołowy
Wielostopniow

y

Nielosowy
Przypadkowy
Sędziów
Kwotowy
Kuli śniegowej

Oszacowanie liczebności próby

Realizacja projektu doboru

Proces doboru próby

background image

Dobór próby

background image

Dobór oparty o rachunek 

prawdopodobieństwa

Dobór losowy prosty

Dobór losowy systematyczny

Dobór losowy warstwowy

Dobór losowy grupowy

Dobór losowy wielostopniowy

Pozostałe dobory

background image

Dobór systematyczny

1

26

51

76

2

27

52

77

3

28

53

78

4

29

54

79

5

30

55

80

6

31

56

81

7

32

57

82

8

33

58

83

9

34

59

84

10

35

60

85

11

36

61

86

12

37

62

87

13

38

63

88

14

39

64

89

15

40

65

90

16

41

66

91

17

42

67

92

18

43

68

93

19

44

69

94

20

45

70

95

21

46

71

96

22

47

72

97

23

48

73

98

24

49

74

99

25

50

75

100

N = 100

N = 100

N = 100

N = 100

 

 

n = 20

n = 20

 

 

n = 20

n = 20

N/n = 5

N/n = 5

N/n = 5

N/n = 5

wybór losowy liczby (1-5):  4

wybór losowy liczby (1-5):  4

wybór losowy liczby (1-5):  4

wybór losowy liczby (1-5):  4

start od #4 i dobór co 5.  jednostkę

start od #4 i dobór co 5.  jednostkę

start od #4 i dobór co 5.  jednostkę

start od #4 i dobór co 5.  jednostkę

background image

Dobór warstwowy

Maksymalizacja wariancji 

(zmienności) między warstwami i 

minimalizacja wariancji wewnątrz 

warstw

Wzrost reprezentatywności próby

Identyfikacja podgrup

Bardziej precyzyjna estymacja 

parametru populacji (mniejsza 

wariancja w warstwach)

background image

Rodzaje doborów warstwowych

Proporcjonalny

Liczba jednostek próby w każdej warstwie jest 

proporcjonalny do rozmiaru warstwy w populacji

Prawdopodobieństwo wyboru jest takie same dla 

każdej warstwy

Nieproporcjonalny

Liczba jednostek próby w wybranych warstwach jest 

nieproporcjonalna w stosunku do rozmiaru warstwy w 

populacji

Pewne jednostki w próbie reprezentują mniejszą lub 

większą liczbę jednostek w populacji

Optymalny

Występują duże różnice w wariancjach zmiennej w 

poszczególnych warstwach

Liczebności warstw są różne

Występują różnice w kosztach dotarcia do 

poszczególnych warstw

background image

Dobór grupowy

Podział populacji na grupy, tak ze 

zmienność wewnątrzgrupowa jest 
maksymalna z międzygrupowa - 
minimalna

Losowy wybór grup

Procedura:

Procedura:

Procedura:

Procedura:

background image

Wybór warstwowy a grupowy

•Wybór próby losowej z każdej warstwy

•Całkowita wariancja zmiennej zależy
  od wariancji wewnątrzwarstwowej

•Losowy wybór grup

•Całkowita wariancja zmiennej zależy
  od wariancji międzygrupowej

Pierwotne jednostki losowania- PSU

Wtórne jednostki losowania- SSU

Grupa 1

Grupa 2

Grupa 3

....

background image

Obszarowy dobór gospodarstw 
domowych

Przestrzenna segmentacja gospodarstw

Błądzenie losowe (random walk)

background image

Dobór Kisha

Etap I – opracowanie alfabetycznej listy osób 

  w gospodarstwie domowym 

Etap II – wybór kolumny w tabeli Kisha 
odpowiadającej 

   ostatniej cyfrze numeru 

domu/mieszkania i wiersza 
 

   oznaczającego liczbę członków 

gospodarstwa
Etap III – wybranie osoby na liście o numerze z 
tabeli Kisha

    

background image

Dobór nie oparty o rachunek 

prawdopodobieństwa

1.Dobór kwotowy

2.Dobór jednostek typowych

3.Dobór przez eliminację

4.Dobór celowy

5.Dobór przypadkowy

6.”Przechwytywanie po drodze”

7. Dobór metodą „kuli śniegowej”

8. Dobór sieciowy

background image

Dobór kwotowy

Zmienne niepowiązane ze sobą

Płeć

Mężczyźni

19

Kobiety

21

Ogółem

40

Wiek

Poniżej
35

20

Powyże
j
35

20

Ogółem

40

Miejsce 

zamieszkania

Wieś

15

Miasto

25

Ogółem

40

background image

Dobór kwotowy

Zmienne wiązane

Miejsce 

zamieszka

nia

Płeć

Wiek

Raze

m

Ogółem

 

 

Poniżej 35

Powyżej 

35

Wieś

Mężczyźni

2

5

7

15

Kobiety

3

5

8

Miasto

Mężczyźni

6

6

12

25

Kobiety

9

4

13

Ogółem

20

20

 

40

background image

Dobór kwotowy

Podejście mieszane

Płeć

Wiek

Ogółe

m

Poniżej 

35

Powyże

j 35

Mężczyźn
i

8

11

19

Kobiety

12

9

21

Ogółem

20

20

40

Miejsce 

zamieszkania

Wieś

15

Miasto

25

Ogółem

40

background image

Liczebność próby

charakterystyka podejść

Arbitralne

Zdeterminowane analizami (wymogi tabel 
kontyngencji)

Zależne od budżetu

Zależne od określonego z góry poziomu 
precyzji:

o

Podejście oparte na przedziałach 
ufności

o

Podejście oparte na testowanie hipotez 
statystycznych

background image

Określenie liczebności próby

Statystyczne determinanty wielkości 

próby

Poziom ufności

95% ufność lub 0.05 poziom istotności 

Stopień precyzji (tolerancja błędu)

Dokładność w estymacji parametru w populacji 

generalnej na podstawie próby 

+/- $5.00  

czy  +/- $1.00

+/- 10%  czy +/- 5%

Zmienność cechy (wariancja) w populacji

W jakim stopniu jednostki losowania różnią się 

między sobą w populacji

background image

Relacja między wielkością 
próby a precyzją

S

N

S

X

  

=

Precyzja oszacowania parametru

Rozmiar próby

Odchylenie standardowe cechy w populacji

background image

Na podstawie średniej z próby 

                     Gdzie:
 σ-
 odchylenie stand. 
populacji

 E- dopuszczalny błąd

 Z- liczba odchyleń 
standardowych związanych 
z poziomem ufności

N- rozmiar populacji (pop. 
duża)

                     Gdzie:
 σ-
 odchylenie stand. 
populacji

 E- dopuszczalny błąd

 Z- liczba odchyleń 
standardowych związanych 
z poziomem ufności

N- rozmiar populacji (pop. 
duża)

       

       

background image

Na podstawie proporcji z próby 

Gdzie: π- proporcja populacji

Gdzie: π- proporcja populacji

background image

Dane interwałowe lub stosunkowe (na dostawie 

średniej z próby)

n  =   Z

2

  

2

E

2

Dla 1- = 0.95, Z

 = 1,96  2

Problem: jaka powinna być liczebność próby, żeby z dokładnością
do 0,1 punktu oszacować średnią ocen na 7 punktowej skali Likerta?

-wariancja odpowiedzi przy założeniu rozkładu normalnego wynosi

41

,

0

6

1

min

max

1

2

146

01

,

0

41

,

0

2

2

n

W 95 takich próbach na 100 średnia ocena na 
skali będzie wynosić X punktów  0,41, czyli

Jestem na 95% „ufny”, że średnia ocena na 
skali będzie wynosić X punktów  0,41

Liczebność próby prostej

background image

     Liczebność próby prostej

Dane nominalne lub porządkowe

n  =  Z

2

 

 

 

(1 - 

E

2

Dla 1- = 0.95, Z = 1,96  2

Problem: jaka powinna być liczebność próby, żeby z dokładnością do 
3% oszacować frakcje respondentów dokonujących zakupu produktu?

-maksymalna wariancja zmiennej występuje w sytuacji gdy 
  

1

05

1111

0009

,

0

1

0009

,

0

25

,

0

2

2

n

W 95 takich próbach na 100 odsetek kupujących
produkt będzie X%  3%, czyli

Jestem na 95% „ufny”, że odsetek kupujących 
będzie wynosić X%  3%

background image

Zasady
100 jednostek losowania w każdej podgrupie głównej i 
20-50 jednostek podgrupie o mniejszej wadze

Przykład
Tabela kontyngencji
Wiek: 5 kategorii
Intencja zakupu: - 5-punktowa skala Likerta 

Wielkość próby:   5  x 5 = 25 x 100  =  2500 

respondentów 

Segmentacja: wielkość próby ogólnokrajowej z 
licznymi podgrupami wynosi 2500 + 

Wielkość próby a analiza podgrup


Document Outline