background image

Statystyka opisowa 

dr Dorota Kałuża-Kopias 

Zakład Demografii i Gerontologii 

społecznej 

 

background image

Informacje ogólne: 

• kontakt e-mail: 

dkaluza@uni.lodz.pl

 

• dyżur: środa 15.00-16.30 pok. A.34 
• obecność na zajęciach zwiększa 

prawdopodobieństwo zaliczenia 
przedmiotu.... 

• zaliczenie: pisemne w formie testu 
 

 

background image

Podstawowe pojęcia 

statystyczne 

background image

• Termin statystyka [łac. Status- państwo] został 

wprowadzony do powszechnego użytku w 
połowie XVII w. przez niemieckiego uczonego 
Gottfreda Achenwalla. Początkowo był to proces 
gromadzenia i zestawiania danych liczbowych 
wykorzystywanych później w procesie rządzenia 
państwem. Obecnie nauka zajmuje się 
badaniem i opisywaniem prawidłowości 
występujących w zjawiskach masowych. 

background image

• Przedmiotem badań statystycznych jest 

zbiorowość statystyczna. Pojęcie to ma 
charakter uniwersalny ze względu na jego 
zastosowanie do wszystkich badań 
statystycznych dotyczących zarówno życia 
społecznego, jak i gospodarczego.  

background image

• Zbiorowość statystyczna (populacja) – 

zbiór jednostek (osób, przedmiotów, 
faktów) podobnych do siebie pod 
względem określonej cechy (cech) i 
powiązanych ze sobą logicznie, ale nie 
identycznych.  

background image

• Liczebność – ilość jednostek wchodzących w 

skład zbiorowości statystycznej. 

• Na przykład zbiorowością statystyczną w 

przypadku badania płci są wszystkie osoby 
będące obywatelami danego kraju.  

• Z uwagi na wielkość zbiorowości statystycznej i 

fakt, iż przeprowadzenie badania pełnego (całej 
zbiorowości) jest zbyt kosztowne w praktyce 
znacznie częściej bada się tylko część jednostek 
wchodzących w skład zbiorowości statystyczne 
(tzw. zbiorowość próbną, próbę statystyczną).  

background image

• Próbą statystyczną (zbiorowością 

próbną) nazywamy cześć zbiorowości 
statystycznej poddanej badaniu, która 
została wyodrębniona ze zbiorowości w 
określony sposób. 

background image

Cechy statystyczne i ich rodzaje  

background image

• Najczęściej cechy statystyczne są dzielone na: 
• Cechy ilościowe (mierzalne) – są to te 

właściwości jednostki statystycznej, które dadzą 

się zmierzyć i wyrazić za pomocą liczb oraz 
konkretnej jednostki, np. wzrost (cm), wiek (lata), 
masa (kg), itd.. 

• Cechy jakościowe (niemierzalne) – są to te 

właściwości jednostki statystycznej, których nie 

można zmierzyć, a jedynie stwierdzić czy dany 

wariant właściwości występuję bądź nie u danej 

jednostki. Cechy te określane są najczęściej 

słownie, np. pleć, wykształcenie, kategorie 

zawodowe, narodowość, itd..  
 

background image

• W wyniku pogrupowania jednostek 

zbiorowości statystycznej według cech 
mierzalnych 

możemy otrzymać podział 

na cechy: 

– Ciągłe – mogą przyjmować dowolną wartość 

z określonego przedziału liczbowego, a zbiór 

wartości takich cech jest nieprzeliczalny, np. 
waga (40-120) kg. 

– Skokowe (dyskretne) – mogą przyjmować 

tylko niektóre wartości z określonego 

przedziału liczbowego, np. ilość dzieci w 
rodzinie. 

 

background image

• W przypadku cech niemierzalnych 

rozróżniamy klasyfikację: 

– Dwudzielną (dychotoniczną) – przyjmują 

tylko dwa warianty, tzn. każda jednostka ma 
daną własność lub nie, innych możliwości nie 
ma np. płeć – kobieta i mężczyzna. 

– Wielodzielną (politomiczną) – przyjmują 

więcej niż dwa warianty, np. stan cywilny – 
panna/kawaler, zamężna/żonaty, 
rozwiedziona/rozwiedziony, 
separowana/separowany, wdowa/wdowiec.  

 

background image

• Innym podziałem cech statystycznych jest 

podział ze względu na przynależność jednostek 

do danej zbiorowości statystycznej. W tym 

przypadku rozróżniamy cechy: 

• Stałe – wspólne wszystkim jednostkom 

zbiorowości statystycznejnie podlegają badaniu 

statystycznemu, pomagają jedynie zaliczyć daną 

jednostkę do określonej zbiorowości 
statystycznej.  

• Zmienne – właściwości, którymi poszczególne 

jednostki różnią się od siebie, tzn. występują u 

poszczególnych jednostek zbiorowości w postaci 

możliwych wariantów cechy.  
 

background image

• W zależności od charakteru zbiorowości 

statystycznej wśród cech stałych 

wyróżnić można cechy: 

• Rzeczowe – odnoszą się do pytania co?, 

lub kogo badamy?, 

• Czasowe – określają, jaki okres obejmuje 

badanie?,  

• Przestrzenne – określają, gdzie odbywa 

się badanie.  
 

background image

• Rozpatrzmy na przykład zbiorowość, której 

jednostkami statystycznymi są wszyscy studenci 

studiujący na kierunku ekonomia w Łodzi w roku 

akademickim 2010/2011. Stałą cechą rzeczową 

jednostek tej zbiorowości jest to, że są to 

studenci kierunku ekonomia, stałą cechą 

przestrzenną jest to, że studenci ci są z łódzkich 

uczelni, stałą cechą czasową jest zaś fakt, iż do 

zbiorowości tej należą tylko ci, którzy byli 
studentami politologii w roku akademickim 
2010/2011. 

background image

 

Rys. 1.1 Podział cech statystycznych 

 

 

 

 

 

 

 

 

 

 

 

Źródło: Opracowanie własne  

Cechy statystyczne  

Zmienne  

Stałe  

Rzeczowe 

Czasowe  

Przestrzenne 

Dwudzielne 
(dychotoniczną) 

Ciągłe  

Skokowe 

Jakościowe 
(niemierzalne) 

Ilościowe 
(mierzalne) 

Wielodzielną 
(politomiczną) 

background image

Etapy badania statystycznego 

background image

• Badanie statystyczne polega na zebraniu 

odpowiednich informacji dotyczących określonej 

zbiorowości statystyczne, a następnie 
przetworzeniu i analizie tych informacji.  

• Wyróżnić można cztery etapy badania 

statystycznego: 

• Przygotowanie badania statystycznego; 
• Obserwacja statystyczna; 
• Opracowywanie zebranego materiału 

statystycznego; 

• Analiza zebranego materiału statystycznego; 

background image

• W pierwszym etapie badania należy: 

– Sformułować cel badania i hipotezy 

badawcze; 

– Określić zbiorowość i jednostkę statystyczną 

(ze względu na kryterium rzeczowe, czasowe, 
przestrzenne); 

– Określić listę cech statystycznych; 
– Określić metodę badania statystycznego; 

background image

• Ze względu na kompletność badania 

statystycznego wyróżniamy badania: 

– Całkowite (pełne) – obserwacji poddane są wszystkie 

jednostki statystyczne, np. spisy powszechne, 
bieżąca rejestracja statystyczna (zgonów, urodzeń, 
małżeństw); 

– Częściowe – część zbiorowości poddana zostaje 

badaniu statystycznemu, są to badania: ankietowe, 
monograficzne, reprezentacyjne, np. kontrola jakości 
wyrobów; 

background image

• Ze względu na ciągłość obserwacji 

wyróżniamy badania: 

– Jednorazowe – np. ustalenie przyczyny 

zgonu; 

– Okresowe (cykliczne) – np. spisy 

powszechne; 

– Ciągłe – np. rejestracja bieżąca urodzeń, 

zgonów; 

background image

– Określić źródła informacji;  

• Pierwotne – zbieramy informacje dla konkretnego 

badania, np. ankieta informacja zaczerpnięta u 
źródła; 

• Wtórne – zbiór danych zgromadzonych dla celów 

poza statystycznych, np. dla bieżącej działalności 
jednostek gospodarczych; 

background image

• Opracować formularze statystyczne i przygotować 

makiety tablic wynikowych oraz zapewnić 
odpowiednią kontrolę zbieranych materiałów 
statystycznych; 

• Szkolenie osób zbierających materiał statystyczny 

(tylko w przypadku materiału pierwotnego); 

• Opracowywanie planu finansowego badania. 

background image

• Etap  drugi  –  obserwacja  statystyczna 

czyli  zbieranie 

materiału  statystycznego 

przebiega  zgodnie  z 

założeniami  z 

wcześniejszego 

etapu 

projektowania 

badania. 

 

background image

• Etap trzeci – opracowywanie zebranego 

materiału statystycznego. 

• Na tym etapie mamy do wykonania 

następujące czynności: 

• Kontrolę formalną i merytoryczną;  
• Grupowanie materiału statystycznego; 
• Podliczanie (zliczanie) materiału 

statystycznego; 

• Prezentacja materiału statystycznego; 

 

background image

• Zebrany materiał statystyczny podczas drugiego 

etapu nazywamy materiałem surowym, który 

często zawiera różnego rodzaju braki i błędy. 

Dlatego przed analizą statystyczną poddajemy 

go kontroli zarówno pod kontem formalnym, jak i 
merytorycznym.  

• Kontrola formalna polega na sprawdzeniu 

kompletności i zgodności rachunkowej materiału 
statystycznego, natomiast kontrola 
merytoryczna
 

sprawdza logiczną poprawność 

zapisów.  

background image

• Do przeprowadzenia badania statystycznego oprócz 

kontroli formalnej i merytorycznej należy dokonać 

grupowania materiału statystycznego, które stanowi 

przejście od materiałów informacyjnych o pojedynczych 

jednostkach badanej zbiorowości statystycznej do 

informacji dających obraz o całej zbiorowości. Inaczej 

mówiąc grupowanie materiału statystycznego polega 

na wyodrębnienie jednorodnych grup ze zbiorowości 

statystycznej. Takim podziałem jest na przykład podział 

ludności ze względu na płeć czy charakter miejsca 

zamieszkania (miasto, wieś).  

background image

• Głównym i ostatecznym celem każdego 

badania statystycznego jest analiza 
zebranego materiału statystycznego

która ma na celu możliwie wszechstronne 
poznanie i zbadanie analizowanej 
zbiorowości.  

background image

Sposoby prezentacji materiału 

statystycznego  

background image

• Opracowanie materiału statystycznego 

(tzn. grupowanie i zliczanie) sprowadza 

się do prezentacji danych statystycznych 
w odpowiedniej formie.  

• Istnieją dwie podstawowe formy 

prezentacji danych statystycznych: 

• Szeregi statystyczne;  
• metoda graficzna (histogramy, wykresy, 

kartogramy, itd.). 
 

background image

• Sposób prezentacji zależny jest od 

specyfiki i celu badania. Główną zasadą 
jaką badacz kieruje się przy wyborze 
formy prezentacji danych statystycznych 
jest zapewnienie czytelności i 
przejrzystości zebranych danych, a dzięki 
temu uzyskanie możliwości analizy 
prezentowanego materiału statystycznego. 

background image

Szeregi statystyczne  

 

background image

• Dane statystyczne uporządkowane według 

wariantu jednej cechy zaprezentowane w 
postaci tabelarycznej tworzą szereg 
statystyczny

• W zależności od rodzaju analizy badanych 

zjawisk rozróżniamy szeregi  

background image

Rys. 1.2. Podstawowe rodzaje szeregów statystycznych 

 

 

 

 

 

 

 

 

 

 

 

 

 

Źródło: Opracowanie własne 

Szeregi 
statystyczne 

Okresów  

Rozdzielcze 

Czasowe 
(dynamiczne) 

Momentów  

Z cechą 
mierzalną 

Szczegółowe 

Przedziałowe  

Geograficzne 
(przestrzenne) 

Punktowe  

Z cechą 
niemierzalną 

background image

1.  Szereg  szczegółowy  (indywidualny,  prosty,  wyliczający)  –  ciąg  liczbowych  wielkości 

statystycznych  uporządkowanych  według  badanej  cechy  (rosnąco  lub  malejąco).  W 

praktyce ma zastosowanie przy małych zbiorowościach. 

 

Nr badanej jednostki 

1

 

2

 

3

 

4

 

n

 

Wariant badanej cechy (

i

x

1

x

 

2

 

3

 

4

 

n

x

 

gdzie: 

i

 - oznacza wartość cechy dla i-tej jednostki zbiorowości statystycznej; 

i= 1,2…,n 

background image

Przykład: 

10  studentów  kierunku  politologia  spytano  ile  palą  dziennie  papierosów.  Uzyskano 

następujące informacje (ilość wypalanych papierosów w sztukach):1,2,8,10,3,2,1,5,6,4. 

Aby  z  powyższych  informacji  utworzyć  szereg  szczegółowy  należy  ułożyć  liczbę 

wypalanych papierosów niemalejąco. 

Nr studenta 

1

2

3

4

5

6

7

8

9

10 

Liczba wypalanych papierosów (

i

x

)  1

1

2

2

3

4

5

6

8

10 

 

background image

• W przypadku gdy mamy do czynienia z dużymi 

zbiorowościami statystycznymi stosujemy 
szeregi rozdzielcze, które dzielą badaną 
zbiorowość na klasy (części) według określonej 
cechy. 

• Szereg rozdzielczy – składa się z dwóch 

kolumn (w pierwszej kolumnie znajdują się 
warianty badanej cechy , w drugiej kolumnie 
liczba jednostek zbiorowości statystycznej, która 
dany wariant cechy posiada .  

background image

  

Wariant badanej cechy (

i

x

1

x

 

2

x

 

3

x

 

4

x

 

k

x

 

 

liczba jednostek (

i

n

1

n

 

2

n

 

3

n

 

4

n

 

k

n

 

n

 

gdzie: 

i

 - oznacza i-ty wariant badanej cechy   

i=1,2,…,k 

i

 - liczba jednostek zbiorowości statystycznej o i-tym wariancie cechy (tzw. liczebności 

cząstkowe); 

k – liczba wariantów cechy (klas); 

n – liczebność całkowita zbiorowości (próby); 

znak sumy; 

przy czym: 

k

i

i

n

n

1

 

background image

• Szeregi rozdzielcze dla cech 

mierzalnych dzielą się na: 

• Punktowe – stosujemy gdy liczba 

wariantów cechy jest niewielka.  

•  Z przedziałami klasowymi – stosujemy 

gdy jest duża liczba wariantów badanej 
cechy. 

background image

• Ważne przy konstrukcji szeregów rozdzielczych 

z przedziałami klasowymi jest ustalenie: 

• Liczby klas (przedziałów), w praktyce wynosi 

ona od 5 do 15 (w zależności od liczby 
obserwacji i charakteru danych). Jednym ze 
sposobów ustalenia liczby klas jest skorzystanie 
z formuły:  

• Długości przedziału klasowego (rozpiętość) 

stanowi różnicę między górną a dolną krawędzią 
przedziału (x dolne - x górne)W praktyce 
staramy się aby rozpiętości poszczególnych 
przedziałów były porównywalne. 
 

background image

Szereg rozdzielczy punktowy (tab. 1.1) 

Szereg rozdzielczy z przedziałami klasowymi (tab. 1.2) 

Tab. 1.1 Wzrost dzieci  

 

 

Tab. 1.2 Absencja chorobową pracowników firmy X 

w klasie trzeciej szkoły podstawowej  

 

 

 

 

 

 

 

 

Źródło: Dane umowne 

Wzrost 

(w cm) 

i

x

 

Liczba 

dzieci 

i

n

 

150 
151 
152 
153 
154 
155 
156 

25 
35 
40 
45 
40 
30 
20 

 

235 

Liczba dni nieobecności 

i

x

 

Liczba pracowników 

i

n

 

0 – 4 
5 – 9 

10 – 14 
15 – 19 
20 – 24 

100 
150 
200 
130 
120 

 

700 

background image

• Czasami mamy do czynienia z szeregami 

statystycznymi rozdzielczymi o pierwszym 
lub ostatnim przedziale kasowym 
otwartym. Sytuacja taka występuje, np. 
gdy w badanej zbiorowości statystycznej 
występują ekstremalne wartości badanej 
cechy (zarówno bardzo duże, jak i bardzo 
małe). 

background image

Szeregi rozdzielcze z otwartymi przedziałami klasowymi (tab. 1.3, 1.4)  

Tab. 1.3  

 

 

 

 

 

Tab. 1.4 

 

 

 

 

 

 

Źródło: Dane umowne 

 

Liczba dni 

 nieobecności 

i

x

 

Liczba 

 pracowników 

i

n

 

0 – 4 
5 – 9 

10 – 14 
15 – 19 

20 i więcej 

100 
150 
200 
130 
120 

 

700 

Liczba dni  

nieobecności 

i

x

 

Liczba  

pracowników 

i

n

 

4 i mniej 

5 – 9 

10 – 14 
15 – 19 
20 – 24 

100 
150 
200 
130 
120 

 

700 

background image

Szereg rozdzielczy dla cechy niemierzalnej (tab. 1.5) 

Tab. 1.5 Struktura ludności w wieku 15 lat i więcej według stanu cywilnego faktycznego w 2002 roku  

Stan cywilny 

i

x

 

Ludność (w tys.) 

i

n

 

Mężczyźni 

 

Kawalerowie 

Żonaci i partnerzy 

W tym partnerzy 

Wdowcy 

Rozwiedzieni 

Separowani 

 

Kobiety 

 

Panny 

Zamężne i partnerki 

W tym partnerki 

Wdowy 

Rozwiedzione 

Separowane 

 

14962,1 

 

4863,0 
9145,7 

198,0 
424,7 
394,2 

9,6 

 

16326,3 

 

3869,0 
9239,9 

198,0 

2446,3 

635,8 

13,7 

 

 

 

 

Źródło: Rocznik Demograficzny 2007, s. 164 

background image

Szereg  przestrzenny  -  (geograficzny) 

– 

prezentuje 

strukturę 

przestrzenną 

badanego  zjawiska.  Konstrukcja  szeregu 
geograficznego  polega  na  tym, 

że  w 

pierwszej 

kolumnie 

zamieszczamy 

jednostki  terytorialne,  a  w  drugiej  badane 
wielkości statystyczne.  
 

background image

Szereg przestrzenny (tab. 1.6) 

Tab. 1.6 Największe państwa świata w 2007 (w mln osób) 

Kraj 

Ludność 

Chiny 

1318 

Indie 

1132 

USA 

302 

Indonezja 

232 

Brazylia 

189 

Pakistan 

169 

Bangladesz 

149 

Nigeria 

144 

Rosja 

142 

Japonia 

128 

Meksyk 

107 

Źródło: dane dostępne na stronie 

www.un.org

  

background image

• Zgrupowany materiał statystyczny przedstawiany jest 

najczęściej w postaci tablic statystycznych, które 

stanowią zbiór szeregów statystycznych. Każda tablica 

statystyczna zaopatrzona jest w tytuł, kolumny i wiersze. 

W zależności z ilu szeregów składa się tablica można je 

podzielić na:  

• Proste – składają się z jednego szeregu i zawierają 

informacje o zbiorowości statystycznej z punktu widzenia 
jednej cechy. 

• Kombinowane – składają się z kilku szeregów i 

zawierają informacje o jednej zbiorowości z punktu 
widzenia kilku cech. 

background image

• W przypadku gdy z różnych przyczyn nie 

możemy wypełnić jakiejś pozycji w tablicy to w 
miejsce to wstawiamy jeden ze znaków: 

• (-) zjawisko nie występuje; 
• (.) brak informacji; 
• (X) rubryka nie może być wypełniona ze 

względu na układ tablicy; 

• (0) wielkość mniejsza od minimum jednostki; 

background image

Analiza struktury zbiorowości  

 

background image

• Realizacji tego zadania służą odpowiednie miary 

statystyczne (zwane parametrami). Do podstawowych 

parametrów opisujących strukturę zbiorowości 

statystycznych należą: 

• wskaźnik natężenia; 
• wskaźnik struktury; 
• wskaźnik podobieństwa struktur; 
• miary opisujące tendencję centralną (średnie); 

– klasyczne, 
– pozycyjne, 

• miary dyspersji (rozproszenia, zróżnicowania, rozrzutu); 

– klasyczne, 
– pozycyjne, 

 

background image

• Wyniku obserwacji statystycznej 

otrzymujemy informację o badanym 
zjawisku w postaci liczb 

bezwzględnych 

(absolutnych), 

które są zawsze 

wielkościami mianowanymi (np. masa w 
kg, liczba w sztukach, powierzchnia w ). 
Wartości bezwzględne jednak nie nadają 
się do porównań w czasie i w przestrzeni 
badanych zbiorowości.  

background image

• Prawdziwy osąd o stanie badanego 

zjawiska daje dopiero uwzględnienie 
wartości bezwzględnych innego zjawiska 
występującego wraz z badanym. Dlatego 
w analizie statystycznej oprócz liczb 
bezwzględnych wykorzystuje się liczby 
względne (stosunkowe), które stanowią 
stosunek (iloraz) liczb bezwzględnych 
opisujących zjawiska ze sobą powiązane.  

 

background image

• Wskaźniki natężenia to liczby względne, 

obliczane wówczas gdy chcemy 
przedstawić badaną wielkość w 
odniesieniu do innej, która jest z nią 
logicznie powiązana.  

background image

Wartość wskaźnika natężenia (

n

) wyznaczamy na podstawie wzoru (1.1): 

b

a

W

n

 

 

 

(1.1) 

gdzie: 

a - wielkość pierwsza; 

b - wielkość druga logicznie powiązana z wielkością pierwszą; 

background image

• W opisie zjawisk demograficznych i 

społeczno-ekonomicznych jest to miara 
bardzo często wykorzystywana. Niektóre z 
nich to: gęstość zaludnienia (liczba 
ludności przypadająca na 1 km2), 
współczynnik zawierania małżeństw 
(odnoszący liczbę zawartych w danym 
okresie małżeństw do populacji osób 
zamieszkałych na danym obszarze), itd.  

background image

Wskaźnik struktury (frakcja), 

wskaźnik podobieństwa struktur  

 

background image

• Struktura badanej zbiorowości często 

przedstawiana jest w podziale na 
podgrupy jednostek różniących się od 
siebie wariantami analizowanej cechy. 
Udział poszczególnych części zbiorowości 
posiadających dany wariant cechy w całej 
zbiorowości opisuje wskaźnik struktury 
(frakcja), który może być wyrażony w 
procentach albo w promilach.  

background image

Wartość wskaźnika struktury (

i

) wyznaczamy na podstawie wzoru (1.2): 

n

n

w

i

i

 

 

 

(1.2) 

przy czym 

k

i

i

w

1

1  (lub 100 jeśli wyrażany jest w procentach, 1000 – jeśli w promilach) 

1

0

i

w

 (lub 100 jeśli wyrażany jest w procentach, 1000 – jeśli w promilach) 

gdzie:  

= 1, 2,…, n; 

– liczba podgrup badanej zbiorowości; 

n - liczebność całkowita zbiorowości; 

i

- liczebność cząstkowa zbiorowości; 

background image

Przykład: 

Tablica 1.7 przedstawia wydatki na grupy towarów w 2004 r. ponoszonych miesięcznie przez 

gospodarstwa  domowe.  Aby  określić,  jaki  był  udział  poszczególnych  grup  towarów  w 

wydatkach  miesięcznych  gospodarstw  domowych,  obliczono  w  kolumnie  3.  wskaźniki 

struktury. 

Tab. 1.7 Wydatki na grupy towarów gospodarstw domowych w 2004 r. 

grupy towarowe 

miesięczne wydatki na os. 

Wskaźniki struktury (

i

w

) w % 

Żywność i napoje bezalkoholowe 

181 

46,06 

Napoje alkoholowe i wyroby tytoniowe 

19 

4,83 

Odzież i obuwie 

39 

9,92 

Użytkowanie mieszkań i nośniki energii 

129 

32,82 

Zdrowie 

25 

6,36 

Suma 

393 

100,00 

Źródło: Obliczenia własne na podstawie danych z Rocznika Statystycznego 2005, s. 203 

background image

• Do określenia podobieństwa struktur 

badanych zbiorowości z punktu widzenia 
określonej cechy w naukach społecznych 
często jako miarę wykorzystuje się 
wskaźnik podobieństwa struktur, który 
wyznacza się według wzoru (1.3):  

background image

)

,

min(

iII

iI

p

w

w

w

 

 

 

(1.3) 

przy czym 

1

0

p

w

,  

gdzie: 

iII

iI

w

,

 - oznaczają wskaźniki struktury dla dwóch porównywalnych zbiorowości (I i II).  

Im  wartość  wskaźnika  bliższa  jedności  tym  struktury  badanych  zbiorowości  są  do  siebie 

bardziej podobne. Najczęściej miara ta wyrażana jest w procentach, wówczas 

100

0

p

w

 

background image

• W tab. 1.8 przedstawiono strukturę studentów według 

płci na dwóch uczelniach (politechnice i uniwersytecie). 

Chcąc odpowiedzieć na pytanie czy struktura studentów 

ze względu na płeć jest do siebie podobna na obu 

uczelniach, należy obliczyć wskaźnik podobieństwa 

struktur, według wzoru (1.3). Jak wynika z danych 

zawartych w tablicy wyższy udział kobiet wśród ogółu 

studentów występuje na uniwersytecie (55%). Mimo to 

obliczony w kolumnie 4., tab. 1.8 wskaźnik podobieństwa 

struktur wynosi 0,7, co wskazuje na 70% podobieństwo 

obu porównywanych struktur. 

background image

Tab. 1.8 Struktura studentów według płci  

Płeć (studenta) 

Politechnika 

iI

w

Uniwersytet

iII

w

 

min (

iII

iI

w

,

Kobieta 

0,25 

0,55 

0,25 

Mężczyzna 

0,75 

0,45 

0,45 

p

w

 

0,70 

Źródło: Dane umowne 

background image

Miary średnie  

(klasyczne i pozycyjne)  

background image

• Średnie klasyczne – do obliczenia 

których potrzebujemy wszystkich 

jednostek zbiorowości statystycznej; 

• Średnie pozycyjne – które są 

konkretnymi wartościami jednostek 

zbiorowości statystycznej, jednostek 

wyróżnionych ze zbiorowości ze względu 

na swoją pozycję w szeregu 
statystycznym;  
 

background image

• Średnia arytmetyczna – otrzymujemy ją w wyniku 

podzielenia sumy wartości cechy wszystkich jednostek 

zbiorowości statystycznej przez liczebność zbiorowości.  

   

 

 

 

 

 
 

gdzie: 
•  wartość cechy dla i-tej jednostki zbiorowości; 
• i=1,2,…, n; 
• n - liczebność całkowita zbiorowości (próby); 
• Średnią arytmetyczną obliczoną według powyższego 

wzoru nazywamy średnią arytmetyczną prostą i 

wyznaczamy ją na podstawie szeregów szczegółowych.  

background image

gdzie: 

i

n

 - liczba jednostek zbiorowości statystycznej o i-tym wariancie cechy  

k – liczba wariantów cechy (klas); 

background image

• W przypadku szeregu rozdzielczego z 

przedziałami klasowymi warianty cechy 
wyrażone są za pomocą klas. W każdej 
klasie występuje nie jeden wariant cechy 
lecz wiele. W tym wypadku średnią 
arytmetyczną ważoną wyznaczamy 
według wzoru  

background image

gdzie: 

i

x

  -  środek  przedziału  klasowego,  który  wyznaczamy  sumując  dolny  i  górny  kraniec 

przedziału, a następnie tak obliczoną sumę dzielimy przez 2. 

background image

Jeśli  w  miejsce  wagi 

i

n

  we  wzorach    podstawimy 

wskaźnik  struktury 

i

w

,  to  średnie  arytmetyczne  ważone 

przyjmą postać: 

 

k

i

i

i

k

i

i

i

x

w

n

x

n

x

1

1

   

 

k

i

i

i

k

i

i

i

x

w

n

x

n

x

1

1

 

 

background image

Wybrane własności średniej arytmetycznej:  

1.  Średnia  arytmetyczna  jest  wielkością  mianowaną,  tzn. 

wyrażona jest w takich samych jednostkach jak badana cecha; 

2.  Średnia  arytmetyczna  nie  może  przyjąć  wartości  niższej  niż 

minimalna  wartość  badanej  cechy  oraz  wyższej  niż 

maksymalna wartość cechy,  

czyli: 

x

x

x

min

max

 

3.  Suma  odchyleń  od  średniej  arytmetycznej  poszczególnych 

wartości cechy 

x

i

 równa jest zero, 

czyli: 

x

x

i

0

 w szeregu szczegółowym 

lub

 

x

x

n

i

i

0

 w szeregu rozdzielczym. 

background image

Wady: 

• Przede wszystkim jest ona wielkością 

abstrakcyjną, tzn. może przyjąć wartość jaka nie 

wystąpiła u żadnej badanej jednostki.  

• W przypadku szeregów rozdzielczych o 

otwartych przedziałach klasowych wyznaczenie 

średniej arytmetycznej jest niemożliwe, ze 

względu na niemożność obliczenia środka 

przedziału klasowego.  

• Ponadto nie powinno się jej wyznaczać dla 

zbiorowości, w których występują nietypowe 

wartości cechy.  

background image

Miary średnie pozycyjne  

background image

 

W odróżnieniu od średnich klasycznych, są 

wielkościami, których wartości wyznaczane są 
na podstawie tylko niektórych (konkretnych) 
wyrazów szeregu statystycznego.  

Tak więc są to rzeczywiste wartości cechy 

występujące w badanej zbiorowości, wybrane ze 
względu na swoje położenie w uporządkowanym 
szeregu statystycznym. Do średnich 
pozycyjnych zaliczamy dominantę oraz kwartyle.  

background image

• Dominanta  (moda, wartość 

najczęstsza, wartość modalna) – jest to 
wartość cechy, która występuje 
najczęściej (najliczniej) w badanej 
zbiorowości statystycznej. 

background image

• W szeregach szczegółowych oraz 

rozdzielczych punktowych dominantę 
stanowi ta wartość cechy, która powtarza 
się najczęściej (o największej liczebności) 
u badanych jednostek zbiorowości 
statystycznej.  

background image

0

1

0

1

0

1

0

0

0

*

)

(

)

(

h

n

n

n

n

n

n

x

D

   

 

 

(1.9) 

gdzie: 

 x

0

- dolna granica przedziału Do

h

0

-rozpiętość przedziału Do – czyli różnica między dolnym i górnym krańcem przedziału Do

n

0

- liczebność przedziału Do

-1

 – liczebność przedziału poprzedzającego przedział Do

+1

 – liczebność przedziału następującego po przedziale Do

background image

Warunki wyznaczania dominanty 

 

• Rozpiętości przedziału dominanty i 

sąsiadujących z nim przedziałów muszą 
być równe; 

• Nie należy wyznaczać dominanty w 

przypadku gdy brak jest jednego wyraźnie 
zaznaczonego maksimum liczebności;  

background image

• Kwartyle są to miary, które dzielą 

zbiorowość na części, które pozostają w 
stosunku do siebie w określonych 
proporcjach. Jednym z najbardziej 
znanych kwartyli jest kwartyl drugi zwany 
medianą. 

background image

• Mediana Me (kwartyl drugi, wartość 

środkowa) – jest to miara, która dzieli 
zbiorowość na dwie równe części w ten sposób, 
że liczba jednostek mających wartość nie 
mniejszą od Me jest równa liczbie jednostek 
mających wartość niewiększą od Me. Sposób 
wyznaczenia mediany zależny jest od typu 
szeregu statystycznego oraz liczby jednostek 
wchodzących w skład zbiorowości statystycznej 
(liczebności).  

background image

 

2

1

n

x

Me

 

 

 

(1.10) 

W przypadku zbiorowości o parzystej liczebności mamy dwie wartości środkowe. W takim 

wypadku medianę stanowi tu średnia arytmetyczna dwóch wartości środkowych (wzór 1.11). 

2

1

2

2

n

n

x

x

Me

 

 

 

(1.11) 

Liczebność  skumulowana  (

sk

)  jest  to  suma  liczebności  cząstkowych  od  1  do  i-tego 

wariantu cechy (klasy w przypadku szeregu rozdzielczego z przedziałami klasowymi), 

k

i

i

n

1

   

(1.12) 

background image

W szeregu z przedziałami klasowymi medianę wyznaczamy ze wzoru 1.13: 

)

(

*

1

0

0

0

sk

Me

n

Nr

n

h

x

Me

  

 

(1.13) 

gdzie: 

x

0

- dolna granica przedziału  Me 

h

0

-rozpiętość przedziału 

Me

n

0

- liczebność przedziału 

Me

n

sk-1

- liczebność skumulowana powyżej przedziału  Me 

Me

Nr   -  numer  mediany  (pozycja  mediany),  który  jest  zależny  od  liczebności  całkowitej 

zbiorowości (wzór 1.14). 



 

2

2

1

n

n

Nr

Me

    

 

 

 

(1.14) 

 

-dla n nieparzystego 

-dla n parzystego 

background image

• Zaletą mediany jest to, iż może być ona 

obliczana w przypadku, w którym nie 
możemy lub nie powinniśmy wyznaczać 
średniej arytmetycznej, która w 
przeciwieństwie do mediany jest wrażliwa 
na występowanie wartości nietypowych 
cechy. 

background image

Kwartyl pierwszy i trzeci 

• Kwartyl pierwszy jest to taka wartość 

cechy, która dzieli zbiorowość w ten 

sposób, że 25% jednostek ma od niej 

wartość mniejszą, a 75% jednostek 

większą, , zaś kwartyl trzeci to wartość tej 

cechy, poniżej której znajduje się 75%, a 

powyżej której 25% jednostek zbiorowości 
statystycznej. Wyznaczenie tych miar 

odbywa się na tej samej zasadzie, jak 
wyznaczenie mediany.  

background image

• W szeregach szczegółowych 

przyjmujemy, że zbiorowość jest dzielona 

przez medianę na dwie równe części. Jeśli 

wyznaczymy ponownie medianę dla 

części pierwszej to jej wartość będzie 

odpowiadała kwartylowi pierwszemu, jeśli 

zaś drugiej połowie zbiorowości to 
kwartylowi trzeciemu. Dla obu tych 

podzbiorowości mediana jest wyznaczana 

według wzoru 1.10 lub 1.11.  

background image

• W przypadku szeregu rozdzielczego 

punktowego wyznaczenie kwartala 
pierwszego i trzeciego polega na 
wskazaniu w kolumnie wartości cechy 
odpowiadającej liczebności skumulowanej 
zawierającej  zbiorowości w przypadku , 
natomiast dla  - 

zawierającej  jednostek 

zbiorowości.  

background image

W  przypadku  szeregu  rozdzielczego  z  przedziałami  klasowymi  kwartyl  pierwszy  i  trzeci 

wyznaczane są ze wzorów 1.15 i 1.16. 

 

)

(

*

1

0

0

0

1

1

sk

Q

n

Nr

n

h

x

Q

   

 

(1.15) 

)

(

*

1

0

0

0

3

3

sk

Q

n

Nr

n

h

x

Q

  

 

(1.16) 

gdzie: 



 

4

4

1

1

n

n

Nr

Q

  

 

 

 

 

(2.17) 



4

3

4

)

1

(

3

3

n

n

Nr

Q

  

 

 

 

 (2.18) 

dla n nieparzystego 

dla n parzystego 

dla n nieparzystego 

dla n parzystego 

background image

Miary zróżnicowania 

(klasyczne i pozycyjne) 

background image

Miary klasyczne
• Wariancja; 
• Odchylenie standardowe; 
• Współczynnik zmienności; 
Miary pozycyjne
• Rozstęp (obszar zmienności); 
• Odchylenie ćwiartkowe; 
• Współczynnik zmienności; 

 

background image

Rozstęp  

Miara  ta  ma 

niewielką  wartość poznawczą, gdyż obszar zmienności 

uzależniony  jest  tylko  od  dwóch  wartości  skrajnych,  które  często 
różnią się istotnie od wszystkich pozostałych wartości badanej cechy, 
tak 

więc  rozstęp  wykorzystywany  jest  jedynie  przy  wstępnej  ocenie 

rozproszenia badanej cechy w 

zbiorowości.  

background image

odchylenie ćwiartkowe (Q), które określa 

średnie zróżnicowanie wartości cechy od 

mediany  

Q=

2

1

3

Q

Q

 

(1.20) 

Miara ta stosowana jest zazwyczaj, gdy niemożliwe lub nie wskazane jest obliczanie miar 
klasycznych zróżnicowania.  

background image

        

Wariancją    określa się średnią 

arytmetyczną z  sumy  kwadratów 
odchyleń poszczególnych wartości   cechy   
statystycznej    od    średniej 
arytmetycznej całej zbiorowości 
statystycznej. Wariancję   wyznacza   się    
z    następujących wzorów:   

dla szeregu szczegółowego:  

 

         

 

 

 

n

i

i

x

x

n

s

1

2

2

1

2

s

background image

-

dla szeregu rozdzielczego punktowego: 

 

 

 

-

dla szeregu rozdzielczego 
przedziałowego:  

 

 

         

 

 

 

i

n

i

i

n

x

x

n

s

1

2

2

1

i

n

i

i

n

x

x

n

s

 

1

2

0

2

1

background image

        

Podstawowe właściwości wariancji: 

1.

Jest  zawsze  liczbą  nieujemną 

2.

Jest    zawsze    wielkością    mianowaną,   
tzn. wyrażoną   w    jednostkach    
badanej    cechy statystycznej.  Miano   
wariancji   zawsze   jest kwadratem    
jednostki    fizycznej,   w    jakiej mierzona  
jest  badana  cecha 

3.

Im   zbiorowość   statystyczna    jest    
bardziej zróżnicowana,   tym   wartość   
wariancji   jest wyższa 

 

background image

        Odchylenie standardowe  jest  

pierwiastkiem    kwadratowym z wariancji: 

 

gdzie: 

     - odchylenie standardowe 

     - wariancja. 

        

Odchylenie    standardowe    określa,   o    

ile wszystkie      jednostki     statystyczne     
danej zbiorowości  różnią  się  średnio  od   
wartości średniej    arytmetycznej    
badanej   zmiennej.  

2

s

s

s

2

s

background image

        W    statystyce     odchylenie      

standardowe wykorzystywane  jest  do 

tworzenia typowego obszaru zmienności  

statystycznej. W obszarze takim    mieści    

się    około    2/3   wszystkich jednostek  

badanej  zbiorowości  statystycznej. 

        

Typowy obszar zmienności określa 

wzór: 

 
         

s

x

x

s

x

typ

background image

        

        

Miary       dyspersji      (rozproszenia),      jak i   wartości 

średnie są liczbami mianowanymi. Fakt        ten         
umożliwia        bezpośrednie porównywania   miar   
dyspersji    obliczonych dla   różnych   szeregów.

  

        

Jeżeli    badane    zjawisko    mierzone     jest w różnych 

jednostkach miary lub kształtuje się na     niejednakowym     
poziomie,     wówczas   do    oceny    rozproszenia    należy    
stosować współczynnik   zmienności. 

  

background image

        

        

Współczynnik  zmienności jest ilorazem odchylenia 

przeciętnego lub odchylenia standardowego oraz średniej: 

  

lub  

 

(zamiast      może być inna średnia, np. mediana)  

        

Współczynnik     zmienności      może      być wyrażony  

w  procentach.  Współczynnik   ten zastępuje   bezwzględne   
miary   dyspersji. 

x

s

V

x

d

V

x

background image

        

        

Współczynnik         zmienności         pozwala porównywać    

różne    szeregi    lub     szeregi tego   samego  typu,  ale  o  
różnej   strukturze. Umożliwia  on  dokonanie  analiz  
zmienności w     czasie     i     przestrzeni.    Współczynnik 
zmienności  (obok odchylenia standardowego) 
wykorzystywany   jest    jako    miara    ryzyka finansowego.