background image

 

 

Metody opracowywania 

i prezentacji danych 

statystycznych

background image

 

 

Podstawowe metody prezentacji 

danych statystycznych:

- tablice,
- wykresy,
- forma opisowa.

background image

 

 

szeregi statystyczne,
wskaźniki struktury,
prezentacja graficzna szeregów 

statystycznych:

• histogram,
• diagram,
• krzywa liczebności.

background image

 

 

Szeregi statystyczne

 

 Szereg statystyczny - jest to zbiór wyników 

obserwacji uporządkowanych według określonych 

cech (kryteriów), których miernikiem są zmienne.

 

 Szeregiem statystycznym

 nazywamy ciąg 

liczbowy monotoniczny, ograniczony z góry i z dołu 

(tj. taki, którego wyrazy występują tylko w pewnym 

przedziale wartości). Składa się zazwyczaj z dwóch 

kolumn, z których jedna podaje wielkości cechy lub 

czas, druga zaś informuje o liczbie jednostek 

przypadających na dana kategorię przedmiotów lub 

zjawisk lub mówi o ich natężeniu występującym w 

danym czasie. 

background image

 

 

Najczęściej wyróżnia się dwa 

kryteria podziału szeregów:

kryterium formalne - związane z 

budową szeregu, na podstawie 

którego możemy wyodrębnić: 

szeregi 

szczegółowe

szeregi rozdzielcze

 i 

szeregi skumulowane

,  

kryterium merytoryczne - 

wynikające z typu badanej cechy 

zbiorowości, według którego wyróżnia 

się: 

szeregi czasowe

 i 

szeregi 

przestrzenne

background image

 

 

Szeregi statystyczne

 

szczegółowe

 

rozdzielcze z cechą 
mierzalną (

ilościową

)

:

- punktowe (proste, 
skumulowane),
- przedziałowe 
(proste, 
skumulowane),

rozdzielcze z cechą 
niemierzalną 
(jakościową:

- geograficzne
- inne 

czasowe

- momentów
- okresów 

background image

 

 

Szereg szczegółowy 
– uporządkowany ciąg wartości badanej cechy 

statystycznej, stosowany, gdy przedmiotem 
badania jest niewielka liczba jednostek, 

np. 

zmienna 

X 

przyjmuje wartości: 

x

1

, x

2

, ..., x

n

wartości cechy porządkujemy rosnąco:

x

1

  x

2

  ...  x

n

 lub malejąco 

x

1

  x

2

 

 ...  x

n

.

background image

 

 

Przykład:  „Ważniejsze  dane  o  sytuacji  społeczno-

gospodarczej kraju (produkcja wybranych wyrobów)”

background image

 

 

 Szereg rozdzielczy - stanowi zbiorowość 

statystyczną, podzieloną na części (klasy) według 

określonej cechy jakościowej lub ilościowej z 

podaniem liczebności lub częstości każdej z 

wyodrębnionych klas.

 

 Szeregi rozdzielcze mogą dotyczyć zarówno 

cechy jakościowej, jak i ilościowej. Charakteryzują 

one strukturę danej zbiorowości stąd nazywane 

są czasem 

szeregami strukturalnymi

background image

 

 

Przykład:  Szereg  rozdzielczy  oparty  o  cechę  mierzalną  z 

grupowaniem prostym.

background image

 

 

Przykład:  Szereg  rozdzielczy  oparty  o  cechę  mierzalną  z 

grupowaniem złożonym.

background image

 

 

Przykład: Szereg rozdzielczy oparty o cechę niemierzalną z 

grupowaniem prostym.

background image

 

 

Przykład: Szereg rozdzielczy oparty o cechę niemierzalną z 

grupowaniem złożonym

.

background image

 

 

Przykład:  Szereg  rozdzielczy  punktowy:  „Wyniki  uczniów 

klasy III  C uzyskane na trzech kolokwiach w semestrze 
zimowym”.

background image

 

 

Przykład: Szereg rozdzielczy przedziałowy: „Uczniowie w 

szkole według wzrostu” 

background image

 

 

Przykład:  Szereg  geograficzny:  „Nauczyciele  akademiccy 

według wykształcenia pracujący w woj. Łódzkim”

background image

 

 

Szeregi czasowe.

background image

 

 

Przykład: Szereg dynamiczny okresów 

background image

 

 

Przykład: Szereg dynamiczny momentów: „Dane o 

uczniach w latach 1990 – 1995”

 

background image

 

 

Rozkład empiryczny - 

zestawienie 

wyników w postaci szeregu 
rozdzielczego z cechą mierzalną, 
odzwierciedla strukturę badanej 
zbiorowości z punku widzenia 
określonej cechy statystycznej. 

background image

 

 

Stosowanie szeregów 

statystycznych:

 szereg rozdzielczy z przedziałami klasowymi 

- dla cech ciągłych 

 szeregi rozdzielcze bez przedziałów klasowych

 lub 

z przedziałami 

klasowymi

 - dla cech mierzalnych skokowych - zależnie od 

możliwości wartości (wariantów) cech: dla niewielkiej liczby 

wariantów: szereg rozdzielczy punktowy, dla dużej szereg 

rozdzielczy z przedziałami klasowymi. 

 szereg rozdzielczy z cechą niemierzalną

 - szereg geograficzny 

(terytorialny) - przedstawia rozmieszczenie pewnych zjawisk w 

przestrzeni (np. zestawienie liczby gmin w Polsce).

 szereg czasowy

 – (dynamiczny chronologiczny) powstaje w 

wyniku grupowania typologicznego i wariacyjnego, gdy podstawą 

grupowania jest zmiana badanego zjawiska w czasie:

- szereg czasowy okresów - zawiera informację o rozmiarach 

zjawiska w krótszych lub dłuższych okresach.

- szereg czasowy momentów - ujmuje wielkość zjawiska w danym 

momencie, najczęściej na początku lub końcu np. miesiąca. 

background image

 

 

Podstawowe oznaczenia, 

podstawowe wielkości

 

n - liczebność próby (zbiorowości próbnej),
x

i

 - wariant cechy statystycznej (i = 1, 2 , ... , n),

n

i

 - liczba jednostek o i-tym wariancie cechy,

k - liczba klas (wariantów cechy),

przy czym:

   

background image

 

 

Szereg rozdzielczy 

punktowy 

Wskaźnik struktury ω

i

 lub częstość (liczebność 

względna, frakcja, odsetek) - występowania 
danego wariantu cechy nazywa się stosunek liczby 
jednostek o danej wartości cechy do liczebności 
próby.

 

przy czym:

background image

 

 

Szereg rozdzielczy skumulowany 

-

 uzyskuje się poprzez 

przyporządkowanie kolejnym wariantom 
cechy odpowiadających im liczebności 
(częstości) skumulowanych, informuje, 
dla ilu jednostek badanej zbiorowości 
cecha przyjmuje wartości nie większe od 
górnej granicy poszczególnego 
przedziału klasowego. 

background image

 

 

Skumulowany wskaźnik struktury

 

ω

isk

 

(częstość skumulowana)

:

 

gdzie n

isk

 oznacza liczbę jednostek, których cechy 

odpowiadają wartościom nie większym niż x

i

.

background image

 

 

Dystrybuanta empiryczna

  - przyporządkowanie kolejnym 

wartościom cechy statystycznej 
(zmiennej) odpowiadających im 
częstości skumulowanych (względnie 
liczebności skumulowanych). 

background image

 

 

Przykład 1

W wybranej grupie studentów 

przeprowadzono kolokwium z 
matematyki. Studenci otrzymali 
następujące oceny:

 2, 5, 3, 4, 3+, 4, 3, 4+, 3+ , 3+, 5, 

4, 3+, 4+, 3+, 3+, 3, 2, 3, 3+, 3, 
4, 5, 3+, 4, 3+, 4, 3, 4+, 4+, 3+.

background image

 

 

Przykład 1 cd

Opracowanie materiału statystycznego
Zbiorowość (populacja) generalna: studenci
Zbiorowość próbna (próba): wybrana grupa 

studentów

Cecha statystyczna: ocena z kolokwium z 

matematyki

Studenci badani są pod względem ocen 

otrzymanych z kolokwium z matematyki, 

"ocena z matematyki" jest cechą mierzalną 

skokową.

Liczebność próby n: 30
Liczba wariantów cechy k: 6
Warianty cechy x

i

: 2, 3, 3,5, 4, 4,5, 5

background image

 

 

Przykład 1 cd

Szereg szczegółowy:
    2; 2; 3; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 

3,5;3,5; 3,5; 3,5; 4; 4; 4; 4; 4; 4; 4,5; 4,5; 4,5; 4,5; 
5; 5;

background image

 

 

Przykład 1 cd

background image

 

 

Szereg rozdzielczy z przedziałami 

klasowymi

background image

 

 

wzory:

Ustalanie liczby klas

background image

 

 

 ustalenie rozpiętości przedziałów 

klasowych

Rozpiętość (szerokość) przedziału klasowego h

i

 

- różnica pomiędzy górną x

1i

 i dolną x

0i

 granicą i-tego 

przedziału klasowego. 

Z reguły ustala się jednakowe rozpiętości przedziałów 

klasowych. Przy równej rozpiętości przedziałów 
klasowych liczebności (częstości) występujące w 
poszczególnych klasach są porównywalne.

Przy różnych rozpiętościach (dla populacji niejednorodnej z 

dużą koncentracją wartości w jednej grupie) zamiast 

liczebności

 (

częstości

) stosuje się wskaźnik: 

gęstość 

liczebności

 (

gęstość częstości

). 

background image

 

 

Gęstość liczebności (gęstość częstości) 

-jest to stosunek liczebności (częstości) danej 

klasy do rozpiętości przedziału klasowego: 

background image

 

 

Dla szeregu rozdzielczego o jednakowych 

rozpiętościach przedziałów klasowych h

i

 = h:

gdzie: 

         nazywa się 

rozstępem

k oznacza liczbę klas.

Uwaga: Jeżeli wybieramy przybliżoną wartość h, to 
powinno to być zawsze przybliżenie z nadmiarem, 
tzn.  hk   R.

background image

 

 

 Ustalanie granic poszczególnych klas.
 
Jako dolną granicę najczęściej przyjmuje się najmniejszą 

wartość cechy lub bliskiej tej wartości, czyli X

01

=X 

min

Przy cechach ciągłych górne granice klas poprzednich 
powinny być dolnymi granicami klas następnych, aby 
nie było pomiędzy przedziałami luk Ponadto trzeba 
ustalić, do które klasy zaliczyć wartości graniczne.

W szeregach o otwartych przedziałach klasowych, 

konieczne jest czasami domknięcie tych przedziałów. 
Stosuje się tutaj zasadę, że jeżeli liczebność w tych 
przedziałach jest niewielka (nie większa niż 5% badanej 
zbiorowości, można te przedziały domknąć taką 
szerokością, jaka jest w sąsiednich przedziałach 
klasowych.

background image

 

 

Przykład 2:

 

Województwa Polski w układzie przestrzennym 

sprzed 1999 r. charakteryzują dwie cechy: 

- liczba gmin znajdująca się na terenie 

województwa

 (cecha skokowa X)

- powierzchnia ogólna w km

2

 (cecha ciągła Y)

 

źródło: Roczniki statystyczny 1999,
           tab. IV, s. XCV

background image

 

 

Przykład 2a: 

struktura województw wg liczby gmin – dla cechy 

skokowej

 
Szereg szczegółowy: 
17, 30, 32, 37, 37, 39, 40, 40, 40, 40, 41, 41, 42, 42, 43, 43, 43, 44, 45, 

46, 46, 47, 47, 47, 48, 48, 49, 51, 54, 54, 55, 55, 55, 56, 57, 57, 58, 

58, 58, 59, 59, 62, 63, 63, 65, 69, 74, 78, 91.

W przykładzie: 
R = 91 – 17 = 74, 
h = 74/7 » 10,57 » 11 
początek pierwszego przedziału klasowego 
x

01

 = x

min

 = 17

(przyjmujemy, że rozpiętość przedziałów klasowych jest taka sama dla 

wszystkich klas)

background image

 

 

Przykład 2a cd:

Rozkład empiryczny i dystrybuanta empiryczna – Struktura 

województw wg liczby gmin

 

background image

 

 

Przykład 2a cd:

background image

 

 

Przykład 2b: struktura województw wg 

powierzchni – dla cechy ciągłej

liczba klas: k = 7,
rozstęp:
 R = x

max

 – x

min

 = 12327 – 1523 = 10804 km

2

 

 

background image

 

 

pierwszy wariant grupowania
h przyjmujemy z nadmiarem, tzn. 

początek pierwszego przedziału klasowego

 x

01

 = 1,5 tys. km

2

Przykład 2b cd:

background image

 

 

Przykład 2b cd:

drugi wariant grupowania
h bez nadmiaru np. h » 1500 km

2

 

background image

 

 

Przykład 2b cd:

Porównanie rozkładów empirycznych dla wariantów: 

pierwszego i drugiego. 

background image

 

 

Przykład 2b cd:

trzeci wariant grupowania

 

background image

 

 

Przykład 2b cd:

background image

 

 

Przykład 3

:

Województwa Polski według liczby gmin i 

powierzchni 

Każda liczba w wewnętrznej części tabeli określa częstotliwość 
występowania dwóch cech.

 

background image

 

 

Wskaźnik podobieństwa struktury w

- służy do porównywania struktur 
analizowanych zbiorowości. 

przy czym:  

(im wartość bliższa jedności, tym struktury 
zbiorowości są bardziej podobne).

background image

 

 

Wskaźniki natężenia 
  

- są to wielkości stosunkowe, 

wyrażające kształtowanie się 
wielkości jednego zjawiska na tle 
innego, logicznie z nim 
związanego. 

background image

 

 

Przykładowe współczynniki natężenia:

 stopa bezrobocia

 - stosunek liczby bezrobotnych do liczby 

ludności czynnej zawodowo, 

 gęstość zaludnienia

 - liczba ludności przypadająca na 1 km

2

 

powierzchni, 

 wskaźnik umieralności

 - liczba zmarłych do średniej liczby 

ludności,  

 wskaźnik rozwoju gospodarczego

 - produkt krajowy brutto 

(netto) do liczby ludności kraju, 

 wskaźnik wydajności pracy

 - wielkość produkcji do czasu 

pracy, 

 wskaźnik spożycia i usług

 - wielkość spożycia i usług do liczby 

ludności, 

 wskaźnik rentowności 

- zysk do wielkości sprzedaży, 

 wskaźnik efektywności

 - zysk do zaangażowanego kapitału, 

 wskaźnik produktywności

 - sprzedaż do do zaangażowanego 

kapitału. 

background image

 

 

Sposoby prezentacji danych

 

background image

 

 

Tablice statystyczne 

- są 

wykorzystywane do prezentacji danych 

statystycznych według określonego 
kryterium.

 

Podział tablic statystycznych:

 proste 

- charakteryzują strukturę lub dynamikę 

jednej zbiorowości pod względem jednej cechy 

(ilościowej lub jakościowej), 

 złożone

 - opisują badaną zbiorowość według 

kilku cech lub kilka zbiorowości według jednej 

cechy (szczególna rola 

tablic dwudzielnych

 - 

korelacyjnych

). 

background image

 

 

Wykres 

- jest graficzną formą rejestracji danych oraz 

narzędziem prezentacji i analizy uogólnionych informacji 

statystycznych.

 

Najczęściej stosowane typy wykresów:

 histogramy (wykresy słupkowe)

 - zbór przylegających 

prostokątów, których podstawy, równe rozpiętości 

przedziałów klasowych - znajdują się na osi odciętych, a 

wysokości są liczebnościami (częstościami) przedziałów, w 

przypadku nierównych szerokości przedziałów - gęstościami 

liczebności (częstości). 

 diagramy, wykresy liniowe (wielobok liczebności)

 - jest 

łamaną, powstałą przez połączenie punków, których 

współrzędnymi są środki przedziałów klasowych i 

odpowiadające im liczebności (częstości lub gęstości).

 krzywe liczebności (częstości) dla cechy ciągłej

 - gęsta siatka 

punktów wyznaczająca wielobok liczebności, w konsekwencji 

wygładzona krzywa otrzymana przy zmniejszaniu rozpiętości 

przedziałów klasowych. 

background image

 

 

W podobny sposób przedstawia się szeregi 

kumulacyjne:

 histogramy liczebności (częstości) 

skumulowanej

,

 diagramy liczebności (częstości) skumulowanej

 

- linia łącząca punkty, których współrzędne to: 
górne granice przedziałów klasowych i 
odpowiadające im liczebności (częstości) 
skumulowane. 

background image

 

 

Graficzna prezentacja danych

 

background image

 

 

Metoda liniowa

background image

 

 

Metoda powierzchniowa 

background image

 

 

Metoda obrazkowa (symbolowa) 

- w której dane zjawisko przedstawiane 

jest za pomocą odpowiedniej wielkości 
obrazka. Metoda ta jest jednak mało 
dokładna. 

background image

 

 

Metoda ilościowo-symbolowa 

–  to  przedstawienie  wielkości  zjawiska  za 

pomocą 

wielokrotności 

dowolnego 

znaku 

graficznego. 

Pojedynczy 

oznaczoną  tym  znakiem  wyraża  się 
odpowiednią 

ilością 

dodatkowo 

dorysowanych tych samych znaków i ich 
części.  Obok  obrazka  bądź  wszystkich 
obrazków 

dodatkowo 

podaje 

się 

wielkość liczbową.

background image

 

 

Kartogram

Liczba 

województw

Stopa 

bezrobocia 

%

31,5

25,5

22,5

19,5

16,5

13,5

10,5

7,5

6

5

7

10

14

3

4

background image

 

 

Wykresy w układzie 
współrzędnych

Histogram

Diagram

background image

 

 

Histogram

0

1

2

3

2

3

4

5

6

9

10

11

12

14

16

18

20

23

Wartość  cechy  Xi

Li

cz

eb

no

ść

  c

ec

hy

  n

i

background image

 

 

Histogram

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

2

3

4

5

6

9

10

11

12

14

16

18

20

23

Wartość  cechy  Xi

Li

cz

e

b

no

ść

  

sk

um

ul

o

w

an

 n

i

 

background image

 

 

Diagram

0

5

10

15

20

25

1970

1975

1980

1985

1980

1992

Lata

P

ro

d

u

kc

ja

 w

 m

ln

 t

background image

 

 

Krzywa liczebności

background image

 

 

0,00

2,00

4,00

6,00

8,00

10,00

12,00

14,00

16,00

18,00

do 1,4  1,4-1,8 1,8-2,2 2,2-2,6 2,6-3,0 3,0-3,4 3,4-3,8 3,8-4,2 4,2-4,6 4,6-50 5,0-5,4 5,4-5,8 5,8-6,2 6,2-6,6 6,6-7,0 ponad

7,0

Wynagrodzenie w mln zł

Za

tr

u

d

n

ie

n

w

 %

background image

 

 

Typy rozkładów empirycznych

background image

 

 

background image

 

 

background image

 

 

background image

 

 


Document Outline