Tabelaryczna prezentacja struktury zbiorowości

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Tabelaryczna i graficzna prezentacja struktury zbiorowości

Wstępna analiza statystyczna obejmuje szereg czynności związanych z porządkowaniem, prezentacją i

opisową charakterystyką zbioru danych. Polega ona, najogólniej mówiąc, na przekształceniu szczegółowych
danych dotyczących poszczególnych osób (rzeczy, zjawisk, procesów) na syntetyczną informację o całej badanej
zbiorowości, czyli na przedstawieniu i opisie struktury tej zbiorowości.

Tabela wyników surowych – arkusz danych

Dane zebrane wpisz w arkusz danych,
aby porządek był zachowany

Zgromadzony w trakcie badań materiał – wypełnione ankiety, rozwiązane testy, dane z przeprowadzonych

wywiadów, itp. musi zostać uporządkowany w tabeli wyników surowych.

Tabela wyników surowych to zapisane - w uporządkowaniu wyznaczonym schematem tabeli - dane z badań.

A więc, na przykład, dane dotyczące płci, wykształcenia, odpowiedzi poszczególnych osób na pytania ankiety,
kwestionariusza, wyniki wykonywanych lub rozwiązywanych przez nich testów, jak też inne wyznaczone celem
badań pomiary.

Identy-
fikator

ZMIENNE

Cechy fizyczne

Środowisko rodzinne

Sprawność

PŁEĆ

WZROST ......

....

Liczba
RODZ.

......

........

TEST1

TEST2

.......

1
2
3
...

Rys.1. Schemat tabeli wyników surowych – przykład

Pierwsza kolumna tabeli wyników surowych – boczek tabeli – zawiera identyfikatory jednostek badania.

Identyfikatorem mogą być dowolne nazwy lub symbole pozwalające rozróżnić poszczególne jednostki. Mogą to
być, na przykład, po prostu liczby porządkowe.

W główce tabeli wyników surowych zapisujemy w hierarchicznym uporządkowaniu właściwości

wyznaczone przedmiotem badań (zmienne badane). Zmiennymi są na przykład takie właściwości osób jak: płeć,
wzrost, liczba rodzeństwa, poziom wykształcenia, preferowany rodzaj wypoczynku, poziom inteligencji.

W komórki tabeli wyników surowych wpisujemy zaobserwowane wartości wyróżnionych zmiennych. I tak

wartości zmiennej płeć, to: płeć męska (mężczyzna), płeć żeńska (kobieta); wartości zmiennej preferowany
rodzaj wypoczynku, to na przykład: wypoczynek bierny, wypoczynek czynny; wartości zmiennej liczba
rodzeństwa, to liczby: 0 rodzeństwa, 1 rodzeństwo, 2 rodzeństwa, ......

Każdy wiersz tabeli zawiera te wartości wyróżnionych zmiennych, które charakteryzują osobę (jednostkę)

oznaczoną identyfikatorem w tym wierszu umieszczonym. Jeżeli, na przykład, identyfikator 1 został
przyporządkowany Annie Abackiej, to w wierszu o numerze 1 wpiszemy wszystkie zebrane dane dotyczące
Anny Abackiej. W kolumnie natomiast umieszczamy dane zebrane od wszystkich osób, ale dotyczące tylko
jednej z badanych właściwości, np. liczby rodzeństwa.

Tabela rozkładu jednej zmiennej

Zgromadzenie i uporządkowanie w tabeli wyników surowych materiału z badań to, można powiedzieć,

wstępny etap wstępnej analizy statystycznej. Kolejnym etapem jest rozpoznanie struktury danych, a tym samym
struktury badanej zbiorowości ze względu na różne, interesujące nas zmienne. Szukamy na przykład odpowiedzi
na pytania: Ile w badanej zbiorowości uczniów jest dziewcząt, a ilu chłopców?; Jaki procent badanej
zbiorowości stanowią dziewczęta, a jaki chłopcy? (jest to pytanie o wskaźniki struktury); Jak licznie
reprezentowane są poszczególne postawy dzieci względem rodziców?; Która z tych postaw jest reprezentowana
najczęściej? (jest to pytanie o wartość modalną, dominantę); Jaki jest rozkład wyników testu sprawności w
badanej grupie młodzieży?

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Odpowiedzi na te i podobne pytania można uzyskać poddając zgromadzone dane odpowiedniemu

grupowaniu. Czynność ta prowadzi do wyodrębnienia w badanej zbiorowości względnie jednorodnych grup, tzn.
takich, że osoby (jednostki) zaliczone do jednej grupy mają co najmniej jedną własność wspólną, bądź różnią się
ze względu na tę własność nieznacznie. Tak więc wyróżnimy, na przykład, grupę chłopców i grupę dziewcząt,
jeżeli za podstawę wyodrębnienia grup przyjmiemy zmienną „płeć”; albo grupy młodzieży, które uzyskały w
teście sprawności wyniki 0p-5p, 6p-10p, itd.; albo grupy chłopców o wynikach odpowiednio 0p-5p, 6p-10p, itd.
i grupy dziewcząt o takichże wynikach. Ogólnie, jakie to mają być grupy wynika przede wszystkim z celów
badań. Natomiast samo grupowanie musi spełniać określone warunki formalne. Po pierwsze, otrzymane grupy
muszą być rozłączne, czyli nie mogą mieć elementów wspólnych. Po drugie, wszystkie podlegające grupowaniu
elementy muszą zostać przyporządkowane do tworzonych grup.

STRUKTURĘ danych
przedstawisz najlepiej
w tabeli lub na wykresie.

Taka struktura, ROZKŁADEM ZMIENNEJ zwana,
prezentuje zbiorowość
pod względem cechy wybranej do badania.

Po utworzeniu grup określamy liczebność każdej grupy, tzn. zliczamy ile jednostek do każdej z grup należy.

Ustalamy tym samym następujące przyporządkowanie:

wartość zmiennej x

→ liczba n

danych równych wartości x

wartość zmiennej x

→ liczba n

danych równych wartości x

3........

Takie przyporządkowanie nazywamy rozkładem liczebności badanej zbiorowości według wartości

zmiennej, krótko: rozkładem empirycznym zmiennej

. Rozkład zmiennej obrazuje strukturę badanej

zbiorowości pod względem badanej zmiennej (cechy) i może być przedstawiony w tabeli liczebności lub na
wykresie.

Wartość

zmiennej

Liczebność

względna

....

.....

100

Rys. 2. Schemat tabeli przedstawiającej rozkład zmiennej

Symbol N oznacza tu liczebność badanej zbiorowości, zaś n

liczebności wyodrębnionych grup. Suma

liczebności wyodrębnionych grup równa jest liczebności badanej zbiorowości:

+ n

+ .... + n

= N, gdzie k oznacza tu liczbę wartości zmiennej.

Liczebności względne

, to wskaźniki struktury. Wskaźnik struktury informuje o tym, jaka część

zbiorowości charakteryzuje się własnością (wartością zmiennej), dla której wskaźnik struktury został obliczony.
Dla wskaźników struktury spełniona jest równość:

+ p

+ .... + p

= 1

Wskaźniki struktury można też podawać w procentach. Wówczas mamy równość:

+ p

+ .... + p

= 100%

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Przykład 1: W ramach prac związanych z przygotowaniem projektu przeciwdziałania bezrobociu w pewnym

regionie, należało poznać strukturę wykształcenia osób bezrobotnych. Pobrano 500-osobową próbę osób
zarejestrowanych w urzędach pracy tego regionu i sprawdzono, jaki poziom wykształcenia ma każda z nich.

Tabela 1. przedstawia otrzymany szereg rozdzielczy (rozkład zmiennej: poziom wykształcenia w badanej

grupie osób).

Tabela 1. Wykształcenie osób bezrobotnych zarejestrowanych w ......

Poziom
wykształcenia

Liczebność

względna p

Zawodowe

335

0,670

Średnie

121

0,242

Wyższe

0,088

500

1,000

Źródło: Dane umowne

Dla wartości „wykształcenie średnie” wskaźnik struktury wynosi 0,242 co oznacza, że 24,2% badanej

zbiorowości stanowią osoby z wykształceniem średnim.

Przykład 2: W celu ustalenia norm empirycznych testu ortograficznego dla uczniów kończących klasę III

szkoły podstawowej przeprowadzono badania. Losowo wybrani na początku czerwca z populacji
trzecioklasistów uczniowie wypełniali test. Rozkład liczby popełnionych błędów przedstawiony jest w tabeli 2.

Tabela2. Liczba błędów w teście ortograficznym

Liczba błędów

ponad 6

Razem

Częstość

330

Częstość
względna %

100

W badanej grupie 330 uczniów bezbłędnie test ortograficzny napisało 12 dzieci, tj. 7% wszystkich uczniów
piszących test. Najczęściej uczniowie popełniali 3 błędy – 93 uczniów na 330, co stanowi 28 % wszystkich
biorących udział w badaniu.

Jeżeli grupowaniu podlegają zmienne o wartościach liczbowych strukturę badanej zbiorowości można

przedstawić również w postaci rozkładu kumulowanego

W rozkładzie kumulowanym wartościom zmiennej przyporządkowane są liczebności kumulowane. Przez

liczebność kumulowaną rozumiemy liczbę jednostek l

, dla których wartość zmiennej nie przekracza danej

wartości x

∑

Gdy wartościom zmiennej przyporządkowane zostają liczebności kumulowane względne otrzymany szereg

przedstawia dystrybuantę empiryczną. Liczebność kumulowana względna określa, jaką część badanej
zbiorowości stanowią te jednostki, dla których wartość zmiennej nie przekracza danej wartości x

∑

Gdy analizowana zmienna jest zmienną o wartościach liczbowych, jak na przykład liczba rodzeństwa,

liczba popełnionych błędów, itp. lub na przykład wiek, wzrost, czas wykonania zadania i mamy dużo danych,
należy ustalić najpierw pewne przedziały wartości zmiennej a następnie zliczyć ile danych w tych przedziałach
się „mieści”.

Liczbę przedziałów, ich szerokość oraz granice ustalamy tak, aby otrzymany rozkład czytelnie przedstawiał

strukturę badanej zbiorowości. Odpowiedź na pytanie ile przedziałów  ma być w konkretnym przypadku, zależy
głównie   od   tego,   jak   liczna   jest   badana   zbiorowość.   Nie   ma   jednak   algorytmu,   którego   zastosowanie
zapewniałoby   otrzymanie   optymalnego,   z   punktu   widzenia   celu   badań,   obrazu   struktury   zbiorowości.   W

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

literaturze można znaleźć różne propozycje ustalania liczby przedziałów klasowych, z których jedna
przedstawiona jest na rys. 4.

Liczebność zbiorowości

40 - 60

60 – 100

100 – 200

200 – 500

Liczba klas

6 -8

7 – 10

9 – 12

12 – 17

Źródło: Z.Zając, Zarys metod statystycznych, PWE, 1988
Rys.4. Proponowana liczba przedziałów klasowych w zależności od liczby danych

Szerokości przedziałów ustalamy tak, aby wyodrębnione w ten sposób grupy były w miarę jednorodne. Z

pewnych względów najlepiej jest gdy szerokości przedziałów są równe, ale nie jest to wymóg konieczny.
Czasem zasadnym jest ustalenie przedziałów o różnej szerokości.

Rozkład zmiennej według przedziałów wartości zmiennej przedstawiamy w tabeli o następującym

schemacie.

Przedziały
klasowe
wartości
zmiennej X

Liczebność

względna

Liczebność

kumulowana

Liczebność

kumulowana

względna
%

; x

]

; x

]

; x

]

.....

100

suma

100

Rys. 3. Schemat tabeli przedstawiającej rozkład zmiennej według przedziałów wartości zmiennej

Rozkład kumulowany zawiera inną informację o badanej zbiorowości niż szereg rozdzielczy prosty.

Liczebność kumulowana informuje nas o tym, u ilu osób badanej zbiorowości zaobserwowano wartości
zmiennej nie wyższe niż ta, dla której tę liczebność obliczyliśmy. Liczebność względna kumulowana wskazuje,
jaka część badanej zbiorowości charakteryzuje się wartościami zmiennej nie wyższymi od tej, dla której tę
liczebność ustaliliśmy.
Rozkładu kumulowanego można nie uwzględniać jeżeli tego nie potrzebujemy. Pomijamy wówczas w tabeli
kolumny „liczebność kumulowana” oraz „liczebność kumulowana względna”.

Tabela 3.

Wzrost uczniów Szkoły Podstawowej nr 55 w Zabeziu w roku szkolnym 1999/2000

Wzrost

(cm)

Liczebność

względna

Liczebność

kumulowana

Liczebność

kumulowana

względna

(136 – 140]

(140 – 145]

(145 – 150]

100

140

(150 – 155]

200

340

(155 – 160]

120

460

(160 – 165]

490

(165 – 170]

500

100

∑

500

100

Źródło: Dane umowne

W powyższym przykładzie liczba uczniów, których wzrost nie przekracza 145 cm równa jest 40 (liczebność

kumulowana równa 40), co stanowi 8% badanej zbiorowości. Uczniów o wzroście nie większym niż 160 cm jest
460, czyli 92% zbiorowości.

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Tabele rozkładu jednej zmiennej w wyodrębnionych grupach

W jednej tabeli można również przedstawić dwa rozkłady tej samej zmiennej w wyodrębnionych grupach.

Taka prezentacja ułatwia porównawcze omówienie struktury badanej zbiorowości, uwypuklenie podobieństw i
różnic w strukturze grup ze względu na badaną właściwość.

Przykład: Jeżeli chcemy porównać rozkład wykształcenia w grupach według miejsca zamieszkania, to tabela
może mieć taką np. formę.

Tabela 4.

Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według miejsca

zamieszkania (w procentach)

Miejsce

zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

100

miasto

100

W grupie osób bezrobotnych mieszkających na wsi przeważają osoby o wykształceniu niższym niż średnie
(57%). Odwrotnie jest w grupie osób bezrobotnych mieszkających w mieście, tu przeważają bezrobotni o
wykształceniu średnim lub wyższym (74%).

Jeżeli natomiast chcemy porównać rozkład miejsca zamieszkania w grupach według wykształcenia, to tabela
może przybrać taką formę.

Tabela 5 .

Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według

wykształcenia (w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

wieś

miasto

razem

100

W grupie osób bezrobotnych mających wykształcenie niższe niż średnie więcej osób mieszka na wsi (70%) niż
w mieście (30%). Inaczej jest w grupie bezrobotnych posiadających wykształcenie średnie lub wyższe – więcej
osób z tej grupy mieszka w mieście (61%) niż na wsi (39%).

Tabele rozkładu wielozmiennej

Wyniki grupowania, które przebiegało w ten sposób, że każda jednostka badania została zaliczona do grupy

ze   względu   na   to,   jaką   wartość   przyjmuje   ze   względu   na   więcej   niż   jedną   zmienną,   tworzą   rozkład
wielozmiennej. Jeżeli, na przykład, interesować nas będzie struktura bezrobotnych ze względu na wykształcenie
(zmienna  X)  i  miejsce zamieszkania  (zmienna  Y)  jednocześnie,  tworzymy grupy w ten sposób:  określamy
wykształcenie i miejsce zamieszkania każdej osoby i zliczamy ile jest osób o wykształceniu niższym niż średnie
i mieszkających na wsi, ile jest osób o wykształceniu średnim lub wyższym i mieszkających na wsi, ile jest osób
o   wykształceniu   niższym   niż   średnie   i   mieszkających   w   mieście,   itd.   Otrzymamy   w   ten   sposób   rozkład
dwuzmiennej (wykształcenie X, miejsce zamieszkania Y), czyli rozkład dwuzmiennej (X,Y).
  Rozkład  dwuzmiennej  przedstawiamy w  tabelach dwudzielczych, zwanych  też tabelami  korelacyjnymi  lub
krzyżowymi.

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Zmienna Y

Zmienna X

Sumy
brzegowe

.........

(zmienna Y)

y1
y2

......

Sumy brzegowe
(zmienna X)

Liczebność
zbiorowości

Rys.6. Schemat tabeli dwudzielczej

W główce tabeli umieszczamy nazwę jednej zmiennej (X) oraz wartości tej zmiennej lub przedziały

wartości zmiennej (x1, x2, x3, x4), w boczku tabeli nazwę drugiej zmiennej oraz jej wartości lub przedziały
wartości. W komórki tabeli wpisujemy liczebności wyodrębnionych grup, tzn. liczebności grup, dla których
zmienna X przyjmuje wartość x1 a zmienna Y wartość y1, dalej – zmienna X przyjmuje wartość x2 a zmienna Y
wartość y1, itd. Ostatnia kolumna, w której umieszczone są sumy liczebności kolejnych wierszy i ostatni wiersz,
w którym mamy sumy liczebności kolejnych kolumn przedstawiają rozkłady brzegowe. Ostatnia kolumna (wraz
z pierwszą, gdzie są wyszczególnione wartości zmiennej Y) - rozkład zmiennej Y, ostatni wiersz (wraz z
pierwszym, gdzie są wyszczególnione wartości zmiennej X) - rozkład zmiennej X.

W tabeli wielodzielczej możemy umieszczać dodatkowo lub zamiast liczebności bezwzględnych,

liczebności względne.

Poniżej (tabela ) pokazany jest przykład tabeli dwudzielczej przedstawiającej rozkład dwuzmiennej

(wykształcenie, miejsce zamieszkania) w populacji osób bezrobotnych zarejestrowanych w Urzędzie Pracy w
Paradyżu w roku 2005.

Tabela 6.

Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w

roku 2005.

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś
miasto

56
24

43
67

99
91

razem

110

190

Spośród 190 przebadanych osób 56 ma wykształcenie niższe niż średnie i mieszka na wsi a 67 ma wykształcenie
średnie lub wyższe i mieszka w mieście. Jak widać bezrobotni o wykształceniu średnim lub wyższym
przeważają w mieście.

W tabeli możemy również podać wartości procentowe.

Tabela 7.

Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w

roku 2005 (w procentach).

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś
miasto

29
13

23
35

52
48

razem

100

Spośród przebadanych osób 29% stanowią bezrobotni, którzy mają wykształcenie niższe niż średnie i mieszkają
na wsi a 35% bezrobotni, którzy mają wykształcenie średnie lub wyższe i mieszkają w mieście. Jak widać
bezrobotni o wykształceniu średnim lub wyższym przeważają w mieście.

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Czasem zachodzi potrzeba przedstawienia struktury badanej zbiorowości z uwzględnieniem więcej niż dwu
zmiennych. Rozkład trójzmiennej przedstawiamy w tabeli o następującym schemacie:

Zmienna Y

Zmienna Z

Zmienna X

.......

Sumy brzegowe
(zmn Y)

z1
z2

........

.....
.....

Sumy
brzegowe
(Zmn X)

Liczebność

zbiorowości

Rys.7. Schemat tabeli trójdzielnej

Prezentację struktury badanej grupy bezrobotnych z uwzględnieniem oprócz miejsca zamieszkania oraz
wykształcenia również płci przedstawia tabela poniżej.

Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie,

miejsce zamieszkania i płeć (w procentach)

Miejsce

zamieszkania

Płeć

Wykształcenie

niższe niż średnie

średnie lub wyższe

∑

płeć

∑

miejsce

wieś

kobieta

mężczyzna

miasto

kobieta

mężczyzna

∑

wykształcenie

100

Proponuję, aby interpretacji powyższej tabeli czytelnik dokonał samodzielnie.
Interpretacja!!!!! Jako zadanie na koniec rozdziału

Tytułowanie tabel i wykresów

Badania empiryczne statystyczne mogą być badaniami populacji ograniczonej lub nieograniczonej. Jeżeli
badaniu podlega populacja ograniczona, to badanie może być wyczerpujące – gdy badaniu został poddany każdy
element populacji lub częściowe – gdy badaniu zostały poddane tylko elementy próbki populacji. Tytuł tabeli lub
wykresu przedstawiającej rozkład analizowanej przez badacza zmiennej powinien być tak sformułowany, aby
wynikało z niego, jakie to było badanie. I tak, gdy przeprowadzono:

1. Badania całościowe populacji ograniczonej - tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

co?

nazwę populacji i

kto

jej przestrzenne

gdzie

i czasowe ograniczenie

kiedy?

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Przykład:

Tabela 1.

Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu

w roku 2005.

Wykształcenie

Liczebność

niższe niż średnie

średnie lub wyższe

110

suma

190

2. Badania częściowe populacji ograniczonej - tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

nazwę

populacji i

jej przestrzenne
i czasowe ograniczenie

oraz informację, że badania nie są całościowe

Przykład:
Tabela 2. Wykształcenie badanej grupy osób bezrobotnych zarejestrowanych w Urzędzie Pracy w

Paradyżu w roku 2005.
lub

Tabela 2. Wykształcenie bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005

(próba 30 osób).

W pierwszym z powyższych przykładów na to, że badania są częściowe wskazuje zwrot „badanej grupy osób”, w
drugim informacja podana w nawiasie.

3. Badania populacji nieograniczonej – tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

nazwę

populacji, którą reprezentuje badana próbka
Przykład:
Tabela 1. Rozkład wieku uczniów w grupie eksperymentalnej

Jeżeli w jednej tabeli przedstawiamy dwa rozkłady jednej zmiennej w wyodrębnionych grupach, to tytuł tabeli
zawiera informację taką jak w przypadku, gdy prezentowany jest rozkład jednej zmiennej (czyli uwzględniająca
rodzaj badania) wraz z dodatkiem „według...”

Przykład:

Tabela 3. Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku

2005 według wykształcenia(w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

wieś

miasto

razem

100

Przykład:

Tabela 4. Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005

według miejsca zamieszkania(w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

100

miasto

100

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Jeżeli w tabeli przedstawiamy rozkład dwuzmiennej, w tytule tabeli podajemy nazwę tej dwuzmiennej w formie
„nazwa cechy 1 a nazwa cechy 2” oraz informację pozwalającą określić typ badania.
Przykład:
Tabela 5. Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w

Paradyżu w roku 2005.

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

miasto

razem

110

190

Wykresy statystyczne

Strukturę badanej zbiorowości można przedstawić graficznie na wykresach statystycznych. Poprawnie i

czytelnie sporządzone wykresy pozwalają na szybką orientację w strukturze danych, obrazowo ujmują różnice
między rozkładami zmiennej w różnych zbiorowościach, co ułatwia dalszą tych różnic analizę statystyczną.
Umożliwiają wstępne rozpoznanie zgodności otrzymanego rozkładu empirycznego z rozkładem teoretycznym,
itd. O wartości wykresu decyduje wybór odpowiedniego do charakteru danych typu wykresu, jak również
właściwy dobór i opis skali oraz właściwa legenda. Przesądzają one często w ogóle o wykresu czytelności.

W literaturze spotykamy wiele rozróżnień typów wykresów statystycznych a odpowiadające rozróżnionym

typom nazwy nie są spójnie stosowane przez różnych autorów. Podobnie rzecz się ma w przypadku
komputerowych programów umożliwiających sporządzanie wykresów statystycznych. W tym skrypcie
ograniczymy się do podania bardzo ogólnych wskazówek dotyczących doboru typu wykresu, w zależności od
rodzaju właściwości (zmiennej), której rozkład ma być przedstawiony graficznie.

Rozróżnimy dwa podstawowe typy wykresów przydatnych do obrazowania rozkładu zmiennej w

zbiorowości:
1.Wykresy, w których wykorzystuje się metodę podziału powierzchni wybranej figury zamkniętej (np. koła,
prostokąta) na części w proporcjach odpowiadających proporcjom podziału badanej zbiorowości na grupy;

Wykresy, w których wykorzystuje się układ odniesienia (np. układ współrzędnych kartezjańskich); w tym

przypadku informację o rozkładzie zmiennej w zbiorowości odczytuje się z odpowiednio oznaczonych i
wyskalowanych osi układu odniesienia.
Pośrednim typem są wykresy, w których wykorzystuje się jedną oś odniesienia.

Wykresy pierwszego typu stosujemy przede wszystkim do prezentacji rozkładu zmiennej nominalnej, bo

tylko taki w tym przypadku jest odpowiedni, choć można je również wykorzystać do prezentacji rozkładu
dowolnej zmiennej. Wykresy drugiego typu stosujemy wyłącznie do prezentacji rozkładu zmiennych
mierzonych na skalach z jednostką miary.

Wykres kołowy i kolumnowy

Przykładem wykresu typu I jest wykres kołowy. Koło – reprezentujące całą zbiorowość - dzielimy tak, aby

poszczególne wycinki koła były proporcjonalne do liczebności rozróżnionych grup.

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Zadania i ćwiczenia
1. Zapisz następujące liczby w postaci procentów:

0,2 = 20%
0,02 = 2%
0,30 =
0,24 =
0,05 =
0,004 =
0,256 =
1,00 =
1,25 =

2. Wyniki :egzaminu z matematyki w grupie studentów przedstawiają się następująco:

ndst, dst, dst, db, ndst, bdb, bdb, db, db, dst, dst, dst, db, bd, bd, ndst, dst, dst, dst, db, dst, db, bdb, dst, db, bdb,
bdb, dst, db, db, db, dst, dst, bdb, db, db, dst, dst, bdb, db, db, dst, bdb, dst, dst, db, db, db, dst, bdb, dst, db, db

Ile było ocen” ndst”, ile „dst”, ile „db”, ile „bdb”? Utwórz odpowiednią tabelę liczebności przedstawiającą
rozkład ocen w grupie studentów.
Ilu studentów zdawało egzamin?
Oblicz wskaźniki struktury otrzymanego rozkładu dla każdej oceny.

3. Na podstawie tabeli 8 odpowiedz na następujące pytania:

Ile procent bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu mieszka na wsi?
Ile procent bezrobotnych ma wykształcenie niższe niż średnie?
Ile, w procentach, jest kobiet wśród badanych?
Ile, w procentach, jest mężczyzn o wykształceniu średnim lub wyższym?
Jaki procent badanych bezrobotnych

Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie,

miejsce zamieszkania i płeć (w procentach)

Miejsce

zamieszkania

Płeć

Wykształcenie

niższe niż średnie

średnie lub wyższe

∑

płeć

∑

miejsce

wieś

kobieta

mężczyzna

miasto

kobieta

mężczyzna

∑

wykształcenie

100

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

4. Przeprowadź statystyczną analizę danych zawartych w poniższej tabeli według podanych poleceń:

Identyfikator

Wynik testu

(„odporność” na

stres)

Ocena z

egzaminu

Płeć

A.Z.

A.C.

B.D.

dst

B.S.

bdb

C.R.

dst

C.G.

T.U.

dst

D.T.

F.O.

bdb

H.I.

dst

N.O.

dst

M.E.

bdb

L.D.

bdb

S.W.

dst

S.B.

dst

G.G.

K.L.

K.I.

R.A.

bdb

G.I.

dst

J.F.

bdb

L.W.

T.A.

bdb

W.A.

dst

C.M.

dst

M.C.

B.O.

D.R.

dst

W.P.

dst

Przedstaw tabelarycznie i graficznie rozkład zmiennej płeć oraz rozkład zmiennej ocena z egzaminu.
Pamiętaj o tytułach tabel i wykresów oraz o zamieszczeniu legendy. W tabeli umieść również liczebności
względne (w procentach).

Przedstaw w tabeli dwudzielczej strukturę grupy:

•

wynik testu a płeć

•

wynik testu a ocena

Pamiętaj o tytułach tabel i legendzie.

Sporządź histogram (zwykły i kumulowany) zmiennej wynik testu (podziel wyniki testu na pięć klas). Naszkicuj
wielobok liczebności oraz dystrybuantę empiryczną.

Oblicz lub odczytaj ze sporządzonych wykresów:

•

Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 30 punktów lub więcej?

•

Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 23 punktów lub mniej?