PARAMETRY STOSOWANE W STATYSTYCE OPISOWEJ

Lp.

Nazwa parametru

Miara

Miary

klasyczna

pozycyjna

1

MIARY TENDENCJI CENTRALNEJ

x- średnia arytmetyczna

D - dominanta

M - mediana

Q - kwartyle

Absolutne (wyrażone w jednostce miary danej cechy)

2

MIARY DYSPERSJI (zróżnicowania, zmienności, rozrzutu, rozproszenia)

d- odchylenie przeciętne

S - odchylenie standardowe

S2 -wariancja

R - rozstęp(obszar zmienności)

Rq - rozstęp kwartylowy

Rd - rozstęp decylowy

Q - odchylenie ćwiartkowe

Qd - odchylenie decylowe

Absolutne

Vd, Vs - współczynnik zmienności

Vq - współczynnik zróżnicowania kwartylowego

Vd - współczynnik zróżnicowania decylowego

Stosunkowe (wyrażone w procentach lub liczbach niemianowanych)

3

MIARY ASYMETRII (skośności)

A1 - klasyczny współczynnik asymetrii

A2 - pozycyjny współczynnik asymetrii

Stosunkowe

A3 - współczynnik skośności

4

MIARY SKUPIENIA (spłaszczenia)

- klasyczny współczynnik skupienia

- pozycyjny współczynnik skupienia

Stosunkowe

5

MIARY KONCENTRACJI

K1 - współczynnik Lorenza

k2 - współczynnik Gini'ego

Stosunkowe

I MIARY TENDENCJI CENTRALNEJ - miary położenia, wskazują miejsce, w którym leży wartość najlepiej reprezentująca wszystkie jednostki wchodzące w skład danej zbiorowości. Miary te charakteryzują średni lub typowy poziom wartości cechy. Są to takie wartości, wokół których skupiają się pozostałe wartości analizowanej cechy.

1. SREDNIA ARYTMETYCZNA X - iloraz sumy pomiarów przez ich liczbę.

Własności:

Suma odchyleń wszystkich pomiarów od średniej wynosi 0;

Średnia spełnia warunek: x min X x max;

Daje prawdziwą charakterystykę tylko zbiorowości jednorodnej ze względu na badaną cechę (tzn. o rozkładzie symetrycznym i umiarkowanie symetrycznym);

Dla obliczania X potrzebna jest znajomość wszystkich wartości cechy;

Jeżeli przedziały klasowe są otwarte, to domyka się je określonymi wartościami cechy;

X jest bardzo wrażliwa na skrajne wartości cech jednostek; nie liczymy jej, gdy cecha ma rozkład skrajnie asymetryczny, U - kształtny lub wielomodalny.

2. MEDIANA M - miernik pozycyjny, podający pozycję pewnego typowego (lub nietypowego) przypadku w stosunku do innych przypadków.

Własności:

Dzieli zbiorowość na 2 połowy; połowa pomiarów jest mniejsza lub równa od wartości M, a połowa jest większa lub równa od M.;

Gdy liczba pomiarów jest nieparzysta - M to środkowy pomiar (w uporządkowanym szeregu);

Gdy liczba pomiarów jest parzysta - M to średnia arytmetyczna dwóch środkowych pomiarów (w uporządkowanym szeregu);

Średnia a mediana:

Średnia zużywa więcej informacji niż M (obliczając X korzystamy ze wszystkich pomiarów, M to tylko pewien pojedynczy pomiar)

Zmiany wartości pomiarów ekstremalnych wpływają na wartość średniej a nie wpływają na wartość M dopóki nie zmieni się wartość pomiaru środkowego.

3. DOMINANTA (wartość modalna) przypadek najczęstszy

4. KWARTALE

Pierwszy - liczba, od której1/4 pomiarów jest mniejsza lub równa

Drugi - równy M

Trzeci - liczba, od której ¾ pomiarów jest mniejsze lub równe

5. DECYLE - liczby, od których np. 1/10, 2/10, 3/10 pomiarów jest mniejsze lub równe

II.MIARY DYSPERSJI - miary zróżnicowania; dokonując pomiarów w danej zbiorowości uzyskane wyniki różnią się między sobą. Im bardziej wartości cechy jednostek skupione są wokół swej średniej, tym mniejsze jest zróżnicowanie jednostek i na odwrót.

1. ROZSTĘP R - różnica między najwyższym i najniższym pomiarem; opiera się na dwóch ekstremalnych pomiarach, więc może nie dawać prawdziwego obrazu

2. ODCHYLENIE SREDNIE d (przeciętne) - Określa o ile jednostki danej zbiorowości różnią się średnio od X; mówi o przeciętnej odległości między pomiarem a średnią.

3. ODCHYLENIE ĆWIARTKOWE Q - określa odchylenie wartości cechy od M; mierzy poziom zróżnicowania tylko w 50% populacji.

4. ODCHYLENIE STANDARDOWE S(x) - określa przeciętne zróżnicowanie poszczególnych wartości cechy od X

5. WSPÓŁCZYNNIK ZMIENNOŚCI V - obliczamy go dzieląc S(x) lub d przez wartość X. Mówi o jednorodności badanej zbiorowości statystycznej, określa siłę rozproszenia

Własności:

Służy do porównania kilku zbiorowości pod względem tej samej cechy

Lub tej samej zbiorowości pod względem kilku różnych cech.

V e <0, 100%>

0 - 20% - zróżnicowanie cechy słabe

20 - 40% - umiarkowane

40 - 60% - silne

60% i więcej - b. silne

ZWIĄZKI MIĘDZY MIARAMI DYSPERSJI:

1. Q < d < S(x)

2. d/S(x)=4/5

3. Q/S(x)= 2/3

4. Jeżeli rozkład zbiorowości jest normalny, to wielkości poszczególnych parametrów rozproszenia można określić na podstawie zależności:

Q=0,845 d = 0,675 S(x)

d=1,183 Q = 0,798 S(x)

S(x) = 1,483 Q = 1,253 d

REGUŁA TRZECH SIGM:

Wyznaczenie S(x) umożliwia ocenę przeciętnego wahania wartości cechy wokół X.

Reguła trzech sigm mówi, że wystąpienie wartości poza przedziałem <X - 3S(x); X +3S(x)> jest mało prawdopodobne.

W przypadku rozkładu normalnego (lub zbliżonego do normalnego):

około 68% jednostek zbiorowości charakteryzuje się tym, że wartości cechy dla tych jednostek nie różnią się od średniej arytmetycznej (in+ i in-) więcej niż o jedno S(x), tzn. około 68% jednostek zbiorowości mieści się w przedziale: <X - S(x); X +S(x)>

około 95% jednostek zbiorowości mieści się w przedziale: <X - 2S(x); X +2S(x)>

około 99,7% jednostek zbiorowości mieści się w przedziale <X - 3S(x); X +3S(x)>

Parametry stosowane w statystyce opisowej

więcej materiałów i notatek na www.wkuwanko.pl

2