background image

03. MIARY ROZKŁADU 

Inaczej  –  liczbowe  charakterystyki  rozkładu  cechy,  umożliwiają  analizę  zjawisk  poprzez 

analizę właściwości ich rozkładów (szeregów). 

1  MIARY POŁOŻENIA 

Służą  do  określenia  tej  wartości  zmiennej  opisanej  przez  szereg,  wokół  której 

koncentrują się pozostałe wartości zmiennej. 

 

a  średnia arytmetyczna, 

x

  

Jest  podstawową  i  najprostszą  wielkością  charakteryzującą  położenie  rozkładu 

prawdopodobieństwa w układzie współrzędnych.  

Jest  wrażliwa  na  skrajne,  odstające  wartości  cechy.  Przy  bardzo  asymetrycznych  

i zróżnicowanych rozkładach prawdopodobieństwa cechy bardziej miarodajna od średniej 

jest wartość dominanty lub mediany. 

szereg szczegółowy   

 

 

(

)

n

n

i

i

x

x

x

x

n

x

n

x

+

+

+

+

=

=

=

K

3

2

1

1

1

1

 

szereg rozdzielczy przedziałowy 

 

=

=

n

i

i

i

n

x

n

x

1

1

 

 

* średnia arytmetyczna ważona 

Oblicza się, jeśli wiadomo, że i-ty wynik pomiaru (x

i

) wystąpił n

i

 razy, n

i

 – pełnią tu rolę 

wag. 

=

=

n

i

i

i

n

x

n

x

1

1

 

 

b  średnia geometryczna, 

g

  

 

 

[=średnia.geometryczna(dane)]

 

Stosuje się w badaniach średniego tempa zmian zjawisk (dynamiczne ujęcie zjawisk). 

n

n

n

n

i

i

x

x

x

x

x

g

=

=

=

K

3

2

1

1

,  

 

x

i

>0 

 

[=średnia(dane)] 

background image

c  średnia harmoniczna, 

h

 

Stosuje  się,  gdy  wartości  cechy  są  podane  w  przeliczeniu  na  stałą  jednostkę  innej 

zmiennej, np. prędkość - km/h, ciśnienie – N/m

2

, gęstość objętościowa – g/cm

3

.  

szereg szczegółowy   

 

 

=

=

n

i

i

x

n

h

1

1

,   

0

1

1

=

n

i

i

x

 

 

d  wartość modalna/moda/dominanta D/wartość najczęstsza, 

M

o

 

 

szereg szczegółowy   

 

 

 

 

 

[=wyst.najczęściej(dane)] 

Wartość cechy statystycznej, która w danej próbce występuje najczęściej i nie jest równa 

x

min

, ani x

max

 

szereg rozdzielczy z przedziałami  

Środek  najliczniejszej  klasy  –  gdy  liczności  klas  sąsiednich  są  identyczne,  albo  gdy 

liczności te różnią się od siebie m

o

 liczy się: 

(

) (

)

b

n

n

n

n

n

n

x

M

m

m

m

m

m

m

m

+

+

=

+

1

1

1

min

_

0

gdzie: 

x

m_min

 – dolna granica klasy modalnej, 

n

m

 – liczność klasy modalnej, 

n

m-1

, n

m+1

 – liczności sąsiednich klas, 

b – rozpiętość klas. 

 

Może się zdarzyć, że szereg nie posiada wartości modalnej – antymodalny lub może mieć 

więcej, niż jedną modalną (więcej szczytów w histogramie) – szereg dwu- i wielomodalny. 

Obecność  więcej  niż  jednego  szczytu  może  wskazywać  na  niejednorodność  próby  –  co 

oznacza konieczność przeprojektowania pomiaru lub dostarcza dodatkowych informacji o 

badanym zjawisku. 

 

 

[=średnia.harmoniczna(dane)] 

background image

e  kwantyle 

Wybrane  wartości  cechy  badanej  zbiorowości  (szeregu  statystycznego),  które  dzielą  tę 

zbiorowość  na  określone  części  pod  względem  liczby  jednostek.  Części  te  pozostają  do 

siebie w określonych proporcjach. 

kwartyle – kwantyle rzędu ¼, ½, ¾ - dzielą próbę na 4 równe części, 

kwartyl drugi/wartość środkowa/mediana, 

M

e

 

Dzieli  zbiorowość  na  dwie  równe  części,  połowa  jednostek  ma  wartości  cechy 

mniejsze/równe  medianie,  a  połowa  –  większe/równe.  Jej  zaletą  jest  niewrażliwość  na 

wartości odstające; z tej przyczyny bywa, że zastępuje średnią arytmetyczną. 

szereg szczegółowy   

 

 



+

=

+

+

parzyste

n

x

x

e

nieparzyst

n

x

M

n

n

n

e

,

2

,

1

2

/

2

/

2

1

 

szereg rozdzielczy przedziałowy 

 



+

=

=

1

1

min

_

2

m

i

i

m

Me

e

n

n

n

b

x

M

gdzie: 

x

Me_min

 – dolna granica przedziału z medianą, 

m – numer przedziału zawierającego medianę, 

n

m

 – liczność klasy zawierającej medianę, 

b – rozpiętość klasy zawierającej medianę. 

 

kwartyl pierwszy/dolny, Q

1

; kwartyl trzeci/górny, Q

3  

 

Kwartyl  pierwszy  dzieli  zbiorowość  na  dwie  części  tak,  że  25%  jednostek  ma  wartości 

cechy niższe lub równe wartości Q

1

, a 75% równe lub wyższe od wartości tego kwartyla. 

Kwartyl trzeci – analogicznie. 

szereg  szczegółowy  –  trzykrotnie  wyznacza  się  medianę  –  wpierw  z  całej  próby,  a 

następnie w powstałych w ten sposób połowach próby        

[=kwartyl(dane,nr kwartyla)]

 

szereg rozdzielczy przedziałowy  

b

n

n

n

x

Q

Q

q

i

i

Q

+

=

=

1

1

1

min

_

1

1

1

4

,        

b

n

n

n

x

Q

Q

q

i

i

Q

+

=

=

3

1

1

min

_

3

3

3

4

3

[=mediana(dane)] 

background image

gdzie: 

q

1

 i q

3

 – numer klasy z odpowiednim kwartylem, 

x

Q1_min

 i x

Q3_min

 – dolne granice klas z kwartylami, 

n

Q1

 i n

Q3

 – liczebność przedziałów z kwartylami, 

b – rozpiętość przedziałów. 

 

ii  kwintyle – dzielą próbę na pięć równych części, 

iii  decyle – dzielą na 10 równych części, 

Szczególnie  przydatne  są  decyle  pierwszy  i  dziewiąty,  gdy  skrajne  wartości  próby 

znacznie odbiegają od pozostałych jej wartości. Wówczas przy pomocy tych decyli można 

‘odciąć’ po 10% skrajnych wartości i analizować tylko środkową część próby (zawierającą 

80% elementów pierwotnej próby). 

iv  percentyle – dzielą na 100 równych części  

[=percentyl(dane,nr percentyle)]

 

 

 

2  MIARY ZMIENNOŚCI 

Są  to  miary  rozkładu  opisujące  rozproszenie  wartości  cechy  (x)  wokół  wartości 

centralnych (np. średnia arytmetyczna, mediana, modalna). 

 

a  wariancja, 

2

s

 

Średnia  arytmetyczna  kwadratów  odchyleń  poszczególnych  wartości  cechy  od  średniej 

arytmetycznej 

x

 próby. Służy do oceny  stopnia jednorodności i powtarzalności wyników 

liczbowych  uzyskiwanych  w  eksperymentach,  np.  do  oceny  dokładności  przyrządu 

pomiarowego.  Jest  zawsze  nieujemna,  a  jej  mianem  jest  kwadrat  jednostki,  w  której 

mierzona jest badana cecha. 

szereg szczegółowy   

 

 

(

)

=

=

n

i

i

x

x

n

s

1

2

2

1

   

[=wariancja(dane)]

 

szereg rozdzielczy przedziałowy 

 

(

)

i

k

i

i

n

x

x

n

s

=

=1

2

2

1

 

 

background image

b  odchylenie standardowe, 

s

  

 

 

       

[=odch.standardowe(dane)]

 

Pierwiastek  kwadratowy  z  wariancji.  Określa  przeciętne  zróżnicowanie  poszczególnych 

wartości cechy od średniej arytmetycznej. Jest nieujemna i ma miano jednostki, w której 

mierzona jest badana cecha. 

2

s

s =

 

 

 

c  odchylenie ćwiartkowe/odchylenie kwartylne, 

Q

 

Parametr  określający  odchylenie  wartości  cechy  od  mediany.  Mierzy  poziom 

zróżnicowania  tylko  części  jednostek  –  pozostających  po  odrzuceniu  25%  jednostek  o 

wartościach największych i 25% o wartościach najmniejszych.  

(

)

(

)

2

2

1

3

1

3

Q

Q

Q

M

M

Q

Q

e

e

=

+

=

 

Im  większa  jego  wartość,  tym  większe  zróżnicowanie  cechy.  Pełni  rolę  podobną  do 

odchylenia standardowego, ale jest bardziej odporne na wartości odstające. 

 

 

d  współczynnik zmienności, 

V

s

 

Jest  niemianowany  i  najczęściej  podaje  się  go  w  procentach.  Jest  stosowany  do 

porównywania  zróżnicowania  jednej  cechy  w  dwóch  różnych  próbach  lub  do 

porównywania jednej zbiorowości pod względem kilku różnych cech. 

x

s

V

s

=

 

 

 

e  rozstęp, 

R

 

Jest  miarą  charakteryzującą  empiryczny  obszar  zmienności  badanej  cechy,  ale  nie  daje 

informacji o zróżnicowaniu poszczególnych wartości cechy w próbie. 

min

max

x

x

R

=

 

 

background image

3  MIARY ASYMETRII 

Charakteryzują  rodzaj  i  stopień  odstępstwa  rozkładu  badanej  cechy  od  symetrii,  a  tym 

samym informują o tym, gdzie znajduje się przeważająca liczba jednostek (powyżej czy 

poniżej przeciętnego poziomu badanej cechy).  Szeregi mogą się  różnić kierunkiem i siłą 

asymetrii.  

Istnieją następujące zależności: 

 

o

e

M

M

x

=

=

 

 

szereg symetryczny 

 

 

 

o

e

M

M

x

>

>

asymetria prawostronna 

o

e

M

M

x

<

<

 asymetria lewostronna 

 

 

background image

a  współczynnik skośności 

Służy  do  określania  siły  i  kierunku  asymetrii  –  im  większa  wartość,  tym  silniejsza 

asymetria. Wartość niemianowana. 

s

M

x

A

o

s

=

 

0

=

s

A

 

szereg symetryczny 

0

>

s

A

 

asymetria prawostronna 

0

<

s

A

 

asymetria lewostronna 

 

b  współczynnik asymetrii/skośność 

 

 

 

[=skośność(dane)]

 

Podobnie jak współczynnik skośności – służy do określania asymetrii. 

3

3

s

M

A =

gdzie M

3

 – moment trzeciego rzędu. 

0

=

A

  

szereg symetryczny 

0

>

A

  

asymetria prawostronna 

0

<

A

  

asymetria lewostronna 

 

 

4  MIARY KONCENTRACJI 

Określają  rozdysponowanie  wartości  cechy  pomiędzy  elementy  próby  losowej.  Stanowią 

uzupełnienie trzech poprzednich miar. 

 

a  kurtoza/współczynnik koncentracji   

 

 

[=kurtoza(dane)]

 

eksces 

Jest 

miarą 

skupienia 

poszczególnych 

obserwacji 

wokół 

średniej. 

Rozkładem 

porównawczym  dla  kurtozy  jest  rozkład  normalny.  Im  większa  wartość  kurtozy,  tym 

bardziej  smukła  jest  krzywa  liczebności  względem  rozkładu  normalnego  i  większa 

koncentracja cech wokół średniej. 

background image

3

4

4

=

s

M

K

gdzie M

4

 – moment czwartego rzędu. 

 

Wartość kurtozy informuje o kształcie szeregu (rozkładu): 

0

=

K

  

mezokurtyczny, spłaszczenie zbliżone do rozkładu normalnego 

0

>

K

  

leptokurtyczny,  wartości  cechy  są  bardziej  skoncentrowane,  niż  w 

rozkładzie normalnym, wartości szeregu tworzą rozkład wyższy i smuklejszy 

0

<

K

  

platykurtyczny,  wartości  cechy  mniej  skoncentrowane,  niż  w  rozkładzie 

normalnym, wartości szeregu tworzą rozkład niższy i bardziej rozłożysty