background image

I rok Farmacji
Statystyka część I

- populacja generalna i próba

- skale pomiarowe

- statystyka opisowa

background image

Popula
cja 
general
na

Prób
a

Próba i populacja generalna.

Zbiór wszystkich
interesujących nas elementów

Elementy wzięte do badania

Ze względów praktycznych zazwyczaj nie 

możemy przebadać całej populacji, wybieramy do 
badań tylko jej część – próbę. 

 Populacja w sensie statystycznym i 

populacja w sensie ekologicznym czy 
genetycznym to nie to samo! 

background image

Statystyki i 

parametry.

Wielkości obliczane dla pobranej próby – 

statystyki,

 oznaczane literami łacińskimi, np. średnia z 

próby      .

 

Wielkości obliczane dla całej populacji – 

parametry,

 oznaczane literami greckimi, np. średnia z 

populacji      .

X

Statystyka elementarna – obliczanie statystyk.

Statystyka matematyczna – 
                    wnioskowanie o populacji generalnej na 
podstawie próby. 

background image

Skale: nominalna, porządkowa i 
interwałowa.

Skala nominalna: 
   – podział populacji na jednoznacznie opisane kategorie 
   – kryteria podziału.
Skala nominalna dychotomiczna – jw. ale tylko dwa podzbiory.  

Skala porządkowa 
   – elementy zbioru porządkujemy według jednej reguły, 
   – każdy element ma przypisaną kolejność (rangę). 

Skala interwałowa 
   – wszystkie pomiary uzyskane przez porównanie ze 
wzorcem:
         długość, objętość, masa, temperatura, czas i 
inne,
   – dane pochodzące z policzenia: 
         liczba drzew danego gatunku, liczba 
studentów noszących
         okulary.

background image

Skala interwałowa:

- skala przedziałowa

~ liczby rzeczywiste
~ istotne są różnice między elementami zbioru
~ np. kalendarz, temperatura w C

- skala ilorazowa

~ j.w.
~ zero bezwzględne
~ stały stosunek (niezależny od jednostek)
~ temperatura w K, masa, odległość

Skale nominalna i porządkowa 

– cechy jakościowe

Skala interwałowa 

– cechy ilościowe

Zamiana skal: 

interwałowa   porządkowa  nominalna 

Zamiana w przeciwna stronę jest niemożliwa, mamy za mało danych. 
Najdokładniejsza jest skala interwałowa a najmniej skala nominalna.

background image

 

 A

B

C

D

E

F

Skala interwałowa 

2

4

9

5

3

7

Skala porządkowa 

(rangi) 

6

4

1

3

5

2

Skala nominalna (>4)  -

-

+ +

-

+

 

 A

B

C

D

E

F

Skala interwałowa 

2

4

9

4

3

7

Skala porządkowa 

(rangi) 

6 3,5 1

3,

5

5

2

Skala nominalna (>4)  -

-

+

-

-

+

Rangi wiązane:

Zamiana skal pomiarowych, rangi wiązane.

background image

Procent:

Proporcja:

Stosunek liczbowy

Z

100

A

 

 

P

Z

A

 

 

P

A

-

Z

A

 

 

S

Na 156 studentów farmacji 142 uzyskało zaliczenie z matematyki. 

%

3

,

97

156

100

42

1

 

 

P

973

,

0

156

42

1

 

 

P

Stosunek liczby studentów którzy uzyskali zaliczenie
 do liczby tych którzy zaliczenia nie uzyskali wynosi: 

1

,

10

14

42

1

 

 

S

lub

 10,1:1. 

Przypomnienie prostych pojęć.

background image

Statystyka opisowa

Obliczanie podstawowych statystyk opisujących pobrana próbę:

- średnie, mediana, moda,

- zmienność (wariancja, odchylenie standardowe),

- charakterystyki kształtu rozkładu,

- zgodność z założona postacią rozkładu,

- przedział ufności.

Graficzne przedstawienie danych:

- histogram.

background image

Wyniki semestru zimowego dla grupy 26 studentów. 

Dane: 

Punkty 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Osoby 1 1 3 6 1 2 2 2 0 2 1 0 1 1 1 0 0 0 0 1 1 0

N=26 osób 

58

,

7

X

0

1

2

3

4

5

6

liczba

 osób

1

3

5

7

9

11 13 15 17 19 21

liczba uzyskanych punktów

Wyniki semestru zimowego.

background image

Szereg rozdzielczy. Przedziały klasowe. 

Większa liczba pomiarów: 
   – grupujemy w klasy
   – liczba klas zależy od liczebności próby. 

Orientacyjnie: 

kilkanaście pomiarów  - 4-5   przedziałów
setki pomiarów

 - 8-10 przedziałów

      tysiące pomiarów   

 - 12    przedziałów 

Rozkład prawoskośny 
   – prawa strona rozkładu ma mniejsze nachylenie,
   – więcej pomiarów jest poniżej średniej.
Rozkład lewoskośny 
   – lewa strona rozkładu ma mniejsze nachylenie,
   – więcej pomiarów jest powyżej średniej. 

background image

Środek

Liczebność

przedziału

skumulowana

praktyczne

rzeczywiste

1 – 4

0,5 – 4,5

2,5

11

11

0,42

5 – 8

4,5 – 8,5

6,5

7

18

0,27

9 – 12

8,5 – 12,5

10,5

3

21

0,12

13 – 16

12,5 – 16,5

14,5

3

24

0,12

17 – 20

16,5 – 20,5

18,5

1

25

0,04

21 – 24

20,5 – 24,5

22,5

1

26

0,04

Razem

26

1,01

Granice przedziałów

Liczebność

Częstość

Szereg rozdzielczy otrzymany dla wyników 
semestru zimowego.  

Jest 6 przedziałów o równej długości.
Granice praktyczne są podane z taką samą dokładnością jak dane. 
Granice rzeczywiste są obliczane w przypadku zmiennej ciągłej
(masa, temperatura, czas).

background image

0

2

4

6

8

10

12

Liczebność

2,5

6,5

10,5

14,5

18,5

22,5

Przedziały (środki)

Histogram

0,00

0,10

0,20

0,30

0,40

0,50

Częstość

2,5

6,5

10,5 14,5 18,5 22,5

Przedziały (środki)

Histogram

background image

STATYSTYKA ELEMENTARNA

miary tendencji centralnej i rozproszenia 

Liczba pomiarów   N   – X

1

, X

2

, X

3

, ..., X

i

, ..., X

N

 

Suma  (konwencje) - 

N

i

1

i

i

X

N

1

i

i

X

X

Średnia arytmetyczna - 

Średnia ważona
   – np. dla szeregu rozdzielczego 

Średnia geometryczna 
   – np. średnie tempo wzrostu populacji 

Średnia harmoniczna
  – liczby dodatnie,
  – większe znaczenie dla mniejszych wartości 

X

N

1

 

X

i

i

i

w

w

X

w

 

X

N

N

1

i

i

G

X

M

X

1

N

1

M

1

H

X

1

N

M

H

background image

Średnia arytmetyczna – 

Średnia ważona (obliczona dla 
przedziałów) -

Średnia geometryczna – 

Średnia harmoniczna –

Przykładowe obliczenia dla danych z tabel,
wyniki semestru zimowego.

7,6

X 

3

,

7

X

w

6,0

M

G

6

,

4

M

H

background image

Miary tendencji centralnej szeregu statystycznego: 

Szereg opisany tabelą ma 26 elementów

2

X

X

Me

14

13

6

2

6

6

Me

 ~ średnie,
 ~ mediana – w uporządkowanym szeregu wartość 
środkowa,
                      przy parzystej liczbie elementów średnia 
ze środkowych.
 ~ moda (wartość modalna rozkładu)
                   – najczęściej występująca wartość, 
                      w podanym rozkładzie Mo = 4,
 ~ przedział modalny (szeregi rozdzielcze i pomiary 
ciągłe)
                   – dla naszego szeregu jest to przedział 1–4.

background image

Miary rozproszenia.

Wariancja i odchylenie standardowe.

Stosowane konwencje oznaczeń.

 

odchylenie od średniej 
   – obliczane dla każdego pomiaru 

suma kwadratów odchyleń (SKO)

można korzystać z wyrażenia
(dużo bardziej praktyczne)

wariancja

odchylenie standardowe

X

X

x

i

i

2

i

2

i

)

X

(X

x

N

X

X

x

2

i

2

i

2

i

1

N

x

s

2

i

2

1

N

x

s

2

i

background image

Dane (wyniki semestru zimowego):

osoba

1

2

3

4

5

6

7

8

9

10

11

12

13

punkty

1

2

3

3

3

4

4

4

4

4

4

5

6

x

i

-6,6

-5,6

-4,6

-4,6

-4,6

-3,6

-3,6

-3,6

-3,6

-3,6

-3,6

-2,6

-1,6

x

i

2

43,3 31,1 21,0 21,0 21,0 12,8 12,8 12,8 12,8 12,8 12,8

6,6

2,5

osoba

14

15

16

17

18

19

20

21

22

23

24

25

26

punkty

6

7

7

8

8

10

10

11

13

14

15

20

21

x

i

-1,6

-0,6

-0,6

0,4

0,4

2,4

2,4

3,4

5,4

6,4

7,4

12,4 13,4

x

i

2

2,5

0,3

0,3

0,2

0,2

5,9

5,9

11,7 29,4 41,3 55,1 154,3 180,2

7,6

X 

   N=26      N-
1=25

197

X

2203

X

2

7,5769

X 

710,346

x

2

28,41

s

2

33

,

5

s 


Document Outline