background image

BADANIE ROZKŁADU ODCHYLEŃ 

WYNIKÓW OD WARTOŚCI 

NAJPRAWDOPODOBNIEJSZEJ

Kolejną 

analizą 

przeprowadzaną 

badaniu 

czasu 

trwania 

czynności 

technologicznej  jest  ustalenie  charakteru 
rozkładu  odchyleń  (błędów)  od  wartości   
najbardziej 

prawdopodobnej 

(średniej). 

Badanie  to  można  przepro-wadzić  testem 
„chi kwadrat”.

UWAGA ! JEŚLI ROZKŁAD ODCHYLEŃ NIE MA 
ROZKŁADU  NORMALNEGO  TO  ŚREDNIA 
(ARYTMETYCZNA  LUB  WAŻONA)  NIE  JEST 
WARTOŚCIĄ NAJPRADOPODOBNIEJSZĄ !!! 

background image

Test  chi-kwadrat  analizuje  różnice  pomiędzy 

liczebnością  teoretyczną  wyników  w  danej  klasie 
wartości  (przedziale  wartości)  a  liczbą  wyników 
uzyskanych                z pomiarów, które przypadają 
do danej klasy.

W  celu  przeanalizowania  tych  różnic 
musimy „zbudować” dwa rozkłady:

  - 

pierwszy  –  empiryczny

,  reprezentujący 

wyniki
                                                              uzyskane  z 
przeprowadzonego pomiaru,

- 

drugi  –  teoretyczny

,  będący  obrazem 

teoretycznego
                               rozkładu normalnego.

celu 

uzyskania 

wiarygodnych 

wyników    takiego  porównania  należy 
posiadać  stosunkowo  dużą  „próbę”            z 
badanej populacji. 

background image

Za  dużą  próbę  uważa  się  już  30 

wyników 

(to  jest  raczej  minimum  dużej 

próby  w  tym  badaniu).  Dla  mniejszej 
nie  powinno  budować  się  histogramu 
wyników świadczącego o ich rozkładzie 
(rozrzucie).   

Dane  z  tych  wyników 

grupuje  się  w  przedziały  klasowe,  przy 
czym: 
         - liczba przedziałów klasowych 

r

 

powinna być 
           dostatecznie liczna - przyjmuje 
się, że 

r

 ≥ 5,

         - liczebności teoretyczne w 
poszczególnych 
           przedziałach klasowych nie 
mogą być zbyt małe;
           zazwyczaj przyjmuje się 

np

I

 ≥ 5, 

gdzie  i = 1,2,…r.

background image

           -   oba rozkłady muszą być ze sobą 
porównywalne
               co uzyskuje się poprzez 
zestandaryzowanie
               rozkładu empirycznego; tablice 
rozkładu
               teoretycznego odnoszą się już do 
rozkładu
               zestandaryzowanego - N(0,1).
   Rozkład zestandaryzowany to taki, w 
którym wartość  
   oczekiwana E(x) = 0, a odchylenie 
standardowe σ = 1;
   co zapisujemy N(0;1). 
          W  celu standaryzacji,  po  
obliczeniu  wartości oczekiwanej i 
odchylenia standardowego badanego 
rozkładu, obliczamy poniższą statystykę  
dla zmiennej standaryzowanej Z
:

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

 g

ęs

to

śc

 f

(X

)

0,13%         2,15%          13,59%      34,13%

POWIERZCHNIA CAŁEGO POLA POD FUNKCJĄ GĘSTOŚCI 
RÓWNA SIĘ 1

Statystyka ta pozwala obliczać teoretyczną 
liczność danych w określonych przedziałach 
zmiennej. Rysunek prezentuje gęstości dla 
krotności odchylenia standardowego σ 

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

 g

ęs

to

śc

 f

(X

)

                                                                  34,13%     13,59%    
2,15%          0,13%

Taki sam procent liczności znajduje się w 
klasach prawej części  rozkładu. 

 

W celu wyznaczenia gęstości dla dowolnego Z  

należy korzystać z tablicy dystrybuanty tego 
rozkładu. 

background image

UWAGA – dla zestandaryzowanej 
funkcji opracowano różne rodzaje 
tablic, w tym:

- tablicę funkcji gęstości (określa 
wysokość krzywej (liczność zdarzeń)  w 
punkcie z

i

 na osi Z),

- tablicę dystrybuanty (zawiera 
skumulowaną wartość liczności 
zdarzeń od -∞ do miejsca z

i

 na osi Z). 

     Tablica gęstości
(rozpoznaje się ją
 po wartości 0,3989!)

0 1 2... 9

0,0

0,1

0,2

0,3

...

1,0

2,0

3,0

4,0

3989

3970

3910

3814

...

2420

0540

0044

0001

3989 ... 3973

f(Z
)

background image

Z

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

 0,0000

 0,0398

   ...

 0,1915

 0,2257

   ...

 0,3413

 0,4332

 0,4772

 0,49865

 0,4999683

... ... ...

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

 g

ęs

to

śc

i  

f(

X

)

Ponieważ tablice dystrybuanty zawierają 
skumulowane liczności  od z=0 do miejsca 
z

i

, to w przedziale od -1 do -2 będziemy 

mieli liczność równą 0,4772 − 0,3413 = 
0,1359, co oznacza, że w tym przedziale 
znajduje się 13,59% całej liczności 
wyników. W przedziale od -1,5 do +1,5 
będzie dwa razy 0,4332, tj. 86,64% 
wszystkich liczności.  

F

*

(

Z)

Tablica dystrybuanty 

background image

Dla mało licznej próby, gęstości 
wyznacza się z tablicy Studenta 
uwzględniającej przyjęty poziom 
istotności oraz określoną liczbę stopni 
swobody. 

background image

PRZYKŁAD

Zbadano  200  osób  pod  względem 
czasu wykonania pewnego zadania
Na 
poziomie  istotności  α  =  0,05    należy 
zweryfikować  hipotezę,  że  rozkład 
czasu 

wykonania 

zadania 

jest 

rozkładem normalnym (Gaussa).

Czas 

[min]

71,0 –

71,4

71,4 –

71,8

71,8 –

72,2

72,2 –

72,6

72,6 –

73,0

Liczebn

ość

15

45

70

50

20

background image

Rozwią zanie przykładu  sprawdzenia 
zgodności rozkładu wyników pomiaru z 
rozkładem normalnym

Obliczanie średniej

Lp przedział

Środek 

przedzia

łu

 x

i

Liczność 

przedzia

le

n

i

n

∙ x

i

1

1,0 –1,4

1,2

15

18,0

0,09

2

1,4 –1,8

1,6

45

72,0

0,36

3

1,8 –2,2

2,0

70

140,0

0,70

4

2,2 –2,6

2,4

50

120,0

0,60

5

2,6 –3,0

2,8

20

56,0

0,280

N = 200

∑ = 

406,0

    

2,03

Ze względu na dokładność pomiaru rzędu 
0,1 do dalszych obliczeń przyjęto średnią 

  

      = 2,0 minuty

background image

Obliczanie odchylenia standardowego z 

próbki

Lp

Środek 

przedzia

łu

 x

i

Liczność 

przedzial

e

n

i

1

1,2

- 0,8

15

0,64

9,60

2

1,6

- 0,4

45

0,16

7,20

3

2,0

- 0,0

67

0,00

0,0

4

2,4

+ 0,4

50

0,16

8,00

5

2,8

+ 0,8

20

0,64

12,8

   

2,0

N = 

200

  

  37,60

background image

Standaryzacja rozkładu z danych 
pomiarowych

Statystyki z próby:         

= 2,0   

oraz  

S = 0,4336 

L

p

przedz

iał

Liczno

ść

danyc

h z 

pomiar

n

i

dla 

prawe

go 

krańc

a klas

 z

i

  

dla 

prawe

go 

krańc

a klas

F(z

i

 )

z tablic 

dla 

praweg

krańca 

klas

p

i

 = 

F(z

i

minu

F(z

i-

1

)

Liczno

ść 

teoret. 

n

teor

 = 

N

i

∙p

i

1

1,0 –

1,4

15

- 0,6

- 1,38

0,084

0,08

4

16,8

0,19

2

1,4 –

1,8

45

- 0,2

- 0,46

0,323

0,23

9

47,8

0,16

3

1,8 –

2,2

70

+ 0,2

0,46

0,677

0,35

4

70,8

0,01

4

2,2 –

2,6

50

+ 0,6

1,38

0,916

0,23

9

47,8

0,10

5

2,6 –

3,0

20

+ 1,0

nie 

trzeb

a

0,08

4

16,8

0,61

∑ = 

200

               

= 1,07

background image

Wartość krytyczną odczytujemy z 
tablic rozkładu przy poziomie 
istotności 

α = 0,05 

dla stopni 

swobody równej (r-k-1)=(5-2-1)=

2

gdzie r – liczba klas, k – liczba 
szacowanych parametrów rozkładu 
(w omawianej analizie k
 = 2 bo 
rozkład normalny opisany jest przez 
dwa parametry - średnią oraz 
odchylenie standardowe).

 Z tablic mamy:                                co 
oznacza, że
wobec                                       nie ma 
podstaw do odrzucenia hipotezy 
zerowej, zatem rozkład badanej 
cechy jest rozkładem normalnym 
(Gaussa).

background image

KONIEC


Document Outline