Zadanie 1

Dokument liczący 35 stron dano do przepisywania trzem różnym osobom a następnie sprawdzono liczbę błędów popełnionych przez te osoby na każdej stronie dokumentu.

Wyniki przedstawia tablica (dane umowne):

Liczba błędów na stronie

0

1

2

3

4

5

6

Osoba 1 – liczba stron

3

4

6

9

6

4

3

Osoba 2 – liczba stron

4

10

8

5

4

3

1

Osoba 3 – liczba stron

1

3

4

5

8

10

4

Określić zbiorowość statystyczną, jednostkę statystyczną i badaną cechę.

Wykorzystując poznane miary, ocenić pracę trzech osób przepisujących dokument. Która z nich najlepiej wykonała zadanie?

Rozwiązanie:

Zbiorowość statystyczną stanowi 35 stron dokumentu.

Jednostka statystyczna to pojedyncza strona.

Badaną cechą jest liczba błędów na stronie dokumentu. Jest to cecha mierzalna, skokowa.

Uzyskane informacje przedstawiono w postaci szeregów rozdzielczych punktowych. Pracę trzech osób ocenimy porównując przeciętną liczbę popełnionych błędów oraz jej zróżnicowanie i asymetrię.

Dysponując pakietami statystycznymi (STATISTICA, SPSS) można tworzyć różnego rodzaju wykresy statystyczne, przedstawiające w sposób graficzny wybrane miary opisujące strukturę zbiorowości. Analiza wykresu ułatwia wstępne porównanie kilku zbiorowości badanych z punktu widzenia tej samej cechy, bez konieczności wykonywania obliczeń.

Jednym z bardziej przydatnych typów wykresów są wykresy pudełkowe, które w sposób schematyczny przedstawiają zakresy wybranych zmiennych oraz klasyczne lub pozycyjne statystyki opisowe (średnia, kwartyle, miary dyspersji). Wykres pudełkowy ma kształt prostokąta z dołączonymi po bokach odcinkami, umieszczonego w pionie lub poziomie, równolegle do skali zakresu wartości danej cechy.

W klasycznym wykresie pudełkowym punktem centralnym (oznaczonym pionową linią) jest mediana, boki pudełka wyznaczają wartości Q1 i Q3, a końce wąsów – najmniejszą i największą wartość cechy.

Rysunek 1 przedstawia wykresy pudełkowe zbudowane w oparciu o miary pozycyjne dla liczby błędów w dokumencie przepisywanym przez trzy różne osoby.

Jak łatwo zauważyć, przeciętna liczba błędów na stronę była najwyższa u osoby 3 a najmniejsza u osoby 2. Z wykresu można bez problemu odczytać wartości pierwszego i trzeciego kwartyla.

Proporcje długości poszczególnych części pudełka i wąsów informują o asymetrii rozkładu badanej cechy. W przypadku osoby 1 szereg jest symetryczny. Dłuższy prawy wąs (osoba 2) informuje o asymetrii prawostronnej (dodatniej) a dłuższy lewy wąs (osoba 3) o asymetrii lewostronnej (ujemnej).

Rysunek 1. Liczba popełnionych błędów - wykresy pudełkowe osoba 3

osoba 2

osoba 1

0

1

2

3

4

5

6

Liczba błędów na stronę dokumentu

Wstępne oceny pracy trzech osób potwierdzimy obliczając niezbędne miary statystyczne.

Obliczenia wykonać można w tablicach pomocniczych.

Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 1

Liczebności

Liczba błędów

Liczba stron

x

x 2 ⋅ n skumulowane

na stronie x

i ⋅ n

i

i

i

i

n

i

isk

n

0

3

0

0

3

1

4

4

4

7

2

6

12

24

13

3

9

27

81

22

4

6

24

96

28

5

4

20

100

32

6

3

18

108

35

Razem

35

105

413

x

∑ xini

i

105

x =

=

= 3 błędy,

n

35

∑ i

i

Me = x N + = x + = x

= 3

1

35 1

18

błędy,

2

2

Do=3 błędy,

Q = x N + = x + = x = 2

1

1

35 1

9

błędy,

4

4

Q

= x N +

= x

+

= x

= 4

3

(

3

)

1

35

(

3

)

1

27

błędy,

4

4

2

∑ x ni

i

i

2

413

sx =

− x

=

− 32 =

8

,

2

= 67

,

1

błędu,

n

35

∑ i

i

sx

67

,

1

Vs =

⋅ 100% =

⋅ 100% =

7

,

55 % ,

x

x

3

x − Do

3 − 3

s

W =

=

= 0 .

s

67

,

1

x

Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 2

Liczebności

Liczba błędów na Liczba stron

x

x 2 ⋅ n skumulowane

stronie x

i ⋅ n

i

i

i

i

n

i

isk

n

0

4

0

0

4

1

10

10

10

14

2

8

16

32

22

3

5

15

45

27

4

4

16

64

31

5

3

15

75

34

6

1

6

36

35

Razem

35

78

262

x

∑ xini

i

78

x =

=

=

23

,

2

błędy,

n

35

∑ i

i

Me = x N + = x + = x

= 2

1

35 1

18

błędy,

2

2

Do=1 błąd,

Q = x N + = x + = x = 1

1

1

35 1

9

błąd,

4

4

Q

= x N +

= x

+

= x

= 3

3

(

3

)

1

35

(

3

)

1

27

błędy,

4

4

2

∑ x ni

i

i

2

262

sx =

− x

=

−

)

23

,

2

(

2 =

51

,

2

= 58

,

1

błędu,

n

35

∑ i

i

sx

58

,

1

Vs =

⋅

%

100

=

⋅

%

100

=

%

85

,

70

,

x

x

23

,

2

x − Do

23

,

2

− 1

s

W

=

=

=

78

,

0

.

s

58

,

1

x

Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 3

Liczebności

Liczba błędów na Liczba stron

x

x 2 ⋅ n skumulowane

stronie x

i ⋅ n

i

i

i

i

n

i

isk

n

0

1

0

0

1

1

3

3

3

4

2

4

8

16

8

3

5

15

45

13

4

8

32

128

21

5

10

50

250

31

6

4

24

144

35

Razem

35

132

586

x

∑ xini

i

132

x =

=

=

77

,

3

błędu,

n

35

∑ i

i

Me = x N + = x + = x

= 4

1

35 1

18

błędy,

2

2

Do=5 błędów,

Q = x N + = x + = x = 3

1

1

35 1

9

błędy,

4

4

Q

= x N +

= x

+

= x

= 5

3

(

3

)

1

35

(

3

)

1

27

błędów,

4

4

2

∑ x ni

i

i

2

586

sx =

− x

=

−

)

77

,

3

(

2 =

53

,

2

= 59

,

1

błędu,

n

35

∑ i

i

sx

59

,

1

Vs =

⋅ 100% =

⋅ 100% =

2

,

42 % ,

x

x

77

,

3

x − Do

77

,

3

− 5

s

W

=

=

= − 77

,

0

.

s

59

,

1

x

W celu ułatwienia interpretacji wyników w tablicy pomocniczej przedstawić można uzyskane wartości miar statystycznych.

Zestawienie uzyskanych wyników

Miara

x

sx

Me Do Q1 Q3

VSx

Ws

Osoba 1

3

1,67

3

3

2

4

55,7%

0

Osoba 2

2,23

1,58

2

1

1

3

70,85%

0,78

Osoba 3

3,77

1,59

4

5

3

5

42,2%

-0,77

Interpretacja:

Przeciętna liczba błędów była najmniejsza w przypadku osoby 2 (średnio 2,23 błędu na stronę) zaś największa w przypadku osoby 3 (średnio 3,77 błędu na stronę).

W przypadku osoby 1 na połowie stron były co najwyżej 3 błędy, na 1/4 stron – co najwyżej 2 błędy a na 3/4 stron – co najwyżej 4 błędy. Osoba 2 przepisała dokument w taki sposób, że 50% stron zawierało nie więcej niż 2 błędy, 25% nie więcej niż 1 błąd a 75% nie więcej niż 3 błędy. W przypadku osoby 3 – na połowie stron były co najwyżej 4

błędy, na 1/4 stron – nie więcej niż 3 błędy zaś na 3/4 stron nie więcej niż 5 błędów.

Osoba 1 najczęściej popełniła 3 błędy na stronę, osoba 2 – 1 błąd zaś osoba 3 – 5

błędów.

Zróżnicowanie liczby błędów mierzone odchyleniem standardowym było najmniejsze w przypadku osoby 3 i stanowiło 42,2% średniej, zaś największe w przypadku osoby 2, dla której stanowiło 71,3% średniej arytmetycznej.

Szereg obrazujący liczbę błędów na stronach dokumentu przepisanego przez osobę 1 był

symetryczny czyli x = Me = Do .

W przypadku szeregu uzyskanego dla osoby 2 zaobserwowano występowanie asymetrii dodatniej (prawostronnej) o dużej sile. Oznacza to, że najczęściej spotykana liczba błędów na stronie była niższa od przeciętnej.

Szereg nr 3 cechowała silna asymetria ujemna (lewostronna), co oznacza, że na większości stron zaobserwowano liczbę błędów wyższą od przeciętnej.

Wniosek: Najlepiej wykonała pracę osoba 2.