4 Statystyka opisowa i rozkład normalny

background image

1

Statystyka w jakości

background image

2

zmienność

PROCES

Losowe specjalne

Losowe

naturalne

- badania 100%
- badania statystyczne

- procesy masowe
- procesy ciągłe
- dużych serii

background image

3

MODELE

ZDETERMINOWANE

LOSOWE

zdarzenie A

zdarzenie B

zdarzenie A

zdarzenie B1

zdarzenie B2

funkcja

funkcja

funkcja

funkcja

prawdopodobie

prawdopodobie

prawdopodobie

prawdopodobieńńńństwa

stwa

stwa

stwa

S=V*t

S=V*t

S=V*t

S=V*t

zdarzenie B3

background image

4

modele

PROCES

POMIAR

ANALIZA

STATYSTYCZNA

WNIOSKOWANIE

właściwości procesu (cechy): średnica wałka, ciężar puszki,

%zawartości a w b

background image

5

Podział cech statystycznych:

cechy

cechy

cechy

cechy

mierzalne

mierzalne

mierzalne

mierzalne

jako

jako

jako

jakośśśściowe

ciowe

ciowe

ciowe

(niemierzalne)

(niemierzalne)

(niemierzalne)

(niemierzalne)

ciągłe

skokowe

(dyskretne)

porządkowe

nominalne

background image

6

– zbiór wszystkich zdarzeń elementarnych

A – zdarzenie

k – liczba zdarzeń sprzyjających zajściu A
m – liczba wszystkich możliwych

zdarze

ń

P(A) = k/m

Liczba wyrażająca przekonanie, że powtarzając proces

losowy wielokrotnie, otrzyma się określoną wartość
zmiennej losowej

Prawdopodobieństwo w ujęciu klasycznym

background image

7

Własności

1) P(A) ≥ 0

2) P(Ω) = 1

3) Jeżeli A

-1

jest zdarzeniem przeciwnym

do A (dope

ł

nieniem) to P(A) = 1 – P(A

-1

)

background image

8

 Zdarzenie elementarne

– konkretna realizacja zmiennej

losowej (np. wynik pomiaru)

 Populacja

– jest rozumiana jako zbiór wyników wszystkich

pomiarów, którymi jesteśmy zainteresowani.

 Próba

– jest podzbiorem wyników pomiarów pobranych z

populacji.

 Próba losowa

– pobieranie próby dokonuje się w sposób

losowy

,

tj. tak

,

aby każda możliwa próba składająca się z n

elementów miała taką samą szansę, że zostanie wybrana.

 Próba reprezentatywna

– próbka, której struktura pod

względem badanej charakterystyki nie różni się istotnie od
struktury populacji

Podstawowe pojęcia

background image

9

Opracowanie próby

 porządkowanie według wielkości
 określenie charakterystycznych punktów

zbioru:

– wartości granicznych

– środkowej wartości

– kwartyli

background image

1
0

Mediana

– le

ży w centrum zbioru w tym sensie, że połowa wyników

znajduje si

ę powyżej, a połowa poniżej jej wartości

(2. kwartyl)

(n+1)Pr/100

Dominanta

– warto

ść

modalna - jest

to

warto

ść, która w tym zbiorze

wyst

ępuje najczęściej

Średnia arytmetyczna (średnia klasyczna)

– zwan

ą także przeciętną jest sumą wartości wszystkich

wyników podzielon

ą przez licz

ebno

ść tego zbioru

M

iary tendencji centralnej:

background image

1
1

Mediana

dla zbioru o parzystej liczbie danych

dla zbioru o nieparzystej liczbie danych

1,2,3,4,190

ś

rednia = 40, mediana = 3

2

1

2

2

+

+

=

n

n

x

x

Me

2

n

x

Me

=

background image

1
2

Średnia arytmetyczna

pr

pr

pr

próóóóbbbb

a

::::

populacj

populacj

populacj

populacj

a

::::

n – liczebność próby

X – średnia z próby

s – odchylenie standardowe
próby

STATYSTYKI

N – liczebność populacji

µ – średnia z populacji

σ – odchylenie standardowe
populacji

PARAMETRY

background image

1
3

Średnia arytmetyczna

n

x

x

n

i

i

=

=

1

N

x

N

i

i

=

=

1

µ

śśśśrednia pr

rednia pr

rednia pr

rednia próóóóbbbby::::

śśśśrednia populacji:

rednia populacji:

rednia populacji:

rednia populacji:

background image

1
4

interpretacja średniej arytmetycznej:

 Średnia z danych streszcza wszystkie informacje w

nich zawarte:

– Może ona być uważana za punkt, w którym skoncentrowała

się cała masa wszystkich wyników obserwacji i który jest
środkiem ciężkości masy.

– Gdyby wszystkie wyniki obserwacji był jednakowe to każdy

z nich byłby równy średniej arytmetycznej.

– Wielkość abstrakcyjna.

background image

1
5

Zadanie 1:

Rozpatrzmy dwa zbiory danych:

Zbiór 1:

1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11

Zbiór 2:

4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8

Obliczyć: średnią zbiorów, medianę i dominantę

background image

1
6

background image

1
7

Miary rozrzutu

Rozstęp:

– w zbiorze wyników obserwacji rozstępem

nazywamy ró

żnicę pomiędzy wartością

najwi

ększą i najmniejszą

Wariancja:

– w zbiorze wyników wariancją nazywamy

przeci

ętne kwadratowe odchylenie

poszczególnych wyników od ich

średniej

Odchylenie standardowe

– pierwiastek kwadratowy z wariancji

background image

1
8

Wzory

Rozstęp

Wariancja

1

)

(

1

2

2

=

=

n

x

x

s

n

i

i

N

x

N

i

i

=

=

1

2

2

)

(

µ

σ

R = x

max

– x

min

pr

pr

pr

próóóóbbbby::::

populacji:

populacji:

populacji:

populacji:

background image

1
9

 Odchylenie standardowe

1

)

(

1

2

2

=

=

=

n

x

x

s

s

n

i

i

N

x

N

i

i

=

=

=

1

2

2

)

(

µ

σ

σ

w

pr

pr

pr

próóóóbbbbie::::

w

populacji:

populacji:

populacji:

populacji:

Zadanie 2

Obliczyć odchylenia standardowe danych z zadania 1

background image

2
0

Grupowanie danych - szeregi

 Najczęś

ęś

ęś

ęściej grupujemy dane w tak zwane szeregi:

Pozycyjny (n<30)

• (sortujemy dane rosnąco lub malejąco i zliczamy ile jest

elementów o tej samej wartości lub cesze)

Rozdzielczy (n≥30)

• dane grupujemy w klasy, czyli przedzia

ły o ustalonej

wielko

ści

• mo

żemy w ten sposób określić rozkład częstości danych w

poszczególnych klasach.

• wykres obrazuj

ący rozkład częstości nazywamy

histogramem

(wykres słupkowy).

Wysoko

ść słupka

reprezentuje cz

ęstość, z jaką pojawiły się wyniki obserwacji

nale

żące do klasy reprezentowanej przez słupek. Sąsiednie słupki

maj

ą wspólne boki.

background image

2
1

a

b

c

d

e

f

g

[1

,

4](4

,

7] …

(27

,

31]

Częstość

(liczebność)

Szerokość przedziału klasowego

Częstości odpowiadają

prawdopodobieństwu wystąpienia
wartości danej cechy i sumują się

do jedności

Wartości

cechy

background image

2
2

jak dobrać liczbę klas?

Liczność próbki

n

Ilość przedziałów

k

30

÷

50

6

÷

10

51

÷

100

7

÷

11

101

÷

200

8

÷

12

201

÷

500

9

÷

15

k

=1+3,32*logN

background image

2
3

Zmienne losowe

 cecha, którą obserwujemy (mierzymy) jest

zmienną losową

(np.

ś

rednica, masa)



zmienna losowa

- zmienna przyjmuj

ą

ca ró

ż

ne

warto

ś

ci liczbowe, wyznaczone przez los (30,6 ;

30,71 ; 30,78 ; 30,62 itd.)



rozkład prawdopodobie

ń

stwa zmiennej losowej

- przyporz

ą

dkowanie prawdopodobie

ń

stw

wszystkim mo

ż

liwym warto

ś

ciom zmiennej

losowej

 zmienne losowe –> model

– dyskretne – funkcja dyskretna (dwumianowy,

Poissona,…)

– ciągłe – funkcja ciągła (normalny, Weibula, itd.)

background image

2
4

Zmienna losowa skokowa (dyskretna)

Rozkładem prawdopodobieństwa zmiennej losowej
skokowej jest tablica, wzór lub wykres, który
przyporządkowuje prawdopodobieństwa każdej
możliwej wartości zmiennej.

Np.
P(X=x) = p

P(X=1) = 0,1

P(X=2) = 0,4

1

P(X=6) = 0,5

background image

2
5

Przykład

Liczba wad pojawiająca się na linii montażowej A

x

P(x) F(x)

0

1

2

3

4

5

0,1

0,2

0,3

0,2

0,1

0,1

0,1

0,3

0,6

0,8

0,9

1,0

1,0

0 1 2 3 4 5

0,1

0,2

0,3

P(x)

0 1 2 3 4 5

1

F(x)

P(1≤x≤3) = P(X=1)+P(X=2)+P(X=3) =F(3)-F(0)

= 0,8-0,1 = 0,7

P(x≤3) = F(3)

= 0,8

Dystrybuanta

zmiennej losowej

Gęstość prawdopodobieństwa

zm. losowej

background image

2
6

 dystrybuanta:

– skumulowana funkcja rozkładu zmiennej losowej:

F

(x) = P(X≤x) = ΣP(i) dla i≤x

background image

2
7

Rozkład dwumianowy:

Ciąg identycznych doświadczeń spełniających

następujące warunki:

• Dwa możliwe wyniki każdego doświadczenia: sukces i

porażka

• Prawdopodobieństwo sukcesu (p) pozostaje takie samo od

doświadczenia do doświadczenia. Prawdopodobieństwo
porażki q = 1-p.

• Doświadczenia są od siebie niezależne

• Liczba sukcesów opisana jest zmienną losową

dwumianową

Przykład rozkładu zmiennej losowej skokowej

Zmienna losowa dwumianowa

background image

2
8

Rozkład dwumianowy:

Doświadczenie polegające na 4 rzutach monetą.

1. Jakie jest prawdopodobieństwo otrzymania

dokładnie 3 orłów?

2. Jakie jest prawdopodobieństwo, że nie

wypadnie żaden orzeł?

3. Jakie jest prawdopodobieństwo, że wypadnie

co najmniej 1 orzeł?)

p - ?

x - ?

n - ?

Przykład rozkładu zmiennej losowej skokowej

P(X=3)

P(X=0)

P(X≥1) = 1 - P(X<1)

background image

2
9

Rozkład dwumianowy:

1.

W statystycznej kontroli jakości partia wyrobów zostaje

zaakceptowana jako dobra tylko wtedy, gdy liczba sztuk wadliwych w

stosunku do liczebności całej partii nie przekracza pewnej z góry

ustalonej wartości. Przypuśćmy, że w dużej partii wyrobów jest 20%

sztuk wadliwych. Pobrano z niej próbę liczącą 20 sztuk. Procedura

kontrolna przewiduje zaakceptowanie partii wyrobów tylko wtedy, gdy

nie więcej niż 2 sztuki wśród 20 okażą się wadliwe. Jakie jest

prawdopodobieństwo, że partia wyrobów

nie

zostanie zaakceptowana?

Przykład rozkładu zmiennej losowej skokowej

p = 0,2, q = 0,8

P(X>2) = 1 - P(X≤2) = 1 - P(X=0) - P(X=1) - P(X=2) = 1 – 0,0115 – 0,0576 – 0,137 =
= 0,793

background image

3
0

Rozkład dwumianowy:

2. Badania pracowników wykazały, że 70% z nich jest przekonanych, że
udział pracowników w zarządzaniu firmą podnosi jakość jej działania.
Jeżeli wybierze się losowo 15 pracowników, jakie jest prawdopodo-
bieństwo, że 3 spośród nich będzie podzielało przekonanie, iż udział
pracowników w zarządzaniu firmą podnosi jakość działania firmy?

3. Zarząd turystyki na wyspie Barbados przeprowadza cotygodniowe
wywiady z sześcioma losowo wybranymi turystami, pytając ich o
wrażenia z pobytu na wyspie. Wrażenia każdego turysty klasyfikuje się
jako pozytywne lub negatywne. Odpowiedzi zamieszcza się w
czasopiśmie „Visitor”. Przypuśćmy, że 5% wszystkich turystów
odwiedzających Barbados jest niezadowolonych z pobytu. Jakie jest
prawdopodobieństwo, że co najmniej dwóch spośród sześciu turystów, z którymi
przeprowadzono wywiady, wyrazi niezadowolenie?

Przykład rozkładu zmiennej losowej skokowej

background image

3
1

Zmienna losowa ciągła



funkcja rozkładu

(gęstości)

f(x

0

) = P(X=x

0

)



dystrybuanta

F(x

0

) = P(X≤x

0

)

x

0

f(x

0

)

x

0

F(x

0

)

x

0

F(x

0

)

1

Rozkład dyskretny – dystrybuanta = suma
prawdopodobieństw poszczególnych słupków
Rozkład ciągły – dystrybuanta = pole pod krzywą
gęstości

background image

3
2

Funkcja gęstości prawdopodobieństwa
a dystrybuanta ciągłej zmiennej losowej

Odcinek =

prawdopodobieństwu

0,8

0,3

0,5

Pole pod krzywą =

całka oznaczona z

funkcji gęstości

prawdopodobieństwa

=

prawdopodobieństwu

background image

3
3

Rozk

łłłład normalny (Gaussa)

 Rozkład normalny jest rozkładem, do którego dąży m.in.

rozk

ład dwumianowy gdy liczba doświadczeń n wzrasta

 Okazuje się, że rozkład normalny jest rozkładem granicznym

wielu innych rozk

ładów, w sytuacjach gdy ujawniają się

skutki przypadkowych czynników pochodz

ących z różnych

źródeł

2

σ

2

)

µ

x

(

e

π

2

σ

1

)

x

(

f

=

2

background image

3
4

Rozkład normalny o różnych wartościach
średniej i odchyleni

a standardowego

x

f(

x

)

x

f(

x

)

x

f(

x

)

1

=

σ

40

=

µ

15

=

µ

50

=

µ

5

=

σ

3

=

σ

Parametry rozkładu:

µ – wartość oczekiwana

σ – odchylenie
standardowe

Odległość od (0,0))

background image

3
5

STANDARYZOWANY ROZKŁAD NORMALNY

 Ponieważ istnieje nieskończenie wiele normalnych

zmiennych losowych, jedn

ą z nich wybieramy aby

s

łużyła jako pewien standard. Została ona stablicowana

i obliczono prawdopodobie

ństwa przyjmowania przez

ni

ą określonych wartości.



µµµµ

=0,

σσσσ

= 1

2

2

2

1

)

(

z

e

z

f

=

π

background image

3
6

standaryzacja

µ

= 0

σ

= 1

µ

0

= -0,042

σ

0

= 1,91

GLT

DLT

x

2

=2,5

x

1

=2,5

u

1

u

2

P(X>x

2

)

P(X<x

1

)

transformacja: (x

2

-

µ

0

)/

σ

0

P(U>u

2

)

P(U>u

1

)

P(X<x

1

) = P(U<u

1

)

P(X>x

2

) = P(U>u

2

)

P(U<u

1

)

background image

3
7

Prawdopodobieństwo wystąpienia zmiennej losowej
standaryzowanej w określonych przedziałach

background image

3
8

Tablice standaryzowanego rozkładu normalnego
– jak je czytać?

P(U>u)

Dopełnienie
dystrybuanty

background image

3
9

Dodawanie zmiennych A i B o rozkładach
normalnych

A --- N(µ

1

,

σ

1

)

B --- N(µ

2

,

σ

2

)

Z = A+B --- N( µ

1

2

,

σ

1

2

+

σ

2

2

)

background image

4
0

zadanie 1:

Włoski producent samochodów jest przekonany, że
liczba kilometrów, które można przejechać na
jednym z jego silników, ma rozkład normalny ze
średnią 160 000 km i odchyleniem standardowym
30 000 km. Jakie jest prawdopodobieństwo, że
silnik tego typu wytrzyma przebieg między 100 000
km a 180 000 km, zanim trzeba go będzie
wymienić?

P ≈ 0,72

background image

4
1

zadanie 2:

Producent dostarcza kulki do myszy komputerowych
o średnicy charakteryzującej się rozkładem
normalnym o następujących parametrach

µ

= 5,25 i

σ

= 0,12.

Odbiorca jest zainteresowany kulkami o średnicy
mieszczącej się w przedziale: GLT (górna linia
tolerancji) = 5,30 i DLT (dolna linia tolerancji) =
5,00.

Jaka jest frakcja kulek nie spełniających wymagań
odbiorcy?

P ≈ 0,36

background image

4
2

zadanie 3:

Tygodniowa wielkość sprzedaży zupy w puszkach
firmy Winiary w sklepie spożywczym rozkłada się
normalnie ze średnią 2450 puszek i odchyleniem
standardowym 400 puszek.
Właściciel sklepu chce znaleźć dwie takie liczby,
położone symetrycznie po obu stronach średniej, by
istniało prawdopodobieństwo 0.95, że tygodniowa
sprzedaż znajdzie się między tymi liczbami.
Tego rodzaju wiadomość będzie dla niego przydatna
przy ustalaniu wielkości zamówień i zapasów.

Właściciel może mieć 95% pewności, że wielkość sprzedaży zup w
proszkach w dowolnym tygodniu będzie się mieściła w przedziale
1666 a 3234 puszki.

background image

4
3

zadanie 4:

Część X powinna być wykonana z tolerancją
wymiaru A wynoszącą +/-20 jednostek. W wyniku
pomiarów dużej próby okazało się, że wymiar A ma
rozkład normalny N(-4, 4).
Jeśli warunki prowadzenia procesu wytwarzania
części A nie ulegną zmianie, jaka frakcja części X
ma wymiar A:
większy od wymaganego,
mniejszy od wymaganego,
w przedziale (-10, +10)

background image

4
4

zadanie 5:

W województwach A i B zbadano roczną liczbę
opadów.

Okazało się, że zarówno w jednym jak i w drugim ilość
opadów podlega rozkładowi normalnemu.

Dla województwa A: N(120, 12) , a dla B: N(180, 16).

Jakie jest prawdopodobieństwo, że ciągu roku łączna
ilość opadów w obu województwach będzie niższa niż
300?


Wyszukiwarka

Podobne podstrony:
6 Statystyka w badaniach Rozkład normalny
Statystyka opisowa - rozkład jednej cechy - powtórkowe, Przydatne Studentom, Akademia Ekonomiczna Kr
4 statystyka opisowa rozkładu empirycznego
tablice statystyczne dystrybuanta rozkladu normalnego
statystyka wykłady, Wyklad5-6, Rozkład normalny
tablice statystyczne wartosci krytyczne rozkladu normalnego
4 Rozklad normalny, STUDIA, SEMESTR IV, Statystyka matematyczna i planowanie eksperymentu, SMiPE
Rozkład wielkości odszkodowań, Statystyka Opisowa UG
rozkład normalny, Tż, Statystyka
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 3 Rozkład normalny
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 6 Rozkład normalny i prawd
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 9b Rozkład normalny
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Rozkład normalny i prawd

więcej podobnych podstron