Ocena zależności

Zadanie 1

Na podstawie podanego rozkładu zmiennej losowej dwuwymiarowej (X,Y), proszę: a) Wyznaczyć wartość c;

b) wyznaczyć rozkłady brzegowe zmiennych;

c) Wyznaczyć parametry rozkładów brzegowych;

d) Wyznaczyć parametry rozkładu łącznego;

e) Wyznaczyć rozkład warunkowy X|Y=3 oraz parametry tego rozkładu.

Y

1

3

5

X

0

0,1

0,1

c

2

0,2

0,1

0

4

0

0,2

0,1

f) Wyznaczyć rozkład warunkowy X|Y=3 oraz parametry tego rozkładu; g) Co można powiedzieć o zależności stochastycznej badanych cech; h) Określić siłę zależności korelacyjnej posługując się współczynnikiem korelacji liniowej.

Zadanie 2

Proszę wyznaczyć liczebności rozkładu łącznego, jeżeli wiadomo, że V=0 i liczebności brzegowe wynoszą odpowiednio:

a) Dla cechy X: 30, 50, 20.

b) Dla cechy Y: 50, 30, 20;

Zadanie 3

Przeprowadzono badanie opinii publicznej dotyczące poparcia dla posłanki Renaty B. oraz miejsca zamieszkania respondentów. Wyniki kształtowały się następująco: poparcie

popieram

nie

brak

miejsce

popieram

zdania

zamieszkania

miasto

30

80

10

wieś

70

40

20

a) Czy na podstawie powyższych informacji można twierdzić, że istnieje zależność stochastyczna między miejscem zamieszkania a poparciem dla Renaty B.? Przyjmij poziom istotności 0,05.

b) Oceń siłę tej zależności w badanej próbie.

Zadanie 4

W 120 osobowej grupie aktywnych zawodowo mieszkańców jednego z województw zbadano zależność pomiędzy miejscem zamieszkania i posiadaniem samochodu osobowego, otrzymując następujące wyniki:

Miejsce zamieszkania

posiada

nie posiada

Miasto

25

35

Wieś

35

25

Na poziomie istotności 0,01 zweryfikować hipotezę o niezależności stochastycznej między badanymi cechami.

1

Zadanie 5

Badając związek miedzy miejscem zamieszkania i wydatkami na rozrywkę i kulturę ( w zł) uzyskano na podstawie 1000 – elementowej próby losowej następującą postać tablicy korelacyjnej:

Kategorie cech

Wydatki w zł:

0-20

20-40

40-60

60-80

Wieś

100

20

0

0

Miejscowość o liczbie mieszkańców do 75 000

80

220

100

60

Miejscowość o liczbie mieszkańców powyżej 75 000

0

0

200

220

Określić siłę zależności statystycznej badanych cech. Czy zależność ta jest istotna?

Zadanie 6

Wylosowano grupę 200 osób, a następnie zbadano zależność pomiędzy ich płcią (x), a faktem posiadania przez nich prawa jazdy (y).Sprawdź hipotezę o stochastycznej niezależności pomiędzy badanymi zmiennymi, wiedząc, że współczynnik V- Cramera przyjął dla tej próby wartość 0,2 (przyjąć poziom istotności 0,05).

Zadanie 7 (5.3.1 ze zbioru)

OECD podaje dane dla wybranych krajów o wydatkach na szkolnictwo wyższe oraz wysokości nakładów na jednego studenta w 2000 roku:

Kraj

Wydatki [%PKB]

Nakłady [$/studenta]

USA

1,1

20358

Szwajcaria

1,2

18450

Szwecja

2,0

15097

Holandia

1,3

11934

Japonia

0,5

10914

Niemcy

1,1

10898

Austria

1,4

10851

Francja

1,0

8373

Włochy

0,8

8065

Polska

0,2

1235

a) Jaka jest kolejność państw w każdym z ciągu danych?

b) Wyznaczyć współczynnik korelacji rang Spearmana i zinterpretować jego wynik.

Zadanie 8

W celu zbadania zależności pomiędzy wysokością płacy a długością stażu w firmie wylosowano 5 pracowników. Na podstawie poniższych informacji należy stwierdzić czy zależność taka istnieje oraz wyznaczyć jej siłę i kierunek. Czy na poziomie istotności 0,05

zależność ta jest istotna w populacji pracowników jeżeli rozkład stażu pracy w firmie i zarobków pracowników mają rozkład normalny?

Staż pracy

1

1,5

2,5

3

2

Płaca

800

2500

2000

3000

1500

2

Zadanie 9

Wysokość kosztów (x) oraz miesięcznych zysków (y) uzyskanych przez firmę w sześciu wybranych losowo miesiącach (mln USD) przedstawiono w zestawieniu: x

10

9

7

5

3

2

y

3

7

9

8

12

15

Określ siłę zależności pomiędzy zmiennymi, wiedząc, że sx= 3,22 oraz sy = 4,15. Czy badaną zależność można uznać za istotnie ujemną (przyjąć α = 0,05) jeżeli miesięczne koszty i zyski firmy mają rozkład normalny?

Zadanie 10

Zbadano 180 hurtowni ze względu na: x - liczbę zatrudnionych osób i y -wartość sprzedaży (tys.zł). Uzyskano następujące informacje: ∑xi = 1440; ∑yi = 32,4; ∑xiyi =11000; Sx= 8; Sy=35. Ocenić siłę zależności wartości sprzedaży względem liczby zatrudnionych. Czy zależność ta jest istotna na poziomie istotności 0,05? Jakie założenia należy poczynić w celu sprawdzenia istotności zależności?

Zadanie 11

W oparciu o informacje ustalone dla 100 losowo wybranych studentów, dotyczące liczby egzaminów w sesji letniej (x) i liczby wizyt w kinie w maju br. zbadaj istotność tego związku dla ogółu studentów. Przyjąć poziom istotności 0,01. Jeżeli wymaga tego metoda, zapisz stosowne założenia.

L.wizyt w kinie 0

1

2

L.egzaminów

4

0

20

10

5

20

20

0

6

20

10

0

Zadanie 12

120 losowo wybranych osób zapytano o wydatki (w zł) na prasę w ciągu ostatniego miesiąca (X) oraz o to, czy w ubiegłym roku przeczytały przynajmniej jedną książkę (Y). Dane zostały pogrupowane według przedziałów klasowych cechy X : 0–10; 10-20; powyżej 20 oraz cechy Y: tak; nie. Na podstawie uzyskanych odpowiedzi wyznaczono współczynnik V-Cramera

=0,28.

a) Czy związek miedzy zmiennymi można uznać za statystycznie istotny (dla α=0,01)?

b) Uzasadnić, czy charakter cech X i Y pozwala wykorzystać do oceny siły zależności współczynnik korelacji liniowej Pearsona r ?

Dodatkowe zadania do rozwiązania w domu:

Zbiór zadań:

▪ dwuwymiarowa zmienna losowa:1.3.2-1.3.4; 1.3.1, 1.3.5, 1.3.6.

▪ ocena zależności w rozkładach empirycznych: 5.2 (przykład); 5.2.2; 5.2.4; 5.3.1; 5.3.3; 5.3.5; 5.3.6; 5.5.1

3