Analiza wielowymiarowa

Zagadnienia.

1. Testowanie wartości średnich dla wektora losowego.

Zadanie

W pliku statedata wybrać zmienne Income, Life. Exp, HS.Grad i sprawdzić, czy średnie tych trzech zmiennych są równe wektorowi (5555, 71, 40)…

2. Testowane równości średnich w n-populacjach. Założenia: ,Analiza kontrastów, Interakcje, Testy post hoc

3. Regresja liniowa:

• Budowa modelu (regresja krokowa, postępująca, wsteczna)

• Ocena modelu (miary dopasowania, analiza reszt)

• Analiza obserwacji odstających (odległość Cooka, „reszta usunięta”)

• Interpretacja parametrów modelu

• Predykcja na podstawie modelu

Zadanie:

Otworzyć plik danych statedata,

• zbudować model regresji, w którym zmienną objaśnianą jest oczekiwana długość życia, wszystkie zmienne są statystycznie istotne przy 8% poziomie istotności

• Przeprowadzić regresję krokową wsteczną

• Zinterpretować parametr przy „najbardziej istotnej zmiennej”

• Sprawdzić czy występują obserwacje odstające – wykorzystać odległość Cooka

• Wyznaczyć „prognozę” dla stanu, w którym zmienne przyjmują wartości Population Income

Illiteracy Life.Exp

Murder

HS.Grad Frost

Area

3000

4000

2,1

15,1

41,3

20

50708

4. modele dla danych binarnych (model logitowy, model probitowy) – budowa modelu, ocena interakcji, interpretacje parametrów modelu, ocena modelu – procent trafnych prognoz, predykcja

Zadanie:

W pliku praca bezrobocie, zbudować model logitowy, zinterpretować parametry modelu, ilorazy szans, ocenić jego jakość dopasowania – procent trafnych prognoz 5. Analiza dyskryminacyjna – budowa modelu – ustalenie ważności zmiennych, założenia, klasyfikacja