Polecenia
Plik credscore.gdt zawiera 100 obserwacji na następujących zmiennych:
Y - zmienna 0-1 przyjmująca wartość 1, jeśli wniosek o kredyt hipoteczny został rozpatrzony pozytywnie;
wiek - wiek osoby ubiegającej się o kredyt hipoteczny
praca - zmienna przyjmuje wartość 1, jeśli osoba pracuje w firmie prywatnej i 0 w przeciwnym przypadku
d - dochód za poprzedni rok (zmienna, której wpływ jest nieistotny; eliminujemy ją ex post)
oszacować dla tych danych liniowy model prawdopodobieństwa, model probitowy i model logitowy;
zinterpretować oceny parametrów i efekty krańcowe dla średnich (np. odpowiedzieć na pytania: O ile procent średnio zmienia się iloraz szans uzyskania kredytu wraz z każdym rokiem? O ile procent różnią się prawdopodobieństwa uzyskania kredytu dla osób pracujących w firmach prywatnych i państwowych (w okolicy wartości średnich w próbie)?
wykorzystując oceny modelu logitowego wyznaczyć przybliżone oceny parametrów pozostałych dwu modeli i ocenić jakość tej aproksymacji;
na podstawie każdego z tych modeli ocenić, jakie jest prawdopodobieństwo, że osoba w wieku 30 lat, pracująca w firmie prywatnej uzyska kredyt; jaka wobec tego jest prognoza?
ocenić dopasowanie modeli do danych empirycznych, w tym wyznaczyć odpowiednie współczynniki korelacji i zliczeniowe R2.
2. Dla danych w pliku dane_6_2 oszacować LMP, model logitowy i model probitowy opisujące prawdopodobieństwo posiadania domu jako funkcję wysokości dochodu. Sporządzić wykresy punktów
i porównać ich położenie z punktami
.
3. Na podstawie danych z pliku work.gdt zawierających informacje pochodzące od 5299 osób oszacować liniowy model prawdopodobieństwa, model probitowy i model logitowy opisujący prawdopodobieństwo wykonywania pracy zarobkowej w zależności od płci i liczby lat nauki:
Working - zmienna 0-1 przyjmująca wartość 1 w przypadku, gdy osoba pracuje zarobkowo;
Male - zmienna 0-1 przyjmująca wartość 1, jeśli osoba jest mężczyzną;
S - liczba lat nauki.
zinterpretować oceny parametrów i efekty krańcowe dla średnich. O ile procent średnio zwiększa się iloraz szans, że osoba podejmie pracę wraz z wydłużeniem okresu nauki o 1 rok? Jakie są różnice w prawdopodobieństwie bycia zatrudnionym w przypadku kobiet i mężczyzn?
na podstawie każdego z tych modeli ocenić, jakie jest prawdopodobieństwo, że kobieta, która dokumentuje 21 lat nauki, jest osobą pracującą zarobkowo? Jak wygląda odpowiednie prawdopodobieństwo w przypadku mężczyzny?
ocenić dopasowanie modeli do danych empirycznych, w tym wyznaczyć odpowiednie współczynniki korelacji i zliczeniowe R2. Który z modeli najlepiej opisuje zmienną zależną?
4. Plik dane_6_3 zawiera dane 40 klientów pewnego banku. Zmienna cenzurowana Y to wysokość inwestycji w pewnym funduszu (20 wartości dodatnich i 20 zerowych), zaś zmienna objaśniająca X to wiek klienta;
oszacować na podstawie tych danych model liniowy (KMNK) oraz model tobitowy.
Sprawdzić efektywność aproksymacji parametru 1 z modelu liniowego za pomocą oceny tego parametru w modelu zmiennej cenzurowanej.
Zinterpretować parametr modelu tobitowego.
5. Uzasadnić wyrażenie na efekty krańcowe:
gdzie ϕ to funkcja gęstości standardowego rozkładu normalnego.