Kurs obs艂ugi programu PASW Statistics
Tworzenie i importowanie zbior贸w danych
Autor: dr Joanna Kar艂owska-Pik, dr Dorota Juszczak
Tworzenie zbior贸w danych
Pliki tworzymy wybieraj膮c Plik -> Nowy -> Dane.... Pliki danych zapisujemy z rozszerzeniem *.sav.
膯wiczenie 1. Utw贸rz w艂asny plik sklep.sav zawieraj膮cy dane dotycz膮ce sprzeda偶y 10 produkt贸w prowadzonego przez Ciebie sklepu. Plik powinien zawiera膰 nast臋puj膮ce zmienne: nazw臋 produktu, kategori臋 (np. 1 - warzywa, 2 - owoce krajowe, 3 - owoce po艂udniowe), dat臋 ostatniej dostawy, cen臋 netto (za jednostk臋), liczb臋 sztuk/wag臋, stawk臋 podatku VAT.
膯wiczenie 2. Utw贸rz w艂asny plik uczniowie.sav zawieraj膮cy dane 10 uczni贸w bior膮cych udzia艂 w badaniu. Plik powinien zawiera膰 nast臋puj膮ce dane: nazwisko ucznia, imi臋 ucznia, dat臋 urodzenia, wiek w momencie przeprowadzania wywiadu, p艂e膰 (dziewczynka, ch艂opiec), typ szko艂y (np. 1 - podstawowa, 2 - gimnazjum, 3 - 艣rednia).
Import danych z plik贸w tekstowych
Otwieramy dany plik np. w Notatniku, aby pozna膰 jego struktur臋. Zamykamy plik.
Wybieramy w PASW Statistics: Plik -> Czytaj dane tekstowe..., otwieramy 偶膮dany plik.
Uruchamia si臋 Kreator importu tekstu, w kt贸rym odpowiadamy na kolejne pytania i klikamy Dalej. U do艂u mamy podgl膮d, w jaki spos贸b przy aktualnych ustawieniach wczyta si臋 plik.
膯wiczenie 3. Zaimportuj do arkusza danych SPSSa plik tekstowy demo.txt. Plik ten zawiera sze艣膰 kolumn danych oddzielonych od siebie znakiem tabulacji. Dane maj膮 posta膰 liczb dziesi臋tnych z co najwy偶ej 10 miejscami po przecinku. Nazwy zmiennych s膮 sprecyzowane w pierwszym wierszu (year - rok, qtr - kwarta艂, gdp - produkt krajowy brutto, pr - indeks cenowy, m1 - oszcz臋dno艣ci, rs - oprocentowanie inwestycji kr贸tkoterminowych). Pierwsza obserwacja znajduje si臋 w drugim wierszu.
膯wiczenie 4. Wczytaj dane umieszczone w pliku band.txt, kt贸ry zawiera dane dotycz膮ce sprzeda偶y p艂yt CD zespo艂u muzycznego. Plik ten zawiera 4 kolumny danych oddzielone od siebie spacjami. Nazwy zmiennych znajduj膮 si臋 w pierwszym wierszu (sales - wielko艣膰 sprzeda偶y p艂yt CD, performances - liczba koncert贸w, web - liczba pobra艅 wersji demo ze strony internetowej, flyers - liczba wys艂anych ulotek promocyjnych). Wyspecyfikuj zmienne.
膯wiczenie 5. Wczytaj dane umieszczone w dwudziestu pierwszych wierszach pliku tax.txt. Plik ten zawiera 4 kolumny danych oddzielone od siebie spacjami. Nazwij poszczeg贸lne zmienne (inc88 - doch贸d firmy w 1988, tax88 - podatki w 1988, inc89 - doch贸d firmy w 1989, tax89 - podatki w 1989) i wyspecyfikuj je.
Import danych z plik贸w formatu Excel
Otwieramy zadany plik w programie Excel, aby pozna膰 jego struktur臋. Zamykamy plik.
Wybieramy w PASW Statistics: Plik -> Otw贸rz ->Dane..., zmieniamy na dole ustawienie na Pliki typu: Excel i otwieramy 偶膮dany plik.
Pojawia si臋 okno dialogowe, w kt贸rym nale偶y zaznaczy膰, czy w oryginalnym pliku nazwy zmiennych znajdowa艂y si臋 w pierwszym wierszu danych, wybra膰 odpowiedni arkusz pliku *.xls i ewentualnie poda膰 zakres danych, kt贸re chcemy wczyta膰. Klikamy OK.
Specyfikujemy zmienne.
膯wiczenie 6. Wczytaj dane z pliku vacation.xls utworzonego w programie Excel, kt贸ry zawiera dane dotycz膮ce wyjazd贸w wakacyjnych. Plik ten zawiera 4 kolumny danych, kt贸re oznaczaj膮: odleg艂o艣膰 od miejsca zamieszkania, doch贸d, wiek, liczb臋 dzieci. Nazwy zmiennych nie s膮 sprecyzowane, w pierwszym wierszu znajduje si臋 pierwsza obserwacja.
Wczytywanie danych z baz danych
Otwieramy baz臋 w programie Microsoft Access, aby obejrze膰 jej struktur臋. Zamykamy.
Wybieramy Plik -> Przejmij baz臋 danych -> Nowa kwerenda....
Otwiera si臋 Kreator przejmowania baz danych. Spo艣r贸d zdefiniowanych 藕r贸de艂 baz danych wybieramy MS Access Database, klikaj膮c dwukrotnie myszk膮.
W oknie, kt贸re si臋 pojawi, klikamy Przegl膮daj... i wczytujemy 偶膮dan膮 baz臋 danych. Klikamy OK.
Po zaznaczeniu na dole opcji Tabele pokazuj膮 si臋 mo偶liwe do wyboru tabele bazy danych. Klikaj膮c na znak + przy nazwie tabeli, mo偶emy otrzyma膰 list臋 zmiennych tej tabeli. Zaznaczamy i przerzucamy do okna z prawej strony ca艂膮 tabel臋 lub wybrane zmienne. Klikamy Dalej.
W nast臋pnym kroku mo偶emy zdecydowa膰, kt贸re obserwacje wczytujemy. Mo偶emy zada膰 jaki艣 warunek z u偶yciem funkcji i dost臋pnych zmiennych oraz wczyta膰 losow膮 pr贸bk臋 spo艣r贸d dost臋pnych obserwacji. Klikamy Dalej.
Specyfikujemy zmienne. Zmienne tekstowe mo偶na przekodowa膰 na numeryczne. Klikamy Dalej.
Otrzymujemy zapytanie w j臋zyku SQL, kt贸re mo偶emy wykona膰 lub zapisa膰 w oknie polece艅. Mo偶emy r贸wnie偶 zapisa膰 kwerend臋 w pliku .spq (kwerenda PASW Statistics) lub jako plik danych .sav.
Uwagi:
Pliki zapisane jako pliki baz danych programu PASW Statistics mo偶na edytowa膰: Plik -> Przejmij baz臋 danych -> Edytuj kwerend臋..., lub otwiera膰: Plik -> Przejmij baz臋 danych -> Uruchom kwerend臋...
Przy losowym wybieraniu zadanego procenta obserwacji nale偶y zapisa膰 polecenie w oknie polece艅 i w u艂amku dziesi臋tnym wyra偶aj膮cym zadany procent zmieni膰 przecinek na kropk臋. (Dotyczy wersji 18.0.1 i wcze艣niejszych).
Generator liczb losowych u偶ywany przy losowaniu ma ustalony punkt startowy, co zapewnia powtarzalno艣膰 losowania. Mo偶na go jednak zmieni膰, wybieraj膮c Przekszta艂cenia -> Generatory liczb losowych... i w polu Inicjalizacja aktywnego generatora zaznaczaj膮c Ustaw punkt startowy.
Kreator zapami臋tuje ostatni膮 baz臋 danych, kt贸r膮 wczytywa艂e艣. Je艣li chcesz uruchomi膰 inn膮 baz臋 danych ni偶 ostatnio u偶ywan膮, zamknij program lub kliknij na Pliki programu dBase, je艣li nie ma tego typu baz, kliknij OK i wtedy wczytaj wybran膮 baz臋 mdb.
膯wiczenie 7.
Wczytaj baz臋 demo.mdb do PASW Statistics. Spo艣r贸d 1000 pierwszych os贸b, kt贸rych samoch贸d nale偶y do kategorii 3 (luksusowe), wybierz losowo 10. Zapisz plik jako demo.spq. Nast臋pnie edytuj kwarend臋 i zmie艅 wybrane osoby na te, kt贸rych samoch贸d nale偶y do kategorii 2.
Otw贸rz baz臋 demo2.mdb. Zawiera ona dwie tabele: demo i KlasaSmochodu oraz kwerend臋 demo. Zamknij baz臋 danych i uruchom Kreator przejmowania baz danych. Po otwarciu bazy przerzu膰 do prawego okna obie tabele. Nast臋pnie zaznacz relacj臋 mi臋dzy nimi: zmiennej CARCAT z tabeli demo odpowiada zmienna id z tabeli KlasaSamochodu. Zaznacz obie zmienne, trzymaj膮c klawisz Ctrl i kliknij Po艂膮cz. Nast臋pnie wybierz losow膮 pr贸b臋 10% obserwacji z grupy respondent贸w, kt贸rzy nie przekroczyli 50. roku 偶ycia. Plik zapisz jako demo2.spq. Wczytaj go jako plik .sav.