bazy danych, Pomoce naukowe, studia, informatyka


Materiały pomocnicze do przedmiotu

BAZY DANYCH

LITERATURA do przedmiotu "Bazy danych" (podstawowa)

  1. J. Kisielnicki, H. Sroka :Systemy informacyjne biznesu. Metody projektowania i wdrażania systemów. Agencja wydawnicza PLACET. Warszawa 1999.

  2. Paul Beynon-Davies. Systemy baz danych. WNT. Warszawa 1998.

  3. J. Martin. Organizacja baz danych. Warszawa 1983

WSTĘP

Dane - wartości przechowywane w bazie, niezrozumiałe bez odpowiedniej interpretacji (wiek? czy waga?)

Informacje - dane przetworzone, zrozumiałe dla użytkownika

Bazy danych dynamiczne - operacyjne - wykorzystywane w codziennym funkcjonowaniu firm, tam gdzie mamy do czynienia z gromadzeniem, przechowywaniem i modyfikowaniem danych.

Dane są dynamiczne, bo ulegają ciągłym zmianom i odzwierciedlają aktualny stan jakiegoś obiektu. (obsługi pacjentów, zamówień, prenumeratorów).

Bazy danych statyczne - analityczne - wykorzystywane do przechowywania danych historycznych (do analizy zmian zjawisk w czasie ).

Dane są statyczne, co oznacza, że rzadko się zmieniają, odzwierciedlają stan obiektu w określonym momencie czasu (próbki, dane statystyczne).

Krótka historia

Dane są elementem majątku organizacji.

Dane od zawsze były gromadzone w organizacjach w postaci różnego rodzaju kartotek. Dawniej były one obsługiwane ręcznie lub automatycznie, obecnie w większości przypadków wykorzystuje się w tym celu sprzęt komputerowy.

Etapy rozwoju systemów baz danych - (rozwój systemów baz danych był związany z ogólnym rozwojem technologii komputerowych)

  1. Etap pierwszy - tradycyjny

  1. Etap drugi - uwarunkowany rozwojem sprzętu, zwłaszcza pamięci o dostępie bezpośrednim

  1. Etap trzeci - powstanie SZBD (System Zarządzania Bazą Danych)

  1. Etap czwarty- wyodrębnienie:

Obecnie są wykorzystywane głównie technologie, które można zaliczyć w większości do etapu trzeciego, a czasem do czwartego.

Na tym etapie wykładu celowym wydaje się zdefiniowanie pojęcia - „baza danych”.

W literaturze spotykamy się z różnym rozumieniem tego pojęcia:

Administrowanie danymi a administrowanie bazą danych

Administrowanie danymi jest funkcją, związaną z zarządzaniem, planowaniem i dokumentowaniem zasobów danych organizacji. Kluczową ideą koncepcji administrowania danymi jest spostrzeżenie, że dane, podobnie jak kapitał, kadry powinny być traktowane jako zasoby wymagające zarządzania. W tym sensie funkcja administrowania danymi jest widziana jako podstawowa część strategii zarządzania informacjami organizacji.

Zbiór czynności, za które jest odpowiedzialny administrator danych:

  1. Konsultacja - na temat wszystkich aspektów związanych z metadanymi organizacji (dane na temat danych)

  2. Zbiorowa świadomość - informowanie na temat znaczenia danych, dostępu do nich, i celu dla jakiego są przechowywane

  3. Wymagania dotyczące danych - tworzenie ogólnej architektury danych w organizacji.

  4. Analiza danych - -używanie metodyki analizy danych do tworzenia biznesowych modeli danych

  5. Kontrola danych - implementowanie standardów zapewniających kontrolę dostępu do danych

  6. Definicja danych - standardy

  7. Integralność danych

  8. Prywatność danych - czuwanie nad tym aby organizacja działała zgodnie z prawem dotyczącym państwowych przepisów na temat danych

  9. Współdzielenie danych - między aplikacje.

Potrzeba administrowania danymi:

  1. W tej samej organizacji jest tworzonych wiele aplikacji, które używają różnych definicji tych samych danych

  2. Dane trzymane przez wiele różnych aplikacji są niespójne

  3. Osoby podejmujące decyzje w organizacji otrzymują niezgodne między sobą dane pochodzące z różnych źródeł tej samej organizacji.

  4. Osoby podejmujące decyzje w organizacji dane za późno, aby móc je użyć

  5. Osoby podejmujące decyzje w organizacji za dużo nieistotnych danych

  6. Istnieją zauważalne braki w danych zebranych w organizacji

  7. Działy w organizacji nie mają jasnego wyobrażenia, po co zbierają pewne dane.

Trudności w administrowaniu danymi

Miejsce funkcji administrowania danymi w organizacji. Zwykle w dziale systemów informacyjnych, ponieważ jest zadaniem związanym z przetwarzaniem danych

Administrowanie bazą danych:

Podstawowe funkcje administratora bazy danych:

  1. Archiwowanie danych (strategia archiwowania)

  2. Tworzenie kopii zapasowych i odtwarzanie danych (np.: w wypadku awarii sprzętu)

  3. Kontrola danych (grupy, hasła, dostęp)

  4. Standardy danych

  5. Szacowanie wpływu zmian na użycie danych trzymanych w systemie baz danych

  6. Monitorowanie na bieżąco działania systemu

  7. Projektowanie fizyczne bazy

  8. Zapewnienie prywatności, bezpieczeństwa i integralności danych na poziomie fizycznym

  9. Szkolenie użytkowników

Wymagania stawiane systemom z bazą danych:

RELACYJNE BAZY DANYCH

Historyczny rozwój logicznych modeli baz danych

  1. Model hierarchiczny

  1. Model sieciowy

  1. Model relacyjny - cechy podstawowe

  1. Model obiektowy

Relacyjne bazy danych - pojęcia podstawowe

Tabela INWENTARZ

Kod części Opis Ilość Cena hurtowa Cena detaliczna

0x08 graphic
XG 12

Gwóźdź

47

0,52

1,35

0x08 graphic
C1 - 98

Gniazdo nr 4

3

16,73

26,98

0x08 graphic
W2A

Kosz

5

9,38

14,95

0x08 graphic
KL7

Śruba nr 4

62

0,12

0,67

0x08 graphic
AT8E

Śruba nr 5

38

0,08

0,21

0x08 graphic
MVP8

Wkręt okrągły

4

7,88

15,00

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

Pola Rekordy

Pole - (atrybut) - najmniejsza wyróżniona struktura w logicznej bazie danych. (Nazwy pól nigdy nie są częścią danych, służą jedynie jako etykiety pól.)

Rekord - (krotka) - reprezentuje pojedynczą instancję. Rekord zawiera pełny opis wszystkich pól.

Tabela - składa się z logicznej kombinacji pól i rekordów, których kolejność jest obojętna. Tabela może dotyczyć:

Relacja - logiczne powiązanie między tabelami, realizowane poprzez klucze lub tabele łączące.

Klucz - pole zawierające dla każdego rekordu unikatową wartość (np. Kod części)

Informacje na temat tabeli:

Nazwy przypisywane tabelom powinny spełniać pewne kryteria:

Każda tabela powinna być określona przez trzy parametry:

Nazwa tabeli

Typ tabeli

Opis tabeli

W zależności od pełnionej przez tabele funkcji mogą wystąpić poniższe typy (na tym etapie projektowania bazy danych będzie występował tylko pierwszy typ „dane”, kolejne pojawią się pózniej:

  • Dane - przechowuje dane opisujące jeden temat i jest wykorzystywana do generowania informacji

  • Połączenie - do łączenia dwóch tabel między którymi występuje relacja wiele_do_wiele

  • Podzbiór - opisujące poddtemat „tabeli-matki” w bardziej szczegółowy sposób

  • Tabela walidacji - do zapewnienia integralności danych

  • Powinien w zwięzły i przejrzysty sposób określać cel stworzenia takiej tabeli i jej znaczenie dla organizacji (jeśli są trudności ze stworzeniem takiego opisu, to należy się zastanowić czy taka tabela jest potrzebna)

  • Opis nie powinien być uzależniony od innych opisów tabel

  • W opisie nie powinny się pojawiać konkretne przykłady.

Informacje na temat pól:

Każde pole należy poddać analizie, czy spełnia kryteria stawiane „polu doskonałemu”

Jeżeli tak nie jest, należy wykonać poniższe czynności:

Usuwanie pól wielowartościowych- (kilka wystąpień tego samego rodzaju danych)

Było:

Prowadzący

Imię i nazwisko prowadzącego

Adres prowadzącego

Telefon domowy prowadzącego

Prowadzone kursy

Jan Kowalski

42-512 Sosnowiec ul. BBBbbb 47/21

266-55-55

CK, DK, WR

Jest:

Prowadzący

Imię i nazwisko prowadzącego

Adres prowadzącego

Telefon domowy prowadzącego

Jan Kowalski

42-512 Sosnowiec ul. BBBbbb 47/21

266-55-55

Kursy_prowadzących

Imię i nazwisko prowadzącego

Prowadzony kurs

Jan Kowalski

CK

Jan Kowalski

DK

Jan Kowalski

WR

Usuwanie pól segmentowych - (więcej danych różnego typu)

Było:

Prowadzący

Imię i nazwisko prowadzącego

Adres prowadzącego

Telefon domowy prowadzącego

Jan Kowalski

42-512 Sosnowiec ul. BBBbbb 47/21

266-55-55

Jest:

Prowadzący

Imię prowadzącego

Nazwisko prowadzącego

Kod prowadzącego

Miasto prowadzą

cego

Ulica prowadzą

cego

Numer_domu prowadzącego

Telefon domowy prowadzącego

Jan

Kowalski

42-512

Sosnowiec

BBBbbb

47/21

266-55-55

Informacje na temat kluczy:

Klucze:

Rodzaje kluczy:

Klucz kandydujący powinien spełniać pewne warunki:

Czasem tworzy się sztuczne klucze kandydujące (dołącza się pole do tabeli np.: ID_procownika)

Wszystkie klucze podstawowe w bazie muszą się różnić (wyjątek - podzbiory)

Informacje na temat relacji:

  1. Rodzaje relacji

  1. Definiowanie relacji - Tworzenie połączeń między dwiema tabelami pomiędzy którymi istnieje relacja

Przykładem takiej relacji jest powiązanie:

DZIAŁY KIEROWNICY

Jest to najczęściej występująca relacja

Przykładem takiej relacji może być:

MATKI DZIECI

BUDYNKI POMIESZCZENIA

Przykładem takiej relacji jest:

STUDENCI WYKŁADY

ZAMÓWIENIA PRODUKTY

Istneje możliwość dołączania do tabeli łączącej jeszcze innych pól, co zmniejsza powtórzenia w tabelach.

Definiowanie cech relacji:

  1. Reguła restrykcyjna (R) - rekord nie może zostać skasowany, jeśli istnieją powiązane z nim rekordy podporządkowane. Muszą one być skasowane wcześniej.

  2. Reguła kaskadowa (C) - żądany rekord zostanie skasowany razem z powiązanymi z nim rekordami.

  1. Uczestnictwo obowiązkowe - w rozpatrywanej tabeli musi istnieć przynajmniej jeden rekord zanim zaczniemy wprowadzać rekordy do drugiej z nich.

  2. Uczestnictwo opcjonalne - dana tabela może być pusta przy przystępowaniu do umieszczania rekordów w drugiej tabeli.

Proces projektowania bazy danych

System zarządzania relacyjnymi bazami danych musi dawać możliwość:

Znajomość metodologii projektowania systemów ogranicza ilość błędów. (przestrzeganie zbioru procedur).

Tworzenie systemów baz danych można sprowadzić do następujących etapów:

Świat rzeczywisty

Analiza wymagań

Modelowanie koncepcyjne

Modelowanie logiczne

Modelowanie fizyczne

SYSTEM BAZY DANYCH

Proces projektowania bazy danych

  1. Analiza wymagań

  1. Modelowanie danych

  1. Normalizacja

Sprawdzenie struktur baz danych z "postaciami normalnymi" (zestaw kryteriów, które musi spełniać dana tabela, aby mogła być uznana za poprawną i nie przyczyniała się do powstawania błędów).

Formułowanie celu i założeń wstępnych systemu

Definicja celu powinna być krótka i zwięzła, nie powinna opisywać konkretnych zadań. Powinna opisywać ogólny cel bazy danych w sposób zrozumiały dla twórców bazy i jej przyszłych użytkowników.

np.: „celem bazy danych jest przechowywanie danych wykorzystywanych w obsłudze sprzedaży detalicznej oraz usług serwisowych świadczonych klientom”

Założenia wstępne to ogólne zadania, jakie mają spełniać dane przechowywane w projektowanej bazie (każde założenie powinno być reprezentowane przez pojedyncze zdanie).

Poprawnie sformułowane założenia wstępne ułatwią definiowanie pól, tabel, relacji,...

np.:„Chcemy przechowywać informacje o zawieranych przez nas umowach.

Chcemy przechowywać informacje o klientach.”

Analiza istniejącej bazy danych

Etapy analizy istniejącej bazy danych

Nowe kierunki rozwoju baz danych

Właściwości nowych baz danych:

Systemy rozproszone - takie, w których występuje rozłożenie danych przez ich fragmentaryzację (podział) lub replikację do różnych konfiguracji sprzętowych i programistycznych na ogół rozmieszczonych w różnych (geograficznie) miejscach organizacji.

Fragment danych stanowi pewien podzbiór wszystkich danych całej bazy danych.

Replikacja danych stanowi kopię całości lub jakiejś części danych przechowywanych w innej części całej bazy danych.

Przykład : Dane reprezentują zarządzanie kadrami w przedsiębiorstwie. Każdy region przechowywany jest u siebie, od czasu do czasu rozważamy je razem.

Zasadniczym celem rozproszonej bazy danych jest to, aby dla użytkownika wyglądała ona jak jedna, scentralizowana baza danych. Trzy rodzaje przezroczystości:

(W każdej bazie jest przechowywana kopia informacji o strukturze firmy)

Powody tworzenia rozproszonych baz danych

  1. Jeżeli istotne jest odwzorowanie w systemie geograficznego podziału organizacji. (departamenty, oddziały)

  2. Większą kontrolę nad danymi możemy uzyskać przechowując je w miejscu, gdzie są one potrzebne.

(Aktualizacji może dokonywać tylko oddział odpowiadający za ten fragment bazy)

  1. Utrzymywanie replikacji danych zwiększa niezawodność systemu. (przechowywanie wiernej kopii danych na wypadek awarii, kiedy zatrzymanie pracy organizacji jest niemożliwe).

  2. Działanie systemu może się istotnie poprawić, jeśli dokonane będzie prawidłowe rozproszenie danych. (przyspieszenie dostępu do danych przy operacjach wyszukiwania i aktualizacji, jeśli są one kierowane do lokalnej bazy danych zamiast do dużej scentralizowanej bazy danych)

Inteligencja - sztuczna inteligencja i jej implementacja w kontekście baz danych.

Relacyjne bazy danych reprezentują fakty. Integralność i funkcje modyfikacji implementowane są w programach użytkowych, na zewnątrz relacyjnej bazy danych.

Dedukcyjne bazy danych (inteligentne) reprezentują fakty, więzy integralności, zapytań i funkcje modyfikacji. Mają aktywny charakter, przechowują reguły.

Inteligentne bazy danych oferują możliwość przechowywania więzów integralności centralnie w samej bazie danych. Co oznacza, że:

Systemy hipermedialne - systemy informacyjne mające postać węzłów różnych rodzajów mediów połączonych w jedną całość siecią asocjacyjnych powiązań. (np.: systemy hipertekstowe)

Brak wewnętrznej struktury danych. Struktura zapytań jest trudna do zrealizowania. Nieukierunkowane wyszukiwanie.

Np.: The National Gallery System - użytkownik może uzyskać dostęp do informacji jedną z wielu dróg:

GIS - geograficzne systemy informacyjne - Dane przestrzenne

Systemy te opierają się na założeniu, że każdy obiekt w przestrzeni można opisać punktami, którym można przypisać współrzędne w przestrzeni euklidesowej.

Trzy aspekty systemów GIS:

Pytania do takiego systemu mogą mieć charakter:

Przykład:

Pytanie: Wymień wszystkich właścicieli gruntów, w których glebie znajduje się żelazo?

Odpowiedź: łączy dane o właścicielach gruntów z własnościami mineralnymi działek ziemi.

Przykład:

Pytanie: Dlaczego na tym odcinku rzeki występują okresowe powodzie?

Techniczne aspekty przechowywania i przetwarzania danych

Przyczyny utraty danych:

Dwie podstawowe metody zabezpieczania przed utratą danych:

(Gdyby nie było przetwarzania transakcyjnego.

Np.: Przelew z jednego konta na drugie. W czasie awarii zmiana mogłaby się zdążyć wykonać w pierwszym rekordzie, a w drugim nie.

Transakcja - procedura posiadająca wyraźny koniec i początek. Zastosowanie flag, precyzyjnie określających stopień zaawansowania transakcji.

Jedna flaga - stan transakcji.

Druga flaga - stan modyfikacji danych.

Przebieg procedury transakcyjnej:

3



Wyszukiwarka

Podobne podstrony:
etapy projektowania bazy danych, Pomoce naukowe, studia, informatyka
system zarządzania bazami danych access, Pomoce naukowe, studia, informatyka
strategia ochrony danych w firmie, Pomoce naukowe, studia, informatyka
hakerzy jako subkultura, Pomoce naukowe, studia, informatyka
język XML, Pomoce naukowe, studia, informatyka
język SQL, Pomoce naukowe, studia, informatyka
wykłady - cz. 1, Pomoce naukowe, studia, informatyka
wirtualni operatorzy komórkowi, Pomoce naukowe, studia, informatyka
automatyka - ściąga, Pomoce naukowe, studia, informatyka
polityka bezpieczeństwa w sieciach komputerowych, Pomoce naukowe, studia, informatyka
analiza systemu informatycznego biura pośrednictwa pracy, Pomoce naukowe, studia, informatyka
projekt i wykonanie sieci komputerowej - cz.2, Pomoce naukowe, studia, informatyka
skróty klawiaturowe, Pomoce naukowe, studia, informatyka
system Netware, Pomoce naukowe, studia, informatyka
wykłady - cz. 6, Pomoce naukowe, studia, informatyka
systemy informatyczne w ekonomii, Pomoce naukowe, studia, informatyka
wykłady - cz. 2, Pomoce naukowe, studia, informatyka
algorytm 1, Pomoce naukowe, studia, informatyka

więcej podobnych podstron