background image

1

POJĘCIE DANYCH, BAZY DANYCH I SYSTEMU 

BAZY DANYCH

Dane  to  fakty,  koncepcje  i  instrukcje  reprezentowane  przez  wartości, 
liczby, ciągi znaków, symbole, obrazy itp. 
Baza  danych  to  zbiór  zapamiętanych  w  urządzeniach  pamięciowych 
(dyski,  dyski  optyczne,  taśmy)  danych  wykorzystywanych  przez 
organizację. 
Baza danych stanowi element większej całości, którą jest system bazy 
danych. System ten tworzą:
•bazy danych,
•sprzęt  komputerowy  do  gromadzenia  i  manipulowania  danymi 
zgromadzonymi w bazie danych,
•oprogramowanie  do  wyszukiwania,  aktualizacji,  wprowadzania  i 
usuwania danych oraz utrzymania integralności danych.
Oprogramowanie składające się na system bazy danych obejmuje:
•zbiór programów wsadowych operujących na danych zgromadzonych w 
bazie,
•zbiór 

programów 

interakcyjnych 

operujących 

na 

danych 

zgromadzonych w bazie,
•oprogramowanie  systemowe  (system  operacyjny  komputera,  na 
którym jest zrealizowana baza danych).
Oprogramowanie  pozwalające  na  stworzenie  oraz  utrzymanie  bazy 
danych nazywa się system zarządzania bazą danych.

background image

2

ZBIORY DANYCH

Organizacja 

danych 

systemie 

komputerowym, 

rozpatrywana  w  kierunku  wstępującym  oparta  jest  o 

następującą sekwencję:

bit (binary digit), czyli cyfra dwójkowa (0 lub 1),

bajt (byte), czyli osiem bitów oznaczających literę, cyfrę 

lub znak specjalny,

pole  (field),  czyli  ciąg  bajtów  zapisujących  konkretną 

daną,

rekord,  czyli  sekwencja  logicznie  powiązanych  ze  sobą 

pól,  stanowiących  łącznie  komunikat  typu  cecha.  Rekord 

opisuje  określoną  encją  (entiti),  czyli  nazwę  obiektu 

będącego  przedmiotem  zainteresowania.  Każdy  rekord 

może zawierać w sobie dowolną liczbę jego wystąpień. Ze 

względu  na  podstawowe  znaczenie  rekordu, musi  on być 

jednoznacznie  identyfikowany  przez  co  najmniej  jeden 

klucz,

zbiór  (file),  czyli  grupa  rekordów  dotyczących 

jednorodnej tematyki.

background image

3

MODELE ORGANIZACJI DANYCH W 

BAZACH DANYCH

Dane  zgromadzone  w  bazie  danych  mogą 
zostać 

zorganizowane 

zgodnie 

możliwościami 

reprezentacji 

danych 

systemach  komputerowych.  W  praktyce 
rozróżnia 

się 

następujące 

podstawowe 

modele baz danych:
•hierarchiczny,
•sieciowy,
•relacyjny,
•obiektowy,
•obiektowo-relacyjny 

background image

4

MODEL HIERARCHICZNY BAZ 

DANYCH 

modelu 

hierarchicznym 

dane 

są 

gromadzone 

postaci 

rekordów 

występujących 

roli 

podrzędnej 

lub 

nadrzędnej.  Rekordy  podrzędne  mają  jedno 
powiązanie 

rekordem 

nadrzędnym, 

natomiast  rekord  nadrzędny  może  mieć 
dowolną 

liczbę 

powiązań 

rekordami 

podrzędnymi (w szczególności zero). Struktura 
hierarchiczna  (zwana  również  drzewiastą) 
charakteryzuje  się  tym,  że  nie  może  istnieć 
żaden rekord podrzędny bez przypisanego mu 
jednoznacznie rekordu nadrzędnego

background image

5

MODEL HIERARCHICZNY BAZ 

DANYCH

background image

6

MODEL SIECIOWY BAZ DANYCH 

Model  sieciowy  bazy  danych  stanowi  naturalne 

rozwinięcie  i  uogólnienie  modelu  hierarchicznego. 

Tak,  jak  w  modelu  hierarchicznym  dane  są 

reprezentowane  przez  rekordy,  jednak  w  sieciowych 

bazach  danych  rekordy  mogą  być  powiązane  z 

dowolną 

liczbą 

innych 

rekordów, 

zarówno 

nadrzędnych, jak i podrzędnych .
Sieciowe  bazy  danych  są  bardziej  złożone  niż 

hierarchiczne.  Dzięki  temu  można  w  bardziej 

naturalny 

sposób 

odzwierciedlać 

zależności 

wieloznaczne. Zazwyczaj model sieciowy jest bardziej 

zbliżony do rzeczywistości niż model hierarchiczny.
Podstawową  wadą  modelu  sieciowego  jest  zbytnia 

złożoność tego modelu oraz związanego z nim języka 

manipulowania danymi. 

background image

7

MODEL SIECIOWY BAZ DANYCH

background image

8

MODEL RELACYJNY BAZ DANYCH 

Najbardziej rozpowszechnionym obecnie modelem danych 

jest  model  relacyjny.  Powstał  on  jako  alternatywa  dla 

modeli  hierarchicznego  i  sieciowego.  Podejście  relacyjne 

zakłada,  że  tradycyjne  pliki  (wykorzystywane  w  modelach 

sieciowym  i  hierarchicznym)  mogą  zostać  potraktowane 

jako  relacje  matematyczne,  dzięki  czemu  można 

zastosować w stosunku do nich mechanizmy znane z teorii 

relacji.
Relacje  R  nad  zbiorami  Di,  D

2

,...,D

n

  nazywamy  dowolny 

podzbiór  iloczynu  kartezjańskiego  D

1

  x  D

2

x...x  D

n

.  Relacja 

jest  więc  zbiorem  n-elementowych  ciągów.  Najczęściej 

relacja przedstawia się w postaci tablicy, a relacyjną bazą 

danych jako zbiór tablic.
Tablica (relacja) w modelu relacyjnym odpowiada plikowi w 

tradycyjnym  przetwarzaniu  danych.  Pojedynczy  wiersz 

relacji 

nazywamy 

krótką 

(rekord 

tradycyjnym 

przetwarzaniu danych). Można więc powiedzieć, że relacją 

jest dowolny skończony podzbiór zbioru krotek.

 

background image

9

MODEL RELACYJNY BAZ DANYCH 

Relacyjna  baza  danych  składa  się  z  kilku  powiązanych  ze  sobą 

tablic  (relacji),  które  otrzymuje  się  w  wyniku  przeprowadzonego 

procesu normalizacji.
Na otrzymanych relacjach można wykonywać określone operacje, 

które są kwalifikowane do jednej z następujących grup:
-  operacje  mnogościowe 

wynikające

  z  faktu,  że  relacja  jest 

zbiorem,
- operacje relacyjne, do których zaliczamy: 
      - operację projekcji,
      - operację selekcji,
      - operację złączenia.
Zaletą  modelu  relacyjnego  jest  to, że jest  on dobrze osadzony  w 

matematycznej  teorii  relacji  i  łatwo  posługiwać  się  nim.  W 

praktyce  jednak  można  napotkać  pewne  ograniczenia  w  jego 

stosowaniu wynikające m.in. z tego że:
- systemy relacyjne wymagają zazwyczaj bardzo dużych zasobów 

pamięci,
- wykonanie skomplikowanych zapytań może być czasochłonne,

- istniejące

  systemy  nie  zawsze  dostarczają  pełnego  zakresu 

operacji algebry relacji.

background image

10

MODEL RELACYJNY BAZ DANYCH

background image

11

 OBIEKTOWY I OBIEKTOWO-RELACYJNY 

MODELE

Omówione 

wcześniej 

modele 

reprezentacji 

danych 

mogą 

się 

okazać 

niewystarczające  w  sytuacjach,  gdy  należy  zapamiętać  informacje  o  bardziej 
złożonych  strukturach  danych,  takich  jak:  obraz,  dźwięk,  sekwencje  wideo.  Do 
reprezentacji tego typu danych przydatny może się okazać model obiektowy. Jako 
obiekt  należy  rozumieć  reprezentację  stanu  i  zachowań  wyróżnionego  fragmentu 
rzeczywistości.  Obiekt  jest  zbiorem  atrybutów  oraz  metod,  czyli  operacji,  które  na 
nim mogą zostać wykonane.
Obiektowe  bazy  danych  wykorzystują  w  modelu  danych  paradygmat  obiektowy 
dotychczas  stosowany  w  nowoczesnych językach programowania.  Obiektowa  baza 
danych umożliwia przechowywanie i zarządzanie klasami, obiektami i ich metodami 
zachowując  jednocześnie  możliwości  posiadane  przez  nowoczesne  systemy 
relacyjne (np. przetwarzanie transakcji, kontrola dostępu, optymalizacja zapytań).
Zalety obiektowych baz danych :
- przechowywanie danych oraz operacji na danych w jednej bazie,
-  bardziej  elastyczne  odwzorowanie  rzeczywistości  w  porównaniu  z  innymi 
modelami danych,
-  dziedzinę  atrybutów  klas  może  stanowić  dowolny  typ  wbudowany  bądź 
zdefiniowany przez użytkownika.
W teorii i praktyce baz danych są rozwijane również inne koncepcje organizacji baz 
danych.  Dość  mocno  akcentują  swoją  obecność  rozwiązania  powstałe  w  wyniku 
połączenia  modelu  relacyjnego  i  obiektowego  -  obiektowo-relacyjne  bazy 
danych.

background image

12

TRANSAKCYJNE BAZY DANYCH (TBD)

W  ujęciu  informatycznym  transakcja  jest  to  ciąg  nierozerwalnych, 

następujących działań:

•wczytanie danych wejściowych,

•aktualizcja danych,

•zatwierdzenie/odrzucenie,

•kontrola danych,

•transmisja danych.

Jednocześnie  tak  pojęta  transakcja  powinna  mieć  następujące  cechy, 

zwane skrótowo ACID, tj.:

•nierozrywalności,

•spójności,

•odizolowania od innych transakcji,

•trwałości.

Transakcyjna  baza  danych  (TBD)  jest  to  kolekcja  danych  i  ich 

zbiorów  zorganizowana  w  ten  sposób,  że  mogą  one  obsługiwać  w 

efektywny  sposób  wiele  ich  zastosowań,  zadanych  jednocześnie  przez 

wielu  użytkowników,  w  oparciu  o  centralne  sterowanie  danymi,  o 

zminimalizowanie  ich  redundancji  oraz  o  uniezależnienie  ich  od 

programów użytkowych.

Główne elementy TBD

•model TBD (zewnętrzny, koncepcyjny i wewnętrzny),

•system zarządzania bazą danych (SZBD),

•administrator  bazy  danych.

background image

13

OGÓLNA KONCEPCJA TBD

 

background image

14

ARCHITEKTURA TBD

 

background image

15

MODELE    TBD

Architektura  TBD  składa  się  z  trzech  powiązanych  ze  sobą 
modeli 

takiej 

bazy, 

tj: 

modelu 

zewnętrznego, 

koncepcyjnego  (zwanego  również  pojęciowym)  oraz 
wewnętrznego
.
Model  zewnętrzny  TBD  odzwierciedla  sposób  widzenia 
bazy danych przez poszczególnych jej użytkowników. Jest to 
więc  odzwierciedlenie  obszaru  roboczego  użytkownika  TBD 
w  postaci  np.  ekranów,  na  których  pojawiają  się  dane  i/lub 
rekordy  żądane  przez  korzystającego  z  bazy  danych.  Model 
zewnętrzny  składa  się  z  wielu  wystąpień  różnych  typów 
rekordów  zewnętrznych,  przy  czym  nie  zakłada  się  aby  był 
on identyczny z rekordem pamiętanym w TBD. Każdy model 
zewnętrzny 

jest 

wyspecyfikowany 

przez 

schemat 

zewnętrzny,  zawierający  opisy  każdego  żądanego  rekordu 
zewnętrznego. Opis taki zawierać może np. określenie ilości 
znaków  dla  odwzorowania  nazwiska  pracownika,  jego 
stanowiska itd.

background image

16

MODELE    TBD

Model  koncepcyjny  (pojęciowy)  TBD  odzwierciedla  pełną 

zawartość  informacyjną  bazy  danych,  która  różni  się  na  ogół  od 

oglądu  jej  przez  konkretnego  użytkownika.  Model  składa  się  z 

wielu  wystąpień  rekordów  pojęciowych,  takich  jak  np.  pracownik, 

dostawca,  odbiorca.  Rekord  pojęciowy  może nie być identyczny z 

rekordem  zewnętrznym  oraz  z  rekordem  pamiętanym.  Model 

pojęciowy  jest  wyspecyfikowany  przez  schemat  pojęciowy 

definiujący  każdy  typ  rekordu  pojęciowego,  z  tym  że  definicje 

takie  nie  dotyczą  ich  fizycznego  uporządkowania,  stosowanych 

metod dostępu, adresowania, indeksowania itp. 

W  szczególności  schemat  pojęciowy:

•charakteryzuje encje i ich cechy,

•ustala  strukturę  logiczną  oraz  relacje  zachodzące  między 

encjami,

•ustala uprawnienia oraz ograniczenia semantyczne,

•podaje formaty czyli fizyczną reprezentację rekordów,

•ustala fizyczną lokalizację danych na nośnikach magnetycznych,

•ustala parametry integralności danych, takie, jak uprawnienia 

dostępu do danych, lub zasady kopiowania danych 

background image

17

MODELE    TBD

Model  wewnętrzny  TBD  zawiera  w  sobie  wystąpienia  różnych  typów 
rekordu  wewnętrznego,  czyli  rekordu  pamiętanego.  Model  ten  różni  się  od 
poziomu  fizycznego,  gdyż  nie  jest  konstruowany  w  zrozumieniu  rekordów 
fizycznych  (bloków).  Model  wewnętrzny  jest  sprecyzowany  w  ramach 
schematu  wewnętrznego,  który  określa  poszczególne  typy  rekordów 
pamiętanych, specyfikuje indeksy, sposób reprezentacji pól pamiętanych, ich 
uporządkowanie fizyczne itp.
Między  trzema  powyższymi  modelami  zachodzą  dwa  rodzaje  odwzorowań: 
między  poziomem  zewnętrznym  i  pojęciowym  oraz  między  poziomem 
pojęciowym a wewnętrznym.
Odwzorowanie: 

poziom 

zewnętrzny 

pojęciowy 

specyfikuje 

odpowiedniości zachodzące między poszczególnymi modelami zewnętrznymi 
a  modelem  pojęciowym.  Jest  to  istotne  m.in.  ze  względu  na  fakt,  iż  modeli 
zewnętrznych może być wiele, i że są one nie zawsze rozłączne między sobą 
(mogą zachodzić na siebie) oraz baza danych obsługiwać może jednocześnie 
wielu użytkowników. Ponadto pola mogą mieć różne typy danych, zaś rekordy 
mogą być różnie uporządkowane.
Odwzorowanie:  poziom  pojęciowy  -  wewnętrzny  określa  sposoby 
odwzorowywania rekordów i pól pojęciowych na ich pamiętane odpowiedniki. 
Jeśli  np.  zmienia  się  strukturę  pamiętanej  bazy  danych,  to  należy  dokonać 
odpowiednich zmian w tym odwzorowaniu, aby schemat pojęciowy pozostał 
nie naruszony.

background image

18

SYSTEM ZARZĄDZANIA BAZĄ 

DANYCH (SZBD)

System  Zarządzania  Bazą  Danych  jest  to  pakiet 
specjalistycznego  oprogramowania,  przy  pomocy  którego 
następuje  scentralizowane  zarządzanie  danymi,  gromadzonymi 
w TBD, umożliwiające dostęp do tych danych, które są żądane w 
programie użytkowym. Jest to więc pomost między programami 
użytkowymi  a  fizycznymi  zbiorami  danych.  Jeśli  np.  TBD  ma 
wygenerować  określony  rekord  zewnętrzny,  to  zwykle  żądane 
pola  takiego  rekordu  będą  pochodzić  z  różnych  wystąpień 
rekordu  pojęciowego,  te  zaś  z  kolei  mogą  wymagać  włączenia 
pól  z  kilku  wystąpień  rekordu  pamiętanego.  W  takim  wypadku 
SZBD musi odnależć żądane wystąpienia rekordu pamiętanego, 
z nich zbudować odpowiednie wystąpienia rekordu pojęciowego 
i w końcu wygenerować żądany rekord zewnętrzny.
W  SZBD  wyodrębnić  można  jego  trzy  główne  części  składowe: 
język  definicji  danych,  język  manipulacji  danymi  oraz 
słownik  danych  (zwany  również  bazą  metadanych  lub 
metabazą danych).

background image

19

SYSTEM ZARZĄDZANIA BAZĄ 

DANYCH (SZBD)

Język  definicji  danych  -  jest  to  język  formalny, 
używany  przez  programistów.  Jego  zadaniem  jest 
definiowanie  każdego  pola,  które  figuruje  w  bazie 
danych,  zanim  pole  to  zostanie  użyte  w  modelu 
zewnętrznym,  szerzej,  w  programie  użytkowym. 
Inaczej mówiąc język ten określa treść i strukturę bazy 
danych;
Język  manipulacji  danymi  -  jest  językiem 
wyspecjalizowanym,  stosowanym  wraz  z  językami 
programowania  trzeciego  lub  czwartego  poziomu 
(języki  proceduralne  lub  nieproceduralne).  Zadaniem 
tego języka jest wydobywanie danych z bazy danych, 
służących  do  budowy  odpowiedzi  na  pytania 
kierowane  przez  użytkowników  pod  adresem  bazy 
danych oraz do tworzenia programów użytkowych. 

background image

20

SYSTEM  ZARZĄDZANIA BAZĄ 

DANYCH (SZBD)

Słownik  danych  (data  dictionary)  jest  wyspecjalizowanym  systemem, 
zbudowanym z tzw. metadanych, opisujących zawartość TBD. Metadane 
są to takie dane, przy pomocy których opisuje się dane zawarte w TBD. 
Metadane  mogą  tworzyć  sobą  metainformację,  czyli  informacje  o 
informacjach, dotyczących zawartości TBD. Konieczność budowy takiego 
słownika  wynika  z  faktu,  że  TBD  zawiera  w  sobie  bardzo  duży  wolumen 
danych,  wymagających  wielokryteryjnego  ich  opisu,  biorąc  pod  uwagę 
zarówno  potrzeby  użytkowników  bazy  danych,  jak  i  projektantów  tych 
baz, programistów oraz administratora bazy danych. 
Podstawową  funkcją  słownika  danych  jest  funkcja  informacyjna, 
dostarczająca użytkownikom bazy danych metainformacji na temat:

•jakie dane zgromadzone są w bazie danych, jakie komunikaty można z 
danych tych utworzyć oraz na jaki temat,

•co oznaczają poszczególne dane,

•gdzie przechowywane są te dane,

•w  jaki  sposób  zorganizowany  jest  dostęp  do  danych,  jak  można  je 
przetwarzać i jakie rodzaje danych znajdują się w zasobach bazy danych,

•kto  jest  użytkownikiem  danych,  kto  odpowiada  za  ich  jakość  i 
udostępnienie oraz kto dostarcza dane do bazy danych.

background image

21

ADMINISTRATOR BAZY DANYCH (ABD)

Administrator  bazy  danych  jest  to  osoba  lub  organizacyjnie 

wydzielony  zespół  osób  odpowiedzialny  za  efektywne  zarządzanie 

zasobami danych, gromadzonych w TBD oraz za jej stałą gotowość 

eksploatacyjną, w oparciu o prawidłowe stosowanie podstawowego 

narzędzia, jakim jest SZBD, w tym słownik.

Podstawowymi  funkcjami  ABD są:

•definiowanie,  wprowadzanie  i  usuwanie  danych,  zgodnie  z 

żądaniami użytkowników baz danych,

•dostarczanie  narzędzi  i  sposobów  dostępu  oraz  aktualizacji 

danych, jak też do tworzenia raportów, generowanych przez TBD,

•informowanie  użytkowników  na  temat  interesujących  ich 

problemów,  związanych  z  TBD  i  uczestniczenie  w  procesach 

planowania i użytkowania zasobów danych w bazie danych,

•nadzorowanie  poprawności  przeprowadzanych  operacji  z 

wykorzystaniem TBD,

•nadzór  nad  integralnością  danych,  tj.  nad  ich  jakością 

(kompletnością,  aktualnością  oraz  niedopuszczeniem  do  ich 

uszkodzenia),  sposobami  kopiowania  bazy  danych,  metodami 

odzyskiwania  danych  oraz  nad  sterowaniem  dostępem  do  danych 

(wraz z ich utajnianiem) itp.

background image

22

OKREŚLENIE HURTOWNI DANYCH

Hurtownia 

danych 

- 

jest 

to 

baza 

danych 

wspomagająca  procesy  analiz  i  podejmowania  decyzji 
na  wyższych  poziomach  zarządzania,  służących  do 
podejmowania  decyzji  strategicznych  związanych  z 
zarządzaniem  organizacją.  Gromadzone  są  w  niej  dane 
pochodzące z różnych źródeł, takich, jak:

•systemy transakcyjne dzialające w danej organizacji,

•bazy danych istniejące w otoczeniu organizacji,

•zasoby systemu WWW,

•arkusze kalkulacyjne lub pliki w formacie XML.
W  hurtowni  są  przechowywane  kopie  danych  z 
systemów  operacyjnych  oraz  wyliczone  na  ich 
podstawie  agregaty  (średnie,  sumy  itp.)  o  różnym 
stopniu agregacji.

background image

23

WŁASNOŚCI  HURTOWNI  DANYCH

Hurtownia  danych  charakteryzująca  się  następującymi 
własnościami:

•jest uporządkowana tematycznie,

•jest zintegrowana,

•zawiera wymiar czasowy,

•jest nieulotna.
Uporządkowanie  tematyczne  oznacza  zbiorczą 
postać danych, dotyczących tego samego zagadnienia, 
a rozproszonych w różnych bazach (zbiorach) danych. I 
tak np. wystąpić może w SG zbiór transakcji zawartych 
z  klientami  indywidualnymi  i  osobny  zbiór  takich 
transakcji 

zawartych 

odbiorcami 

zinstytucjonalizowanymi. W hurtowni danych występuje 
suma  transakcji  obu  typów  odbiorców  w  danym 
momencie lub przedziale czasu.

background image

24

WŁASNOŚCI  HURTOWNI  DANYCH

Integracja  dotyczy  ujednolicenia  nazw,  sposobów 
pomiaru wartości oraz sposobów kodowania.
Wymiar 

czasowy 

związany 

jest 

szerokim 

uwzględnieniem  w  hurtowni  zagregowanych  danych 
historycznych,  które  z  zasady  nie  występują  w  TBD. 
Ponadto  w  TBD  dane  za  poszczególne  okresy  mogą  być 
uaktualniane, natomiast w hurtowni danych dane za okres 
X  są  te  same,  bez  względu  na  moment,  w  którym  są 
żądane.
Nieulotność dotyczy tego, że w hurtowni danych dane są 
stałe, czyli nie są wrażliwe na częste aktualizacje, co ma 
miejsce  w  TBD.  Stąd,  o  ile  w  TBD  wprowadza  się  każdą 
transakcję  osobno,  o  tyle  w  hurtowni  danych,  dane 
wprowadza się okresowo, w trybie wsadowym. Tak więc, o 
ile  dane  w  TBD  „napędzają"  SG,  to  w  hurtowni  danych 
otrzymujemy informacje, jak SG jest „napędzana".

background image

25

STRUKTURA HURTOWNI DANYCH

W strukturze hurtowni danych wyodrębnić można pięć jej 
warstw:
1.warstwa danych źródłowych,
2.warstwa pośrednia,
3.metabaza,
4.warstwa hurtowni właściwej,
5.warstwa użytkownika końcowego. 

Powiązanie tych warstw

background image

26

WARSTWY  DANYCH

1.  Warstwa  danych  źródłowych  obejmuje  źródła  zasilające 

hurtownię  danych.  Do  tych  źródeł  zliczyć  należy:  dane 

historyczne SG, dane pochodzące z aktualnie eksploatowanych 

TBD oraz różnego typu dane o otoczeniu SG. Takie dane są w 

stosunku  wzajemnym  w  różnym  stopniu  redundantne,  a 

ponadto  nie  wszystkie  są  potrzebne  w  hurtowni  danych. 

Oznacza  to,  że  przed  przystąpieniem  do  budowy  hurtowni 

danych  należy  określić,  jakie  dane  będą  znajdować  się  w 

hurtowni  danych,  czyli  jakie  cele  i  zadania  hurtownia  taka 

powinna spełniać.

2. Warstwa pośrednia ma na celu przygotowanie wybranych 

zbiorów  danych,  pobieranych  ze  zbiorów  danych  źródłowych, 

do przeniesienia ich do hurtowni danych. Warstwa ta dokonuje 

operacje:  ekstrakcji  i  konwersji  danych.  Do  tej  warstwy, 

spełniającej  funkcje  pomocnicze,  użytkownik  hurtowni  danych 

nie ma możliwości kierowania zapytań. Warstwa pośrednia ma 

zatem  charakter  roboczy,  czyli  jest  miejscem,  gdzie  dane  z 

warstwy  danych  źródłowych  są  składowane,  czyszczone  oraz 

kontrolowana jest ich poprawność. 

background image

27

WARSTWY  DANYCH

3.  Metabaza  danych  jest  tym  elementem  hurtowni 
danych,  która  jest  istotnym  narzędziem  administrowania 
hurtownią,  umożliwiającym  zapewnienie  integralności 
oraz  spójności  językowej  i  informacyjnej  hurtowni 
(podhurtowni)  danych.  Metabaza  opisuje  struktury 
danych,  wprowadzanych  i  przechowywanych  w  hurtowni 
danych,  specyfikację  wymiarów,  źródeł  pochodzenia 
danych, reguł transformacji, reguł i procedur czyszczenia, 
zasilania, archiwizacji, bezpieczeństwa danych w hurtowni 
itp. 
4.

Warstwa 

hurtowni 

właściwej 

może 

być 

budowana  w  różny  sposób.  Głównie  chodzi  tu  o 
odpowiedź  na  pytania,  czy  hurtownia  danych  ma  być 
jednolitą,  scentralizowaną  hurtownią,  czy  też  ma  być 
oparta na podhutowniach danych oraz czy i w jaki sposób 
powiązać ze sobą te podhurtownie z hurtownią.

background image

28

WARSTWY  DANYCH

5.  Podhurtownie  danych  -  są  to  odpowiednie  części 
wydzielone  z  globalnej  hurtowni  danych,  albo  wyciągi  z 
transakcyjnych  baz  danych,  ukierunkowane  na  obsługę 
lokalnych  potrzeb  informacyjnych,  zgłaszanych  przez 
określone  grupy  użytkowników.  W  stosunku  do  hurtowni 
danych,  podhurtownie  dysponują  mniejszym  wolumenem 
danych, są łatwiejsze w eksploatacji i wymagają mniejszych 
nakładów.  Biorąc  pod  uwagę  oba  elementy  (hurtownię  i 
podhurtownie danych) możliwe są następujące rozwiązania: 
•  dane  źródłowe  po  przejściu  przez  warstwę  pośrednią,  są 
ładowane  do  jednej,  globalnej  hurtowni  danych.  Zalety 
takiego  rozwiązania  polegają  na  możliwości  odpowiedzi  na 
wszelkie  pytania,  w  ramach  poszczególnych  tematów, 
interesujących  użytkownika.  Wadą  jest  tu  operowanie  na 
dużym  wolumenie  danych,  na  budowie  wielu  programów 
ekstrakcji danych itp. 

background image

29

GLOBALNA HURTOWNIA DANYCH

background image

30

ROZWIĄZANIA  HURTOWNI  DANYCH 

• dane źródłowe po przejściu przez warstwę pośrednią, są 

ładowane  do  globalnej  hurtowni  danych,  powiązanych 
następnie  z  określoną  ilością  podhurtowni.  Użytkownik 
ma  możliwości  odwołania  się  albo  do  globalnej 
hurtowni,  albo  do  odpowiedniej  podhurtowni.  Zaletą 
takiego  rozwiązania  jest  możliwość  zbudowania 
podhurtowni,  co  jest  łatwiejsze  i  prostsze.  Wadą  jest 
możliwość 

powstania 

niezgodności 

między 

podhurtowniami,  a  hurtownią.  Schemat  tego  typu 
hurtowni:

background image

31

ROZWIĄZANIA  HURTOWNI  DANYCH 

• dane źródłowe, po przejściu przez warstwę pośrednią są 

najpierw  ładowane  do  podhurtowni,  te  zaś  tworzą 
hurtownie.  Jest  to  więc  schemat  odwrotny  od 
poprzedniego.  Zalety  i  wady  są  podobne  jak  w 
wariancie 

poprzednim. 

Taki 

schemat, 

o 

„wstępującym„  charakterze przedstawia rys.:

 

background image

32

ROZWIĄZANIA  HURTOWNI  DANYCH 

• dane źródłowe po przejściu przez warstwę pośrednią, są 

ładowane  jedynie  do  podhurtowni  danych,  co  oznacza 
brak  hurtowni  globalnej.  Ten  model  jest  obecnie 
stosowany coraz częściej. Schemat takiej hurtowni:

background image

33

KORZYŚCI  HURTOWNI DANYCH

Korzyści  ze  stosowania  hurtowni  danych  dotyczą 

głównie:

• możliwości 

scalania 

informacji 

odmiennych 

tematycznie systemów transakcyjnych w jeden, pełny 
obraz 

SG, 

ułatwiający 

podejmowanie 

decyzji 

racjonalnych;

• wykorzystywanie dla celów podejmowania decyzji oraz 

różnego  typu  analiz,  danych  historycznych  SG, 
zwłaszcza  dla  celów  predykcji  i  prognozowania  w 
średnich i długich okresach;

• stworzenie  godnego  zaufania  jednoznacznego  źródła 

informacji  o  SG,  umożliwiające  jednolite  rozumienie 
prowadzonych  w  SG  przedsięwzięć  gospodarczych 
(jednolitość interpretacji danych o SG);

• oddzielenie  danych  transakcyjnych  od  procesu 

podejmowania decyzji.

background image

34

UWARUNKOWANIA  HURTOWNI  DANYCH

Uwarunkowania  stosowania  hurtowni  danych  dotyczą 

głównie:

• określenia  celów,  które  spełnić  ma  hurtownia  danych  dla 

potrzeb wyższych poziomów zarządzania;

• zidentyfikowania  danych,  które  będą  przenoszone  z  TBD 

do hurtowni danych;

• standaryzacji  pojęć  i  definicji,  które  będą  obowiązujące 

dla całego SG.

Jednocześnie należy zwrócić uwagę na to, że:

• hurtownia danych absorbuje znaczne zasoby pamięci,

• hurtownia jest o połowę droższa niż standardowa TBD,

• hurtownia  wymaga  bardziej  złożonych  interfejsów  niż  to 

ma miejsce w relacyjnej bazie danych.

Budowa hurtowni danych nie jest przedsięwzięciem łatwym, 

zazwyczaj wiąże się z dużym ryzykiem i kosztami. jednak 

w  sytuacji,  gdy  projekt  budowy  hurtowni  kończy  się 

sukcesem  można  oczekiwać  szybkiego  zwrotu  kosztów  i 

wymiernych efektów wynikających z jej stosowania.


Document Outline