background image

Bazy danych

1

 Hurtownie danych 
 Architektura hurtowni 

danych

 Zastosowania HD

BAZY DANYCH

Wykład 11 

BAZY DANYCH W ZARZĄDZANIU.

HURTOWNIE DANYCH

background image

Bazy danych

2

ISTOTA INFORMACJI

Cel  nadrzędny  każdej  organizacji:  trwanie  -  trwanie  na  rynku 
konkurencji.

 

Dla  zachowania  konkurencyjności,  współczesne  korporacje 
muszą być w stanie:

  określić ryzyko w działalności korporacji;
  zoptymalizować procesy zarządzania;
  maksymalizować  zysk  na  bardzo  konkurencyjnym  rynku  ze  świadomymi 
klientami;
  umieć  określić  i  natychmiast  odpowiadać  na  zmiany  i  możliwości,  jakie 
stwarza rynek;
  adaptować  się  do  zmian  na  rynku  w  technologii,  bez  konieczności 
restrukturyzacji

całej korporacji.

Kluczowym  elementem,  pozwalającym  wykonać  te  zadania  jest  posiadanie 
prawidłowej  informacji  we  właściwym  czasie  –  możliwość  podejmowania 
właściwych decyzji. 

Rozwiązanie 

problematyki 

system, 

który 

integrowałby 

czynniki 

technologiczne oraz umożliwiałby dostęp do informacji gromadzonej w różnych 
źródłach. 

Informacja ta musi być spójna i dokładna, posiadając jednocześnie wartość dla 
przedsiębiorstwa.

background image

Bazy danych

3

TYPY DANYCH

Dane  operacyjne 

–  stanowią  element  dynamiczny,  podlegający  ciągłym 

zmianom i aktualizacjom.

Dane  te  reprezentują  informację  aktualną  w  określonym  momencie  czasowym, 
określają one więc stan bieżący, mogący ulegać zmianie w każdej chwili. 

Dane  analityczne

  -  dane  historyczne,  zwykle  pozostające  niezmienione.  Ich 

zmiana jest możliwa tylko w przypadku wykrycia błędu w danych oryginalnych. 

Dane analityczne są zwykle budowane z danych operacyjnych (nie muszą jednak 
pochodzić  z  samej  korporacji)  i  mogą  być  używane  do  wyczerpującej  analizy 
procesów zachodzących w korporacji na przestrzeni czasu. 

 

Dane  analityczne  gromadzone  w  analitycznych  bazach  danych  są  często 
wykorzystywane  do  podejmowania  decyzji  (strategicznych,  taktycznych). 
Ponadto  wymagane  są  jeszcze  systemy  informatyczne,  pozwalające  dokonywać 
różnego 

rodzaju 

analiz 

(np. 

wyszukania 

pewnych 

prawidłowości, 

przeprowadzenia obliczeń, wykonania symulacji).

Jedną  z  kategorii  systemów  informatycznych,  które  wykorzystują  dane 
analityczne do wspomagania decyzji są 

informatyczne systemy wspomagania 

decyzji

, czyli 

systemy klasy DSS

.

background image

Bazy danych

4

SYSTEMY DSS

System  wspomagania  podejmowania  decyzji  (DSS)

  jest  systemem,  którego 

zadaniem  jest  dostarczenie  użytkownikowi  informacji  umożliwiających 
zanalizowanie  sytuacji  i  podjęcie  decyzji  (czyli  wspomaganie  pracowników  w 
podejmowaniu decyzji – czyniąc pracę bardziej efektywną).

Proces  podejmowania  decyzji  może  być  długotrwały  i  mieć  strategiczny 
charakter
  (np.  kilkuletnia  analiza  sprzedaży  określonych  produktów  w  celu 
wprowadzenia na rynek nowych produktów i usług). 

Proces podejmowania decyzji może być krótkotrwały i mieć charakter taktyczny 
(
np. 

rewidowanie 

i zmienianie liczby zalecanych zamówień danego produktu). 

Systemy  dostarczające  informacje,  które  sprawiają,  że  pracownicy  są  lepiej 
przygotowani do podejmowania przemyślanych decyzji, to systemy wspomagania 
podejmowania decyzji. 

background image

Bazy danych

5

CELE SYSTEMÓW DSS

System  wspomagania  decyzji  powinien  realizować  następujące 

zasady:

1.

Głębia  informacji  -  przegląd  informacji  od  najwyższego  do  najniższego 
poziomu;  użytkownik  może  przeglądać  zarówno  globalne  zestawienia 
informacji, jak i najdrobniejsze szczegóły dotyczące jednostek wchodzących 
w skład tych zestawień.

2.

Porównywanie  informacji  -  łatwe  porównywanie  informacji  na  podstawie 
wspólnych cech, (np. porównanie zarobków w zadanych okresach czasu, dla 
określonej kategorii pracowników).

3.

Użyteczność informacji - zastosowanie w rozwiązywaniu problemów firmy, 
musi być w jakiś sposób użyteczna dla firmy. Sama ilość zebranej informacji 
nie gwarantuje jej użyteczności.

4.

Punktualność informacji - informacja użyteczna ze względu na treść, ale 
uzyskana  zbyt  późno,  może  być  bezwartościowa  (np.  podsumowanie  I 
kwartału  roku  wykonane  na  koniec  II  kwartału,  wskazujące  na  ucieczkę 
klientów do konkurencji, jest całkowicie bezwartościowe).

5.

Szybka analiza - analiza danych na wiele sposobów; każde zapytanie musi 
być wykonane  szybko,  aby  zestaw  skomplikowanych  zapytań  był  wykonany 
w rozsądnym czasie.

6.

Dostępność informacji – prezentowanie informacji w języku biznesu, a nie 
w  języku  systemów  analitycznych  (analizy  przy  użyciu  słów  i  języka 
zrozumiałego dla użytkownika).

background image

Bazy danych

6

HURTOWNIE DANYCH

Hurtownia  danych

  (data  warehouse,  DW)  to  analityczna  baza  danych 

wykorzystywana jako podstawa systemu wspomagającego podejmowanie decyzji. 
Hurtownię projektuje się dla dużej liczby stałych danych. Zapewnia ona dostęp 
do informacji, które będą wykorzystane podczas wypracowywania decyzji. 

Hurtownia  danych

  jest  zestawem  narzędzi  pozwalających  kierownikom, 

dyrektorom  i  analitykom  szybciej  i  skuteczniej  podejmować  decyzje. 
Podstawowym  celem  HD  jest  dostarczenie  właściwych  informacji,  właściwym 
kosztem,  we  właściwym  miejscu  i  czasie,  by  na  ich  podstawie  można  było 
podejmować właściwe decyzje.

Tradycyjne  systemy  transakcyjne  (online  transaction  processing,  OLTP)  nie  są 
najskuteczniejszym  narzędziem  wspomagającym  podejmowanie  decyzji,  z  kolei 
samo  wykorzystanie  szybkich  połączeń  sieciowych  nie  rozwiąże  problemu 
sprawnego dostępu do informacji. 

Hurtownie  danych  stanowią  platformę  integrującą  dane  pochodzące  z  różnych 
źródeł i umożliwiającą ich przetwarzanie analityczne (online analytic processing, 
OLAP
).

background image

Bazy danych

7

HURTOWNIE DANYCH - UMIEJSCOWIENIE

Hurtownia  danych  gromadzi  wybrane  informacje  i  pozwala  na  szybszy,  tańszy  i 
efektywniejszy do nich dostęp, stanowiąc rodzaj długookresowego bufora między 
systemami OLTP a OLAP. 

Rys. HD jako element pośredni między przetwarzaniem transakcyjnym a przetwarzaniem analitycznym

1. W jaki sposób ujednolicać strumień danych napływających z różnych źródeł?
2. Jak  dostosować  sposób  przechowywania  informacji  do  konkretnych 

programów typu OLAP?

Budowa hurtowni danych determinowana jest kompromisem między tymi dwoma 
zadaniami, zmieniającym się ciągle zgodnie z zapotrzebowaniem rynkowym.

Hurtownie  danych  nie  mogą,  więc  być  wytwarzanymi  masowo  „produktami  z 
półki"  i  zawsze  wymagają  indywidualnego  zaprojektowania  i  optymalizacji  z 
uwzględnieniem potrzeb klienta. 

Tradycyjne techniki projektowania baz danych nie uwzględniają wielu czynników 
charakterystycznych  dla  HD,  np.  problem  wyboru  źródła  danych,  zależności 
czasowe, agregacje, kontrola nadmiarowości.

background image

Bazy danych

8

ARCHITEKTURA HURTOWNI DANYCH

Strukturę  HD  tworzą  kolejne  warstwy  danych  (dane  jednej  warstwy  są 
pochodnymi warstwy niższej). 

Rys. Ogólna architektura HD

Źródła  danych  (operacyjne  bazy  danych)  - 
najniższa  warstwa;  usystematyzowane  dane 
przechowywane  w  otwartych  systemach  baz 
danych,  dane  nieuporządkowane  lub  częściowo 
uporządkowane, przechowywane w plikach.

Środkową warstwę zajmuje „globalna" hurtownia 
danych,  nazywana  też  hurtownią  podstawową 
lub 

centralną 

zbiór 

zintegrowanych, 

nieulotnych, 

ukierunkowanych 

baz 

danych 

stanowiący  podstawę  DSS  (dane  atomowe, 
podsumowania).

Kolejną  warstwę  stanowią  „lokalne"  hurtownie 

dane 

silnie 

zagregowane, 

będące 

podsumowaniem informacji z globalnej hurtowni. 
Przeznaczone 

są 

do 

bezpośredniego 

wykorzystania 

zarządzaniu, 

planowaniu 

długoterminowym, 

analizach 

historycznych, 

analizach  trendów,  przetwarzaniu  informacji  i 
analizach zintegrowanych.

 

Lokalne hurtownie danych, np.

 hurtownie tematyczne (data marts, składnice 

danych, hurtownie oddziałowe)

 bazy danych OLAP.

background image

Bazy danych

9

HURTOWNIE TEMATYCZNE

Hurtownie  tematyczne

  to  niewielkie  hurtownie,  zawierające  wycinek  pełnej 

informacji zgromadzonej w hurtowni globalnej.

 

Mogą być np. używane przez jeden z oddziałów firmy i dotyczyć tylko informacji 
o  tym  oddziale  (np.  dział  marketingu  -  informacje  o  klientach,  transakcjach  i 
sprzedawanych produktach), podczas gdy globalna HD powinna też obejmować 
dane na temat zatrudnionych w firmie, działach itp. 

Tematyczne  HD  mogą  być  zaimplementowane  jako  relacyjne  bazy  danych  lub 
specjalne struktury wielowymiarowe.

 

Różnice  pomiędzy  globalnymi  hurtowniami  danych  a  lokalnymi 
hurtowniami tematycznymi:

1.

Globalne HD - efekt złożonego procesu ekstrakcji, integracji i transformacji 
danych;

 

Hurtownie tematyczne – wynik procesu transformacji i agregacji danych z  
globalnej HD.

 
2.

Dane w globalnej HD - szczegółowe, obszerne, słabo zagregowane;

Dane w lokalnych hurtowniach tematycznych - silnie zagregowane, mniejsze 
rozmiary. 

background image

Bazy danych

10

MAGAZYN DANYCH OPERACYJNYCH (ODS)

Magazyn  danych  operacyjnych

  (operational  data  store,  ODS)  -  warstwa 

pośrednia pomiędzy warstwą danych źródłowych a globalną hurtownią danych.

Warstwa  ODS  zawiera  zintegrowane  dane  tematyczne,  aktualne  (ulotne)  i 
szczegółowe. 

ODS  zawiera  zwykle  wyniki  transformacji,  integracji  i  agregacji  danych  ze 
źródeł,  podobnie  jak  globalna  hurtownia  danych  (ODS  jest  zbiorem 
zmaterializowanych perspektyw relacyjnych).

Główne różnice między ODS a hurtownią danych są następujące:  

1.

ODS jest aktualizowany o wiele częściej niż hurtownia danych; 

 

2.

zawiera znacznie aktualniejsze informacje; 

3.

stopień  agregacji  (ziarnistości)  danych  jest  znacznie  mniejszy  (dane  mogą 
być np. w niewielkim tylko stopniu podsumowane). 

Baza  metadanych  jest  pomocna zarówno  dla  administratora, jak i  projektanta 
hurtowni  danych  (duża  złożoność  HD  -  architektura  (fizyczna  i  logiczna)  może 
być bardzo  skomplikowana,  ilość danych  ogromna i  mogą być  stosowane  różne 
metody  ekstrakcji,  transformacji,  agregacji,  czyszczenia  i  przechowywania 
informacji

background image

Bazy danych

11

PROJEKTOWANIE HD

Projektowanie hurtowni danych jest trudnym zadaniem, należy rozwiązać 
wiele problemów:

 

1.

pogodzić semantycznie informacje pochodzące z różnych źródeł i połączyć je 
we wspólny model hurtowni danych przedsiębiorstwa

 

2.

zaprojektować  logiczną  strukturę  relacji  w  podstawowej  części  hurtowni 
danych; 

3.

uwzględnić  problemy  techniczne  związane  z  samym  projektowaniem 
(wybów  sposobu  reprezentacji  tablic,  procesów,  indeksów,  podziałów 
danych,  logicznego  schematu  hurtowni,  zapewnienie  sprawności  całego 
systemu);

4.

wyboru bazy sprzętowej i tworzenie oprogramowania.   

Projektowanie HD nie kończy się z chwilą jej wdrożenia, ale stanowi stałą część 
cyklu życia systemu.

 

Stosowane metodologie projektowania hurtowni danych: projektowanie metodą 
zstępującą
 (top-down) i wstępującą (bottom-up).

Ogólny kształt ostatecznego schematu hurtowni danych:  

1.

pierwsza warstwa - ODS (czyszczenie i transformację danych);

 

2.

zdenormalizowana,  gwiaździsta  baza  danych  –  miejsce  przechowywania 
danych

background image

Bazy danych

12

ZASILANIE DANYMI HD

Dostęp do danych z wielu różnorodnych źródeł informacji: 

1.

systemów  baz  danych  (relacyjnych,  obiektowych,  hierarchicznych, 
sieciowych, itp.);

2.

źródeł 

zewnętrznych 

(np. 

od 

innych 

przedsiębiorstw, 

instytucji 

gromadzących dane, itp.);

3.

plików  standardowych  typów  (np.  Microsoft  Excel,  programy  napisane  w 
języku COBOL, itp.);

4.

innych dokumentów (Microsoft Word, strony WWW).

Programy do przenoszenia danych ze źródeł do HD:

1.

tłumaczące (wrappers) 

2.

ładujące (loaders); 

3.

integrujące (mediators).

Ponadto programy ekstrahujące dane mogą analizować informacje źródłowe pod 
kątem  przyczyn  występowania  wartości  nietypowych  (odstających),  być  może 
błędnych.

background image

Bazy danych

13

PROGRAMY ETL

Narzędzia  z  tej  grupy,  handlowo  zwanej  programami  ekstrakcji-transformacji-
ładowania  (ETL,  extraction-transformation-load),  automatyzują  lub  ułatwiają 
następujące rodzaje zadań:

ekstrakcja (dostęp do różnorodnych źródeł danych),

czyszczenie (wykrywanie i rozwiązywanie niespójności danych źródłowych),

transformacje (np. pomiędzy różnymi formatami danych, językami),

ładowanie (wprowadzanie danych do hurtowni),

replikacja (tworzenie kopii danych źródłowych w hurtowni danych),

analiza  (np.  wykrywanie  w  danych  wartości  nieprawidłowych  lub 

nieoczekiwanych),

szybki  transfer  danych  (ważne  w  przypadku  bardzo  dużych  hurtowni 

danych),

kontrola  jakości  danych  (np.  z  punktu  widzenia  kompletności  i 

poprawności),

analiza  metadanych  (pod  kątem  wykorzystania  ich  w  projektowaniu 

hurtowni danych) 

background image

Bazy danych

14

WIELOWYMIAROWE DANE Z HD

Narzędziami pozwalającymi na dostęp i wykorzystanie informacji sumarycznych 
zebranych w hurtowni są programy typu OLAP. 

Zwykle  uzyskanie  sumarycznej  informacji  z  bazy  znormalizowanej  za  pomocą 
narzędzi  OLAP  wymaga  wielu  złożonych  zapytań  z  wielokrotnym  łączeniem  i 
agregacjami, co powoduje przeciążenie relacyjnej bazy danych.

Typowe operacje wykonywane przez narzędzia OLAP obejmują:

 

raportowanie i wykonywanie zapytań,

wykorzystanie systemów informacji geograficznej (GIS),

eksplorację danych (data mining), czyli wykrywanie trendów i regularności 
w danych,

wspieranie decyzji (decision support systems, DSS),

dostarczanie  informacji  kadrze  zarządzającej  (executive  Information 
sys
tems, EIS),

analizy statystyczne. 

zwijanie (roli up, podnoszenie poziomu agregacji, czyli uogólnienia danych),

rozwijanie (drill down, obniżanie poziomu agregacji danych),

selekcja (slice) i projekcja (dice) wymiarów,

tablice przestawne (pivot, obracanie kostek danych). 

Poza tymi podstawowymi operacjami OLAP hurtownie danych umożliwiają: 

background image

Bazy danych

15

SZBD DLA HD

Wykorzystuje się dwa rodzaje SZBD dla HD: 

systemy superrelacyjne,

systemy wielowymiarowe.

Superrelacyjne systemy zarządzania bazą danych

Rozszerzenie  RDBMS  w  kierunku  współpracy  z  narzędziami  OLAP  za  pomocą 
tzw.  funkcji  superrelacyjnych  (rozszerzenie  formatów  przechowywania  danych, 
operacji relacyjnych i wyspecjalizowanych schematów indeksowania). 

Zmniejszenie  czasu  wykonywania  zapytań  na  potrzeby  OLAP  zostało  osiągnięte 
poprzez przechowywanie danych w strukturze gwiazdy (lub płatka śniegu). 

Uzyskany  w  ten  sposób  model  danych  może  być  bardzo  złożony  (ukryta 
złożoność za pomocą specjalnych mechanizmów ukierunkowanych na zapytania 
(architektura ROLAP (Relational OLAP)).

Wielowymiarowe  systemy  baz  danych  (multidimensional  database 
systems, MDDB)

 

Wspieranie  sposobu,  w  jaki  narzędzia  OLAP  prezentują  i  przetwarzają  dane. 
OLAP  -  proces,  który  wymaga  analizy  dużej  ilości  złożonych,  powiązanych 
danych - tworzenie różnych przekrojów. 

MDDB  przechowuje  dane  w  postaci  kostek  n-wymiarowych.  Każdy  wymiar 
reprezentuje jedną perspektywę użytkownika. 

background image

Bazy danych

16

DESKTOP OLAP, HOLAP

Segment  produktów  tanich,  czyli  desktop  OLAP,  skupia  się  na  efektywnej  i 
wygodnej  dla  użytkownika  analizie  względnie  niewielkich  kostek  danych 
przechowywanych  na  komputerach  klienckich.  W  tym  przypadku  MDDB  jest 
jedynie  pośrednikiem  wykorzystującym  dane  zgromadzone  w  (relacyjnej) 
hurtowni  danych  i  oferującym  użytkownikowi  końcowemu  możliwości 
analityczne. 

Segment  produktów  drogich,  obejmujących  rozwiązania  typu  HOLAP 
(hybrydowe,  hybrid  OLAP),  zapewnia  pełną  integrację  relacyjnej  hurtowni 
danych  (gdzie  priorytetem  jest  skalowalność)  z  modelem  wielowymiarowym 
(gdzie  priorytetem  jest  efektywność  zadań  OLAP)  w  ramach  jednej,  złożonej 
architektury. 

background image

Bazy danych

17

SPECYFICZNE ZASTOSOWANIA OLAP

Dziedziny  zastosowań  systemów  OLAP  można  podzielić  ze  względu  na 
zadania biznesowe: 

raportowanie  i  przetwarzanie  zapytań  związanych  z  typowymi  zadaniami 

związanymi 

z kierowaniem przedsiębiorstwa,

analiza problemów i możliwości (nazywana też Business Intelligence),

planowanie,

doraźne zadania z dziedziny eksploracji danych lub projektów analitycznych.

Dwie ważne dziedziny zastosowań: 

analizy sprzedaży i obsługi klientów; 

aporty i analizy finansowe oraz konsolidacja. 

background image

Bazy danych

18

STRUKTURA FIZYCZNA HD

Wyróżnia się trzy podstawowe kształty architektury hurtowni danych:

centralizowana,

federacyjna,

warstwowa. 

Rys. Architektura scentralizowana HD

W  architekturze  scentralizowanej  wszystkie  dane  wykorzystywane  do  analiz  w 
przedsiębiorstwie przechowywane są w jednej hurtowni danych. 

background image

Bazy danych

19

STRUKTURA FEDERACYJNA

Architektura  zdecentralizowana  przynosi  korzyści  jedynie  w  przypadku 
rozproszonego przetwarzania danych operacyjnych. 

Rys. Architektura federacyjna HD

Istotną cechą struktury federacyjnej jest to, że globalna hurtownia danych jest tworem wirtualnym.

background image

Bazy danych

20

STRUKTURA WARSTWOWA HD

Architektura  warstwowa  zakłada,  że  hurtownia  globalna  jest  rzeczywistą, 
fizyczną  bazą  danych.  Hurtownię  globalną  uzupełniają  kolejne  poziomy 
lokalnych  tematycznych  hurtowni  danych,  zawierających  kopie  danych 
poprzedniej  warstwy  lub  ich  podsumowania  (z  pominięciem  szczegółów, 
obecnych np. w strukturze federacyjnej). 

Rys. Architektura warstwowa HD

Struktura warstwowa może również dotyczyć źródeł danych. 

background image

Bazy danych

21

KORZYŚCI Z ROZPROSZONEJ ARCHITEKTURY HD

Korzyści z rozproszonej architektury hurtowni danych obejmują:

 

a)  krótszy  czas  działania,  gdyż  dane  są  umiejscowione  bliżej  użytkownika 

końcowego, 

b) zmniejszenie przeszukiwanego obszaru danych. 

Konieczność 

użycia 

architekturze 

rozproszonej 

wielu 

systemów 

komputerowych  może,  wbrew  pozorom,  obniżyć  koszty  całego  systemu  ze 
względu  na  niższe  wymagania  (tylko  część  danych  przechowywana  jest  w 
jednym  miejscu,  a  zapytania  wykonywane  są  równolegle  na  różnych 
komputerach), a więc niższe ceny sprzętu i oprogramowania.  

Duże znaczenie ma skalowalność systemów przeznaczonych do obsługi hurtowni 
danych. Ze względu na to, że hurtownie danych nie są systemami statycznymi i 
zwykle  rosną  z  czasem,  wybrana  architektura  musi  zapewniać  łatwość 
rozszerzania i przebudowywania struktury systemu.

background image

Bazy danych

22

METADANE

Metadane  odgrywają  istotną  rolę  w  budowie  i  działaniu  hurtowni  danych.  Aby 
efektywnie  uzyskać  cenne  informacje  z  hurtowni,  konieczna  jest  wiedza  o  jej 
zawartości  i  fizycznym  rozmieszczeniu  danych.  Oprócz  informacji  o  położeniu 
poszukiwanych przez użytkownika danych, baza metadanych może zawierać:

słowniki  danych,  zawierające  definicje  baz  danych  i  relacji  między 
elementami danych,

informacje  o  przepływie  danych,  np.  o  kierunku  i  częstotliwości  napływu 
nowych porcji,

informacje o transformacji danych, wykonywanej podczas ich przenoszenia,

numery wersji przechowywanych metadanych, informacje o modyfikacjach,

statystyki użycia danych (profil danych),

nazwy nadane poszczególnym polom w bazie

uprawnienia użytkowników dotyczące dostępu do danych.

Metadane są przechowywane w wydzielonej bazie danych, do której mają dostęp 
wszystkie  inne  składniki  HD.  Ze  względu  na  powszechność  dostępu  do 
metadanych, zachodzi potrzeba ujednolicenia ich formatu. 

Organizacja 

Metadata 

Coalition 

zaproponowała 

standard 

Metadata 

Interchange  Specification,  natomiast  Microsoft  wprowadził  program 
Microsoft Repository
 jako składnik pakietu Office, zawierające pewne modele 
używane w HD.

background image

Bazy danych

23

ZARZĄDZANIE PROJEKTEM

Projekty  obejmujące  stworzenie  i  wdrożenie  hurtowni  danych  mogą  mieć 
rozmiary od średnich do bardzo dużych i ich prowadzenie ma często zasadniczy 
wpływ na funkcjonowanie firmy. 

Rozkład  kosztów  pomiędzy  poszczególne  zadania  projektowe  i  administracyjne 
jest zbliżony do zaprezentowanego na rys. poniżej.

Rys. Koszty projektowania HD

Przyczyny niepowodzeń projektowania HD:
-  niedostatek literatury przedmiotu;

-  niedoszacowanie wymagań sprzętowych i programowych; 

Problemy techniczne narastają w miarę powiększania się wielkości HD i liczby 
użytkowników. 

background image

Bazy danych

24

KORZYŚCI Z WDROŻENIA HD

Gdy  zrozumie  się,  czym  różni  się  hurtownia  danych  od  tradycyjnego  systemu 
przetwarzania operacyjnego, pytaniem staje się: 

–  Dlaczego poświęcać czas, pracę i pieniądze na stworzenie takiego monstrum? 
–  Jakie nowe wartości wniesie do organizacji przedsiębiorstwa? 

Główne korzyści ze stworzenia hurtowni danych są następujące:

– Zintegrowany i całościowy obraz przedsiębiorstwa.

– Dostęp do archiwalnej informacji o przedsiębiorstwie.

–  Wewnątrz  przedsiębiorstwa  jednoznaczne  źródło  informacji,  które  jest  godne 

zaufania.

–  Wspomaganie  podejmowania  decyzji  bez  ingerencji  w  systemy  przetwarzania 

operacyjnego.

background image

Bazy danych

25

ZASTOSOWANIA HURTOWNI DANYCH

Hurtownia danych musi przynosić widoczne korzyści 

w działalności firmy !!!

Najbardziej  oczywiste  korzyści  dają  zastosowania,  które  maksymalizują 
dochodowość  firmy  w  sposób  umożliwiający  jej  zmierzenie  i  odniesienie 
bezpośrednio do wyników finansowych firmy. 

Hurtownie  danych  dostarczają  informacji  mających  istotny  wpływ  na 
działalność  przedsiębiorstwa.  Często  modele  biznesowe  i  strategie 
opracowane  dla  hurtowni  danych  stają  się  częścią  systemów 
produkcyjnych.

Dobrze zaprojektowana hurtownia danych umożliwia więcej niż jedno jej 
zastosowanie,  tak  więc  zwrot  nakładów  nie  ogranicza  się  do  jednego 
obszaru.

   

background image

Bazy danych

26

WYKRYWANIE OSZUSTW

Pomysł  polega  na  opracowaniu  (na  podstawie  możliwości  hurtowni) 
algorytmu  wykrywania  oszustw,  a  następnie  wykorzystania  go  w 
systemach operacyjnych.

Wykorzystując  dane  archiwalne  z  hurtowni  tworzy  się  modele  do 
przewidywania  schematów  oszustw,  tak  aby  można  je  było  wykryć  przed 
wystąpieniem wielkich strat z ich powodu.

Przykład:

Dokonywanie zakupów z wykorzystaniem kart kredytowych.

Posiadacze kart wykazują powtarzające się wzorce zachowań w tym, co kupują, 
gdzie, kiedy i ile wydają. 

Łatwo  jest  wykryć  oszustwo,  przyglądając  się  nieregularnościom  w  przyjętych 
wzorcach zachowań (duże zakupy w krótkim czasie, inne miejsca zakupów, itp.)

Informacje  z  hurtowni  danych  wykorzystywane  są  w  celu  scharakteryzowania 
wzorców  oszustw  i  wzorców  legalnego  wykorzystania  karty,  a  następnie 
dostarczenie 

odpowiednich 

algorytmów 

(oraz 

kluczowych 

zmiennych 

archiwalnych)  do  systemów  operacyjnych,  aby  zapobiegać  oszustwom  w  czasie 
rzeczywistym lub półrzeczywistym.

background image

Bazy danych

27

UKIERUNKOWANY MARKETING

Hurtownia danych pozwala na indywidualizację rynku, w przeciwieństwie 
do stosowanych strategii masowych.  

Wykonanie  skomplikowanych  analiz  informacji  przechowywanej  w 
hurtowni  danych  umożliwia  handlowcom  ukierunkowanie  sprzedaży  na 
wybrane grupy klientów, a nawet zindywidualizowaną sprzedaż.

Uzyskuje  się  informacje  na  temat  demografii  klientów,  zachowań, 
zapotrzebowań na produkt. Grupuje się klientów o podobnych cechach i 
zachowaniu i dostosowuje się metody kontaktu z nimi. 

Im  więcej  informacji  z  hurtowni  danych  będzie  osiągalnych  (z  szerokiej 
populacji  klientów)  oraz  im  lepsze  zostaną  zastosowane  metody  ich 
efektywnego  wykorzystania,  tym  stopień  indywidualizacji  marketingu 
będzie wzrastał.

Gdy  marketing  jest  ukierunkowany  na  pojedynczego  osobnika, 
prawdopodobieństwo pozytywnej reakcji wzrasta znacząco.

background image

Bazy danych

28

ANALIZA RENTOWNOŚCI

Wykorzystanie hurtowni danych do określenia rentowności swojej firmy, 

wskazania klientów dochodowych i niedochodowych. 

Wykorzystując  modele  kosztów  oparte  na  aktywności  klientów  i 
szczegółowe  informacje  o  ich  dochodach,  można  ocenić  dochodowość 
każdego klienta. 

Często  bywa  tak,  że  znaczny  procent  zysków  firmy  pochodzi  od 
niewielkiego procenta klientów (np. zasada 80/20).

Korzyściami  stosowania  hurtowni  danych  w  tym  przypadku  jest 
zidentyfikowanie  mało  rentownych  klientów  i  opracowanie  programów 
umożliwiających przesunięcie ich do kategorii bardziej dochodowej.

Takie programy mogą polegać na:
 zmianie cen i restrukturyzacji pewnych ofert
 wykorzystaniu programów edukacyjnych do wpływania na zachowanie 
klientów
  wprowadzeniu  nowych  produktów  i  usług  ukierunkowanych  na 
niedochodowych
    klientów
  ucieczce  od  niedochodowych  klientów  w  celu  poprawienia  jakości 
usług 

dla

    klientów dochodowych

background image

Bazy danych

29

ZATRZYMYWANIE KLIENTÓW

Zatrzymanie istniejących klientów jest mniej kosztowne od zdobywania 

nowych lub odzyskiwania klientów zabranych przez konkurencję.

Wykorzystując  hurtownię  danych,  analitycy  mogą  opracować  modele 
oceny  ryzyka,  pozwalające  na  zidentyfikowanie  klientów,  którzy  mogą 
odejść zanim to się stanie.

Klienci  wysyłają  sygnały  o  swoich  zamiarach  na  długo  przed  ich 
spełnieniem – często zanim staną się tego świadomi.

Pytaniem  dla  usługodawcy  jest,  czy  zbiera  odpowiednie  dane  i  czy 
można  je  zinterpretować,  tak  aby  były  przydatne  w  programie 
zatrzymywania klienta. 

Modele oceny ryzyka mogą przewidywać dostatecznie wcześnie, co może 
się zdarzyć  w przyszłości, żeby temu zapobiec.

Program  zatrzymywania  klienta  może  polegać  na  specjalnych 
promocjach,  telefonach,  listach  z  wyrazami  uznania  lub  też  na  akcji 
marketingowej  mającej  na  celu  uświadomienie  i  przypomnienie  zalet 
oferty firmy.  

background image

Bazy danych

30

ZARZĄDZANIE ZAPASAMI

Dobry handel polega na posiadaniu właściwych towarów we właściwym 

miejscu, czasie i po właściwej cenie.

Kluczową  sprawą  dla  efektywnego  zarządzania  zapasami  jest  dostęp  do 
informacji  o  wzorcach  popytu  i  zachowaniu  się  dostawców,  jak  i 
podstawowe  informacje  dotyczące  marginesów  zysku  i  wymagań  na 
powierzchnię magazynową. 

Hurtownia  danych  wykorzystywana  w  zarządzaniu  zapasami  potrzebuje 
danych  historycznych  z  co  najmniej 15  do 27  miesięcy,  aby  można było 
określić  długofalowe  tendencje  w  sprzedaży  dla  poszczególnych 
produktów i dla sklepu.

Zrozumienie  wpływu  sezonowości  i  możliwość  odniesienia  nowych 
produktów  do  porównywalnych  z  przeszłości  pozwala  na  całkiem 
dokładne przewidywanie przyszłego popytu.

Dobry  sprzedawca  wykorzystuje  różne  analizy  dla  każdego  sklepu 
oddzielnie i ustala ofertę i jej wielkość dla lokalnych rynków.

 

background image

Bazy danych

31

ANALIZA RYZYKA KREDYTOWEGO

Wraz z nasyceniem się rynku analiza ryzyka kredytowego staje się coraz 

bardziej skomplikowana.

W celu dokładnego określenia ryzyka związanego z udzieleniem kredytu 
każda większa  firma kredytowa  opracowuje  modele  ilościowe,  oparte  na 
danych  z  przeszłości,  umożliwiające  przewidywanie  zachowania  się 
osobników podczas spłacania kredytu.

Dokładniejsze  modele  opierają  się  na  lepszej  analityce  i  lepszym 
dostępie do informacji o klientach występujących o kredyty. 

Ocena    ryzyka  kredytowego  może  być  szczególnie  efektywna,  gdy 
standardowe  dane  biurowe  uzupełnimy  danymi  pochodzącymi  z 
wewnętrznej hurtowni danych.

Przez zastosowanie poufnej wiedzy o zachowaniu klientów, pochodzącej z 
wewnętrznych źródeł, możliwe jest opracowanie modeli przewyższających 
dokładnością 

oceny 

oparte 

na 

informacjach 

pozyskiwanych 

zewnętrznych źródeł.

Zbieranie i utrzymywanie informacji z wielu systemów źródłowych w 

hurtowni danych jest warunkiem powodzenia takiej strategii.  

background image

Bazy danych

32

DŁUGOTERMINOWA OCENA WARTOŚCI KLIENTA

Poznanie wartości związków z klientem, to coś znacznie więcej niż ocena 

jego np. zeszłorocznej rentowności.

Mało  dochodowy  klient  może  stać  się  bardzo  dochodowym  lub 
odwrotnie.  Sztuką  jest  ocenienie  który  scenariusz  jest  bardziej 
prawdopodobny.

Modele predykcyjne stosowane do oceny klienta są oparte na informacji 
z hurtowni danych o zachowaniu się klienta, cechach psychologicznych, 
demograficznych, itp.

Zachowanie  klienta  śledzi  się  w  hurtowni  danych  poprzez  takie 
wydarzenia, jak zakupy, ankiety i inne kontakty z firmą.

Informacje  o  kliencie  uzupełnia  się  również  danymi  pochodzącymi  ze 
źródeł  zewnętrznych  (skłonności  do  robienia  zakupów,  profile  ryzyka, 
itp.)

 

.

Hurtownia  danych  umożliwia  zarówno  ocenianie  prognostyczne,  jak  i 
dostarczanie  informacji  dla  potrzeb  marketingowych  i  do  systemów 
operacyjnych, 

które 

ułatwiają 

zatrzymanie 

potencjalnych 

długoterminowych klientów.

 

background image

Bazy danych

33

USTALANIE CENY

Ustalanie konkurencyjnej ceny zawiera w sobie rozpoznawanie popytu na 

produkt, konkurencyjność rynku i granic rentowności.

Wszystkie te dane mogą pochodzić z hurtowni danych. 

Popyt  na  produkt  można  określić  na  podstawie  danych  z  przeszłości,  z 
uwzględnieniem  warunków  rynkowych  i  sezonowości.  Ustalanie 
konkurencyjnej  ceny  polega  także  na  zbadaniu  cen  produktów 
zastępczych i alternatywnych wyborów dokonywanych przez klientów.

W  decyzjach  dotyczących  cen  należy  również  brać  pod  uwagę  granice 
rentowności. Na podstawie informacji z hurtowni danych, często buduje 
się  skomplikowane  modele  pozwalające  ustalić  strukturę  cen  w  taki 
sposób, żeby zmaksymalizować dochody.  

background image

Bazy danych

34

LITERATURA

1. V.  Poe,  P.  Klauer,  S.  Brobst  –  Tworzenie  hurtowni 

danych, WNT.

2. M.  Jarke,  M.  Lenzerini,  Y.  Vassiliou,  P.  Vassiliadis, 

Hurtownie danych, WSiP.

background image

Bazy danych

35

KONIEC


Document Outline