background image

Wprowadzenie do przetwarzania obrazów 

 Akwizycja obrazu

 

jest procesem pozyskiwania informacji o otaczającym świecie i przekształcania jej 

na postać obrazu będącego notacją „wyglądu” obserwowanej sceny. Klasyczne obrazy są obrazami 
analogowymi. Obraz cyfrowy powstaje z obrazu analogowego w wyniku procesów próbkowania i 
kwantowania. Do akwizycji obrazów cyfrowych mogą zostać wykorzystane różne urządzenia 
techniczne, takie jak cyfrowy aparat fotograficzny, kamera cyfrowa, skaner. 
Przetwarzanie obrazu

 

jest to stosowanie szeregu przekształceń poprawiających jakość obrazu (np. 

eliminujących jego zbędne lub szkodliwe składowe/zakłócenia/) pod kątem uwypuklenia treści 
istotnych dla analizy obrazu. Proces poprawy jakości obrazu nie prowadzi do zwiększenia jego treści, 
ale może ułatwić jej wydobycie. 
Analiza obrazu

 

jest procesem wyodrębniania z obrazu informacji istotnej z punktu 

widzenia rozpoznawania obrazu. Wynikiem analizy obrazu są dane (informacja) stanowiące opis 
obrazu. Opis obrazu jest znacznie bardziej podatny na zastosowanie metod i algorytmów 
rozpoznawania niż sam obraz. Podczas analizy obrazu gubiona jest bezpowrotnie pewna część 
informacji. 
Rodzaje obrazów - w technice cyfrowej korzysta się z następujących rodzajów obrazów: obrazu 
czarno-białego (binarnego), obrazu monochromatycznego, obrazu kolorowego. 
Obraz czarno-biały - wyróżnia się w nim tylko dwa poziomy szarości, najczęściej czarny i biały. 
Obraz monochromatyczny – obraz  o większej od dwóch liczbie poziomów szarości. 
Barwa – wrażenie psychiczne wywoływane w mózgu człowieka (i zwierząt), gdy oko odbiera 
promieniowanie elektromagnetyczne z widzialnej części fal świetlnych. 
Modele przestrzeni barw  - zaliczamy: model RGB, model CMYK,  model HSV. 
Nazwa modelu CMYK powstała ze złożenia pierwszych liter angielskich nazw barw: C – Cyan (cyjan), 
M – Magenta (magenta), Y – Yellow (żółta) i ostatniej litery angielskiej nazwy barwy czarnej – blacK. 
Nazwa modelu RGB powstała ze złożenia pierwszych liter angielskich nazw barw: R – Red 
(czerwonej), G – Green (zielonej) i B – Blue (niebieskiej). Model RGB ma zastosowanie zarówno w 
technice analogowej, jak i cyfrowej. Jest szeroko wykorzystywany w urządzeniach wyświetlających 
obraz (np. telewizory, monitory komputerowe) oraz w urządzeniach analizujących obraz (np. aparaty 
cyfrowe, skanery) . HSV - Model jest rozpatrywany jako stożek, którego podstawą jest koło barw. 
Wymiary stożka opisuje składowa S (nasycenie barwy) jako promień podstawy oraz składowa V 
(wartość barwy – jasność barwy) jako wysokość stożka. 
Macierz binarna służy do zapisu obrazu czarno-białego i jest macierzą, której elementy przyjmują 
tylko dwie wartości – czerni przypisuje się wartość 0 (zerowa jasność), a bieli wartość 1 (maksymalna 
jasność). Do zapamiętania pojedynczego punktu obrazu wystarczy jeden bit pamięci. 
Macierz poziomów szarości -  służy do zapisu obrazu monochromatycznego, a wartości jej 
elementów kodują jasności poszczególnych punktów obrazu. Do zapamiętania stopnia szarości 
pojedynczego punktu stosuje się zazwyczaj 8 bitów pamięci (klasa uint8). Pozwala to na zapamiętanie 
28, czyli 256 stopni (poziomów) szarości – poszczególne elementy macierzy przyjmują wartości 
całkowite z przedziału [0, 255]. 
Macierz RGB to macierz o wymiarach M×N×3 (M×N – rozmiar obrazu), będąca w zasadzie złożeniem 
macierzy poziomów nasycenia trzech podstawowych barw składowych: M×N×R, M×N×G, M×N×B 
(trzeci wymiar macierzy wskazuje odpowiednią barwę składową). W przypadku kodowania obrazu 
danymi klasy uint8, poszczególne elementy kolejnych macierzy M×N×R, M×N×G, M×N×B przyjmują 
wartości całkowite z przedziału [0, 255], co odpowiada 256 poziomom nasycenia odpowiednio barw 
czerwonej, zielonej lub niebieskiej. 
Macierz indeksów - podobnie jak macierz RGB, służy do zapisu obrazu kolorowego. 
Stosuje się tutaj inną niż poprzednio metodę zapisu kolorów poszczególnych elementów 
obrazu. Obraz indeksowany składa się z dwóch macierzy: macierzy (o wymiarach M×N) 
indeksów (klasy uint lub double) do macierzy kolorów oraz trójkolumnowej macierzy 
(mapy) kolorów (dane klasy double). 
Grafika rastrowa (mapa pikseli) – obraz opisany jest za pomocą siatki (macierzy, tablicy) pikseli. 
Formaty: JPEG, GIF, PNG, TIFF, RAW. 

background image

Grafika wektorowa (obiektowa) – obraz opisany jest za pomocą figur geometrycznych (w przypadku 
grafiki dwuwymiarowej) lub brył geometrycznych (w przypadku grafiki trójwymiarowej), 
umiejscowionych w matematycznie zdefiniowanym układzie współrzędnych, odpowiednio dwu- lub 
trójwymiarowym. Formaty: CDR, DWG, WMF, SVG, SWF, VSD. 
Obraz cyfrowy powstaje na etapie akwizycji sprzętowej w wyniku procesu dyskretyzacji, składającego 
się z procesów próbkowania i kwantowania. 
Próbkowanie obrazu (dyskretyzacja przestrzenna obrazu) powoduje podział przestrzenny ciągłego 
analogowego obszaru obrazu na jego elementarne jednolite części zwane pikselami. 
Próbkowanie przestrzenne obrazu – wyznaczenie średniej wartości obrazu z bardzo małego obszaru 
obrazu odpowiadającego rozmiarowi elementu światłoczułego matrycy. 
Kwantowanie obrazu (dyskretyzacja barwna obrazu) powoduje podział zakresu wartości (poziomów 
szarości /dla obrazów monochromatycznych/ lub poziomów intensywności /nasycenia/ barw /dla 
obrazów kolorowych/) obrazu analogowego na skończoną liczbę rozłącznych przedziałów i 
przyporządkowanie tym przedziałom wartości dyskretnych, czyli tak zwanych poziomów 
reprezentacji.  
Rozdzielczość przestrzenną obrazu można zdefiniować jako uporządkowaną parę liczb: 
(N/dx, M/dy) gdzie: dx, dy – liniowy rozmiar obrazu analogowego odpowiednio w poziomie i w 
pionie; N, M – liczba punktów (pikseli) obrazu cyfrowego odpowiednio w poziomie i w pionie 
(liczba kolumn i wierszy macierzy /tablicy/ pikseli). Rozdzielczość przestrzenną obrazu (gęstość 
punktów próbkowania) podaje się w pikselach na milimetr lub punktach na cal (ppi – pixels per inch, 
dpi – dots per inch, spi – samples per inch). Rozdzielczość barwną obrazu determinuje liczba 
dostępnych poziomów reprezentacji szarości lub intensywności barwy punktów (pikseli) obrazu 
cyfrowego. 
Rozdzielczość barwną obrazu determinuje liczba dostępnych poziomów reprezentacji szarości lub 
intensywności barwy punktów (pikseli) obrazu cyfrowego. Wartość poziomu szarości lub 
intensywności barwy punktu (piksela) L obrazu cyfrowego spełnia warunek: 
 L(m,n) e P/(wmax – wmin)  gdzie: m, n – dyskretne współrzędne punktu (piksela) obrazu cyfrowego; 
wmax, wmin – odpowiednio najwyższa i najniższa wartość szarości lub intensywności barwy; 
P – zbiór liczb całkowitych z przedziału [0, 2B– 1]. 
Dla obrazów binarnych do zapamiętania stanu jednego piksela wystarczy 1 bit pamięci. Dla obrazów 
monochromatycznych do zapamiętania stanu jednego piksela używa się zazwyczaj 8 bitów (bajt). Dla 
obrazów kolorowych (macierz RGB) do zapamiętania wartości poziomu intensywności (nasycenia) 
każdej barwy podstawowej używa się zazwyczaj 8 bitów, zatem do zapamiętania stanu jednego 
piksela potrzeba wówczas 24 bitów. 
Przekształcenia punktowe obrazu cyfrowego

 

są to przekształcenia dotyczące stopnia szarości lub 

intensywności barwy poszczególnych punktów (pikseli) obrazu. 
Normalizacja obrazu polega na sprowadzeniu przedziału zmian wartości poziomów szarości lub 
intensywności barwy punktów (pikseli) obrazu źródłowego do pewnego, ustalonego zakresu. 
Histogram danych obrazu jest funkcją przypisującą każdemu poziomowi szarości lub intensywności 
barwy liczbę punktów (pikseli) obrazu o tym poziomie jasności.  
Wyrównywanie histogramu polega na takim przekształceniu wartości poziomów szarości lub 
intensywności barwy poszczególnych punktów (pikseli) obrazu źródłowego, aby liczba punktów w 
każdym z przedziałów histogramu była w przybliżeniu taka sama (aby w miarę równomiernie 
rozmieszczone słupki miały podobną wysokość). 
Binaryzacja polega na przekształceniu źródłowego obrazu mającego wiele poziomów 
szarości lub intensywności barwy w wynikowy obraz binarny, którego punkty (piksele) mogą 
przyjmować tylko dwie wartości. 

                 Korekcja gamma to przekształcenie punktowe mające za zadanie przeskalowanie wartości jasności obrazu. 
   

Współczynnik gamma - określa stopień korekcji nierównomiernego przedstawiania jasnych i ciemnych pikseli                                                                                                               

   

w stosunku do średnich w monitorach. 
 

1.  Wyjaśnij pojęcia: akwizycjaanalizaprzetwarzanie i rozpoznawanie obrazów. 

 

background image

Akwizycja  obrazu  -  przetworzenie  obrazu  obiektu  fizycznego  (f(x,y))  do  postaci  zbioru  danych  dyskretnych 
(obraz cyfrowy) nadających się do dalszego przetwarzania.  

  Elementy procesu akwizycji:  

-  Oświetlenie  obrazu.        -  Formowanie  obrazu  (optyczne).  -  Detekcja  obrazu.  -  Formowanie  wyjściowego 
sygnału z urządzenia (kamera, skaner) 

Przetwarzanie obrazów  – To stosowanie szeregu przekształceń mających na celu poprawić jakość obrazu i 
uwypuklenie  treści  istotnych  w  kontekście  analizy  obrazu.  Przetwarzanie  cyfrowe  obrazów  obejmuje  m.in. 
operacje: - filtrowania - binaryzacji - transformacji geometrycznej  

Analiza  obrazu  –  wyodrębnianie  z  obrazu  informacji  istotnej  z  punktu  widzenia  rozpoznawania  obrazu. 
Wynikiem  analizy  są  dane  stanowiące  opis  obrazu.  Podczas  analizy  tracone  są  bezpowrotnie  pewne 
informacje o obrazie. 

Rozpoznawanie  obrazu  –  interpretacja  zawartości  obrazu,  wynikiem  rozpoznawania  jest  decyzja.  Może  to 
być np. identyfikacja elementow obrazu, rozpoznanie elementow i ich stanów. 

2.  Dokonaj  podziału  obrazów  pod  względem  zakresu  reprezentacji  barw.  Wymień  podstawowe  modele 

przestrzeni barw i rozwiń ich nazwy. 
Model RGB Red Green Blue (biały  255 255 255) jest jednym z pierwszych praktycznych modeli przestrzeni 
kolorów  zawierającym  receptę  dla  tworzenia  barw.  Barwy  podstawowe:  są  to  trzy  barwy  proste,  dobrane 
tak, że przez zmieszanie dowolnych dwóch spośród nich nie jest możliwe uzyskanie trzeciej, natomiast przez 
mieszanie trzech można uzyskać wrażenie dowolnej barwy prostej.  

Czerń  znajduje  się  w  początku  układu,  i  ma  wartości  R=0,  G=0,  B=0,  czyli  brak  światła.  Przeciwległy  róg  to 
biel, o wartościach R=100%, G=100%, B=100%. Zauważmy, że na krawędziach niestykających się z punktem 
czerni  i  bieli  znajdują  się  barwy  proste.  Przekątna  sześcianu,  od  punktu  czerni  do  bieli,  reprezentuje  skalę 
szarości,  czyli  wszystkie  punkty,  dla  których  R=G=B.  Poszczególne  wartości  składowe  tego  modelu  mogą 
przyjmować wartości od 0 do 255 

Model  CMYK  Cyan  Magenta  Yellow  blacK  w  praktyce  barwy  CMY  nie  sumują  się  do  czerni.  Pomijając 
skomplikowane  zagadnienia  ściśle  kolorymetryczne,  trzeba  podkreślić,  że  drukowanie  jest  zawsze 
konkretnym procesem fizyko-chemicznym dalekim od ideału. Co zaś najważniejsze, aby osiągnąć sumowanie 
się barwnika, farby są półprzeźroczyste, "rozwodnione". W efekcie pełnego nałożenia na siebie farb C, M i Y 
otrzymujemy  taką  samą  szaro-brązową  barwę,  jaką  ma  woda  po  malowaniu  akwarelkami.  Dlatego  w 
praktyce  używa  się  jeszcze  czwartej  farby, czarnej,  dla  wydobycia  głębi  kolorów  i  podkreślenia kontrastów 
(oznaczonej K, jak kontrast lub jak blacK). 

Model HSV (Hue Saturation Value)  określa wartości opisujące barwę (ang. Hue), nasycenie (ang. saturation) 
i jasność (ang. brightness). Są to cechy, które odbiera ludzkie oko na podstawie wrażenia psychofizycznego. 
W  modelu  HSB  nie  jest  stosowane  mieszanie  kolorów  składowych.  To  powoduje,  że  często  odnalezienie 
koloru za pomocą tych wartości jest łatwiejsze 

3.  Zapisz kolor biały za pomocą parametrów poznanych modeli barw.  

RGB 255 255 255 CMYK 0 0 0 HSV  0 0 100% 

4.  Wyjaśnij określenia macierz RGB i macierz indeksów zwracając uwagę na istniejące między nimi różnice. 

Macierz  RGB  macierz  MxNx3,  MxN  wymiary  obrazu.  Trzeci  wymiar  macierzy  to  wartości  nasycenia 
poszczególnych kolorow. Umozliwia to odwzorowanie 256 stopni kolorów i około 16mln kolorów 

Macierz indeksow – obraz tworzy się na podstawie 2 macierzy – macierzy indeksow MxN i macierzy kolorów 
–  3kolumnowej  gdzie  poszczególne  kolory  RGB  mieszcza  się  pomiedzy  wartościami  0,1.  Macierz  indeksow 
wskazuje wiersze macierzy kolorow i tym samym kolor przyporządkowany konkretnemu punktowi obrazu 

background image

5.  Wyjaśnij różnice między obrazem w postaci mapy pikseli (bitmapy) a reprezentacją wektorową obrazu. 

Bitmapa – obraz zapisany jest za pomocą siatki pikseli. 

Reprezentacja  wektorowa  –  obraz  zapisany  jest  za  pomocą  figur  Bryl  geometrycznych  umiejscowionym  w 
matematycznie zdefiniowanym układzie współrzędnych. 

6.  Wyjaśnij pojęcia próbkowanie i kwantowanie obrazu oraz określenia piksel i BPP

Próbkowanie  obrazu  podział  analogowego,  ciągłego  obrazu,  na  dyskretyzowany.  Polega  na  odczycie 
wartości  z  ustalonym  krokiem  (stala  czasowa).  Podczas  próbkowania  w  dół  (zmniejszania  ilości  pikseli), 
pewne informacji są usuwane z obrazu. Podczas ponownego próbkowania w górę obraz jest uzupełniany o 
nowe piksele. Użytkownik sam określa interpolację, czyli metodę dodawania lub usuwania pikseli z obrazu 

Kwantowanie  –  podzial  zakresu  wartości  sygnaly  analogowego  na  skonczona  liczbe  przedziałów  i 
przyporzadowanie tym przedziałom konkretnych wartości dyskretnych czyli tzw poziomów reprezentacji 

Piksel – połaczenie słów Picture+Element – najmniejszy jednolity element obrazu. 

7.  Wyjaśnij  na  czym  polegają  i  czym  się  charakteryzują  przekształcenia  punktowe  obrazu.  Podaj  i  opisz 

przykłady. 
Przekształcenia  punktowe,  zwane  inaczej  przekształceniami  bezkontekstowymi,  są  to  przekształcenia 
dotyczące  stopnia  szarości  lub  nasycenia  barwy  każdego  punktu  obrazu  oddzielnie.  W  przekształceniach 
punktowych wartości stopnia szarości lub nasycenia barwy poszczególnych punktów obrazu stanowią wynik 
operacji algebraicznych prowadzonych tylko na tym punkcie. 

8.  Wyjaśnij  pojęcie  histogram  obrazu.  Naszkicuj  przykładowe  histogramy  obrazu  ciemnego,  jasnego,  o  niskim 

kontraścieo wysokim kontraście
Histogram obrazu w odcieniach szarości wyznaczany jest jako suma wszystkich pikseli o danej wartości. W 
histogramie zawarta jest informacja o kontraście i jasności obrazu. Dane zawarte w histogramie umożliwiają 
również  polepszenie  jakości  obrazu.  Możliwe  operacje  to  m.in.  rozjaśnianie  i  przyciemnianie  obrazu, 
zwiększanie  i  zmniejszanie  kontrastu,  korekcja  gamma,  wyrównywanie  histogramu  oraz  rozciąganie 
histogramu. 

9.  Wyjaśnij pojęcie korekcja gamma obrazu. Zdefiniuj określenie współczynnik gamma

Korekcja gamma to przekształcenie punktowe mające za zadanie przeskalowanie wartości jasności obrazu. 

Współczynnik  gamma  -  określa  stopień  korekcji  nierównomiernego  przedstawiania  jasnych  i  ciemnych 
pikseli w stosunku do średnich w monitorach 

10.  Wyjaśnij  na  czym  polega  normalizacja  i  wyrównywanie  histogramu  obrazu.  Naszkicuj  przykładowy 

histogram obrazu ciemnego i histogram wyrównany tego obrazu. 
Wyrównywanie histogramu -

 

ma na celu takie dobranie wartosci aby wykres był mozliwie "płaski". W 

praktyce wyrównywanie histogramu sprowadza się do wykonania przeksztalcenia obraz. Operacja 
wyrównywania histogramu pozwala na uwypuklenie tych szczegółów w obrazie, które z uwagi na niewielki 
kontrast sa mało widoczne. 

Normalizacja histogramu jest prostą operacją punktową stosowaną w celu poprawy obrazów o złym 
kontraście. Zakładamy że wartości pikseli należą do podprzedziału <0,255>. wyszukujemy minimalną (minPix) 
oraz maksymalną (maxPix) wartość piksela. Następnie dla każdego piksela na obrazie wykonujemy 
następujące przekształcenie: 

pixel[x,y]=255*(pixel[x,y]-minPix)/(maxPix-minPix)