Digital Image

Processing

Lecture 3:

Contrast Transformation &

Image Binarization

Profesor

Valery Starovoitov

Rozszerzanie zakresu jasności

(Contrast stretching)

W obrazach, których zakres jasności nie zajmuje całej skali
dostępnej dla obrazu, można przez odpowiednią transformację
skorygować i równocześnie zwiększyć kontrast. Rozszerzenie
zakresu jasności omówimy jako przykład operacji liniowej
opisanej wzorem (2.4). Niech zakres jasności wykorzystywany
przez obraz zawiera się pomiędzy Jmin i Jmax. Wtedy operacja
liniowego rozszerzania jasności na cały zakres jasności [0, 255]
wyraża się wzorem:

dla J

min

< J(x, y) <J

max

(2.15)

)

(

255

)

(

min

max





Obraz po operacji wyrównywania histogramu

Obraz po operacji
liniowego rozszerzania
jasności

Piecewise-Linear Contrast

Stretching

To increase the dynamic range of the gray

levels in the image being processed.

Gray-Level Slicing

• To highlight a specific range of gray levels

in an image (e.g. to enhance certain
features).

One way is to display
a high value for all
gray levels in the
range of interest and
a low value for all
other gray levels
(binary image).

Gray-Level Slicing

– The second approach is to brighten the desired

range of gray levels but preserve the
background and gray-level tonalities in the
image:

Image Enhancement in the Spatial

Domain

Bit-Plane Slicing

To highlight the contribution made to the total

image appearance by specific bits.

– i.e. Assuming that each pixel is represented by

8 bits, the image is composed of 8 1-bit planes.

– Plane 0 contains the least significant bit and

plane 7 contains the most significant bit.

Bit-Plane Slicing

More on bit planes:

– Only the higher order bits (top four) contain

visually significant data. The other bit planes
contribute the more subtle details.

– Plane 7 corresponds exactly with an image

thresholded at gray level 128.

Towards binarization

Progowanie obrazu

Jednym z podstawowych zadań analizy obrazu jest segmentacja, czyli podział obrazu

na obszary spełniające pewne kryterium jednorodności. Mówiąc inaczej, pojęcie

obszaru jest używane do określenia spójnej grupy punktów obrazu mających

dodatkowo pewną wspólną cechę, która nie występuje poza najbliższym sąsiedztwem.

Jedną z najprostszych metod wydzielania obszarów jest progowanie. Polega ono na

porównywaniu wartości każdego punktu obrazu z zadaną wartością progową.

Odpowiedni wybór wartości progowej umożliwia wyodrębnienie obszarów określonego

typu. Powstało kilka wersji metody wyodrębniania obszarów przez progowanie.

Metoda najprostsza stosuje jedną wartość progu i jest realizowana według zależności









)

(

;

)

(

;

)

(

(2.16) gdzie t - próg
binaryzacji.

Specjalny przypadek transformacji









)

(

)

(

)

(

)

(













)

(

)

(

)

(

)

(

Progowanie jest prostą i szybką operacją.

Metody progowania globalnego

Wybór optymalnego progu

podczas przetwarzania

obrazów jest ważny i trudny.

Prostą metodą jest określanie

progu na podstawie

histogramu poziomów jasności

obrazu. Jeżeli histogram będzie

miał rozkład bimodalny, to jako

próg wybiera się takie miejsce,

któremu odpowiada minimum

między pikami histogramu.

Przy użyciu takiego progu treść

obrazu zostanie podzielona na

dwie klasy - obiekty

i tło (rys. 2.12).

Metody tej nie używa się do

znajdowania więcej niż dwóch

progów, nawet jeśli jest więcej

pików w histogramie.

Przykładowy histogram bimodalny

Binarizatio
n

•

Wyżej opisane podejście można również zrealizować

w wersji iteracyjnej. Wtedy schemat postępowania dla

rozkładu bimodalnego może być następujący:

•

1. Przyjmij początkową wartość progu t.

•

2. Oblicz średnią wartość czerni tcz wszystkich pikseli poniżej

progu t.

•

3. Oblicz średnią wartość bieli tb wszystkich pikseli powyżej

progu t.

•

4. Oblicz nową wartość progu

•

5. Powtarzaj obliczenia aż t przestanie się zmieniać.





Wyznaczanie progu na podstawie

prostej statystyki obrazu

Zakładamy, że treść analizowanego obrazu można podzielić na
dwie klasy – obiekty i tło. Do wyznaczenia progu skorzystamy z
pewnej statystyki, która nie wymaga konstruowania histogramu.
Algorytm obliczania progu składa się z następujących kroków:
Wyznaczyć moduł gradientu jasności dla każdego punktu obrazu
G(x,y)  =  max {|Gx(x,y)|, |Gy(x,y)|},
gdzie:  Gx(x,y)  =  J(x+1,y) – J(x-1,y),
Gy(x,y)  =  J(x,y+1) – J(x,y-1).
-     Obliczyć próg według wzoru





)

(

)

(

)

(

Metoda Otsu

Metoda wyznacza się próg t, który dzieli piksele obrazu na dwie

klasy c0 i c1 (obiekty i tło). W dalszych rozważaniach zakładamy,

że:
obraz może mieć L poziomów jasności;
ni oznacza liczbę pikseli o poziomie jasności i, i = 0, 1,... L-1;
całkowita liczba pikseli n = no + n1 + ... nL-1;
histogram obrazu jest unormowany i może być traktowany jak

rozkład prawdopodobieństwa



, i = 0, 1,...L – 1,









;

piksele dzielimy na dwie klasy co i c1 za pomocą progu o wartości t,
gdzie co oznacza piksele o jasności (0,1,... t), zaś c1 oznacza piksele
(t+1,... L-1).

Prawdopodobieństwo wystąpienia tych klas i ich

wartości średnie dane są wzorami:





= P



































gdzie P



są odpowiednio momentami zerowego i pierwszego

rzędu dla histogramu obrazu oraz









jest średnią jasnością całego
obrazu.

Można łatwo sprawdzić, że dla dowolnego t jest słuszna następująca relacja:







Wariancje klas dane są wzorami:

)

(













)

(

















Znalezienie optymalnego progu można dokonać na
podstawie optymalizacji jednej
z następujących (równoważnych) funkcji kryterialnych
zależnych od progu t:



















)

(

)

(

)

(

















- wariancja międzyklasowa,







- wariancja wewnątrzklasowa











)

(





- wariancja globalna,

przy czym



jest niezależne od wartości progu t i wyraża się wzorem







Warto zwrócić uwagę, że wymaga posługiwania się

statystykami 2‑go rzędu (wariancja), podczas gdy - 1-
go rzędu (średnie klas). Dlatego jest najprostszą
miarą zależną od t. Stąd optymalny próg t* możemy
obliczyć ze wzoru:

)

(

max

arg









max

arg







)

(



Ponieważ wariancja jest miarą rozrzutu poziomów
szarości wokół średniej, stąd duża jej wartość oznacza, że
odchylenie od średniej jest duże i piksel obrazu jakby
słabo przynależy do regionu. W związku z tym
maksymalizowanie (2.21) oznacza zwiększanie
odizolowania dwu klas w binaryzowanym obrazie.

(2.21
)

Algorithim Otsu

Gonzalez’ method for thresholding

(Rafael C. Gonzalez, Richard E. Woods, Steven L. Eddins,

“Digital Image Processing Using Matlab”)

function [bw, t] = threshold_gw(b);
% b bimodal image (dark on bright or bright on dark)
b=double(b);
t=0.5*(min(b(:))+max(b(:)));
told=0;
c=1;
bw(:,:,c)=(b<t);
while abs((told-t)/told)>0.01

c=c+1;
m1 = mean(b(b>t));
m2 = mean(b(b<t));
told=t;
t=0.5*(m1+m2)
bw(:,:,c)=(b<t);

end

Problemy

• Adaptive thresholding typically takes a grayscale

image as input and, in the simplest implementation,
outputs a binary image.

• There are two main approaches to finding the

threshold:

(i) the Chow and Kaneko approach,
(ii) local thresholding.

• The assumption behind both methods is that smaller image

regions are more likely to have approximately uniform
illumination, thus being more suitable for thresholding. Chow
and Kaneko divide an image into an array of overlapping
subimages and then find the optimum threshold for each
subimage by investigating its histogram. The threshold for each
single pixel is found by interpolating the results of the
subimages. The drawback of this method is that it is
computational expensive and, therefore, is not appropriate for
real-time applications.

Adaptive thresholding

An alternative approach

An alternative approach to finding the local threshold is to
statistically examine the intensity values of the local
neighborhood of each pixel. The statistic which is most
appropriate depends largely on the input image. Simple and
fast functions include the mean of the local intensity
distribution,

T=mean,

the median value,

T=median,

or the mean of the minimum and maximum values,

T=(max+min)/2

The size of the neighborhood has to be large enough to cover
sufficient foreground and background pixels, otherwise a poor
threshold is chosen. On the other hand, choosing regions which
are too large can violate the assumption of approximately
uniform illumination.
This method is less computationally intensive than the Chow
and Kaneko approach and produces good results for some
applications.

Metody progowania lokalnego

Podczas progowania lokalnego obraz
dzielony jest na podobrazy i próg
określa się dla każdego z nich
niezależnie. To powoduje, że pojawiają
się nieciągłości na granicach dwu
różnych podobrazów (rys. 2.13d).
Dlatego stosuje się różne techniki
wygładzania tych nieciągłości obrazu,
np. poprzez lokalnie liniowe
interpolowanie wartości
progów (rys. 2.13c).
Używając interpolacji skonstruowanej
na podstawie progów sąsiednich
podobrazów otrzymuje się wygładzony
obraz, jak pokazuje rys. 2.13e.

Lokalne progowanie jest formą
progowania adaptacyjnego.

Rys. 2.13

Segmenting text from the image

global

mean of
a 7×7
neighborhood

(mean-C),
C=7,
7×7
neighborhood

(mean-C),
C=10,
75×75
neighborhood

(median-C),
7×7 and C = 4

Zakończenie

• Wiele globalnych metod progowania można

rozszerzyć na operację wieloprogowania.

• Uogólnienie metody globalnej na

wieloprogowanie omówimy na przykładzie
metody Otsu.

• Ogólnie trzeba stwierdzić, że problem

wieloprogowania jest trudny i poszukiwania
optymalnego algorytmu ciągle trwają.

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33