background image

GENOMIKA.

 

MAPOWANIE 

GENOMÓW

 

MAPY

 

GENOMICZNE

Bioinformatyka, wykład 3 (21.X.2008)

 

krzysztof_pawlowski@sggw.waw.pl

background image

„Gen”

 

???

Biologiczne bazy danych –

 

historia

Biologiczne bazy danych 

– „najważniejsze”

tydzień

 

temu…

background image

Wykład 3 –

 

spis treści

Genomika
Mapy genomowe
Markery genetyczne, 

mapy genetyczne
Mapowanie fizyczne
Bazy danych map genomowych

background image

GENOMIKA 

GENOMIKA 

 

badanie struktury i funkcjonowania genom

badanie struktury i funkcjonowania genom

ó

ó

w

w

GENOMIKA

GENOMIKA 

STRUKTURALNA

GENOMIKA 

PORÓWNAWCZA

GENOMIKA 

FUNKCJONALNA

MAPOWANIE GENOMU: 

Mapy genetyczne 
Mapy fizyczne

SEKWENCJONOWANIE

Ewolucja genomów

• Ewolucja genów

Transkryptom

Regulacja tranckrypcji

• Proteom

Structural

 

genomics

 

Comparative

 

genomics

 

Functional genomics

background image

GENOMIKA 

GENOMIKA 

 

badanie struktury i funkcjonowania genom

badanie struktury i funkcjonowania genom

ó

ó

w

w

GENOMIKA

GENOMIKA 

STRUKTURALNA

GENOMIKA 

PORÓWNAWCZA

GENOMIKA 

FUNKCJONALNA

MAPOWANIE GENOMU: 

Mapy genetyczne 
Mapy fizyczne

SEKWENCJONOWANIE

Ewolucja genomów

• Ewolucja genów

Transkryptom

Regulacja tranckrypcji

• Proteom

Structural

 

genomics

 

Comparative

 

genomics

 

Functional genomics

II znaczenie:

 

=proteomika

 

strukturalna

Bio

logia 

molekularna & bioinformatyka

background image

Zmienność

 

genomu ludzkiego

Nature, 2008

1695 sites

 

of

 

structural

 

variation

 

(> 6kbp)

4 million

 

SNPs

800000 small

 

indels

 

(< 100 bp)

background image

Zmienność

 

genomu ludzkiego

background image

PubMed stats

 

[Oct

 

2008]

Genomics[MAJR]

 

12,606

Bioinformatics[MAJR] 8,257

Genomics

 

43,415

Bioinformatics

 

34,610

Bioinformatics

 

(Google) 12,200,000 

Genomics

 

(Google) 12,100,000

background image

Mapa genomu –

 

graficzna prezentacja 

położenia markerów/genów na chromosomie

MAPY

GENETYCZNE

MAPY

 

FIZYCZNE

cM

bp

background image

Mapy genomowe

MAPY GENETYCZNE

MAPY

 

FIZYCZNE

 

powstają

 

w oparciu o analizę

 

częstości rekombinacji między 
badanymi markerami

 

pokazują

 

rozmieszczenie 

markerów na chromosomie oraz 
odległości genetyczne między 
nimi

 

powstają

 

poprzez bezpośrednią

 

lokalizację, technikami biologii 
molekularnej, badanej sekwencji 
DNA w genomie

jednostka:

pary zasad –

 

pz

 

(ang. bp, kbp)

jednostka:

1cM = 1% rekombinacji             
(1 crossing

 

 

over

 

na 100 mejoz)

u ludzi to ok.0,7 –

 

1 Mb 

background image

Mapy genetyczne  

Rekombinacje

Jeżeli

 

markery A i B są

 

na

 

tym

 

samym

 

chromosomie, 

częstość

 

rekombinacji

 

jest > 0 i < 0.5

Jeżeli

 

markery

 

A i B są

 

na

 

różnych

 

chromosomach,

częstość

 

rekombinacji

 

jest = 0.5. 

background image

Ten sam

 

chromosom

Różne

 

chromosomy

Bardzo

 

blisko

Blisko

Daleko

Częstość

 

CROSSING-OVER 

Rzadko

Kilka

Często

Często

Sprzężenie

TAK

TAK

NIE

NIE

θ

0%

1-4%

50%

50%

Częstość

 

rekombinacji

 

(

θ

)

From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY 

background image

Marker genetyczny

 

 

polimorficzna sekwencja DNA 

(specyficzna) z jednego miejsca na chromosomie, 
używana do mapowania genetycznego,

 

może być

 

związana z fenotypem.

Jest to podstawowe narzędzie genetyka

Marker genetyczny

klasa I

 

(markery fenotypowe)

 

to geny kodujące cechy jakościowe 

organizmu np. antygeny erytrocytarne, antygeny 
głównego układu zgodności tkankowej     
(Major Histocompatibility

 

Complex

 

-

 

MHC). 

markery tej klasy indentyfikowane

 

 

metodami serologicznymi lub metodami 
elektroforetycznymi.

klasa II

 

(markery DNA)

 

to sekwencje DNA, niekoniecznie 

kodujące, np. RFLP, SSLP, SNP

markery

 

takie

 

jako markery

 

genetycze

 

muszą

 

mieć

 

przynajmniej dwie alleliczne

 

formy.

markery tego typu identyfikowane są

 

przy użyciu technik analizy molekularnej.

background image

Markery DNA

RFLPs

 

(Restriction

 

Fragment Lenght

 

Polymorphisms) 
Minisatelity
Mikrosatelity
SNPs (Single Nucleotide

 

Polymorphisms)

background image

Markery

 

genetyczne cd.

RFLPs

 

(

R

estriction 

F

ragment 

L

enght 

P

olymorphisms) -- 

polimorfizm długości fragmentów restrykcyjnych

Miejsce cięcia enzymu restrykcyjnego HindIII. 

background image

Markery

 

RFLP

:

 

Restriction

 

Fragment  Length  Polymorphism

Żel

background image

Markery genetyczne cd.

Wady

 

markerów RFLP:

-

tylko dwie formy alleliczne

-

dużo miejsc cięcia  w dużych genomach 

background image

SSLPs

 

(

S

imple 

S

equence 

L

ength 

P

olymorphisms) – 

polimorfizm długości prostych sekwencji

-minisatelity

-

mikrosatelity

Markery genetyczne cd.

background image

Minisatelitarny

 

DNA 

VNTRs

 

(

V

ariable 

N

umber of 

T

andem 

R

epeats)  

 

zmienna liczba powtórzeń

 

tandemowych

 

sekwencje zawierające zmienną

 

liczbę

 

tandemowych powtórzeń

 

motywu 

(11 –

 

60 pz) 

z reguły występują

 

przy końcach chromosomów  -

 

telomerach

 

liczba powtórzeń

 

motywu:

 

2 do 1000,

 

w zależności od ilości powtórzeń

 

dany 

fragment DNA ma charakterystyczną

 

długość

 

(polimorfizm długości widoczny 

podczas elektroforezy)

 

VNTR może być

 

badane metodą

 

PCR wraz z elektroforezą, połączoną

 

z hybrydyzacją

 

z wyznakowaną

 

sondą. Liczba powtórzeń

 

decyduje o długości 

fragmentu, co z kolei wpływa na szybkości jego przemieszczania się

 

podczas 

elektroforezy.

w danym locus VNTR występuje znaczna zmienność

 

osobnicza

Przykładowy motyw sekwencji minisatelitarnej: 

AGGGCTGGAGG

 

Allel

 

1.

 

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

 

Allel

 

2

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

 

Allel

 

3.

 

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

AGGGCTGGAGG

 

itd. 

background image

Przykładowa 

analiza VNTRs

background image

Mikrosatelitarny

 

DNA

 

STRs

 

(

S

hort 

T

andem 

R

epeats) – 

krótkie sekwencje powtórzone tandemowo

 

sekwencje zawierające zmienną

 

liczbę

 

tandemowych powtórzeń

 

kilkunukleotydowego

 

motywu (1 –

 

4 pz) 

motyw równomiernie rozmieszczony w genomie

 

liczba powtórzeń

 

motywu minisatelitarnego:

 

10 do 50

 

i w zależności od ilości powtórzeń

 

dany fragment DNA ma charakterystyczną

 

długość

 

(polimorfizm długości widoczny podczas elektroforezy)

często motyw taki może być

 

regularnie przerywany inną

 

sekwencją. 

 

ulokowane są

 

zazwyczaj w intronach (czasami również

 

w eksonach

 

[egzonach] w postaci mniejszej liczby powtórzeń). 

background image

STR (Short

 

Tandem Repeats) 

a analiza restrykcyjna

A1A1

A1A2

A3A4

Zalety:

- duża zmienność

-

 

często tworzą

multi-locus patterns

 

charakterystyczne dla 
danego osobnika
Wady:
-

 

nie nadają

 

się

 

do 

dokładnego mapowania 
z powodu ich nielosowego 
rozkładu w genomie

A1A1   A1A2  A3A4

…ACGACGACGACG…

background image

SNPs

 

(

S

ingle 

N

ucleotide 

P

olymorphisms) – 

polimorfizm pojedynczych nukleotydów

Genom ludzki: 56 mln

 

SNPs (6,5 mln

 

„validated”

 

SNPs) -

dbSNP

 

@ NCBI

Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego 
nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na 
amplifikacji określonego fragmentu genomu w reakcji PCR 
i sekwencjonowaniu

 

uzyskanego produktu. 

Zaletą

 

tej techniki jest wysoka wydajność

 

identyfikacji polimorfizmu 

w obrębie badanej sekwencji, wadą

 

jest wysoki koszt analizy.

Markery genetyczne cd.

background image

Analiza SNP

SNP 

microarrays

molecular

 

beacons

background image

Analiza sprzężeń

zaburzenia w 

analizach:

-

 

gorące miejsca 

rekombinacji

-

 

podwójny 

crossing

 

 

over

background image

Type of marker

No. of loci Features

Blood groups

~20

May need fresh blood

1910-1960

  

No easy physical localization

Electrophoretic  mobility 
variants of serum proteins

~30

May need fresh serum, specialized assays

1960-1975

No easy physical localization
Often limited polymorphism

HLA tissue types

1 One linked set

1970-

Can only test for linkage to 6p21.3

DNA RFLPs

>10

5

Two allele markers, maximum heterozygosity 0.5

1975-

(potentially) Initially required Southern blotting, now PCR

Easy physical localization

DNA VNTRs

>10

4

Many alleles, highly informative

(minisatellites)

(potentially) Tend to cluster near ends of chromosomes

1985-

Easy physical localization

DNA VNTRs

>10

5

Many alleles, highly informative

(microsatellites)

(potentially) Can type by automated multiplex PCR

Easy physical localization

1989-

Distributed throughout genome

DNA SNPs

>10

6

Less informative than microsatellites

(single nucleotide 
polymorphisms)

(potentially) Can be typed on a very large scale by automated 

equipment without gel electrophoresis

1998-

Markery 
fenotypowe

Markery 
DNA

background image

Mapa

 

Cytogenetyczna

 

(chromosome bands) –

 

rozróżnialne

 

zabarwione

 

fragmenty chromosomów

 

(mikroskop

 

optyczny) 

Mbps

Niska

Niska

 

rozdzielczo

rozdzielczo

ść

ść

Wysoka

Wysoka

 

rozdzielczo

rozdzielczo

ść

ść

Sequence “map”

 

-

 

całkowicie

 

zsekwencjonowany chromosom

 

1bp

.

STS sequence

 

mapping

 

 

kolejność

 

unikalnych

 

w genomie

 

markerów

 

DNA (STS)

 

100 kbp

Mapowanie

 

Fizyczne

Restriction mapping

 

 

kolejność

 

i odległości

 

pomiędzy

 

punktami

 

trawienia

 

enzymami

 

DNA.

 

100s kbp

Fluorescence

 

in

 

situ hybridisation

 

 

hybrydyzacja 

fluorescencyjnych sond do chromosomów 

100s kbp

background image

Mapy fizyczne

FISH 

(

F

luorescent

i

n

s

itu 

h

ybridization) –

 

hybrydyzacja fluorescencyjna 

in situ

background image

Mapa fizyczna genomu 

Medicago truncatula

 

(lucerny)

 

skonstruowana metodą

 

FISH

background image

Mapy fizyczne cd.

STS

 

(

S

equence 

t

agged 

s

ite) 

mapping

 

-

 

-

 

mapowanie 

miejsc znakowanych sekwencją

background image

Analiza STS

background image

A

B

Mapa restrykcyjna

A

B

background image

Sekwencjonowanie genomów

WGS

 

(whole

 

genome

 

shotgun)

Clone contig

background image

Przeglądarki genomowe

 

-

 

Genome

 

Browsers

NCBI Map Viewer
UCSC Genome

 

Browser

 

(University

 

of

 

Calif., Santa Cruz)

Ensembl Map View

background image

Ensembl

Ensembl

background image

UCSC

background image

NCBI

NCBI

background image

Document Outline