Modelos de máxima verosimilitud para secuencias de ADN

9
Modelos de máxima verosimilitud para secuencias de ADN Eliseo Martínez, Catherine Lizama

description

Modelos de máxima verosimilitud para secuencias de ADN. Eliseo Martínez, Catherine Lizama. denota el valor de la base en un determinado sitio del ADN. C. A. C. A. T. G. T. A. C. A. C. C. T. G. T. A. probabilidad de que una base mute a la base i. - PowerPoint PPT Presentation

Transcript of Modelos de máxima verosimilitud para secuencias de ADN

Page 1: Modelos de máxima verosimilitud para secuencias de ADN

Modelos de máxima verosimilitud para secuencias de ADN

Eliseo Martínez, Catherine Lizama

Page 2: Modelos de máxima verosimilitud para secuencias de ADN

C A C A G T A T0n

C A C C G T A TTn

)(nX denota el valor de la base en un determinado sitio del ADN

iXjTXTp ji )0(/)(Pr)(

TGCAji ,,,4,3,2,1,

Hipótesis fundamental: la tasa total de mutación, , es constante, esto es la razón de sustitución de cambio de base de generación a generación es constante.

Probabilidad de que la base i cambie a la base j luego de transcurrido el tiempo T (varias generaciones)

i probabilidad de que una base mute a la base i

Page 3: Modelos de máxima verosimilitud para secuencias de ADN

C A C A G T A T

C A C A G T A T

T)1(

0n

Tn

La probabilidad de que no ocurra mutación en ningún sitio hasta la generación T es

… y en consecuencia la probabilidad de que ocurra (al menos una) mutación hasta la generación T es

Tp )1(1 Te 1

Page 4: Modelos de máxima verosimilitud para secuencias de ADN

C A C i G T A T

C A C j G T A T

0n

Tn

La probabilidad de mutación después del tiempo T

Tp )1(1 Te 1

… y que el cambio haya sido por j (desde i) es entonces … jji pTp )(

Page 5: Modelos de máxima verosimilitud para secuencias de ADN

C A C i G T A T

C A C i G T A T

0n

Tn

… la probabilidad de no mutación después del tiempo T…

Tp )1(1 Te

… o que haya mutado al mismo estado (estando inicialmente en i) es decir… iii ppTp )1()(

Ahora calcularemos la probabilidad de que el sitio, estando en la base i, al cabo de T generaciones siga con la base i. Esto es…

Page 6: Modelos de máxima verosimilitud para secuencias de ADN

iii ppTp )1()(

ijpTp jji ;)(

La probabilidad de cambio de base después del tiempo T está dada por

iiT

iTT

ii eeeTp )1()1()(

ijepTp iT

jji )1()(

Si ocurre que4

1i

pTp ii 4

31)(

4)(

pTp ji

Page 7: Modelos de máxima verosimilitud para secuencias de ADN

El modelo anterior considera el tiempo discreto (de generación en generación, digamos en intervalos de 20 años, por ejemplo). Un tratamiento más general considera el tiempo continuo, y entonces se usan probabilidades “instantáneas” de transición de una base a otra.

jbaselaamutóytenMutó

ji iXjtXtp],0(

)0(/)(Pr)(

tttp jjji )(Probabilidad de cambio de una base a otra (de i a j) en un tiempo de duración t

… y en consecuencia la probabilidad de no cambiar en un tiempo de longitud t es

ienequedarsdeprob

iseanoquebaseotraamutardeprob

ijjii ttp

".

.

1)( ti )1(1

Ojo: recuerde que

4

1

1k

k

Page 8: Modelos de máxima verosimilitud para secuencias de ADN

?)( ttp ji

t t

khastaidesdemutardeadprobabilidlaexistetiempoesteEn

En este poco tiempo debe mutar desde k hasta j

)(tp ki )( tp jk

)()()(4

1

tptpttp jkk

kiji

)()()()()()()()()( 242423232222212121 tptptptptptptptpttp

¡cuidado, hay 16 ecuaciones!

… y una de ellas es esta…

Page 9: Modelos de máxima verosimilitud para secuencias de ADN

Afortunadamente estas 16 ecuaciones se pueden escribir en forma matricial (con matrices de 4 x 4) de la siguiente forma:

ttttt APPP )()()(

)()()()(

)()()()(

)()()()(

)()()()(

)(

tptptptp

tptptptp

tptptptp

tptptptp

t

TTTGTCTA

GTGGGCGA

CTCGCCCA

ATAGACAA

P

)1(

)1(

)1(

)1(

TGCA

TGCA

TGCA

TGCA

A

APP

APPP

)()(

)()()(

0t

td

tdt

t

tttt

tet APP )0()(