Modelos de máxima verosimilitud para secuencias de ADN
description
Transcript of Modelos de máxima verosimilitud para secuencias de ADN
Modelos de máxima verosimilitud para secuencias de ADN
Eliseo Martínez, Catherine Lizama
C A C A G T A T0n
C A C C G T A TTn
)(nX denota el valor de la base en un determinado sitio del ADN
iXjTXTp ji )0(/)(Pr)(
TGCAji ,,,4,3,2,1,
Hipótesis fundamental: la tasa total de mutación, , es constante, esto es la razón de sustitución de cambio de base de generación a generación es constante.
Probabilidad de que la base i cambie a la base j luego de transcurrido el tiempo T (varias generaciones)
i probabilidad de que una base mute a la base i
C A C A G T A T
C A C A G T A T
T)1(
0n
Tn
La probabilidad de que no ocurra mutación en ningún sitio hasta la generación T es
… y en consecuencia la probabilidad de que ocurra (al menos una) mutación hasta la generación T es
Tp )1(1 Te 1
C A C i G T A T
C A C j G T A T
0n
Tn
La probabilidad de mutación después del tiempo T
Tp )1(1 Te 1
… y que el cambio haya sido por j (desde i) es entonces … jji pTp )(
C A C i G T A T
C A C i G T A T
0n
Tn
… la probabilidad de no mutación después del tiempo T…
Tp )1(1 Te
… o que haya mutado al mismo estado (estando inicialmente en i) es decir… iii ppTp )1()(
Ahora calcularemos la probabilidad de que el sitio, estando en la base i, al cabo de T generaciones siga con la base i. Esto es…
iii ppTp )1()(
ijpTp jji ;)(
La probabilidad de cambio de base después del tiempo T está dada por
iiT
iTT
ii eeeTp )1()1()(
ijepTp iT
jji )1()(
Si ocurre que4
1i
pTp ii 4
31)(
4)(
pTp ji
El modelo anterior considera el tiempo discreto (de generación en generación, digamos en intervalos de 20 años, por ejemplo). Un tratamiento más general considera el tiempo continuo, y entonces se usan probabilidades “instantáneas” de transición de una base a otra.
jbaselaamutóytenMutó
ji iXjtXtp],0(
)0(/)(Pr)(
tttp jjji )(Probabilidad de cambio de una base a otra (de i a j) en un tiempo de duración t
… y en consecuencia la probabilidad de no cambiar en un tiempo de longitud t es
ienequedarsdeprob
iseanoquebaseotraamutardeprob
ijjii ttp
".
.
1)( ti )1(1
Ojo: recuerde que
4
1
1k
k
?)( ttp ji
t t
khastaidesdemutardeadprobabilidlaexistetiempoesteEn
En este poco tiempo debe mutar desde k hasta j
)(tp ki )( tp jk
)()()(4
1
tptpttp jkk
kiji
)()()()()()()()()( 242423232222212121 tptptptptptptptpttp
¡cuidado, hay 16 ecuaciones!
… y una de ellas es esta…
Afortunadamente estas 16 ecuaciones se pueden escribir en forma matricial (con matrices de 4 x 4) de la siguiente forma:
ttttt APPP )()()(
)()()()(
)()()()(
)()()()(
)()()()(
)(
tptptptp
tptptptp
tptptptp
tptptptp
t
TTTGTCTA
GTGGGCGA
CTCGCCCA
ATAGACAA
P
)1(
)1(
)1(
)1(
TGCA
TGCA
TGCA
TGCA
A
APP
APPP
)()(
)()()(
0t
td
tdt
t
tttt
tet APP )0()(