Pnt Ebt 04 Gene Boy
-
Upload
noelia-deibe-perez -
Category
Documents
-
view
22 -
download
1
Transcript of Pnt Ebt 04 Gene Boy
EBT / CSLACC2 / 04 OPERACIÓNS SINXELAS CON SECUENCIAS
FECHA INICIO: FECHA FINALIZACIÓN: TIEMPO EMPLEADO
(HORAS) CONTROLADA:
SI [ ] / NO [ } 01/12/13 06/12/13 4
ELABORADO POR: REVISADO POR: APROBADO POR:
Página 1 de 5 Noelia Deibe
Pérez
Carlos de Paz
Secuencia inicial de ADN
ATGTGCGACCATACCAAGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTA
GGGCCCAGTCAGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTTATGTGC
GACCATACCAAGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTAGGGCC
CAGTCAGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTTATGTGCGACCA
TACCAAGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTAGGGCCCAGTC
AGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTTATGTGCGACCATACCA
AGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTAGGGCCCAGTCAGTAG
TGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTT
Secuencia reversa segundo a pauta de lectura 3´-5´
0001TTCACGTTGTGGTGTTACAAGCGCGTACCA 0030
0031 GGGGGTGGCGTGATGACTGACCCGGGATTC 0060
0061 GACGAACTGACACGTCTAGTCTGCCCTACG 0090
0091 TCATAAAAGTCGAACCATACCAGCGTGTAT 0120
0121 TCACGTTGTGGTGTTACAAGCGCGTACCAG 0150
0151 GGGGTGGCGTGATGACTGACCCGGGATTCG 0180
0181 ACGAACTGACACGTCTAGTCTGCCCTACGT 0210
0211 CATAAAAGTCGAACCATACCAGCGTGTATT 0240
0241 CACGTTGTGGTGTTACAAGCGCGTACCAGG 0270
0271 GGGTGGCGTGATGACTGACCCGGGATTCGA 0300
0301 CGAACTGACACGTCTAGTCTGCCCTACGTC 0330
0331 ATAAAAGTCGAACCATACCAGCGTGTATTC 0360
0361 ACGTTGTGGTGTTACAAGCGCGTACCAGGG 0390
0391 GGTGGCGTGATGACTGACCCGGGATTCGAC 0420
0421 GAACTGACACGTCTAGTCTGCCCTACGTCA 0450
0451 TAAAAGTCGAACCATACCAGCGTGTA 0476
Secuencia complementaria
0001 TACACGCTGGTATGGTTCGACTTTTATGAC 0030
0031 GTAGGGCAGACTAGACGTGTCAGTTCGTCG 0060
0061 AATCCCGGGTCAGTCATCACGCCACCCCCT 0090
0091 GGTACGCGCTTGTAACACCACAACGTGAAT 0120
0121 ACACGCTGGTATGGTTCGACTTTTATGACG 0150
0151 TAGGGCAGACTAGACGTGTCAGTTCGTCGA 0180
0181 ATCCCGGGTCAGTCATCACGCCACCCCCTG 0210
0211 GTACGCGCTTGTAACACCACAACGTGAATA 0240
0241 CACGCTGGTATGGTTCGACTTTTATGACGT 0270
0271 AGGGCAGACTAGACGTGTCAGTTCGTCGAA 0300
0301 TCCCGGGTCAGTCATCACGCCACCCCCTGG 0330
0331 TACGCGCTTGTAACACCACAACGTGAATAC 0360
EBT / CSLACC2 / 04 OPERACIÓNS SINXELAS CON SECUENCIAS
FECHA INICIO: FECHA FINALIZACIÓN: TIEMPO EMPLEADO
(HORAS) CONTROLADA:
SI [ ] / NO [ } 01/12/13 06/12/13 4
ELABORADO POR: REVISADO POR: APROBADO POR:
Página 2 de 5 Noelia Deibe
Pérez
Carlos de Paz
0361 ACGCTGGTATGGTTCGACTTTTATGACGTA 0390
0391 GGGCAGACTAGACGTGTCAGTTCGTCGAAT 0420
0421 CCCGGGTCAGTCATCACGCCACCCCCTGGT 0450
0451 ACGCGCTTGTAACACCACAACGTGAA 0476
Tránscrito de ARN
0001 AUGUGCGACCAUACCAAGCUGAAAAUACUG 0030
0031 CAUCCCGUCUGAUCUGCACAGUCAAGCAGC 0060
0061 UUAGGGCCCAGUCAGUAGUGCGGUGGGGGA 0090
0091 CCAUGCGCGAACAUUGUGGUGUUGCACUUA 0120
0121 UGUGCGACCAUACCAAGCUGAAAAUACUGC 0150
0151 AUCCCGUCUGAUCUGCACAGUCAAGCAGCU 0180
0181 UAGGGCCCAGUCAGUAGUGCGGUGGGGGAC 0210
0211 CAUGCGCGAACAUUGUGGUGUUGCACUUAU 0240
0241 GUGCGACCAUACCAAGCUGAAAAUACUGCA 0270
0271 UCCCGUCUGAUCUGCACAGUCAAGCAGCUU 0300
0301 AGGGCCCAGUCAGUAGUGCGGUGGGGGACC 0330
0331 AUGCGCGAACAUUGUGGUGUUGCACUUAUG 0360
0361 UGCGACCAUACCAAGCUGAAAAUACUGCAU 0390
0391 CCCGUCUGAUCUGCACAGUCAAGCAGCUUA 0420
0421 GGGCCCAGUCAGUAGUGCGGUGGGGGACCA 0450
0451 UGCGCGAACAUUGUGGUGUUGCACUU 0476
Proteína codificada (estructura primaria)
Marco de Lectura RF+1:
MCDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLHL
CATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCTY
VRPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVALM
CDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLH
Marco de Lectura RF+2:
CATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCTY
VRPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVALM
CDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLHLC
ATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCT
Marco de Lectura RF+3:
VRPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVALM
CDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLHLC
ATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCTYV
RPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVAL
EBT / CSLACC2 / 04 OPERACIÓNS SINXELAS CON SECUENCIAS
FECHA INICIO: FECHA FINALIZACIÓN: TIEMPO EMPLEADO
(HORAS) CONTROLADA:
SI [ ] / NO [ } 01/12/13 06/12/13 4
ELABORADO POR: REVISADO POR: APROBADO POR:
Página 3 de 5 Noelia Deibe
Pérez
Carlos de Paz
Marco de Lectura RF-1:
KCNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSHI
SATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT*
VQHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAHK
CNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSH
Marco de Lectura RF-2:
SATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT*
VQHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAHK
CNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSHIS
ATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT
Marco de Lectura RF-3:
VQHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAHK
CNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSHIS
ATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT*V
QHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAH
Existen seis marcos de lectura posibles e polo tanto seis posibles solucións para a secuencia
problema por ser de dobre cadea, dependendo o inicio de cada unha delas de onde
comecemos a ler e cada unha das cales comeza cun codón de inicio (AUG) e remata cun
de parada (UAA, UAG ou UGA). Así, os tres primeiros marcos de lectura correspondentes á
secuencia problema, serán +1 se se comeza a ler dende o primeiro carácter, +2 se se
comeza dende o segundo e +3 se se comeza dende o terceiro. Por outro lado os tres
marcos seguintes, correspondentes á secuencia reversa complementaria, serán -1 se se
comeza a ler dende o primeiro carácter, -2 se se comeza dende o segundo e -3 se se
comeza dende o terceiro.
Estadística da secuencia
Porcentaxe de nucleótidos:
A: 112 nucleótidos 23.52%
C: 120 nucleótidos 25.21%
G: 136 nucleótidos 28.57%
T: 108 nucleótidos 22.68%
Porcentaxe de dímeros:
AA: 24 dímeros 5.04%
AC: 28 dímeros 5.88%
AG: 32 dímeros 6.72%
AT: 28 dímeros 5.88%
CA: 48 dímeros 10.08%
CC: 28 dímeros 5.88%
CG: 20 dímeros 4.2%
EBT / CSLACC2 / 04 OPERACIÓNS SINXELAS CON SECUENCIAS
FECHA INICIO: FECHA FINALIZACIÓN: TIEMPO EMPLEADO
(HORAS) CONTROLADA:
SI [ ] / NO [ } 01/12/13 06/12/13 4
ELABORADO POR: REVISADO POR: APROBADO POR:
Página 4 de 5 Noelia Deibe
Pérez
Carlos de Paz
CT: 24 dímeros 5.04%
GA: 20 dímeros 4.2%
GC: 44 dímeros 9.24%
GG: 32 dímeros 6.72%
GT: 40 dímeros 8.4%
TA: 19 dímeros 3.99%
TC: 20 dímeros 4.2%
TG: 52 dímeros 10.92%
TT: 16 dímeros 3.36%
Porcentaxe de tripletes:
AAA: 8 tripletes 1.68%
AAC: 4 tripletes 0.84%
AAG: 8 triplete 1.68%
AAT: 4 tripletes 0.84%
ACA: 8 tripletes 1.68%
ACC: 12 tripletes 2.52%
ACG: 0 tripletes 0%
ACT: 8 tripletes 1.68%
AGA: 0 tripletes 0%
AGC: 12 tripletes 2.52%
AGG: 4 tripletes 0.84%
AGT: 16 tripletes 3.36%
ATA: 8 tripletes 1.68%
ATC: 8 tripletes 1.68%
ATG: 8 tripletes 1.68%
ATT: 4 tripletes 0.84%
CAA: 8 tripletes 1.68%
CAC: 8 tripletes 1.68%
CAG: 16 tripletes 3.36%
CAT: 16 tripletes 3.36%
CCA: 16 tripletes 3.36%
CCC: 8 tripletes 1.68%
CCG: 4 tripletes 0.84%
CCT: 0 tripletes 0%
CGA: 8 tripletes 1.68%
CGC: 4 tripletes 0.84%
CGG: 4 tripletes 0.84%
CGT: 4 tripletes 0.84%
CTA: 0 tripletes 0%
CTC: 0 tripletes 0%
CTG: 16 tripletes 3.36%
CTT: 8 tripletes 1.68%
GAA: 8 tripletes 1.68%
GAC: 8 tripletes 1.68%
EBT / CSLACC2 / 04 OPERACIÓNS SINXELAS CON SECUENCIAS
FECHA INICIO: FECHA FINALIZACIÓN: TIEMPO EMPLEADO
(HORAS) CONTROLADA:
SI [ ] / NO [ } 01/12/13 06/12/13 4
ELABORADO POR: REVISADO POR: APROBADO POR:
Página 5 de 5 Noelia Deibe
Pérez
Carlos de Paz
GAG: 0 tripletes 0%
GAT: 4 tripletes 0.84%
GCA: 16 tripletes 3.36%
GCC: 4 tripletes 0.84%
GCG: 16 tripletes 3.36%
GCT: 8 tripletes 1.68%
GGA: 4 tripletes 0.84%
GGC: 4 tripletes 0.84%
GGG: 16 tripletes 3.36%
GGT: 8 tripletes 1.68%
GTA: 4 tripletes 0.84%
GTC: 12 tripletes 2.52%
GTG: 20 tripletes 4.2%
GTT: 4 tripletes 0.84%
TAA: 0 tripletes 0%
TAC: 8 tripletes 1.68%
TAG: 8 tripletes 1.68%
TAT: 3 tripletes 0.63%
TCA: 8 tripletes 1.68%
TCC: 4 tripletes 0.84%
TCG: 0 tripletes 0%
TCT: 8 tripletes 1.68%
TGA: 8 tripletes 1.68%
TGC: 24 tripletes 5.04%
TGG: 8 tripletes 1.68%
TGT: 12 tripletes 2.52%
TTA: 7 tripletes 1.47%
TTC: 0 tripletes 0%
TTG: 8 tripletes 1.68%
TTT: 0 tripletes 0%
Fuentes de información consultadas
http://www.dnai.org/geneboy/
http://www.marcoregalia.com/STUFF/UDISTRITAL/Bioinformatica/Actividades/Resumenes%20
Clases/Openreadingframes.html