Rendimiento de Excel 2010_ Mejora Del Rendimiento de Cálculo (Traducción Automática)
Curso urgente de traducción automática
-
Upload
forcada-mikel -
Category
Technology
-
view
679 -
download
1
Transcript of Curso urgente de traducción automática
Curso urgente de traduccion automatica
Mikel L. Forcada
Departament de Llenguatges i Sistemes Informatics
Universitat d’Alacant
E-03071 Alacant, Spain
TI aplicadas al uso de las lenguas para fines especıficos
Universitat d’Alacant, 2007
1
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
Indice
1. ¿Que es la traduccion automatica (TA)? Aplicaciones
2. Formatos de texto
3. ¿Como funciona la TA?
4. ¿Por que es difıcil la TA?
5. Evaluacion de la traduccion automatica
6. TA de paginas web
7. Memorias de traduccion
2
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [1]
La traduccion, . . .
. . . mediante un sistema informatico . . .
. . . (ordenador(es) + programas) . . .
. . . de textos informatizados en la lengua origen (LO). . .
. . . a textos informatizados en la la lengua meta (LM).
¡¡Atencion al formato de los textos!!
3
¿Que es la traduccion automatica (TA)? [2]
Esquematicamente:
Texto LO →Sistema de
traduccion
automatica
→Texto LM
(en bru-
to)
4
Aplicaciones de la TA [1]
Dos grandes grupos:
Asimilacion: traduccion efımera, idealmente instantanea, para la
revision o la comprension de documentos en otra lengua. P.e.,
navegacion por internet, chat, etc.
Diseminacion: traduccion permanente, idealmente con pocos erro-
res, para su publicacion. P.e., produccion de borradores para pos-
teditar .
5
Aplicaciones de la TA [1]
Dos grandes grupos:
Asimilacion: traduccion efımera, idealmente instantanea, para la
revision o la comprension de documentos en otra lengua. P.e.,
navegacion por internet, chat, etc.
Diseminacion: traduccion permanente, idealmente con pocos erro-
res, para su publicacion. P.e., produccion de borradores para pos-
teditar .
5
Aplicaciones de la TA [1]
Dos grandes grupos:
Asimilacion: traduccion efımera, idealmente instantanea, para la
revision o la comprension de documentos en otra lengua. P.e.,
navegacion por internet, chat, etc.
Diseminacion: traduccion permanente, idealmente con pocos erro-
res, para su publicacion. P.e., produccion de borradores para pos-
teditar .
5
Aplicaciones de la TA [1]
Dos grandes grupos:
Asimilacion: traduccion efımera, idealmente instantanea, para la
revision o la comprension de documentos en otra lengua. P.e.,
navegacion por internet, chat, etc.
Diseminacion: traduccion permanente, idealmente con pocos erro-
res, para su publicacion. P.e., produccion de borradores para pos-
teditar .
5
Aplicaciones de la TA [2]
Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:
Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.
Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.
Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.
6
Aplicaciones de la TA [2]
Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:
Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.
Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.
Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.
6
Aplicaciones de la TA [2]
Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:
Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.
Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.
Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.
6
Aplicaciones de la TA [2]
Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:
Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.
Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.
Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.
6
Aplicaciones de la TA [2]
Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:
Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.
Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.
Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.
6
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [3]
Alternativa a la preedicion: lenguaje controlado.
Los autores escriben ya pensando en el tratamiento automatizadodel texto.
Se evitan lexico y construcciones problematicas.
Se minimiza la postedicion.
Consistencia de estilo, comprensibilidad, mantenibilidad.
Pero. . . ¡los autores lo deben conocer y aplicar!
Se les puede ayudar con herramientas informaticas.
7
Aplicaciones de la TA [4]
La postedicion es conveniente cuando
coste
traduccion automatica+
postedicion
< coste(traduccion humana).
Para que sea eficiente:
se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio
se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento
8
Aplicaciones de la TA [4]
La postedicion es conveniente cuando
coste
traduccion automatica+
postedicion
< coste(traduccion humana).
Para que sea eficiente:
se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio
se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento
8
Aplicaciones de la TA [4]
La postedicion es conveniente cuando
coste
traduccion automatica+
postedicion
< coste(traduccion humana).
Para que sea eficiente:
se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio
se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento
8
Aplicaciones de la TA [4]
La postedicion es conveniente cuando
coste
traduccion automatica+
postedicion
< coste(traduccion humana).
Para que sea eficiente:
se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio
se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento
8
Aplicaciones de la TA [4]
La postedicion es conveniente cuando
coste
traduccion automatica+
postedicion
< coste(traduccion humana).
Para que sea eficiente:
se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio
se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento
8
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [1]
Un texto informatizado es, como cualquier porcion de datos informa-
tizada, una secuencia de bits, es decir, de unos y ceros:
000101010010100111101001010010....
Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se
pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:
00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).
Hay muchas maneras de organizar los bytes para almacenar textos.
Muchos problemas provienen de discrepancias en cuanto a la manera
de hacerlo.
9
Formatos de texto [2]
Dos aspectos importantes: codificacion y formato propiamente dicho.
Codificacion: Asignacion de un codigo (una secuencia de uno o
mas bytes concreta) a cada caracter posible de la lengua corres-
pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”
(63), etc.)
10
Formatos de texto [2]
Dos aspectos importantes: codificacion y formato propiamente dicho.
Codificacion: Asignacion de un codigo (una secuencia de uno o
mas bytes concreta) a cada caracter posible de la lengua corres-
pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”
(63), etc.)
10
Formatos de texto [2]
Dos aspectos importantes: codificacion y formato propiamente dicho.
Codificacion: Asignacion de un codigo (una secuencia de uno o
mas bytes concreta) a cada caracter posible de la lengua corres-
pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”
(63), etc.)
10
Formatos de texto [3]
Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.
Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:
• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o
• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).
11
Formatos de texto [3]
Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.
Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:
• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o
• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).
11
Formatos de texto [3]
Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.
Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:
• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o
• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).
11
Formatos de texto [3]
Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.
Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:
• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o
• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).
11
Formatos de texto [3]
Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.
Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:
• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o
• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).
11
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):
ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)
ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.
En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)
En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.
12
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):
ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)
ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.
En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)
En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.
12
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):
ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)
ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.
En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)
En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.
12
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):
ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)
ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.
En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)
En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.
12
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):
ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)
ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.
En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)
En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.
12
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [5]
Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):
Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.
UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:
• codigos del 0 al 127: 1 byte (compatible con ASCII);
• codigos del 128 al 2047: 2 bytes;
• codigos del 2048 al 65535: 3 bytes, etc.
13
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:
Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:
<p>Un parrafo corto con una palabra <em>enfatizada</em><p>
(HTML visto a traves de un editor de texto)
14
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:
Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:
<p>Un parrafo corto con una palabra <em>enfatizada</em><p>
(HTML visto a traves de un editor de texto)
14
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:
Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:
<p>Un parrafo corto con una palabra <em>enfatizada</em><p>
(HTML visto a traves de un editor de texto)
14
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:
Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:
<p>Un parrafo corto con una palabra <em>enfatizada</em><p>
(HTML visto a traves de un editor de texto)
14
Formatos de texto [7]
Con codigos no interpretables como caracteres: (no visibles a
traves de un editor de texto sencillo) Adobe PDF (impresion,
presentacion), formatos semisecretos de procesadores de textos
comerciales como .doc de Microsoft, etc.
15
Formatos de texto [7]
Con codigos no interpretables como caracteres: (no visibles a
traves de un editor de texto sencillo) Adobe PDF (impresion,
presentacion), formatos semisecretos de procesadores de textos
comerciales como .doc de Microsoft, etc.
15
Formatos de texto [8]
El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendras”):
Las personas usan la presentacion visual para comunicar la estructura
logica de los documentos (¡a personas videntes!).
Los procesadores de textos actuales nos muestran el documento tal
como quedara impreso mientras lo estamos editando.
Sucumbimos a la tentacion de trabajar directamente sobre la presen-
tacion (negritas, margenes, tipos) en vez de sobre la estructura logica
(secciones, tıtulos, etc.)
16
Formatos de texto [8]
El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendras”):
Las personas usan la presentacion visual para comunicar la estructura
logica de los documentos (¡a personas videntes!).
Los procesadores de textos actuales nos muestran el documento tal
como quedara impreso mientras lo estamos editando.
Sucumbimos a la tentacion de trabajar directamente sobre la presen-
tacion (negritas, margenes, tipos) en vez de sobre la estructura logica
(secciones, tıtulos, etc.)
16
Formatos de texto [8]
El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendras”):
Las personas usan la presentacion visual para comunicar la estructura
logica de los documentos (¡a personas videntes!).
Los procesadores de textos actuales nos muestran el documento tal
como quedara impreso mientras lo estamos editando.
Sucumbimos a la tentacion de trabajar directamente sobre la presen-
tacion (negritas, margenes, tipos) en vez de sobre la estructura logica
(secciones, tıtulos, etc.)
16
Formatos de texto [8]
El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendras”):
Las personas usan la presentacion visual para comunicar la estructura
logica de los documentos (¡a personas videntes!).
Los procesadores de textos actuales nos muestran el documento tal
como quedara impreso mientras lo estamos editando.
Sucumbimos a la tentacion de trabajar directamente sobre la presen-
tacion (negritas, margenes, tipos) en vez de sobre la estructura logica
(secciones, tıtulos, etc.)
16
Formatos de texto [9]
El problema wysiwyg:
Si hacemos esto, y mas adelante queremos cambiar el tipo de letra
de los tıtulos de seccion o de las palabras extranjeras. . .
. . . ¡nos toca cambiarlos uno por uno!
Resultado: “lo que ves es todo lo que tienes”
¿Podemos evitarlo? Sı.
17
Formatos de texto [9]
El problema wysiwyg:
Si hacemos esto, y mas adelante queremos cambiar el tipo de letra
de los tıtulos de seccion o de las palabras extranjeras. . .
. . . ¡nos toca cambiarlos uno por uno!
Resultado: “lo que ves es todo lo que tienes”
¿Podemos evitarlo? Sı.
17
Formatos de texto [9]
El problema wysiwyg:
Si hacemos esto, y mas adelante queremos cambiar el tipo de letra
de los tıtulos de seccion o de las palabras extranjeras. . .
. . . ¡nos toca cambiarlos uno por uno!
Resultado: “lo que ves es todo lo que tienes”
¿Podemos evitarlo? Sı.
17
Formatos de texto [9]
El problema wysiwyg:
Si hacemos esto, y mas adelante queremos cambiar el tipo de letra
de los tıtulos de seccion o de las palabras extranjeras. . .
. . . ¡nos toca cambiarlos uno por uno!
Resultado: “lo que ves es todo lo que tienes”
¿Podemos evitarlo? Sı.
17
Formatos de texto [9]
El problema wysiwyg:
Si hacemos esto, y mas adelante queremos cambiar el tipo de letra
de los tıtulos de seccion o de las palabras extranjeras. . .
. . . ¡nos toca cambiarlos uno por uno!
Resultado: “lo que ves es todo lo que tienes”
¿Podemos evitarlo? Sı.
17
Formatos de texto [10]
¿Como? Usando estilos.
Marcamos estructuralmente las partes (elementos): tıtulo de segundo
nivel, texto enfatizado, ejemplo, etc.
Y despues asignamos un estilo de presentacion a cada parte (por
ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-
camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita
y el ejemplo en cursiva)
Cambiar la presentacion de todas las apariciones de un elemento es
facil: basta con cambiar el estilo asociado al elemento.18
Formatos de texto [10]
¿Como? Usando estilos.
Marcamos estructuralmente las partes (elementos): tıtulo de segundo
nivel, texto enfatizado, ejemplo, etc.
Y despues asignamos un estilo de presentacion a cada parte (por
ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-
camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita
y el ejemplo en cursiva)
Cambiar la presentacion de todas las apariciones de un elemento es
facil: basta con cambiar el estilo asociado al elemento.18
Formatos de texto [10]
¿Como? Usando estilos.
Marcamos estructuralmente las partes (elementos): tıtulo de segundo
nivel, texto enfatizado, ejemplo, etc.
Y despues asignamos un estilo de presentacion a cada parte (por
ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-
camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita
y el ejemplo en cursiva)
Cambiar la presentacion de todas las apariciones de un elemento es
facil: basta con cambiar el estilo asociado al elemento.18
Formatos de texto [10]
¿Como? Usando estilos.
Marcamos estructuralmente las partes (elementos): tıtulo de segundo
nivel, texto enfatizado, ejemplo, etc.
Y despues asignamos un estilo de presentacion a cada parte (por
ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-
camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita
y el ejemplo en cursiva)
Cambiar la presentacion de todas las apariciones de un elemento es
facil: basta con cambiar el estilo asociado al elemento.18
Formatos de texto [10]
¿Como? Usando estilos.
Marcamos estructuralmente las partes (elementos): tıtulo de segundo
nivel, texto enfatizado, ejemplo, etc.
Y despues asignamos un estilo de presentacion a cada parte (por
ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-
camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita
y el ejemplo en cursiva)
Cambiar la presentacion de todas las apariciones de un elemento es
facil: basta con cambiar el estilo asociado al elemento.18
Formatos de texto [11]
En aplicaciones de internet, la separacion estructura–presentacion se
hace ası:
La informacion —el contenido— se estructura usando XML o
HTML
La presentacion se genera (en el servidor o en el navegador) usan-
do hojas de estilo escritos en CSS o en XSL
19
Formatos de texto [11]
En aplicaciones de internet, la separacion estructura–presentacion se
hace ası:
La informacion —el contenido— se estructura usando XML o
HTML
La presentacion se genera (en el servidor o en el navegador) usan-
do hojas de estilo escritos en CSS o en XSL
19
Formatos de texto [11]
En aplicaciones de internet, la separacion estructura–presentacion se
hace ası:
La informacion —el contenido— se estructura usando XML o
HTML
La presentacion se genera (en el servidor o en el navegador) usan-
do hojas de estilo escritos en CSS o en XSL
19
Formatos de texto [11]
En aplicaciones de internet, la separacion estructura–presentacion se
hace ası:
La informacion —el contenido— se estructura usando XML o
HTML
La presentacion se genera (en el servidor o en el navegador) usan-
do hojas de estilo escritos en CSS o en XSL
19
Formatos de texto [12]
documento (XML o HTML) →hoja de estilo (XSL o CSS) →
Procesador
de hojas de
estilo
→ presentacion
20
Formatos de texto [13]
Accesibilidad (no todos los receptores son videntes):
Fichero de sonido Docum. Braille Docum. para moviles
� Ò H
Hoja de estilo 1 Hoja de estilo 2 Hoja de estilo 3
Documento XML
? ? ?
? ? ?
21
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
Formatos de texto [14]
Los sistemas de TA deben ser capaces:
De separar del texto a traducir la informacion de formato;
de reintegrar adecuadamente la informacion de formato al textotras traducirlo;
y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.
La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).
22
¿Como funciona la TA? [1]
Primera aproximacion [!!]: Traducir textos es traduir oraciones.
Traducir oraciones supone:
Construir una interpretacion (un significado) a partir de la oracion
en LO.
Construir una oracion en LM a partir de la interpretacion.
23
¿Como funciona la TA? [1]
Primera aproximacion [!!]: Traducir textos es traduir oraciones.
Traducir oraciones supone:
Construir una interpretacion (un significado) a partir de la oracion
en LO.
Construir una oracion en LM a partir de la interpretacion.
23
¿Como funciona la TA? [1]
Primera aproximacion [!!]: Traducir textos es traduir oraciones.
Traducir oraciones supone:
Construir una interpretacion (un significado) a partir de la oracion
en LO.
Construir una oracion en LM a partir de la interpretacion.
23
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [2]
Principio de composicionalidad [semantica]:
La interpretacion de una oracion se construye . . .
. . . a partir de las interpretaciones de las palabras . . .
Escriben cartas 6= Escriben artıculos
. . . componiendolas siguiendo las agrupaciones indicadas por la es-
tructura sintactica de la oracion.
Israel amenaza a Palestina 6= Palestina amenaza a Israel
25
¿Como funciona la TA? [3]
Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tenermas de una interpretacion):
porque las palabras tienen mas de una interpretacion (ambiguedadlexica)
porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)
por ambas cosas a la vez.
Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).
25
¿Como funciona la TA? [3]
Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener
mas de una interpretacion):
porque las palabras tienen mas de una interpretacion (ambiguedadlexica)
porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)
por ambas cosas a la vez.
Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).
25
¿Como funciona la TA? [3]
Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener
mas de una interpretacion):
porque las palabras tienen mas de una interpretacion (ambiguedadlexica)
porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)
por ambas cosas a la vez.
Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).
25
¿Como funciona la TA? [3]
Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener
mas de una interpretacion):
porque las palabras tienen mas de una interpretacion (ambiguedadlexica)
porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)
por ambas cosas a la vez.
Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).
25
¿Como funciona la TA? [3]
Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener
mas de una interpretacion):
porque las palabras tienen mas de una interpretacion (ambiguedadlexica)
porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)
por ambas cosas a la vez.
Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).
25
¿Como funciona la TA? [4]
Esquematicamente:
Oracion
LO→ interpretacion → Oracion
LM
En algunos sistemas de TA se intenta representar directamente las
interpretaciones con una interlingua (un lenguaje estructurado artifi-
cial).
26
¿Como funciona la TA? [4]
Esquematicamente:
Oracion
LO→ interpretacion → Oracion
LM
En algunos sistemas de TA se intenta representar directamente las
interpretaciones con una interlingua (un lenguaje estructurado artifi-
cial).
26
¿Como funciona la TA? [4]
Esquematicamente:
Oracion
LO→ interpretacion → Oracion
LM
En algunos sistemas de TA se intenta representar directamente las
interpretaciones con una interlingua (un lenguaje estructurado artifi-
cial).
26
¿Como funciona la TA? [5]
Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?
“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →
“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”
“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”
No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).
27
¿Como funciona la TA? [5]
Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?
“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →
“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”
“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”
No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).
27
¿Como funciona la TA? [5]
Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?
“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →
“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”
“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”
No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).
27
¿Como funciona la TA? [5]
Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?
“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →
“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”
“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”
No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).
27
¿Como funciona la TA? [5]
Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?
“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →
“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”
“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”
No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).
27
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [6]
Esto nos permite hacer la segunda aproximacion [!!]:
La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .
. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .
. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .
. . . haciendo las dos operaciones bastante independientemente.
28
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [7]
Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).
Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:
Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.
Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.
29
¿Como funciona la TA? [8]
Por tanto...
Podemos esperar que un buen sistema de TA nos libere de la parte
mas mecanica (mecanizable) de la tarea de traduccion.
Pero no podemos esperar —por bueno que sea— que comprenda el
texto, resuelva las ambiguedades siempre correctamente y produzca
textos en una variante genuina de la lengua meta.
30
¿Como funciona la TA? [8]
Por tanto...
Podemos esperar que un buen sistema de TA nos libere de la parte
mas mecanica (mecanizable) de la tarea de traduccion.
Pero no podemos esperar —por bueno que sea— que comprenda el
texto, resuelva las ambiguedades siempre correctamente y produzca
textos en una variante genuina de la lengua meta.
30
¿Como funciona la TA? [8]
Por tanto...
Podemos esperar que un buen sistema de TA nos libere de la parte
mas mecanica (mecanizable) de la tarea de traduccion.
Pero no podemos esperar —por bueno que sea— que comprenda el
texto, resuelva las ambiguedades siempre correctamente y produzca
textos en una variante genuina de la lengua meta.
30
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [1]
Los cuatro problemas de la traduccion automatica (Arnold 2003):
1. El problema del analisis
2. El problema de la sıntesis
3. El problema de la transferencia
4. El problema de la descripcion
31
¿Por que es difıcil la TA? [2]
El problema del analisis: La forma no determina completamente el
contenido (la interpretacion). Tambien se denomina ambiguedad:
Traıan noticias de Grecia (¿tema o procedencia?)
Ha vendido las naranjas que ha comprado a Fermın (¿Fermın
vende o compra?)
Trabaja en el estudio que le han encargado (¿prepara un docu-
mento o disena un taller de artista?)
32
¿Por que es difıcil la TA? [3]
El problema de la sıntesis: El contenido no determina completamen-te la forma (hay mas de una manera de decir lo mismo en cualquierlengua):
¿Que hora es?
¿Como es de tarde? (de: Wie spat ist es?)
¿Que horas son? (pt: Que horas sao?)
Los expedientes, ¿se abren o se inician?
Las sesiones, ¿se clausuran, se cierran, o se levantan?
33
¿Por que es difıcil la TA? [4]
El problema de la transferencia: Las lenguas divergen. Es decir,
hay diferencias irreductibles en la manera en que el mismo contenido
se expresa en lenguas diferentes:
es: Me gusta nadar (Me objeto, gusta verbo, nadar sujeto)
en: I like swimming (I sujeto, like verbo, swimming objeto)
de: Ich schwimme gern (Ich sujeto, schwimme, verbo, gern, ad-
verbio)
Todas quieren decir dar placer(agente=nadar(agente=yo),destinatario=yo)
34
¿Por que es difıcil la TA? [5]
El problema de la descripcion (otra vez): construir un sistema de
traduccion automatica comporta la gestion de una gran cantidad de
conocimiento, que se debe explicitar, reunir, describir, y representar
en una forma util y computable.
35
Evaluacion de la traduccion automatica [1]
Queremos evaluar la adopcion de un sistema de traduccion automati-
ca para la diseminacion.
Las traducciones en sucio se deberan posteditar (corregir): cuanto
menos correcciones, mas calidad: mejor.
De acuerdo: ¿como evaluamos la calidad?
36
Evaluacion de la traduccion automatica [1]
Queremos evaluar la adopcion de un sistema de traduccion automati-
ca para la diseminacion.
Las traducciones en sucio se deberan posteditar (corregir): cuanto
menos correcciones, mas calidad: mejor.
De acuerdo: ¿como evaluamos la calidad?
36
Evaluacion de la traduccion automatica [1]
Queremos evaluar la adopcion de un sistema de traduccion automati-
ca para la diseminacion.
Las traducciones en sucio se deberan posteditar (corregir): cuanto
menos correcciones, mas calidad: mejor.
De acuerdo: ¿como evaluamos la calidad?
36
Evaluacion de la traduccion automatica [1]
Queremos evaluar la adopcion de un sistema de traduccion automati-
ca para la diseminacion.
Las traducciones en sucio se deberan posteditar (corregir): cuanto
menos correcciones, mas calidad: mejor.
De acuerdo: ¿como evaluamos la calidad?
36
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [2]
Para evaluar la calidad, necesitamos:
elegir una muestra suficiente de textos representativos,
traducirla automaticamente,
y contar cual es el mınimo de correcciones necesario para hacer
que la traduccion sea adecuada al proposito previsto.
Parece sencillo, pero. . .
37
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [3]
¡. . . no lo es en absoluto!
es difıcil elegir suficiente texto representativo de antemano;
la nocion de adecuacion es a veces difıcil de especificar;
es difıcil hacer el mınimo de correcciones (supone encontrar tra-
ducciones adecuadas que se obtengan con pocas correcciones);
todo el proceso es muy costoso (tiempo de correccion).
38
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [4]
¡Pero la calidad de los textos traducidos en sucio no lo es todo!
Hagamos un presupuesto: si adoptamos la traduccion automatica,
por una parte, nos ahorramos los costes de traduccion humana,
pero tenemos gastos nuevos:
gastos de funcionamiento
y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)
39
Evaluacion de la traduccion automatica [5]
Gastos de funcionamiento:
Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.
Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.
Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.
40
Evaluacion de la traduccion automatica [5]
Gastos de funcionamiento:
Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.
Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.
Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.
40
Evaluacion de la traduccion automatica [5]
Gastos de funcionamiento:
Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.
Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.
Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.
40
Evaluacion de la traduccion automatica [5]
Gastos de funcionamiento:
Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.
Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.
Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.
40
Evaluacion de la traduccion automatica [5]
Gastos de funcionamiento:
Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.
Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.
Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.
40
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [6]
Gastos de formacion:
Formacion en uso del programa de TA: uso propiamente dicho,
configuracion y mantenimiento; uso de nuevo software asociado.
Formacion en postedicion:
• conocimiento del programa de TA (errores tıpicos);
• tecnicas de correccion, uso adelantado del procesador de tex-
tos, macroinstrucciones, sustitucion de patrones, etc.
41
Evaluacion de la traduccion automatica [7]
¡Y quizas nos hemos dejado todavıa algo!
Evaluar la traduccion automatica no es facil.
¿La leccion? Desconfiad de las primeras impresiones.
42
Evaluacion de la traduccion automatica [7]
¡Y quizas nos hemos dejado todavıa algo!
Evaluar la traduccion automatica no es facil.
¿La leccion? Desconfiad de las primeras impresiones.
42
Evaluacion de la traduccion automatica [7]
¡Y quizas nos hemos dejado todavıa algo!
Evaluar la traduccion automatica no es facil.
¿La leccion? Desconfiad de las primeras impresiones.
42
Evaluacion de la traduccion automatica [7]
¡Y quizas nos hemos dejado todavıa algo!
Evaluar la traduccion automatica no es facil.
¿La leccion? Desconfiad de las primeras impresiones.
42
TA de paginas web [1]
La traduccion automatica de paginas web es como la TA de otros
documentos de texto, pero hay algunas diferencias:
las paginas web son hipertextos: contienen enlaces a otros paginas
web
a veces son activas: contienen programas que se ejecutan durante
la presentacion
a veces son dinamicas: el servidor no las tiene guardadas sino que
las genera automaticamente cuando se solicitan
43
TA de paginas web [1]
La traduccion automatica de paginas web es como la TA de otros
documentos de texto, pero hay algunas diferencias:
las paginas web son hipertextos: contienen enlaces a otros paginas
web
a veces son activas: contienen programas que se ejecutan durante
la presentacion
a veces son dinamicas: el servidor no las tiene guardadas sino que
las genera automaticamente cuando se solicitan
43
TA de paginas web [1]
La traduccion automatica de paginas web es como la TA de otros
documentos de texto, pero hay algunas diferencias:
las paginas web son hipertextos: contienen enlaces a otros paginas
web
a veces son activas: contienen programas que se ejecutan durante
la presentacion
a veces son dinamicas: el servidor no las tiene guardadas sino que
las genera automaticamente cuando se solicitan
43
TA de paginas web [1]
La traduccion automatica de paginas web es como la TA de otros
documentos de texto, pero hay algunas diferencias:
las paginas web son hipertextos: contienen enlaces a otros paginas
web
a veces son activas: contienen programas que se ejecutan durante
la presentacion
a veces son dinamicas: el servidor no las tiene guardadas sino que
las genera automaticamente cuando se solicitan
43
TA de paginas web [1]
La traduccion automatica de paginas web es como la TA de otros
documentos de texto, pero hay algunas diferencias:
las paginas web son hipertextos: contienen enlaces a otros paginas
web
a veces son activas: contienen programas que se ejecutan durante
la presentacion
a veces son dinamicas: el servidor no las tiene guardadas sino que
las genera automaticamente cuando se solicitan
43
TA de paginas web [2]
Dos usos basicos de la TA de paginas web:
Diseminacion: TA para construir y mantener servidores de internet
multilingues
Asimilacion: TA durante la navegacion (”navegacion traducida”),
en el cliente, en el servidor que contiene la informacion, o en otro
servidor (p.e., interNOSTRUM)
44
TA de paginas web [2]
Dos usos basicos de la TA de paginas web:
Diseminacion: TA para construir y mantener servidores de internet
multilingues
Asimilacion: TA durante la navegacion (”navegacion traducida”),
en el cliente, en el servidor que contiene la informacion, o en otro
servidor (p.e., interNOSTRUM)
44
TA de paginas web [2]
Dos usos basicos de la TA de paginas web:
Diseminacion: TA para construir y mantener servidores de internet
multilingues
Asimilacion: TA durante la navegacion (”navegacion traducida”),
en el cliente, en el servidor que contiene la informacion, o en otro
servidor (p.e., interNOSTRUM)
44
TA de paginas web [2]
Dos usos basicos de la TA de paginas web:
Diseminacion: TA para construir y mantener servidores de internet
multilingues
Asimilacion: TA durante la navegacion (”navegacion traducida”),
en el cliente, en el servidor que contiene la informacion, o en otro
servidor (p.e., interNOSTRUM)
44
TA de paginas web [3]
Los requisitos son diferentes en cada caso:
Diseminacion: la TA debe ser de calidad, quizas seguida de pos-
tedicion (la web traducida es percibida como definitiva)
Asimilacion: la TA debe ser muy rapida, “instantanea”, como si
formara parte del proceso de presentacion de la traduccion: la
calidad no es tan crucial (la traduccion es percibida como provi-
sional)
45
TA de paginas web [3]
Los requisitos son diferentes en cada caso:
Diseminacion: la TA debe ser de calidad, quizas seguida de pos-
tedicion (la web traducida es percibida como definitiva)
Asimilacion: la TA debe ser muy rapida, “instantanea”, como si
formara parte del proceso de presentacion de la traduccion: la
calidad no es tan crucial (la traduccion es percibida como provi-
sional)
45
TA de paginas web [3]
Los requisitos son diferentes en cada caso:
Diseminacion: la TA debe ser de calidad, quizas seguida de pos-
tedicion (la web traducida es percibida como definitiva)
Asimilacion: la TA debe ser muy rapida, “instantanea”, como si
formara parte del proceso de presentacion de la traduccion: la
calidad no es tan crucial (la traduccion es percibida como provi-
sional)
45
TA de paginas web [3]
Los requisitos son diferentes en cada caso:
Diseminacion: la TA debe ser de calidad, quizas seguida de pos-
tedicion (la web traducida es percibida como definitiva)
Asimilacion: la TA debe ser muy rapida, “instantanea”, como si
formara parte del proceso de presentacion de la traduccion: la
calidad no es tan crucial (la traduccion es percibida como provi-
sional)
45
Un inciso: el formato de las paginas web [1]
Las paginas web son documentos especiales:
La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).
HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.
Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.
La transparencia siguiente contiene un ejemplo.
46
Un inciso: el formato de las paginas web [1]
Las paginas web son documentos especiales:
La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).
HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.
Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.
La transparencia siguiente contiene un ejemplo.
46
Un inciso: el formato de las paginas web [1]
Las paginas web son documentos especiales:
La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).
HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.
Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.
La transparencia siguiente contiene un ejemplo.
46
Un inciso: el formato de las paginas web [1]
Las paginas web son documentos especiales:
La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).
HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.
Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.
La transparencia siguiente contiene un ejemplo.
46
Un inciso: el formato de las paginas web [1]
Las paginas web son documentos especiales:
La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).
HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.
Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.
La transparencia siguiente contiene un ejemplo.
46
Un inciso: el formato de las paginas web [2]
<HTML><HEAD><TITLE>Tıtulo del documento</TITLE></HEAD><BODY><H1>Encabezamiento de nivel 1</H1><H2>Encabezamiento de nivel 2</H2><P>Este es el <EM>primer</EM> parrafode este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıaacabar con una marca de final de parrafo.</P><H2>Otro encanezamiento de nivel 2</H2><P>Este es el<EM>ultimo</EM> parrafode este documento HTML. Los documentos HTML pueden contener<A HREF="http://www.internostrum.com">enlaces</A>a otros documentos HTML, locales o remotos.</P></BODY></HTML>
47
Un inciso: el formato de las paginas web [3]
Encabezamiento de nivel 1
Encabezamiento de nivel 2
Este es el primer parrafo de este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıa acabar con una marca de final deparrafo.
Otro encabezamiento de nivel 2
Este es el ultimo parrafo de este documento HTML. Los documentos HTML puedencontener enlaces a otros documentos HTML, locales o remotos.
48
TA de paginas web (reanudamos) [4]
Traducir un documento HTML comporta:
Identificar las porciones del documento que corresponden a texto
que debe ser leıdo y traducirlas;
Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden
enlazar el mismo documento!).
La adaptacion de enlaces depende de la situacion.
49
TA de paginas web (reanudamos) [4]
Traducir un documento HTML comporta:
Identificar las porciones del documento que corresponden a texto
que debe ser leıdo y traducirlas;
Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden
enlazar el mismo documento!).
La adaptacion de enlaces depende de la situacion.
49
TA de paginas web (reanudamos) [4]
Traducir un documento HTML comporta:
Identificar las porciones del documento que corresponden a texto
que debe ser leıdo y traducirlas;
Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden
enlazar el mismo documento!).
La adaptacion de enlaces depende de la situacion.
49
TA de paginas web (reanudamos) [4]
Traducir un documento HTML comporta:
Identificar las porciones del documento que corresponden a texto
que debe ser leıdo y traducirlas;
Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden
enlazar el mismo documento!).
La adaptacion de enlaces depende de la situacion.
49
TA de paginas web (reanudamos) [4]
Traducir un documento HTML comporta:
Identificar las porciones del documento que corresponden a texto
que debe ser leıdo y traducirlas;
Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden
enlazar el mismo documento!).
La adaptacion de enlaces depende de la situacion.
49
TA de paginas web [5]
Los enlaces contienen URIs (direcciones de otros documentos):
Podeis visitar tambien nuestros
<a href="http://www.servidor.ct/es/prod/ta.html">
productos</a>.
50
TA de paginas web [5]
Los enlaces contienen URIs (direcciones de otros documentos):
Podeis visitar tambien nuestros
<a href="http://www.servidor.ct/es/prod/ta.html">
productos</a>.
50
TA de paginas web [5]
Los enlaces contienen URIs (direcciones de otros documentos):
Podeis visitar tambien nuestros
<a href="http://www.servidor.ct/es/prod/ta.html">
productos</a>.
50
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [6]
Una mirada a los URIs de los enlaces:
http://www.servidor.ct/es/prod/ta.html
El URI (localitzador) indica:
El esquema http: (protocolo de transferencia de hipertextos)
El nombre de la maquina que hace de servidor (www.servidor.ct)
La ruta que identifica el recurso concreto (/es/prod/ta.html) den-
tro del servidor
51
TA de paginas web [7]
Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en
un servidor bilingue espanol–ingles, si un enlace desde una pagina en
espanol apunta a la URI
http://www.servidor.ct/es/prod/ta.html
La traduccion inglesa deberıa apuntar a la URI:
http://www.servidor.ct/en/prod/ta.html
52
TA de paginas web [7]
Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en
un servidor bilingue espanol–ingles, si un enlace desde una pagina en
espanol apunta a la URI
http://www.servidor.ct/es/prod/ta.html
La traduccion inglesa deberıa apuntar a la URI:
http://www.servidor.ct/en/prod/ta.html
52
TA de paginas web [7]
Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en
un servidor bilingue espanol–ingles, si un enlace desde una pagina en
espanol apunta a la URI
http://www.servidor.ct/es/prod/ta.html
La traduccion inglesa deberıa apuntar a la URI:
http://www.servidor.ct/en/prod/ta.html
52
TA de paginas web [8]
Pero el texto mismo de las paginas web contiene a veces material
especial que no se debe traducir:
URIs: www.blueberry.com (no es “www.arandano.com”)
Direcciones de correo electronico: [email protected] (no es
53
TA de paginas web [8]
Pero el texto mismo de las paginas web contiene a veces material
especial que no se debe traducir:
URIs: www.blueberry.com (no es “www.arandano.com”)
Direcciones de correo electronico: [email protected] (no es
53
TA de paginas web [8]
Pero el texto mismo de las paginas web contiene a veces material
especial que no se debe traducir:
URIs: www.blueberry.com (no es “www.arandano.com”)
Direcciones de correo electronico: [email protected] (no es
53
TA de paginas web [8]
Pero el texto mismo de las paginas web contiene a veces material
especial que no se debe traducir:
URIs: www.blueberry.com (no es “www.arandano.com”)
Direcciones de correo electronico: [email protected] (no es
53
TA de paginas web [9]: paginas generadas en el ser-vidor
Muchas veces los documentos HTML no estan en el disco duro, sino
que son generados por un programa que se ejecuta en el servidor
durante la navegacion.
Posiblemente se generan paginas diferentes para cada perfil de visi-
tante.
Los detalles de la traduccion de este tipo de documentos quedan fuera
del ambito de este curso, porque presentan retos considerables.
54
TA de paginas web [9]: paginas generadas en el ser-vidor
Muchas veces los documentos HTML no estan en el disco duro, sino
que son generados por un programa que se ejecuta en el servidor
durante la navegacion.
Posiblemente se generan paginas diferentes para cada perfil de visi-
tante.
Los detalles de la traduccion de este tipo de documentos quedan fuera
del ambito de este curso, porque presentan retos considerables.
54
TA de paginas web [9]: paginas generadas en el ser-vidor
Muchas veces los documentos HTML no estan en el disco duro, sino
que son generados por un programa que se ejecuta en el servidor
durante la navegacion.
Posiblemente se generan paginas diferentes para cada perfil de visi-
tante.
Los detalles de la traduccion de este tipo de documentos quedan fuera
del ambito de este curso, porque presentan retos considerables.
54
TA de paginas web [9]: paginas generadas en el ser-vidor
Muchas veces los documentos HTML no estan en el disco duro, sino
que son generados por un programa que se ejecuta en el servidor
durante la navegacion.
Posiblemente se generan paginas diferentes para cada perfil de visi-
tante.
Los detalles de la traduccion de este tipo de documentos quedan fuera
del ambito de este curso, porque presentan retos considerables.
54
Webs preparadas para la TA: aspectos linguısticos [1]
Si prevemos que una web debe ser traducida automaticamente a otra
lengua, podemos preparar el texto origen.
Conocer el sistema concreto de TA nos puede ayudar a evitar las
palabras o las construcciones que dan lugar a problemas.
La nocion es conocida de hace tiempo y se denomina lenguaje con-
trolado.
55
Webs preparadas para la TA: aspectos linguısticos [1]
Si prevemos que una web debe ser traducida automaticamente a otra
lengua, podemos preparar el texto origen.
Conocer el sistema concreto de TA nos puede ayudar a evitar las
palabras o las construcciones que dan lugar a problemas.
La nocion es conocida de hace tiempo y se denomina lenguaje con-
trolado.
55
Webs preparadas para la TA: aspectos linguısticos [1]
Si prevemos que una web debe ser traducida automaticamente a otra
lengua, podemos preparar el texto origen.
Conocer el sistema concreto de TA nos puede ayudar a evitar las
palabras o las construcciones que dan lugar a problemas.
La nocion es conocida de hace tiempo y se denomina lenguaje con-
trolado.
55
Webs preparadas para la TA: aspectos linguısticos [1]
Si prevemos que una web debe ser traducida automaticamente a otra
lengua, podemos preparar el texto origen.
Conocer el sistema concreto de TA nos puede ayudar a evitar las
palabras o las construcciones que dan lugar a problemas.
La nocion es conocida de hace tiempo y se denomina lenguaje con-
trolado.
55
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [2]
Algunos consejos independientes del idioma:
Hacer paginas y parrafos cortos.
No usar textos en graficos (imagenes), sino iconos.
Usar estructuras gramaticales sencillas.
Usar vocabulario basico (frecuente, cotidiano), pero. . .
Evitar las palabras polisemicas y los homografos (homonimos).
Evitar las abreviaturas.
56
Webs preparadas para la TA: aspectos linguısticos [3]
Mes consejos independientes del idioma:
No usar el formato para transmitir informacion crucial; mejor usar
texto.
Repasar la ortografıa.
Evitar las expresiones idiomaticas (no obviamente composiciona-
les).
57
Webs preparadas para la TA: aspectos linguısticos [3]
Mes consejos independientes del idioma:
No usar el formato para transmitir informacion crucial; mejor usar
texto.
Repasar la ortografıa.
Evitar las expresiones idiomaticas (no obviamente composiciona-
les).
57
Webs preparadas para la TA: aspectos linguısticos [3]
Mes consejos independientes del idioma:
No usar el formato para transmitir informacion crucial; mejor usar
texto.
Repasar la ortografıa.
Evitar las expresiones idiomaticas (no obviamente composiciona-
les).
57
Webs preparadas para la TA: aspectos linguısticos [3]
Mes consejos independientes del idioma:
No usar el formato para transmitir informacion crucial; mejor usar
texto.
Repasar la ortografıa.
Evitar las expresiones idiomaticas (no obviamente composiciona-
les).
57
Webs preparadas para la TA: aspectos linguısticos [3]
Mes consejos independientes del idioma:
No usar el formato para transmitir informacion crucial; mejor usar
texto.
Repasar la ortografıa.
Evitar las expresiones idiomaticas (no obviamente composiciona-
les).
57
Memorias de traduccion [1]
Los traductores (humanos) han generado muchısimas traducciones.
Tenemos a nuestro alcance numerosos textos electronicos bilingues
donde la version en un idioma es una buena traduccion de la version
en el otro y viceversa.
No se podrıa aprovechar este trabajo para traducir documentos nuevos
(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-
cion automatica.
58
Memorias de traduccion [1]
Los traductores (humanos) han generado muchısimas traducciones.
Tenemos a nuestro alcance numerosos textos electronicos bilingues
donde la version en un idioma es una buena traduccion de la version
en el otro y viceversa.
No se podrıa aprovechar este trabajo para traducir documentos nuevos
(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-
cion automatica.
58
Memorias de traduccion [1]
Los traductores (humanos) han generado muchısimas traducciones.
Tenemos a nuestro alcance numerosos textos electronicos bilingues
donde la version en un idioma es una buena traduccion de la version
en el otro y viceversa.
No se podrıa aprovechar este trabajo para traducir documentos nuevos
(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-
cion automatica.
58
Memorias de traduccion [1]
Los traductores (humanos) han generado muchısimas traducciones.
Tenemos a nuestro alcance numerosos textos electronicos bilingues
donde la version en un idioma es una buena traduccion de la version
en el otro y viceversa.
No se podrıa aprovechar este trabajo para traducir documentos nuevos
(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-
cion automatica.
58
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [2]
Para aprovechar estos bitextos hace falta:
Alinearlos (indicar que partes son traduccion de cuales);
Segmentarlos en unidades de traduccion (UT);
Organizar las UT en una base de datos eficiente.
Todas estas tareas, tan automaticamente como sea posible.
59
Memorias de traduccion [3]
Esquema del proceso de segmentacion y de alineamiento de un par
de textos existente para alimentar una memoria de traduccion.
texto izquierdo E →segmen-
tacion→
texto derecho D →segmen-
tacion→
alineador-
corrector
asistido
→UTs
(e, d)→
Memoria
de tra-
duccion
60
Memorias de traduccion [4]
Para traducir textos nuevos hace falta:
Segmentarlos en unidades que puedan corresponder con las UT
Substituir los segmentos existentes encontrados por las traduc-
ciones correspondientes.
Este es el fundamento de las memorias de traduccion.
61
Memorias de traduccion [4]
Para traducir textos nuevos hace falta:
Segmentarlos en unidades que puedan corresponder con las UT
Substituir los segmentos existentes encontrados por las traduc-
ciones correspondientes.
Este es el fundamento de las memorias de traduccion.
61
Memorias de traduccion [4]
Para traducir textos nuevos hace falta:
Segmentarlos en unidades que puedan corresponder con las UT
Substituir los segmentos existentes encontrados por las traduc-
ciones correspondientes.
Este es el fundamento de las memorias de traduccion.
61
Memorias de traduccion [4]
Para traducir textos nuevos hace falta:
Segmentarlos en unidades que puedan corresponder con las UT
Substituir los segmentos existentes encontrados por las traduc-
ciones correspondientes.
Este es el fundamento de las memorias de traduccion.
61
Memorias de traduccion [4]
Para traducir textos nuevos hace falta:
Segmentarlos en unidades que puedan corresponder con las UT
Substituir los segmentos existentes encontrados por las traduc-
ciones correspondientes.
Este es el fundamento de las memorias de traduccion.
61
Memorias de traduccion [5]
Esquema del proceso de de pretraduccion de un nuevo texto izquierdo
E′ usando una memoria de traduccion.
texto izquierdo E′ → segmentacion → pretraduccion →
texto
derecho
pretra-
ducido y
segmenta-
do↑↓ UTs
Memoria de
traduccion
62
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [6]
Algunos productos comerciales (precios de 600 euros para arriba):
Deja Vu de Atril (http://www.atril.com)
Transit de Star (http://www.star-transit.com)
Trados (www.trados.com)
SDLX (www.sdlintl.com)
Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).
63
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [7]
¿Cuando funcionan bien las memorias de traduccion?
Cuando tenemos muchas traducciones alineadas en la memoria
Cuando los tipos de textos a traducir son muy repetitivos
Cuando la terminologıa y la fraseologıa son estables en la memoria
Pero siempre hace falta revisar la pretraduccion.
A cambio: la pretraduccion revisada se puede anadir ya a la me-
moria de traduccion para usarla en el futuro.
64
Memorias de traduccion [8]
Sobre la segmentacion:
Los programas de MT segmentan los textos en “oraciones” usan-
do la puntuacion y el formato.
A cambio, encuentran en la memoria segmentos aproximados
ademas de los identicos (y producen traducciones aproximadas).
Existe (desde 1998) un formato estandar internacional de MT
independiente del programa: TMX (Translation Memory eXchan-
ge), que permite el intercambio de memorias entre equipos de
traduccion.
65
Memorias de traduccion [8]
Sobre la segmentacion:
Los programas de MT segmentan los textos en “oraciones” usan-
do la puntuacion y el formato.
A cambio, encuentran en la memoria segmentos aproximados
ademas de los identicos (y producen traducciones aproximadas).
Existe (desde 1998) un formato estandar internacional de MT
independiente del programa: TMX (Translation Memory eXchan-
ge), que permite el intercambio de memorias entre equipos de
traduccion.
65
Memorias de traduccion [8]
Sobre la segmentacion:
Los programas de MT segmentan los textos en “oraciones” usan-
do la puntuacion y el formato.
A cambio, encuentran en la memoria segmentos aproximados
ademas de los identicos (y producen traducciones aproximadas).
Existe (desde 1998) un formato estandar internacional de MT
independiente del programa: TMX (Translation Memory eXchan-
ge), que permite el intercambio de memorias entre equipos de
traduccion.
65
Memorias de traduccion [8]
Sobre la segmentacion:
Los programas de MT segmentan los textos en “oraciones” usan-
do la puntuacion y el formato.
A cambio, encuentran en la memoria segmentos aproximados
ademas de los identicos (y producen traducciones aproximadas).
Existe (desde 1998) un formato estandar internacional de MT
independiente del programa: TMX (Translation Memory eXchan-
ge), que permite el intercambio de memorias entre equipos de
traduccion.
65
Memorias de traduccion [8]
Sobre la segmentacion:
Los programas de MT segmentan los textos en “oraciones” usan-
do la puntuacion y el formato.
A cambio, encuentran en la memoria segmentos aproximados
ademas de los identicos (y producen traducciones aproximadas).
Existe (desde 1998) un formato estandar internacional de MT
independiente del programa: TMX (Translation Memory eXchan-
ge), que permite el intercambio de memorias entre equipos de
traduccion.
65
c© 2007 Universitat d’Alacant
c© 2007 Mikel L. Forcada
Este trabajo se puede distribuir libremente en los terminos de cual-quiera de estas dos licencias:
la licencia Creative Commons Attribution–Share Alike: http://
creativecommons.org/licenses/by-sa/3.0/deed.es
la licencia GNU GPL v. 3.0: http://www.gnu.org/licenses/gpl.html
Para obtener los fuentes LATEX, basta con escribir a:[email protected]
66