Curso urgente de traducción automática

Post on 23-Jun-2015

682 views 1 download

Transcript of Curso urgente de traducción automática

Curso urgente de traduccion automatica

Mikel L. Forcada

Departament de Llenguatges i Sistemes Informatics

Universitat d’Alacant

E-03071 Alacant, Spain

TI aplicadas al uso de las lenguas para fines especıficos

Universitat d’Alacant, 2007

1

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

¿Que es la traduccion automatica (TA)? [2]

Esquematicamente:

Texto LO →Sistema de

traduccion

automatica

→Texto LM

(en bru-

to)

4

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Formatos de texto [7]

Con codigos no interpretables como caracteres: (no visibles a

traves de un editor de texto sencillo) Adobe PDF (impresion,

presentacion), formatos semisecretos de procesadores de textos

comerciales como .doc de Microsoft, etc.

15

Formatos de texto [7]

Con codigos no interpretables como caracteres: (no visibles a

traves de un editor de texto sencillo) Adobe PDF (impresion,

presentacion), formatos semisecretos de procesadores de textos

comerciales como .doc de Microsoft, etc.

15

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Formatos de texto [12]

documento (XML o HTML) →hoja de estilo (XSL o CSS) →

Procesador

de hojas de

estilo

→ presentacion

20

Formatos de texto [13]

Accesibilidad (no todos los receptores son videntes):

Fichero de sonido Docum. Braille Docum. para moviles

� Ò H

Hoja de estilo 1 Hoja de estilo 2 Hoja de estilo 3

Documento XML

? ? ?

? ? ?

21

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tenermas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

¿Por que es difıcil la TA? [2]

El problema del analisis: La forma no determina completamente el

contenido (la interpretacion). Tambien se denomina ambiguedad:

Traıan noticias de Grecia (¿tema o procedencia?)

Ha vendido las naranjas que ha comprado a Fermın (¿Fermın

vende o compra?)

Trabaja en el estudio que le han encargado (¿prepara un docu-

mento o disena un taller de artista?)

32

¿Por que es difıcil la TA? [3]

El problema de la sıntesis: El contenido no determina completamen-te la forma (hay mas de una manera de decir lo mismo en cualquierlengua):

¿Que hora es?

¿Como es de tarde? (de: Wie spat ist es?)

¿Que horas son? (pt: Que horas sao?)

Los expedientes, ¿se abren o se inician?

Las sesiones, ¿se clausuran, se cierran, o se levantan?

33

¿Por que es difıcil la TA? [4]

El problema de la transferencia: Las lenguas divergen. Es decir,

hay diferencias irreductibles en la manera en que el mismo contenido

se expresa en lenguas diferentes:

es: Me gusta nadar (Me objeto, gusta verbo, nadar sujeto)

en: I like swimming (I sujeto, like verbo, swimming objeto)

de: Ich schwimme gern (Ich sujeto, schwimme, verbo, gern, ad-

verbio)

Todas quieren decir dar placer(agente=nadar(agente=yo),destinatario=yo)

34

¿Por que es difıcil la TA? [5]

El problema de la descripcion (otra vez): construir un sistema de

traduccion automatica comporta la gestion de una gran cantidad de

conocimiento, que se debe explicitar, reunir, describir, y representar

en una forma util y computable.

35

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Un inciso: el formato de las paginas web [2]

<HTML><HEAD><TITLE>Tıtulo del documento</TITLE></HEAD><BODY><H1>Encabezamiento de nivel 1</H1><H2>Encabezamiento de nivel 2</H2><P>Este es el <EM>primer</EM> parrafode este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıaacabar con una marca de final de parrafo.</P><H2>Otro encanezamiento de nivel 2</H2><P>Este es el<EM>ultimo</EM> parrafode este documento HTML. Los documentos HTML pueden contener<A HREF="http://www.internostrum.com">enlaces</A>a otros documentos HTML, locales o remotos.</P></BODY></HTML>

47

Un inciso: el formato de las paginas web [3]

Encabezamiento de nivel 1

Encabezamiento de nivel 2

Este es el primer parrafo de este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıa acabar con una marca de final deparrafo.

Otro encabezamiento de nivel 2

Este es el ultimo parrafo de este documento HTML. Los documentos HTML puedencontener enlaces a otros documentos HTML, locales o remotos.

48

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: carter@mail.net (no es

“carretero@correo.red”)

53

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: carter@mail.net (no es

“carretero@correo.red”)

53

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: carter@mail.net (no es

“carretero@correo.red”)

53

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: carter@mail.net (no es

“carretero@correo.red”)

53

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Memorias de traduccion [3]

Esquema del proceso de segmentacion y de alineamiento de un par

de textos existente para alimentar una memoria de traduccion.

texto izquierdo E →segmen-

tacion→

texto derecho D →segmen-

tacion→

alineador-

corrector

asistido

→UTs

(e, d)→

Memoria

de tra-

duccion

60

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Memorias de traduccion [5]

Esquema del proceso de de pretraduccion de un nuevo texto izquierdo

E′ usando una memoria de traduccion.

texto izquierdo E′ → segmentacion → pretraduccion →

texto

derecho

pretra-

ducido y

segmenta-

do↑↓ UTs

Memoria de

traduccion

62

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

c© 2007 Universitat d’Alacant

c© 2007 Mikel L. Forcada

Este trabajo se puede distribuir libremente en los terminos de cual-quiera de estas dos licencias:

la licencia Creative Commons Attribution–Share Alike: http://

creativecommons.org/licenses/by-sa/3.0/deed.es

la licencia GNU GPL v. 3.0: http://www.gnu.org/licenses/gpl.html

Para obtener los fuentes LATEX, basta con escribir a:mlf@ua.es

66