Curso urgente de traducción automática

287
Curso urgente de traducci´ on autom´ atica Mikel L. Forcada Departament de Llenguatges i Sistemes Inform` atics Universitat d’Alacant E-03071 Alacant, Spain TI aplicadas al uso de las lenguas para fines espec´ ıficos Universitat d’Alacant, 2007 1

Transcript of Curso urgente de traducción automática

Page 1: Curso urgente de traducción automática

Curso urgente de traduccion automatica

Mikel L. Forcada

Departament de Llenguatges i Sistemes Informatics

Universitat d’Alacant

E-03071 Alacant, Spain

TI aplicadas al uso de las lenguas para fines especıficos

Universitat d’Alacant, 2007

1

Page 2: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 3: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 4: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 5: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 6: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 7: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 8: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 9: Curso urgente de traducción automática

Indice

1. ¿Que es la traduccion automatica (TA)? Aplicaciones

2. Formatos de texto

3. ¿Como funciona la TA?

4. ¿Por que es difıcil la TA?

5. Evaluacion de la traduccion automatica

6. TA de paginas web

7. Memorias de traduccion

2

Page 10: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 11: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 12: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 13: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 14: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 15: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 16: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [1]

La traduccion, . . .

. . . mediante un sistema informatico . . .

. . . (ordenador(es) + programas) . . .

. . . de textos informatizados en la lengua origen (LO). . .

. . . a textos informatizados en la la lengua meta (LM).

¡¡Atencion al formato de los textos!!

3

Page 17: Curso urgente de traducción automática

¿Que es la traduccion automatica (TA)? [2]

Esquematicamente:

Texto LO →Sistema de

traduccion

automatica

→Texto LM

(en bru-

to)

4

Page 18: Curso urgente de traducción automática

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Page 19: Curso urgente de traducción automática

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Page 20: Curso urgente de traducción automática

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Page 21: Curso urgente de traducción automática

Aplicaciones de la TA [1]

Dos grandes grupos:

Asimilacion: traduccion efımera, idealmente instantanea, para la

revision o la comprension de documentos en otra lengua. P.e.,

navegacion por internet, chat, etc.

Diseminacion: traduccion permanente, idealmente con pocos erro-

res, para su publicacion. P.e., produccion de borradores para pos-

teditar .

5

Page 22: Curso urgente de traducción automática

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Page 23: Curso urgente de traducción automática

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Page 24: Curso urgente de traducción automática

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Page 25: Curso urgente de traducción automática

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Page 26: Curso urgente de traducción automática

Aplicaciones de la TA [2]

Preedicion y postedicion: los profesionales colaboran con el sistemade TA en aplicaciones de diseminacion:

Preedicion: preparacion del texto para evitar lexico o construccio-nes que dan problemas de traduccion con un sistema de traduccionautomatica.

Postedicion: correccion del texto traducido en sucio para hacerloadecuado al proposito previsto.

Conocer bien como funciona el sistema de TA ayuda mucho en ambastareas.

6

Page 27: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 28: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 29: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 30: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 31: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 32: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 33: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 34: Curso urgente de traducción automática

Aplicaciones de la TA [3]

Alternativa a la preedicion: lenguaje controlado.

Los autores escriben ya pensando en el tratamiento automatizadodel texto.

Se evitan lexico y construcciones problematicas.

Se minimiza la postedicion.

Consistencia de estilo, comprensibilidad, mantenibilidad.

Pero. . . ¡los autores lo deben conocer y aplicar!

Se les puede ayudar con herramientas informaticas.

7

Page 35: Curso urgente de traducción automática

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Page 36: Curso urgente de traducción automática

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Page 37: Curso urgente de traducción automática

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Page 38: Curso urgente de traducción automática

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Page 39: Curso urgente de traducción automática

Aplicaciones de la TA [4]

La postedicion es conveniente cuando

coste

traduccion automatica+

postedicion

< coste(traduccion humana).

Para que sea eficiente:

se debe ser competente en la lengua meta → generar un textogenuino a partir del texto en sucio

se debe conocer el sistema de TA → reconocer el origen de loserrores, predecir el comportamiento

8

Page 40: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 41: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 42: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 43: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 44: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 45: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 46: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 47: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 48: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 49: Curso urgente de traducción automática

Formatos de texto [1]

Un texto informatizado es, como cualquier porcion de datos informa-

tizada, una secuencia de bits, es decir, de unos y ceros:

000101010010100111101001010010....

Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se

pueden hacer 2×2×2×2×2×2×2×2×2= 28= 256 combinaciones:

00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255).

Hay muchas maneras de organizar los bytes para almacenar textos.

Muchos problemas provienen de discrepancias en cuanto a la manera

de hacerlo.

9

Page 50: Curso urgente de traducción automática

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Page 51: Curso urgente de traducción automática

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Page 52: Curso urgente de traducción automática

Formatos de texto [2]

Dos aspectos importantes: codificacion y formato propiamente dicho.

Codificacion: Asignacion de un codigo (una secuencia de uno o

mas bytes concreta) a cada caracter posible de la lengua corres-

pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111”

(63), etc.)

10

Page 53: Curso urgente de traducción automática

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Page 54: Curso urgente de traducción automática

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Page 55: Curso urgente de traducción automática

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Page 56: Curso urgente de traducción automática

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Page 57: Curso urgente de traducción automática

Formatos de texto [3]

Formato propiamente dicho: Los textos, ademas de caracteres,contienen informacion de formato.

Es precisa la asignacion de codigos para regular otras caracterısti-cas del texto:

• Para codificar la apariencia visual o de presentacion, por ejem-plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”),o

• para codificar la estructura (es decir, la organizacion del conte-nido, por ejemplo, “tıtulo de seccion”, “lista numerada”, “notaa pie de pagina”, “fila de una tabla”, etc.).

11

Page 58: Curso urgente de traducción automática

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Page 59: Curso urgente de traducción automática

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Page 60: Curso urgente de traducción automática

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Page 61: Curso urgente de traducción automática

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Page 62: Curso urgente de traducción automática

Formatos de texto [4]

Codificacions de 1 byte (“unibyte”):

ASCII: Asigna codigos de 7 bits, del 0000000 (0) al 1111111 (127),(sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.)

ANSI o ISO: familia de codificaciones que aprovechan los codigosdel 128 al 255 para caracteres internacionales.

En Europa occidental: ISO-8859-1 (o Latin-1); mas recientemen-te, ISO-8859-15 (o Latin-9; contiene el sımbolo del euro)

En Windows se usa CP-1252 que es muy similar (pero no identico)al ISO-8859-1.

12

Page 63: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 64: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 65: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 66: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 67: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 68: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 69: Curso urgente de traducción automática

Formatos de texto [5]

Codificacions de mas de 1 byte (“multibyte”: japones, chino, coreano,devanagari. . . ):

Unicode (ISO-10646): Asigna codigos de 31 bits (4 bytes) y per-mite codificar 231 = 2147483648 caracteres.

UTF-8: Version de Unicode que solo usa mas de un byte cuandohace falta:

• codigos del 0 al 127: 1 byte (compatible con ASCII);

• codigos del 128 al 2047: 2 bytes;

• codigos del 2048 al 65535: 3 bytes, etc.

13

Page 70: Curso urgente de traducción automática

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Page 71: Curso urgente de traducción automática

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Page 72: Curso urgente de traducción automática

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Page 73: Curso urgente de traducción automática

Formatos de texto [6]

Necesidad de formato (estructural o presentacional) mas alla de lacodificacion de caracteres. La informacion de formato se puede codi-ficar:

Como secuencias de caracteres (llamadas marcas) que se puedenleer con un editor sencillo de texto como el Bloc de notas: Lafamilia SGML (ahora XML): HTML y XHTML (paginas web),NewsML (noticias), etc.; RTF, TeX (procesadores de textos);Postscript (impresoras), etc. Un ejemplo:

<p>Un parrafo corto con una palabra <em>enfatizada</em><p>

(HTML visto a traves de un editor de texto)

14

Page 74: Curso urgente de traducción automática

Formatos de texto [7]

Con codigos no interpretables como caracteres: (no visibles a

traves de un editor de texto sencillo) Adobe PDF (impresion,

presentacion), formatos semisecretos de procesadores de textos

comerciales como .doc de Microsoft, etc.

15

Page 75: Curso urgente de traducción automática

Formatos de texto [7]

Con codigos no interpretables como caracteres: (no visibles a

traves de un editor de texto sencillo) Adobe PDF (impresion,

presentacion), formatos semisecretos de procesadores de textos

comerciales como .doc de Microsoft, etc.

15

Page 76: Curso urgente de traducción automática

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Page 77: Curso urgente de traducción automática

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Page 78: Curso urgente de traducción automática

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Page 79: Curso urgente de traducción automática

Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves

es lo que obtendras”):

Las personas usan la presentacion visual para comunicar la estructura

logica de los documentos (¡a personas videntes!).

Los procesadores de textos actuales nos muestran el documento tal

como quedara impreso mientras lo estamos editando.

Sucumbimos a la tentacion de trabajar directamente sobre la presen-

tacion (negritas, margenes, tipos) en vez de sobre la estructura logica

(secciones, tıtulos, etc.)

16

Page 80: Curso urgente de traducción automática

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Page 81: Curso urgente de traducción automática

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Page 82: Curso urgente de traducción automática

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Page 83: Curso urgente de traducción automática

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Page 84: Curso urgente de traducción automática

Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y mas adelante queremos cambiar el tipo de letra

de los tıtulos de seccion o de las palabras extranjeras. . .

. . . ¡nos toca cambiarlos uno por uno!

Resultado: “lo que ves es todo lo que tienes”

¿Podemos evitarlo? Sı.

17

Page 85: Curso urgente de traducción automática

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Page 86: Curso urgente de traducción automática

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Page 87: Curso urgente de traducción automática

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Page 88: Curso urgente de traducción automática

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Page 89: Curso urgente de traducción automática

Formatos de texto [10]

¿Como? Usando estilos.

Marcamos estructuralmente las partes (elementos): tıtulo de segundo

nivel, texto enfatizado, ejemplo, etc.

Y despues asignamos un estilo de presentacion a cada parte (por

ejemplo, los tıtulos de segundo nivel pueden ir numerados automati-

camente y en Helvetica de 14 puntos, el enfasis puede ser en negrita

y el ejemplo en cursiva)

Cambiar la presentacion de todas las apariciones de un elemento es

facil: basta con cambiar el estilo asociado al elemento.18

Page 90: Curso urgente de traducción automática

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Page 91: Curso urgente de traducción automática

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Page 92: Curso urgente de traducción automática

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Page 93: Curso urgente de traducción automática

Formatos de texto [11]

En aplicaciones de internet, la separacion estructura–presentacion se

hace ası:

La informacion —el contenido— se estructura usando XML o

HTML

La presentacion se genera (en el servidor o en el navegador) usan-

do hojas de estilo escritos en CSS o en XSL

19

Page 94: Curso urgente de traducción automática

Formatos de texto [12]

documento (XML o HTML) →hoja de estilo (XSL o CSS) →

Procesador

de hojas de

estilo

→ presentacion

20

Page 95: Curso urgente de traducción automática

Formatos de texto [13]

Accesibilidad (no todos los receptores son videntes):

Fichero de sonido Docum. Braille Docum. para moviles

� Ò H

Hoja de estilo 1 Hoja de estilo 2 Hoja de estilo 3

Documento XML

? ? ?

? ? ?

21

Page 96: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 97: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 98: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 99: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 100: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 101: Curso urgente de traducción automática

Formatos de texto [14]

Los sistemas de TA deben ser capaces:

De separar del texto a traducir la informacion de formato;

de reintegrar adecuadamente la informacion de formato al textotras traducirlo;

y, idealmente, de usar la informacion de formato para decidirque partes se deben traducir.

La preservacion del formato ahorra tiempo a la persona traducto-ra/correctora (que se concentra en la parte linguıstica del trabajo).

22

Page 102: Curso urgente de traducción automática

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

Page 103: Curso urgente de traducción automática

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

Page 104: Curso urgente de traducción automática

¿Como funciona la TA? [1]

Primera aproximacion [!!]: Traducir textos es traduir oraciones.

Traducir oraciones supone:

Construir una interpretacion (un significado) a partir de la oracion

en LO.

Construir una oracion en LM a partir de la interpretacion.

23

Page 105: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 106: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 107: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 108: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 109: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 110: Curso urgente de traducción automática

¿Como funciona la TA? [2]

Principio de composicionalidad [semantica]:

La interpretacion de una oracion se construye . . .

. . . a partir de las interpretaciones de las palabras . . .

Escriben cartas 6= Escriben artıculos

. . . componiendolas siguiendo las agrupaciones indicadas por la es-

tructura sintactica de la oracion.

Israel amenaza a Palestina 6= Palestina amenaza a Israel

25

Page 111: Curso urgente de traducción automática

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tenermas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

Page 112: Curso urgente de traducción automática

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

Page 113: Curso urgente de traducción automática

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

Page 114: Curso urgente de traducción automática

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

Page 115: Curso urgente de traducción automática

¿Como funciona la TA? [3]

Pero, ¡atencion! Las oraciones pueden ser ambiguas (es decir, tener

mas de una interpretacion):

porque las palabras tienen mas de una interpretacion (ambiguedadlexica)

porque la oracion tiene mas de un posible analisis sintactico (am-biguedad sintactica)

por ambas cosas a la vez.

Elegir la interpretacion correcta no es trivial para un sistema informati-co (normalmente solo puede usar parte del cotexto).

25

Page 116: Curso urgente de traducción automática

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

Page 117: Curso urgente de traducción automática

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

Page 118: Curso urgente de traducción automática

¿Como funciona la TA? [4]

Esquematicamente:

Oracion

LO→ interpretacion → Oracion

LM

En algunos sistemas de TA se intenta representar directamente las

interpretaciones con una interlingua (un lenguaje estructurado artifi-

cial).

26

Page 119: Curso urgente de traducción automática

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

Page 120: Curso urgente de traducción automática

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

Page 121: Curso urgente de traducción automática

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

Page 122: Curso urgente de traducción automática

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

Page 123: Curso urgente de traducción automática

¿Como funciona la TA? [5]

Pero. . . los traductores profesionales ¿realmente necesitan interpretaro comprender completamente una oracion para traducirla?

“... spin-independent interactions in units of the Dirac neutrinocross section. . . ” →

“... interacciones independientes del espın en unidades de la seccioneficaz del neutrino de Dirac...”

“. . . bolts joining the flywheel to the crankshaft. . . →“. . . tornillos que unen el volante de inercia al arbol de levas . . . ”

No: Transforman estructuras o patrones y subsituyen el lexico (pres-tando especial atencion al terminologico).

27

Page 124: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 125: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 126: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 127: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 128: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 129: Curso urgente de traducción automática

¿Como funciona la TA? [6]

Esto nos permite hacer la segunda aproximacion [!!]:

La mayorıa de los sistemas de TA no construyen completamentela interpretacion, . . .

. . . sino que transforman la estructura sintactica de la oracion enLO en una estructura sintactica valida para la oracion en LM y. . .

. . . substituyen las palabras de la oracion en LO por equivalentesadecuados en LM. . .

. . . haciendo las dos operaciones bastante independientemente.

28

Page 130: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 131: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 132: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 133: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 134: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 135: Curso urgente de traducción automática

¿Como funciona la TA? [7]

Para programar un sistema de TA es preciso formular todos los proce-sos de traduccion de forma explıcita y mecanizable (¡adios “intuicionlinguıstica”!).

Ademas, la mecanizacion debe ser eficiente (programas rapidos ycompactos) y se debe llevar a cabo en un tiempo razonable:

Esto exige una reflexion linguıstica (traductologica) sobre los pro-cesos de traduccion por parte de los disenadores del sistema.

Ademas, puede comportar mas aproximaciones, simplificaciones,compromisos y sacrificios.

29

Page 136: Curso urgente de traducción automática

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

Page 137: Curso urgente de traducción automática

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

Page 138: Curso urgente de traducción automática

¿Como funciona la TA? [8]

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte

mas mecanica (mecanizable) de la tarea de traduccion.

Pero no podemos esperar —por bueno que sea— que comprenda el

texto, resuelva las ambiguedades siempre correctamente y produzca

textos en una variante genuina de la lengua meta.

30

Page 139: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 140: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 141: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 142: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 143: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 144: Curso urgente de traducción automática

¿Por que es difıcil la TA? [1]

Los cuatro problemas de la traduccion automatica (Arnold 2003):

1. El problema del analisis

2. El problema de la sıntesis

3. El problema de la transferencia

4. El problema de la descripcion

31

Page 145: Curso urgente de traducción automática

¿Por que es difıcil la TA? [2]

El problema del analisis: La forma no determina completamente el

contenido (la interpretacion). Tambien se denomina ambiguedad:

Traıan noticias de Grecia (¿tema o procedencia?)

Ha vendido las naranjas que ha comprado a Fermın (¿Fermın

vende o compra?)

Trabaja en el estudio que le han encargado (¿prepara un docu-

mento o disena un taller de artista?)

32

Page 146: Curso urgente de traducción automática

¿Por que es difıcil la TA? [3]

El problema de la sıntesis: El contenido no determina completamen-te la forma (hay mas de una manera de decir lo mismo en cualquierlengua):

¿Que hora es?

¿Como es de tarde? (de: Wie spat ist es?)

¿Que horas son? (pt: Que horas sao?)

Los expedientes, ¿se abren o se inician?

Las sesiones, ¿se clausuran, se cierran, o se levantan?

33

Page 147: Curso urgente de traducción automática

¿Por que es difıcil la TA? [4]

El problema de la transferencia: Las lenguas divergen. Es decir,

hay diferencias irreductibles en la manera en que el mismo contenido

se expresa en lenguas diferentes:

es: Me gusta nadar (Me objeto, gusta verbo, nadar sujeto)

en: I like swimming (I sujeto, like verbo, swimming objeto)

de: Ich schwimme gern (Ich sujeto, schwimme, verbo, gern, ad-

verbio)

Todas quieren decir dar placer(agente=nadar(agente=yo),destinatario=yo)

34

Page 148: Curso urgente de traducción automática

¿Por que es difıcil la TA? [5]

El problema de la descripcion (otra vez): construir un sistema de

traduccion automatica comporta la gestion de una gran cantidad de

conocimiento, que se debe explicitar, reunir, describir, y representar

en una forma util y computable.

35

Page 149: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Page 150: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Page 151: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Page 152: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [1]

Queremos evaluar la adopcion de un sistema de traduccion automati-

ca para la diseminacion.

Las traducciones en sucio se deberan posteditar (corregir): cuanto

menos correcciones, mas calidad: mejor.

De acuerdo: ¿como evaluamos la calidad?

36

Page 153: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 154: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 155: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 156: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 157: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 158: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [2]

Para evaluar la calidad, necesitamos:

elegir una muestra suficiente de textos representativos,

traducirla automaticamente,

y contar cual es el mınimo de correcciones necesario para hacer

que la traduccion sea adecuada al proposito previsto.

Parece sencillo, pero. . .

37

Page 159: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 160: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 161: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 162: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 163: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 164: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [3]

¡. . . no lo es en absoluto!

es difıcil elegir suficiente texto representativo de antemano;

la nocion de adecuacion es a veces difıcil de especificar;

es difıcil hacer el mınimo de correcciones (supone encontrar tra-

ducciones adecuadas que se obtengan con pocas correcciones);

todo el proceso es muy costoso (tiempo de correccion).

38

Page 165: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 166: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 167: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 168: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 169: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 170: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 171: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [4]

¡Pero la calidad de los textos traducidos en sucio no lo es todo!

Hagamos un presupuesto: si adoptamos la traduccion automatica,

por una parte, nos ahorramos los costes de traduccion humana,

pero tenemos gastos nuevos:

gastos de funcionamiento

y gastos de formacion (se debe aprender a usar una nueva tecno-logıa)

39

Page 172: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Page 173: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Page 174: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Page 175: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Page 176: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [5]

Gastos de funcionamiento:

Coste del sistema de TA (coste efectivo por palabra): amor-tizacion (sistema en propiedad), coste por palabra (sistema al-quilado), servicio tecnico y mantenimiento, costes de migracion(adaptacion de programas, adquisicion de sistemas), y (no lo ol-videmos) el coste de evaluacion.

Coste de preedicion y preparacion: es preciso preparar y quizaspreeditar los textos y esto lo debe hacer alguien, cobrando.

Coste de postedicion: depende de la calidad; puede bajar conla formacion; depende de como paguemos a los posteditores (porpalabra, por tiempo), etc.

40

Page 177: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 178: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 179: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 180: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 181: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 182: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [6]

Gastos de formacion:

Formacion en uso del programa de TA: uso propiamente dicho,

configuracion y mantenimiento; uso de nuevo software asociado.

Formacion en postedicion:

• conocimiento del programa de TA (errores tıpicos);

• tecnicas de correccion, uso adelantado del procesador de tex-

tos, macroinstrucciones, sustitucion de patrones, etc.

41

Page 183: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Page 184: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Page 185: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Page 186: Curso urgente de traducción automática

Evaluacion de la traduccion automatica [7]

¡Y quizas nos hemos dejado todavıa algo!

Evaluar la traduccion automatica no es facil.

¿La leccion? Desconfiad de las primeras impresiones.

42

Page 187: Curso urgente de traducción automática

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

Page 188: Curso urgente de traducción automática

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

Page 189: Curso urgente de traducción automática

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

Page 190: Curso urgente de traducción automática

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

Page 191: Curso urgente de traducción automática

TA de paginas web [1]

La traduccion automatica de paginas web es como la TA de otros

documentos de texto, pero hay algunas diferencias:

las paginas web son hipertextos: contienen enlaces a otros paginas

web

a veces son activas: contienen programas que se ejecutan durante

la presentacion

a veces son dinamicas: el servidor no las tiene guardadas sino que

las genera automaticamente cuando se solicitan

43

Page 192: Curso urgente de traducción automática

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

Page 193: Curso urgente de traducción automática

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

Page 194: Curso urgente de traducción automática

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

Page 195: Curso urgente de traducción automática

TA de paginas web [2]

Dos usos basicos de la TA de paginas web:

Diseminacion: TA para construir y mantener servidores de internet

multilingues

Asimilacion: TA durante la navegacion (”navegacion traducida”),

en el cliente, en el servidor que contiene la informacion, o en otro

servidor (p.e., interNOSTRUM)

44

Page 196: Curso urgente de traducción automática

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

Page 197: Curso urgente de traducción automática

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

Page 198: Curso urgente de traducción automática

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

Page 199: Curso urgente de traducción automática

TA de paginas web [3]

Los requisitos son diferentes en cada caso:

Diseminacion: la TA debe ser de calidad, quizas seguida de pos-

tedicion (la web traducida es percibida como definitiva)

Asimilacion: la TA debe ser muy rapida, “instantanea”, como si

formara parte del proceso de presentacion de la traduccion: la

calidad no es tan crucial (la traduccion es percibida como provi-

sional)

45

Page 200: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Page 201: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Page 202: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Page 203: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Page 204: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [1]

Las paginas web son documentos especiales:

La mayorıa de las paginas web estan escritas en (algun dialectono estandar de) HTML (HyperText Markup Language, “lenguajede marcas para hipertextos”).

HTML contiene, ademas de texto sencillo, marcas para controlarla presentacion y para enlazar otros documentos.

Cuando editamos con programas especializados (Composer, Front-page, Dreamweaver, etc.) no vemos las marcas sino la aparienciaaproximada del documento.

La transparencia siguiente contiene un ejemplo.

46

Page 205: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [2]

<HTML><HEAD><TITLE>Tıtulo del documento</TITLE></HEAD><BODY><H1>Encabezamiento de nivel 1</H1><H2>Encabezamiento de nivel 2</H2><P>Este es el <EM>primer</EM> parrafode este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıaacabar con una marca de final de parrafo.</P><H2>Otro encanezamiento de nivel 2</H2><P>Este es el<EM>ultimo</EM> parrafode este documento HTML. Los documentos HTML pueden contener<A HREF="http://www.internostrum.com">enlaces</A>a otros documentos HTML, locales o remotos.</P></BODY></HTML>

47

Page 206: Curso urgente de traducción automática

Un inciso: el formato de las paginas web [3]

Encabezamiento de nivel 1

Encabezamiento de nivel 2

Este es el primer parrafo de este documento. El navegador decide como dividirloen lıneas para presentarlo. Idealmente, deberıa acabar con una marca de final deparrafo.

Otro encabezamiento de nivel 2

Este es el ultimo parrafo de este documento HTML. Los documentos HTML puedencontener enlaces a otros documentos HTML, locales o remotos.

48

Page 207: Curso urgente de traducción automática

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

Page 208: Curso urgente de traducción automática

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

Page 209: Curso urgente de traducción automática

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

Page 210: Curso urgente de traducción automática

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

Page 211: Curso urgente de traducción automática

TA de paginas web (reanudamos) [4]

Traducir un documento HTML comporta:

Identificar las porciones del documento que corresponden a texto

que debe ser leıdo y traducirlas;

Adaptar los enlaces a la nueva situacion (¡quizas ya no pueden

enlazar el mismo documento!).

La adaptacion de enlaces depende de la situacion.

49

Page 212: Curso urgente de traducción automática

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

Page 213: Curso urgente de traducción automática

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

Page 214: Curso urgente de traducción automática

TA de paginas web [5]

Los enlaces contienen URIs (direcciones de otros documentos):

Podeis visitar tambien nuestros

<a href="http://www.servidor.ct/es/prod/ta.html">

productos</a>.

50

Page 215: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 216: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 217: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 218: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 219: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 220: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 221: Curso urgente de traducción automática

TA de paginas web [6]

Una mirada a los URIs de los enlaces:

http://www.servidor.ct/es/prod/ta.html

El URI (localitzador) indica:

El esquema http: (protocolo de transferencia de hipertextos)

El nombre de la maquina que hace de servidor (www.servidor.ct)

La ruta que identifica el recurso concreto (/es/prod/ta.html) den-

tro del servidor

51

Page 222: Curso urgente de traducción automática

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

Page 223: Curso urgente de traducción automática

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

Page 224: Curso urgente de traducción automática

TA de paginas web [7]

Traducir supone adaptar los URIs de los enlaces. Por ejemplo, en

un servidor bilingue espanol–ingles, si un enlace desde una pagina en

espanol apunta a la URI

http://www.servidor.ct/es/prod/ta.html

La traduccion inglesa deberıa apuntar a la URI:

http://www.servidor.ct/en/prod/ta.html

52

Page 225: Curso urgente de traducción automática

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: [email protected] (no es

[email protected]”)

53

Page 226: Curso urgente de traducción automática

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: [email protected] (no es

[email protected]”)

53

Page 227: Curso urgente de traducción automática

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: [email protected] (no es

[email protected]”)

53

Page 228: Curso urgente de traducción automática

TA de paginas web [8]

Pero el texto mismo de las paginas web contiene a veces material

especial que no se debe traducir:

URIs: www.blueberry.com (no es “www.arandano.com”)

Direcciones de correo electronico: [email protected] (no es

[email protected]”)

53

Page 229: Curso urgente de traducción automática

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

Page 230: Curso urgente de traducción automática

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

Page 231: Curso urgente de traducción automática

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

Page 232: Curso urgente de traducción automática

TA de paginas web [9]: paginas generadas en el ser-vidor

Muchas veces los documentos HTML no estan en el disco duro, sino

que son generados por un programa que se ejecuta en el servidor

durante la navegacion.

Posiblemente se generan paginas diferentes para cada perfil de visi-

tante.

Los detalles de la traduccion de este tipo de documentos quedan fuera

del ambito de este curso, porque presentan retos considerables.

54

Page 233: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Page 234: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Page 235: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Page 236: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [1]

Si prevemos que una web debe ser traducida automaticamente a otra

lengua, podemos preparar el texto origen.

Conocer el sistema concreto de TA nos puede ayudar a evitar las

palabras o las construcciones que dan lugar a problemas.

La nocion es conocida de hace tiempo y se denomina lenguaje con-

trolado.

55

Page 237: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 238: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 239: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 240: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 241: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 242: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 243: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 244: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [2]

Algunos consejos independientes del idioma:

Hacer paginas y parrafos cortos.

No usar textos en graficos (imagenes), sino iconos.

Usar estructuras gramaticales sencillas.

Usar vocabulario basico (frecuente, cotidiano), pero. . .

Evitar las palabras polisemicas y los homografos (homonimos).

Evitar las abreviaturas.

56

Page 245: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Page 246: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Page 247: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Page 248: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Page 249: Curso urgente de traducción automática

Webs preparadas para la TA: aspectos linguısticos [3]

Mes consejos independientes del idioma:

No usar el formato para transmitir informacion crucial; mejor usar

texto.

Repasar la ortografıa.

Evitar las expresiones idiomaticas (no obviamente composiciona-

les).

57

Page 250: Curso urgente de traducción automática

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Page 251: Curso urgente de traducción automática

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Page 252: Curso urgente de traducción automática

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Page 253: Curso urgente de traducción automática

Memorias de traduccion [1]

Los traductores (humanos) han generado muchısimas traducciones.

Tenemos a nuestro alcance numerosos textos electronicos bilingues

donde la version en un idioma es una buena traduccion de la version

en el otro y viceversa.

No se podrıa aprovechar este trabajo para traducir documentos nuevos

(¿reciclaje automatico de traducciones?) → Alternativa a la traduc-

cion automatica.

58

Page 254: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 255: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 256: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 257: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 258: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 259: Curso urgente de traducción automática

Memorias de traduccion [2]

Para aprovechar estos bitextos hace falta:

Alinearlos (indicar que partes son traduccion de cuales);

Segmentarlos en unidades de traduccion (UT);

Organizar las UT en una base de datos eficiente.

Todas estas tareas, tan automaticamente como sea posible.

59

Page 260: Curso urgente de traducción automática

Memorias de traduccion [3]

Esquema del proceso de segmentacion y de alineamiento de un par

de textos existente para alimentar una memoria de traduccion.

texto izquierdo E →segmen-

tacion→

texto derecho D →segmen-

tacion→

alineador-

corrector

asistido

→UTs

(e, d)→

Memoria

de tra-

duccion

60

Page 261: Curso urgente de traducción automática

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Page 262: Curso urgente de traducción automática

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Page 263: Curso urgente de traducción automática

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Page 264: Curso urgente de traducción automática

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Page 265: Curso urgente de traducción automática

Memorias de traduccion [4]

Para traducir textos nuevos hace falta:

Segmentarlos en unidades que puedan corresponder con las UT

Substituir los segmentos existentes encontrados por las traduc-

ciones correspondientes.

Este es el fundamento de las memorias de traduccion.

61

Page 266: Curso urgente de traducción automática

Memorias de traduccion [5]

Esquema del proceso de de pretraduccion de un nuevo texto izquierdo

E′ usando una memoria de traduccion.

texto izquierdo E′ → segmentacion → pretraduccion →

texto

derecho

pretra-

ducido y

segmenta-

do↑↓ UTs

Memoria de

traduccion

62

Page 267: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 268: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 269: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 270: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 271: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 272: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 273: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 274: Curso urgente de traducción automática

Memorias de traduccion [6]

Algunos productos comerciales (precios de 600 euros para arriba):

Deja Vu de Atril (http://www.atril.com)

Transit de Star (http://www.star-transit.com)

Trados (www.trados.com)

SDLX (www.sdlintl.com)

Suelen contener, ademas de la memoria de traduccion, otros utilescomo por ejemplo bases de datos lexicas (“terminologicas”), etc. Hayproductos abiertos (y gratuitos) como por ejemplo OmegaT (www.omegat.org).

63

Page 275: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 276: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 277: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 278: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 279: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 280: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 281: Curso urgente de traducción automática

Memorias de traduccion [7]

¿Cuando funcionan bien las memorias de traduccion?

Cuando tenemos muchas traducciones alineadas en la memoria

Cuando los tipos de textos a traducir son muy repetitivos

Cuando la terminologıa y la fraseologıa son estables en la memoria

Pero siempre hace falta revisar la pretraduccion.

A cambio: la pretraduccion revisada se puede anadir ya a la me-

moria de traduccion para usarla en el futuro.

64

Page 282: Curso urgente de traducción automática

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Page 283: Curso urgente de traducción automática

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Page 284: Curso urgente de traducción automática

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Page 285: Curso urgente de traducción automática

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Page 286: Curso urgente de traducción automática

Memorias de traduccion [8]

Sobre la segmentacion:

Los programas de MT segmentan los textos en “oraciones” usan-

do la puntuacion y el formato.

A cambio, encuentran en la memoria segmentos aproximados

ademas de los identicos (y producen traducciones aproximadas).

Existe (desde 1998) un formato estandar internacional de MT

independiente del programa: TMX (Translation Memory eXchan-

ge), que permite el intercambio de memorias entre equipos de

traduccion.

65

Page 287: Curso urgente de traducción automática

c© 2007 Universitat d’Alacant

c© 2007 Mikel L. Forcada

Este trabajo se puede distribuir libremente en los terminos de cual-quiera de estas dos licencias:

la licencia Creative Commons Attribution–Share Alike: http://

creativecommons.org/licenses/by-sa/3.0/deed.es

la licencia GNU GPL v. 3.0: http://www.gnu.org/licenses/gpl.html

Para obtener los fuentes LATEX, basta con escribir a:[email protected]

66