Read Iris

158
MANUAL MANUAL MANUAL MANUAL MANUAL DEL USUARIO DEL USUARIO DEL USUARIO DEL USUARIO DEL USUARIO

Transcript of Read Iris

Page 1: Read Iris

I

MANUAL DEL USUARIO

MANUALMANUALMANUALMANUALMANUALDEL USUARIODEL USUARIODEL USUARIODEL USUARIODEL USUARIO

foreword.pmd 3/04/2006, 15:341

Page 2: Read Iris

II

Readiris Pro

© 1990-2006 I.R.I.S. Reservados todos los derechosTecnología de OCR propriedad de I.R.I.S.

Tecnologías Connectionist, AutoFormat y tecnología lingüística propriedad de I.R.I.S.Tecnología de ICR y de lectura de códigos de barras de I.R.I.S.

© 1990-2006 I.R.I.S. Reservados todos los derechos

foreword.pmd 3/04/2006, 15:342

Page 3: Read Iris

III

MANUAL DEL USUARIO

¡A¡A¡A¡A¡AHORREHORREHORREHORREHORRE TIEMPOTIEMPOTIEMPOTIEMPOTIEMPO, , , , , NONONONONO VUELVUELVUELVUELVUELVVVVVAAAAA AAAAA TECLEARTECLEARTECLEARTECLEARTECLEAR!!!!!

Queremos darle la enhorabuena por haber adquirido Readiris. Este paquetede software le resultará, sin duda, de gran ayuda a la hora de capturar textos,tablas, gráficos, códigos de barras y incluso textos escritos a mano.

Por eficientes que sean los ordenadores, primero tiene que teclear suinformación. Si alguna vez ha tenido que volver a teclear un informe de 15 páginaso una amplia tabla de cifras, sabrá lo tedioso y prolongado que puede ser. Utiliceeste innovador paquete de software de OCR para introducir texto automáticamenteen sus aplicaciones y disfrute de un nivel de eficiencia y comodidad sin precedentes.(Hay dos modos de reconocimiento disponibles: uno que garantiza una velocidadóptima, y otro que garantiza una precisión de OCR óptima.)

Escanee cualquier documento impreso o mecanografiado, indique las zonasde interés - o deje que el sistema lo haga por usted -, ejecute el reconocimiento decaracteres y exporte el documento al procesador de textos que prefiera. Losdocumentos de múltiples páginas se procesan de principio a fin de una sola vez.Unos cuantos clics con el ratón equivalen a largas horas de trabajo, puesto queReadiris convierte sus documentos en papel en archivos digitales modificableshasta 40 veces más rápido que si volviese a teclearlos.

El asistente de OCR lo ayudará durante el proceso de reconocimiento:¡responda a unas simples preguntas para obtener rápidos resultados con Readiris!Podrá enviar directamente el resultado del reconocimiento a un procesador detextos o a una hoja de cálculo. Para reconocer un fax y convertir documentosPDF, basta con arrastrar el archivo desde el Explorador de Windows hasta laventana de la aplicación Readiris. O hacer clic sobre cualquier imagen con elbotón secundario del ratón para enviarla inmediatamente a Readiris.

Readiris reconoce datos tabulados y los reproduce como hojas de cálculo ocomo objetos de tabla en un procesador de textos; los datos numéricos están asílistos para ser procesados.

Basado en la tecnología Connectionist de I.R.I.S., Readiris representa lo me-jor que puede ofrecer el reconocimiento de caracteres. La extracción de carac-

foreword.pmd 3/04/2006, 15:343

Page 4: Read Iris

IV

terísticas independiente de las fuentes está complementada por técnicas deautoaprendizaje derivadas de una red neural patentada. El sistema puede apren-der nuevos caracteres mediante análisis del contexto: los conocimientos lingüísticossobre sílabas y palabras mejoran el rendimiento del reconocimiento.

Readiris reconoce hasta 126 idiomas: todos los idiomas americanos y europeos,incluyendo los idiomas centroeuropeos y bálticos, además de los alfabetos cirílico(“ruso”) y griego. (Opcionalmente, puede reconocer documentos escritos en árabey en cuatro idiomas asiáticos: el japonés, el chino simplificado, el chino tradicionaly el coreano.) Readiris puede procesar incluso alfabetos mixtos: el programadetecta las palabras “occidentales” que aparecen en documentos escritos engriego, cirílico, árabe o alguna lengua asiática, como muchos nombres propios,nombres de marcas, etc. que no se pueden transcribir y se escriben utilizando lossímbolos occidentales.

Readiris usa la lingüística durante la fase de reconocimiento, no después. Comoresultado de ello, Readiris reconoce documentos de todo tipo con máxima precisión,incluyendo documentos de baja calidad, faxes e impresiones con matriz de agujas.Procesa los documentos mal escaneados y copiados que contienen formas defuentes demasiado claras u demasiado oscuras. Los caracteres unidos entre sí(“ligaduras”) se resuelven y las formas fragmentadas, como los símbolos de lasmatrices de agujas, se vuelven a componer.

La ventana de verificación por parte del usuario no sólo destaca los caracte-res dudosos, sino que también aumenta la precisión del sistema. Todas las solu-ciones confirmadas por el usuario se almacenan en memoria, aumentando así lavelocidad y confianza a medida que trabaja. Usar Readiris significa hacerlo másinteligente cada vez! Esta potente herramienta de aprendizaje le permite enseñara Readiris para que reconozca caracteres especiales, como símbolos matemáti-cos y dingbats, e incluso procesar fuentes distorsionadas como las que se en-cuentran en los documentos de la vida real.

Para aumentar aún más su productividad, Readiris no sólo reconoce textos,sino que también puede darles formato. Si utiliza el “formato automático”, Readirisreproducirá una copia facsímil del documento escaneado, manteniendo el forma-to de las palabras, párrafos y páginas del documento original.

foreword.pmd 3/04/2006, 15:344

Page 5: Read Iris

V

MANUAL DEL USUARIO

Se utilizan tipos de letras similares, los tamaños y estilos usados en el documentooriginal se mantienen tras el reconocimiento. La colocación de columnas, bloquesde texto y gráficos imita la de los documentos originales. Y como Readiris escaneasin ningún problema imágenes en escala de grises o en color, puede capturarcualquier gráfico - ya sean dibujos, fotografías en blanco y negro o ilustracionesen color. Cuando el documento contiene tablas, Readiris las recoloca imitandoperfectamente las celdas y reproduciendo los bordes de las tablas originales.

En otras palabras, Readiris le permite archivar una copia fiel de sus documen-tos en forma de archivos digitales de texto que puede modificar en lugar de unaimagen escaneada. Existen varios niveles de formato, la elección la tiene el usua-rio.

También es posible leer los códigos de barras que aparezcan en las páginasescaneadas, así como cualquier tipo de texto escrito a mano - siempre que sehaya escrito utilizando letras “de palo seco” debidamente separadas entre ellas.

Readiris permite utilizar una amplia gama de escáneres: escáneres planos,escáneres con alimentador de hojas, periféricos multifuncionales (“MFP” - “mul-tifunctional peripheral”) y cámaras digitales. Readiris también cumple la normaTwain y, además, puede utilizarse en algunas plataformas de escaneado. Elescaneado a intervalos le permite escanear documentos de múltiples páginas demanera eficiente si su escáner no dispone de alimentador de documentos.

TTTTTABLAABLAABLAABLAABLA DEDEDEDEDE MAMAMAMAMATERIASTERIASTERIASTERIASTERIAS

¡Ahorre tiempo, no vuelva a teclear! ............................................................................. IIITabla de materias ........................................................................................................... VCréditos y derechos de autor ....................................................................................... VII

Capítulo 1: InstalaciónCapítulo 1: InstalaciónCapítulo 1: InstalaciónCapítulo 1: InstalaciónCapítulo 1: InstalaciónRequisitos del sistema ................................................................................................. 1-1Instalación del software de Readiris ............................................................................ 1-1Desinstalación del software de Readiris ...................................................................... 1-3Instalación de software opcional ................................................................................. 1-4Instalación de productos relacionados ........................................................................ 1-6

foreword.pmd 3/04/2006, 15:345

Page 6: Read Iris

VI

Archivos instalados ..................................................................................................... 1-8Archivo “Léame” y documentación ............................................................................................... 1-8Patrón de escritura ............................................................................................................................ 1-8

¡Regístrese! .................................................................................................................. 1-8Cómo obtener asistencia técnica ............................................................................... 1-10

Capítulo 2: Capítulo 2: Capítulo 2: Capítulo 2: Capítulo 2: VVVVVisita guiadaisita guiadaisita guiadaisita guiadaisita guiadaInicio del software ........................................................................................................ 2-1Primera ejecución ......................................................................................................... 2-2Descubrir el interfaz de Readiris ................................................................................... 2-2Primera lección introductoria ....................................................................................... 2-5Ampliación de imágenes ............................................................................................ 2-10Uno, descomponer una imagen escaneada ................................................................ 2-13Una y media, clasificación de ventanas ..................................................................... 2-16Dos, trazar ventanas manualmente ............................................................................ 2-19Tres, guardar modelos de ventanas ........................................................................... 2-23Readiris lo lleva por todo el mundo ............................................................................ 2-25Readiris cambia de idioma cuando es necesario ........................................................ 2-30Definir las características del documento ................................................................... 2-33Velocidad contra precisión ......................................................................................... 2-35¡Readiris se hace cada vez más inteligente! ............................................................... 2-37

Aprender ........................................................................................................................................... 2-39Descartar Aprendizaje ..................................................................................................................... 2-40Borrar ................................................................................................................................................ 2-41Deshacer ........................................................................................................................................... 2-41Terminar ........................................................................................................................................... 2-41Cancelar ............................................................................................................................................ 2-41

Papel de los diccionarios de fuentes .......................................................................... 2-41Envío de resultados a la aplicación de trabajo ........................................................... 2-44Guardar los resultados en un archivo de texto ........................................................... 2-48Creación de documentos portátiles ............................................................................ 2-51... o reconocimiento de dichos documentos ............................................................... 2-60Reconocimiento de varias páginas ............................................................................ 2-63Edición de documentos de múltiples páginas ............................................................ 2-73Abrir un nuevo documento ........................................................................................ 2-75Reconocimiento de zonas de texto ............................................................................. 2-76Organización del texto resultante ............................................................................... 2-77Configuración del escáner ......................................................................................... 2-79

foreword.pmd 3/04/2006, 15:346

Page 7: Read Iris

VII

MANUAL DEL USUARIO

Ponga colores en sus textos digitalizados! ................................................................ 2-81Aparatos distintos, resolución distinta ...................................................................... 2-84Guardar la configuración predeterminada .................................................................. 2-89Guardar propiedades específicas ............................................................................... 2-90Escanear documentos ................................................................................................ 2-91Ajuste de las imágenes escaneadas ........................................................................... 2-95Deje que el asistente trabaje por usted .................................................................... 2-100Readiris reproduce el diseño de sus documentos .................................................... 2-101Utilice columnas en lugar de cuadros ...................................................................... 2-106Formato de textos, 2ª parte ....................................................................................... 2-109Exportar el texto varias veces ................................................................................... 2-110Guardar gráficos por separado ................................................................................. 2-111Recrear columnas, cuadros, etc. de color ................................................................. 2-114Conservar los colores del texto ................................................................................ 2-116Lectura de faxes y reconocimiento diferido .............................................................. 2-118Reconocimiento de tablas ........................................................................................ 2-120Reconocimiento de textos escritos a mano .............................................................. 2-128Lectura de barras y espacios ................................................................................... 2-133Cómo obtener ayuda en línea ................................................................................... 2-136

CCCCCRÉDITRÉDITRÉDITRÉDITRÉDITOSOSOSOSOS YYYYY DERECHOSDERECHOSDERECHOSDERECHOSDERECHOS DEDEDEDEDE AUTAUTAUTAUTAUTOROROROROR

El programa Readiris ha sido diseñado y desarrollado por I.R.I.S. Lastecnologías de OCR, ICR, lectura de códigos de barras, Connectionist, AutoFormaty lingüística son propiedad de I.R.I.S. Asímismo, I.R.I.S. detenta los derechos deautor del software Readiris, de la tecnología de OCR, de la tecnología de ICR, dela tecnología de lectura de códigos de barras, de la tecnología lingüística, delsistema de ayuda en línea y del presente manual.

AutoFormat, Cardiris, Connectionist, el logotipo de I.R.I.S., Readiris y latecnología lingüística I.R.I.S. son marcas de I.R.I.S.

Analizador sintáctico XML desarrollado por Apache. Este producto incluyesoftware desarrollado por la Apache Software Foundation (www.apache.org).

foreword.pmd 3/04/2006, 15:347

Page 8: Read Iris

VIII

Acrobat y Reader son marcas (registradas) de Adobe. Excel, Windows yWord son marcas de Microsoft. Intel es una marca registrada de Intel.

foreword.pmd 3/04/2006, 15:348

Page 9: Read Iris

1 - 1

MANUAL DEL USUARIO

Capítulo 1INSTALACIÓN

Este capítulo describe los requisitos del sistema y la instalación del softwareReadiris.

RRRRREQUISITOSEQUISITOSEQUISITOSEQUISITOSEQUISITOS DELDELDELDELDEL SISTEMASISTEMASISTEMASISTEMASISTEMA

Ésta es la configuración mínima del sistema necesaria para utilizar Readiris:un procesador Intel 486 o compatible. Se recomienda un procesadorPentium.64 MB de RAM. Se recomiendan 128 MB para procesar imágenes enescala de grises o en color.120 MB de espacio en el disco duro. Bastarán 105 MB si deja losarchivos de muestra en el CD-ROM.sistema operativo Windows XP, Windows ME, Windows 2000, Win-dows 98 o Windows NT 4.0.

Puede que algunos controladores de escánercontroladores de escánercontroladores de escánercontroladores de escánercontroladores de escáner no funcionen con la(s)última(s) versión(es) de Windows. Consulte la documentación del escáner paraver qué plataformas pueden utilizarse.

IIIIINSTNSTNSTNSTNSTALACIÓNALACIÓNALACIÓNALACIÓNALACIÓN DELDELDELDELDEL SOFTWSOFTWSOFTWSOFTWSOFTWAREAREAREAREARE DEDEDEDEDE R R R R READIRISEADIRISEADIRISEADIRISEADIRIS

El programa Readiris se entrega exclusivamente en un CD-ROMCD-ROMCD-ROMCD-ROMCD-ROMautoejecutanteautoejecutanteautoejecutanteautoejecutanteautoejecutante. Para instalarlo, simplemente introduzca el CD-ROM en la unidadde CD-ROM y espere a que el programa de instalación comience a ejecutarse.Siga las instrucciones que aparecen en la pantalla.

chapter1.pmd 3/04/2006, 15:361

Page 10: Read Iris

1 - 2

Si la instalación no comienza a ejecutarse con el CD-ROM introducido en launidad de CD-ROM, ejecute el programa MENU.EXE para instalar el programa.

Los usuarios de Windows XP, Windows 2000 y Windows NT 4.0 debencomprobar que tienen los derechos de acceso derechos de acceso derechos de acceso derechos de acceso derechos de acceso adecuados. Si fuera necesario,deberán ponerse en contacto con el administrador del sistema.

El usuario puede escoger entre una instalación completa y una instalaciónpersonalizada. Asegúrese de instalar las bases de datos lingüísticas bases de datos lingüísticas bases de datos lingüísticas bases de datos lingüísticas bases de datos lingüísticas de todoslos idiomas con los que piensa trabajar. Por defecto, se instalan todas. Lerecomendamos que también instale las imágenes de muestra imágenes de muestra imágenes de muestra imágenes de muestra imágenes de muestra que se usan enlos tutoriales del presente manual.

De igual manera, el manual electrónico manual electrónico manual electrónico manual electrónico manual electrónico se copia por defecto en el discoduro, pero puede dejarlo en el CD-ROM. (Asegúrese de instalar Abobe Readerpara acceder a la documentación del programa Readiris en caso necesario.)

chapter1.pmd 3/04/2006, 15:362

Page 11: Read Iris

1 - 3

MANUAL DEL USUARIO

El programa de instalación crea automáticamente el submenú "AplicacionesI.R.I.S. - Readiris" en el menú "Programas".

Hará lo mismo creando un acceso directoacceso directoacceso directoacceso directoacceso directo a Readiris en el escritorio escritorio escritorio escritorio escritorio deWindows. Así podrá usted lanzar Readiris directamente desde su escritorio.

DDDDDESINSTESINSTESINSTESINSTESINSTALACIÓNALACIÓNALACIÓNALACIÓNALACIÓN DELDELDELDELDEL SOFTWSOFTWSOFTWSOFTWSOFTWAREAREAREAREARE DEDEDEDEDE R R R R READIRISEADIRISEADIRISEADIRISEADIRIS

Sólo hay una forma correcta de eliminar Readiris: utilizando el “asistente de(des)instalación” de Windows. Le recomendamos encarecidamente no desinstalarReadiris o sus módulos de software borrando manualmente los archivos deprograma.

Ejecute los siguientes pasos para utilizar el programa automático deprograma automático deprograma automático deprograma automático deprograma automático de(des)instalación de (des)instalación de (des)instalación de (des)instalación de (des)instalación de WWWWWindowsindowsindowsindowsindows.

Haga clic en "Configuración" en el menú "Inicio" de Windows y vaya al"Panel de Control".Haga clic en el "Agregar o Quitar Programas" situado en el panel decontrol.

chapter1.pmd 3/04/2006, 15:373

Page 12: Read Iris

1 - 4

Siga las instrucciones que aparecen en pantalla para eliminar el soft-ware de Readiris.

IIIIINSTNSTNSTNSTNSTALACIÓNALACIÓNALACIÓNALACIÓNALACIÓN DEDEDEDEDE SOFTWSOFTWSOFTWSOFTWSOFTWAREAREAREAREARE OPCIONALOPCIONALOPCIONALOPCIONALOPCIONAL

Existe un software opcional complementario a Readiris. Se trata del “MóduloMóduloMóduloMóduloMódulode OCR asiáticode OCR asiáticode OCR asiáticode OCR asiáticode OCR asiático”, que le permitirá reconocer documentos en japonés, chinosimplificado, tradicional y coreano.

chapter1.pmd 3/04/2006, 15:374

Page 13: Read Iris

1 - 5

MANUAL DEL USUARIO

Este software se suministra asimismo en un CD-ROM autoejecutable. Alinstalar esta opción, se habilitará la documentación específica en la que se explicacómo reconocer documentos escritos en lenguas asiáticas.

chapter1.pmd 3/04/2006, 15:375

Page 14: Read Iris

1 - 6

IIIIINSTNSTNSTNSTNSTALACIÓNALACIÓNALACIÓNALACIÓNALACIÓN DEDEDEDEDE PRODUCTPRODUCTPRODUCTPRODUCTPRODUCTOSOSOSOSOS RELACIONADOSRELACIONADOSRELACIONADOSRELACIONADOSRELACIONADOS

Según del paquete de software que haya adquirido, Readiris puede suministrarsecon una versión de evaluación del producto Cardiris, un organizador de tarjetasorganizador de tarjetasorganizador de tarjetasorganizador de tarjetasorganizador de tarjetasde visitade visitade visitade visitade visita.

Si su versión de Readiris contiene este programa gratuito, también se instalarámediante el programa autoejecutable del CD-ROM. Siga para ello las instruccionesque aparecen en pantalla.

Póngase en contacto con I.R.I.S. para obtener más información acerca deeste software; la opción "Contactar con I.R.I.S" del menú "Ayuda" de Readirisdescribe las formas en que puede ponerse en contacto con I.R.I.S.

chapter1.pmd 3/04/2006, 15:376

Page 15: Read Iris

1 - 7

MANUAL DEL USUARIO

Un icono del submenú "Aplicaciones I.R.I.S. - Readiris" del menú "Programas"lo conducirá directamente a la página webpágina webpágina webpágina webpágina web de I.R.I.S. También podrá accedera esta página desde la pantalla de inicio del programa, o seleccionando la opción"I.R.I.S. en Internet" del menú "Ayuda".

chapter1.pmd 3/04/2006, 15:377

Page 16: Read Iris

1 - 8

AAAAARCHIVOSRCHIVOSRCHIVOSRCHIVOSRCHIVOS INSTINSTINSTINSTINSTALADOSALADOSALADOSALADOSALADOS

El programa de instalación crea una carpeta en la que se localizan los archivosde Readiris. Nunca intente desinstalar Readiris o alguno de sus módulos borrandomanualmente los archivos de programa, utilice el programa automático de(des)instalación de Windows. Véase más arriba.

Archivo “Léame” y documentaciónArchivo “Léame” y documentaciónArchivo “Léame” y documentaciónArchivo “Léame” y documentaciónArchivo “Léame” y documentaciónREADME.HTM Archivo “Léame” (en formato HTML)MANUAL.PDF Manual del usuario (en formato Adobe Acrobat)

Patrón de escrituraPatrón de escrituraPatrón de escrituraPatrón de escrituraPatrón de escrituraTEMPLATE.PDF Patrón de escritura en blanco para reimprimir

(en formato Adobe Acrobat)TEMPLATE.DOC Patrón de escritura en blanco para editar

(en formato Word)

¡R¡R¡R¡R¡REGÍSTRESEEGÍSTRESEEGÍSTRESEEGÍSTRESEEGÍSTRESE!!!!!

No olvide de registrar su licencia Readiris. Si lo hace lo mantendremosinformado sobre futuros productos y productos conexos de I.R.I.S. Las ventajasde registrarse, como la asistencia asistencia asistencia asistencia asistencia gratuita y las ofertas especialesofertas especialesofertas especialesofertas especialesofertas especiales, estánreservadas estrictamente a los usuarios registrados.

Puede registrarse de muchas formas: enviándonos por correo el formulario deregistro, o por fax el formulario electrónico, llamando a I.R.I.S. en horas de oficina,o bien completando el formulario de registro en la página web de I.R.I.S.

chapter1.pmd 3/04/2006, 15:378

Page 17: Read Iris

1 - 9

MANUAL DEL USUARIO

El asistente de registro asistente de registro asistente de registro asistente de registro asistente de registro de Readiris, que encontrará en el menú "Registrar"del programa Readiris, lo guiará cómodamente durante todo el proceso.

chapter1.pmd 3/04/2006, 15:379

Page 18: Read Iris

1 - 10

Dependiendo de la versión adquirida, recibirá la clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso necesariopara continuar utilizando el programa Readiris después de un mes de demostración.

CCCCCÓMOÓMOÓMOÓMOÓMO OBTENEROBTENEROBTENEROBTENEROBTENER ASISTENCIAASISTENCIAASISTENCIAASISTENCIAASISTENCIA TÉCNICATÉCNICATÉCNICATÉCNICATÉCNICA

La opción "Asistencia Técnica" del menú "Ayuda" de Readiris explica cómoobtener asistencia técnica. Describa claramente lo que le sucede e incluya todala información pertinente sobre Readiris, su escáner y su sistema informático.

chapter1.pmd 3/04/2006, 15:3710

Page 19: Read Iris

1 - 11

MANUAL DEL USUARIO

Antes de solicitar asistencia técnica, le recomendamos que compruebe si hayactualizaciones de actualizaciones de actualizaciones de actualizaciones de actualizaciones de software software software software software disponibles para ser descargadas. Utilice laopción "Buscar Actualizaciones" del menú "Ayuda" para hacerlo.

chapter1.pmd 3/04/2006, 15:3711

Page 20: Read Iris

1 - 12

chapter1.pmd 3/04/2006, 15:3712

Page 21: Read Iris

2 - 1

MANUAL DEL USUARIO

Capítulo 2VISITA GUIADA

Readiris es un paquete con la tecnología OCR de punta provisto de numerosascaracterísticas avanzadas. En este capítulo describiremos todas sus principalescaracterísticas y añadiremos consejos sobre el uso de Readiris.

IIIIINICIONICIONICIONICIONICIO DELDELDELDELDEL SOFTWSOFTWSOFTWSOFTWSOFTWAREAREAREAREARE

Haga clic en el submenú "Aplicaciones I.R.I.S. - Readiris", o en el accesodirecto a la aplicación Readiris situada en su escritorio.

Se visualizarán la pantalla de inicio y la ventana de la aplicación Readiris. Lapantalla de inicio muestra la versión y los derechos de autor del programa Readiris.Le permite también un acceso directo a la portada webportada webportada webportada webportada web de I.R.I.S. - haga clicen la dirección URL para acceder a la página. Esta pantalla desaparecerá haciendoclic en cualquier otra zona.

La siguiente ventana se refiere al asistente de OCR. Haga clic en "Cancelar".

chapter2.pmd 3/04/2006, 15:381

Page 22: Read Iris

2 - 2

PPPPPRIMERARIMERARIMERARIMERARIMERA EJECUCIÓNEJECUCIÓNEJECUCIÓNEJECUCIÓNEJECUCIÓN

Dependiendo del paquete de software que haya adquirido, la primera ejecuciónpuede ser especial, pues se le pedirá que registre su licencia.

En tal caso, la utilización de Readiris está limitada a un mes y, al registrarse,recibirá de I.R.I.S. una clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso gratuita para continuar utilizando elsoftware transcurrido dicho plazo.

Necesitará su número de identificación número de identificación número de identificación número de identificación número de identificación para generar la clave de acceso;asegúrese de disponer de dicho número o de mencionarlo al registrar su licencia.

DDDDDESCUBRIRESCUBRIRESCUBRIRESCUBRIRESCUBRIR ELELELELEL INTERFINTERFINTERFINTERFINTERFAZAZAZAZAZ DEDEDEDEDE R R R R READIRISEADIRISEADIRISEADIRISEADIRIS

La ventana de aplicación de Readiris no sólo contiene menús de opcionesmenús de opcionesmenús de opcionesmenús de opcionesmenús de opciones,sino también dos barras de botones que permiten acceder rápidamente a todaslas opciones frecuentes. Al principio, algunos menús están difuminados, pues serefieren a la vista preliminar. Mientras no se abra una imagen, no se puede dis-poner de ellos.

chapter2.pmd 3/04/2006, 15:382

Page 23: Read Iris

2 - 3

MANUAL DEL USUARIO

Otro tanto sucede con la barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen situada a laderecha de la ventana de aplicación: contiene todas las opciones que necesitadurante la vista preliminar de la imagen. La barra principal de herramientasbarra principal de herramientasbarra principal de herramientasbarra principal de herramientasbarra principal de herramientassituada a la izquierda permite acceder rápidamente a todas las opciones gen-erales usadas con frecuencia.

chapter2.pmd 3/04/2006, 15:393

Page 24: Read Iris

2 - 4

Para saber la opción que corresponde a cada botón, coloque el cursor delratón sobre este último durante un momento: una etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente le dirá loque hace el botón.

La parte interior de la ventana o zona de imagen zona de imagen zona de imagen zona de imagen zona de imagen es donde se muestran lasimágenes escaneadas. Puede arrastrar los archivos gráficos hacia la zona deimágenes (o hacia el icono de Readiris) para reconocerlos.

Cuando se procesan páginas, en la parte izquierda aparecerá una nueva barrade herramientas, denominada barra de herramientas de páginabarra de herramientas de páginabarra de herramientas de páginabarra de herramientas de páginabarra de herramientas de página. En estabarra se representan las distintas páginas del documento y permite el acceso alas funciones de página haciendo clic con el botón secundario del ratón. (Se abreel menú "Contexto".)

chapter2.pmd 3/04/2006, 15:394

Page 25: Read Iris

2 - 5

MANUAL DEL USUARIO

A continuación, aparece el panel de documentos panel de documentos panel de documentos panel de documentos panel de documentos debajo de la imagenescaneada. En él podrá encontrar estadísticas estadísticas estadísticas estadísticas estadísticas e información acerca de todaslas páginas escaneadas - la imagen original y su resolución, el tiempo empleadoen los procesos de escaneado y reconocimiento, etc. (El panel de documentostambién incluye mensajes emergentes...)

PPPPPRIMERARIMERARIMERARIMERARIMERA LECCIÓNLECCIÓNLECCIÓNLECCIÓNLECCIÓN INTRODUCTORIAINTRODUCTORIAINTRODUCTORIAINTRODUCTORIAINTRODUCTORIA

La mejor manera de familiarizarse con el manejo de Readiris es sin dudautilizándolo. El programa contiene una serie de imágenes ya escaneadas imágenes ya escaneadas imágenes ya escaneadas imágenes ya escaneadas imágenes ya escaneadas que

chapter2.pmd 3/04/2006, 15:395

Page 26: Read Iris

2 - 6

le permitirán comenzar incluso si no tiene un escáner conectado a su ordenador.Pasemos a estas imágenes.

El botón "Fuente" de la barra principal de herramientas determina si va autilizar un escáner o una imagen ya escaneada como origen de la imagen.

Readiris reconoce igualmente imágenes en color, en escala de grises y enblanco y negro. Readiris le permite abrir documentos PDF de Adobe Acrobat yarchivos de imagen en los formatos fax DCX (una versión multipágina del formatoPaintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (nocomprimidas o con compresión LZW, PackBits, Grupo 3, Grupo 4 o JPEG), TIFFde múltiples páginas, mapas de bits de Windows (*.bmp) y ZSoft Paintbrush(*.pcx).

Esta función resulta especialmente útil para convertir sus faxes faxes faxes faxes faxes en archivosdigitales de texto.

Cuando vaya a abrir una imagen ya escaneada, con el botón "Fuente" de labarra principal de herramientas seleccione el disco y no el escáner como origende la imagen.

A continuación haga clic en el botón "Abrir". (Cuando selecciona el discocomo origen de la imagen, al botón "Escanear" lo sustituye el botón "Abrir".Asimismo, el mando "Escanear" del menú "Acción" la sustituye el mando "Abrir".)

chapter2.pmd 3/04/2006, 15:396

Page 27: Read Iris

2 - 7

MANUAL DEL USUARIO

A continuación haga clic en el botón "Abrir" del menú "Archivo" y abre unaimagen escaneada previamente - esto es posible incluso si su escáner funcionacomo origen actual de la imagen.

Se le pedirá que elija un archivo gráfico. Seleccione el archivo SPANISH.JPGde la carpeta "Samples", una subcarpeta de la carpeta donde está instalado Readiris.(¡Todas las imágenes de muestra se encuentran en esta carpeta!) Como se tratade una imagen en color, además de leerla directamente desde el disco, se creauna versión “binaria”, en blanco y negro, para el proceso de OCR.

Finalmente, la imagen se visualiza en la zona de imágenes, y la barra deherramientas de página y el panel de documentos indican que se ha cargado unapágina en Readiris.

chapter2.pmd 3/04/2006, 15:397

Page 28: Read Iris

2 - 8

Una tercera forma de abrir imágenes ya escaneadas es el “arrastre con elarrastre con elarrastre con elarrastre con elarrastre con elratónratónratónratónratón”: arrastre imágenes desde el Explorador de Windows hacia la zona deimagen de Readiris o hacia el icono de Readiris y se abrirán inmediatamente.

chapter2.pmd 3/04/2006, 15:398

Page 29: Read Iris

2 - 9

MANUAL DEL USUARIO

Por último, podrá abrir imágenes directamente desde el Explorador de Win-dows haciendo clic con el botón derecho haciendo clic con el botón derecho haciendo clic con el botón derecho haciendo clic con el botón derecho haciendo clic con el botón derecho del ratón en un archivo gráfico yseleccionando el mando "Reconocer" del menú "Contexto". (Esto mando sóloestará disponible si el archivo en cuestión pertenece a alguno de los reconocidospor el programa.)

chapter2.pmd 3/04/2006, 15:399

Page 30: Read Iris

2 - 10

Esto no significa que el OCR se efectúe inmediatamente. Con el fin deproporcionar al usuario la máxima flexibilidad de uso, únicamente se ejecuta laaplicación Readiris y se abre la imagen.

La barra de herramientas de imagen situada a la derecha de la ventana deaplicación de Readiris contiene todas las opciones que necesita durante la vistapreliminar de la imagen: herramientas para indicar las zonas de interés, para girarla imagen, para ampliarla o reducirla, etc.

AAAAAMPLIACIÓNMPLIACIÓNMPLIACIÓNMPLIACIÓNMPLIACIÓN DEDEDEDEDE IMÁGENESIMÁGENESIMÁGENESIMÁGENESIMÁGENES

Readiris cuenta con varias opciones que le permiten ampliar ampliar ampliar ampliar ampliar la imagenescaneada, por ejemplo, para verificar la calidad de escaneado.

La barra de herramientas de imagen contiene botones que le permiten ampliara tamaño real, ajustar la imagen al ancho de página y ajustar toda la imagen en la

chapter2.pmd 3/04/2006, 15:3910

Page 31: Read Iris

2 - 11

MANUAL DEL USUARIO

ventana de vista preliminar. El menú "Ver" contiene las mismas opciones y añadedos niveles adicionales de ampliación: puede mostrar la imagen al 50% y al 200%de su tamaño real. En tamaño real, un pixel de pantalla corresponde a un pixel dela imagen. (Hay métodos abreviados de teclado para todos los niveles de zoom.)

Observe también que dispone de un aceso a los niveles de ampliación graciasal clic derecho. Haga clic con el botón derecho del ratón para que aparezca elmenu contextual y seleccione el nivel de ampliación adecuado.

chapter2.pmd 3/04/2006, 15:3911

Page 32: Read Iris

2 - 12

Además, puede hacer doble clic con el botón derecho del ratón en una zonade la imagen escaneada para ampliarla inmediatamente a tamaño real. Repita laoperación para volver a disminuirla.

Por último, puede utilizar la lupa lupa lupa lupa lupa para ampliar detalles del documentoescaneado. La lupa de aumento también está disponible en el menú contextual alhacer clic sobre la imagen con el botón derecho del ratón.

Pulse Escape o haga clic con el ratón para que vuelva a desaparecer la lupa.

chapter2.pmd 3/04/2006, 15:3912

Page 33: Read Iris

2 - 13

MANUAL DEL USUARIO

UUUUUNONONONONO, , , , , DESCOMPONERDESCOMPONERDESCOMPONERDESCOMPONERDESCOMPONER UNAUNAUNAUNAUNA IMAGENIMAGENIMAGENIMAGENIMAGEN ESCANEADAESCANEADAESCANEADAESCANEADAESCANEADA

Una vez escaneada la imagen debe indicar las partes que desea convertir entexto modificable trazando marcos, denominados “ventanas”, alrededor de laszonas de interés.

De hecho, Readiris lo hará automáticamente si activa la opción "Análisis dePágina" desde el botón "Opciones" de la barra de herramientas principal (o desdeel menú "Configuración").

La descomposición automática de páginas resulta especialmente útil parareconocer textos con columnas textos con columnas textos con columnas textos con columnas textos con columnas y documentos con un diseño de página complejo(incluirán posiblemente gráficos y tablas).

chapter2.pmd 3/04/2006, 15:3913

Page 34: Read Iris

2 - 14

La división de página se realiza mediante tres tipos de ventanastipos de ventanastipos de ventanastipos de ventanastipos de ventanas: ventanasde texto, de gráficos y de tablas. Readiris separa en cada página bloques detexto, zonas de tablas y zonas de gráficos (fotografías, ilustraciones, etc.). (Lamanera de reconocer tablas y guardar gráficos se tratará ampliamente másadelante.)

chapter2.pmd 3/04/2006, 15:3914

Page 35: Read Iris

2 - 15

MANUAL DEL USUARIO

Hay dos otros tipos más de zona que siempre deben definirse manualmente:las zonas de códigos de barras y las zonas de texto manuscrito. (La lectura decódigos de barras y el reconocimiento de “letras de palo seco” escritas a mano seexplican detalladamente en otra sección de este manual.)

Un código de colorcódigo de colorcódigo de colorcódigo de colorcódigo de color indica el tipo de ventana de que se trata: las zonas detexto tienen un borde amarillo, las ventanas gráficas tienen un borde azul y las detablas, un borde morado. Las zonas de código de barras son verdes, mientras quelas manuscritas son azules.

El número de ventanas se indica en todo momento en las etiquetas emergentesde las herramientas de ventanas.

El análisis de página es rápido, sumamente preciso y tolera distorsiones: trazaformas complejas e “irregulares”.

El análisis de página detectará incluso aquellas zonas en que hay texto blancotexto blancotexto blancotexto blancotexto blancosobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. El reconocimiento de dichos trozos no plantea problemaalguno: la vista preliminar muestra el documento escaneado de forma correcta enla pantalla, pero Readiris “invierte” la imagen cuando es necesario para reconocerdichos bloques de texto. (Gracias al escáner, podrá generar imágenes totalmenteinvertidas de páginas que contengan texto blanco sobre fondo negro. Ver másadelante.)

chapter2.pmd 3/04/2006, 15:3915

Page 36: Read Iris

2 - 16

UUUUUNANANANANA YYYYY MEDIAMEDIAMEDIAMEDIAMEDIA, , , , , CLASIFICACIÓNCLASIFICACIÓNCLASIFICACIÓNCLASIFICACIÓNCLASIFICACIÓN DEDEDEDEDE VENTVENTVENTVENTVENTANASANASANASANASANAS

Readiris no sólo detecta los diferentes tipos de bloques, sino que también losclasifica: esta clasificación se realiza por defecto de arriba a abajo y de derechaa izquierda, con objeto de poder trabajar con documentos que contengan columnas.Los números indican la clase de orden.

Evidentemente, puede usted modificar el orden de clasificaciónorden de clasificaciónorden de clasificaciónorden de clasificaciónorden de clasificación. Para ello,haga clic en el botón "Ordenar" de la barra de herramientas de imagen. El cursorse convierte en una manecilla en cuanto se activa el “modo de clasificación”.

Haga clic en las ventanas que desee incluir. Las ventanas en las que no hagaclic no serán clasificadas, quedando excluidas del reconocimiento. Es muy fácilsaber qué zonas han sido seleccionadas y cuáles no: las ventanas seleccionadasse visualizan con todo su color, mientras que las no lo han sido presentan unostonos más claros y no tienen ningún número.

chapter2.pmd 3/04/2006, 15:3916

Page 37: Read Iris

2 - 17

MANUAL DEL USUARIO

Por defecto, el análisis de página está activado. Para obligar a Readiris adescomponer la página actual - debido a que desactivó el análisis de páginaaccidentalmente o borró algunas ventanas por error y desea volver a efectuar elanálisis de página - simplemente haga clic en el botón "Analizar Página" de labarra de herramientas de imagen.

chapter2.pmd 3/04/2006, 15:3917

Page 38: Read Iris

2 - 18

Seleccione el idioma del documento antes de ejecutar el análisis de páginasiempre que vaya a reconocer documentos escritos en un idioma asiático. Paraestos idiomas se utilizan rutinas específicas, dado que, por una parte, el espacioentre líneas de los documentos escritos en lenguas asiáticas es, por regla general,mayor que el de los documentos escritos en lenguas occidentales. Además, eltexto está formado por pequeños iconos denominados “ideogramas” que podríanser fácilmente confundidos con zonas gráficas en los documentos occidentales.Y, por último, es posible que el texto vaya de arriba a abajo y de derecha aizquierda. Si ha olvidado seleccionar el idioma adecuado, seleccionel después:Readiris volverá a ejecutar el análisis de página automáticamente.

Algunos documentos presentan pequeñas manchas sobre la página, puedengenerar un borde negro alrededor de la imagen real, etc. Para eliminar todas laspequeñas ventanas - suponiendo que no contienen texto - haga clic en el mando"Suprimir Pequeñas Ventanas" bajo el menú "Edición".

Otra rutina parecida es automática: la detección de zonas en los márgenes delas páginas. Cuando se desactiva esta rutina en el menú "Configuración", el análisisde página ignora cualquier zona que esté muy cerca de los márgenes. Si el escánergenera márgenes negros alrededor de la imagen, el análisis de página tiende aencontrar zonas en lugares en los que en realidad sólo hay “ruido” Las zonas degráficos que pueda haber en los márgenes no se tocan: las fotos a menudo se

chapter2.pmd 3/04/2006, 15:4018

Page 39: Read Iris

2 - 19

MANUAL DEL USUARIO

tocan con los márgenes, los gráficos de fondo en muchos casos ocupan toda lapágina, etc.

DDDDDOSOSOSOSOS, , , , , TRAZARTRAZARTRAZARTRAZARTRAZAR VENTVENTVENTVENTVENTANASANASANASANASANAS MANUALMENTEMANUALMENTEMANUALMENTEMANUALMENTEMANUALMENTE

El análisis de página es la forma automática de trazar ventanas en una páginaescaneada. También puede dividir manualmente una imagen con las herramientasherramientasherramientasherramientasherramientasde trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de Readiris.

chapter2.pmd 3/04/2006, 15:4019

Page 40: Read Iris

2 - 20

(Tal como se comenta en un apartado anterior, el usuario siempre debe trazarmanualmente las ventanas de código de barras y de texto manuscrito, ¡ya que elanálisis de página no las detecta automáticamente!)

Para trazar trazar trazar trazar trazar un rectángulo alrededor de una zona concreta, seleccione laherramienta correspondiente en la barra de herramientas de imagen y arrastre elcursor desde el extremo superior izquierdo hasta el extremo inferior derecho dela ventana. (No se permiten lados inferiores a 1 mm., pues no podrían contener niun solo carácter...)

En caso de haber seleccionado el tipo de zona erróneo, no se preocupe: podrácambiarlo rápidamente haciendo clic con el botón derecho del ratón sobre unaventana y seleccionando el mando "Ventana - Tipo" desde el menú contextual.

Las ventanas se clasifican automáticamente siguiendo el orden de su creación:el orden de clasificación se indica mediante números.

También puede enmarcar bloques “irregulares” de texto trazando ventanasventanasventanasventanasventanaspoligonales poligonales poligonales poligonales poligonales alrededor de ellos. Las ventanas no rectangulares se creanfusionando zonas rectangulares: tan pronto como dos rectángulos (del mismo

chapter2.pmd 3/04/2006, 15:4020

Page 41: Read Iris

2 - 21

MANUAL DEL USUARIO

tipo) se intersectan, se convierten automáticamente en una sola ventana. Decierta forma, es como construir una casa añadiendo una habitación tras otra...(Crear ventanas de tablas poligonales y de códigos de barras carece de sentido.)

Además, puede combinarse el trazado manual de ventanas con la clasificaciónde éstas: puede trazar nuevas ventanas incluso cuando esté activado el “modo declasificación”. Así, puede realizar una clasificación automática para incluir lasventanas detectadas y después crear otras ventanas manualmente allí donde elanálisis de página no ha ofrecido los resultados esperados. ¡En cuanto comienceel trazado manual de ventanas, con el “modo de clasificación” activado, se borrarántodas las ventanas que no haya seleccionado!

Para modificar, mover y eliminar ventanas, primero debe seleccionarlas.seleccionarlas.seleccionarlas.seleccionarlas.seleccionarlas.Para ello, seleccione la herramienta "Selección de Ventana" (la “flecha”) en labarra de herramientas de imagen y haga clic en el interior de la ventana. Apareceránunas marcas rectangulares en cada esquina y en el centro de los lados de laventana.

chapter2.pmd 3/04/2006, 15:4021

Page 42: Read Iris

2 - 22

Para deseleccionar deseleccionar deseleccionar deseleccionar deseleccionar ventanas, pulse el botón del ratón en cualquier otrolugar. Para seleccionar ventanas adicionalesventanas adicionalesventanas adicionalesventanas adicionalesventanas adicionales, mantenga pulsada la tecla Mayúsmientras hace clic en dichas ventanas. Para seleccionar una ventana y las ventanasventanasventanasventanasventanasincluidas incluidas incluidas incluidas incluidas (de otro tipo), mantenga pulsada la tecla Ctrl y haga clic en la ventanaprincipal.

Hasta aquí la selección de ventanas. Para modificar modificar modificar modificar modificar una ventana de texto,selecciónela, coloque el cursor del ratón sobre una marca y arrastre el lado paracambiar el tamaño de la ventana.

Para mover mover mover mover mover una ventana, simplemente selecciónela y arrástrela al lugardeseado.

Para eliminar eliminar eliminar eliminar eliminar ventanas, seleccione la(s) ventana(s) y elija el mando "Suprimir"del menú contextual. Dicha función borra la(s) ventana(s) seleccionada(s) y laque se encuentre bajo el cursor del ratón. Al pegar ventanas, éstas se insertan ensu posición original y debe arrastrarlas al lugar deseado.

De igual modo, puede seleccionar zonas y optar los mandos "Cortar" o "Borrar"del menú "Edición". El mando "Cortar" corta la(s) ventana(s) y la(s) envía a unamemoria temporal interna; la función "Borrar" borra irreversiblemente la(s)ventana(s). Al pegar ventanas, éstas se insertan en su posición original y debearrastrarlas al lugar deseado.

chapter2.pmd 3/04/2006, 15:4022

Page 43: Read Iris

2 - 23

MANUAL DEL USUARIO

De hecho, todos los mandos del menú "Edición" se aplican a las ventanas:puede eliminarlas, cortarlas, copiarlas y pegarlas. También puede utilizar la opción"Deshacer": si por error ha eliminado, movido, cambiado de tamaño, etc. algunasventanas, "Deshacer" anulará la última operación.

Existen macros para todas las opciones. He aquí un ejemplo: para borrar todaslas ventanas presentes, puede elegir la opción "Seleccionar Todo" del menú"Edición" o la macro equivalente Ctrl+A y hacer clic en el mando "Borrar" delmenú "Edición" o su macro Supr. Ahora ya está listo para reproducir el diseñonecesario. Para restaurar el diseño anterior, elija "Deshacer" o su macro Ctrl+Z.

TTTTTRESRESRESRESRES, , , , , GUARDARGUARDARGUARDARGUARDARGUARDAR MODELOSMODELOSMODELOSMODELOSMODELOS DEDEDEDEDE VENTVENTVENTVENTVENTANASANASANASANASANAS

Los diseños de ventanas resultantes pueden guardarse en forma de modelosmodelosmodelosmodelosmodelosde zonas de zonas de zonas de zonas de zonas para futuro uso, con la opción "Guardar el Formato" del menú "Archivo"y cargarlos en memoria con la opción "Cargar el Formato".

Si desea reconocer documentos con un diseño similar, por ejemplo, un informede 50 páginas en la que el encabezado y el pie de página deben excluirse porrazones obvias, se puede aplicar un modelo único para dividir en zonas las 50páginas.

chapter2.pmd 3/04/2006, 15:4023

Page 44: Read Iris

2 - 24

Al cargar una plantilla en la memoria se desactiva automáticamente el análisisde página. La división en zonas del modelo se mantiene activa hasta que vuelva aactivar el análisis de página en la barra principal de herramientas. Cuando cargueun formato en la memoria, puede activar la opción "Aplicar Formato a Todas lasPáginas" para aplicarlo inmediatamente a todas las páginas del documento.

De hecho, existe una eficaz alternativa para establecer las plantillas dedeterminación de zona. La herramienta de vista preliminar "Ignorar la Zona Ex-terior" limita la descomposición de la página a la sección “cortada” de la imagen.

Seleccione esta herramienta y encuadre la sección de la imagen que quiereprocesar. Cuando está trabajando con un documento de múltiples páginas, puedeeliminar la misma zona exterior mediante un análisis de página de cada página.(Vuelva a realizar el análisis de página para cancelar el “corte” de la imagen ocambie las zonas manualmente.)

chapter2.pmd 3/04/2006, 15:4024

Page 45: Read Iris

2 - 25

MANUAL DEL USUARIO

RRRRREADIRISEADIRISEADIRISEADIRISEADIRIS LOLOLOLOLO LLEVLLEVLLEVLLEVLLEVAAAAA PORPORPORPORPOR TTTTTODOODOODOODOODO ELELELELEL MUNDOMUNDOMUNDOMUNDOMUNDO

Suponiendo que las ventanas estén correctamente definidas, ahora ya casiestá listo para ejecutar el reconocimiento de caracteres. Decimos “casi” porqueaún no hemos verificado el idioma y las propiedades del documento.

chapter2.pmd 3/04/2006, 15:4025

Page 46: Read Iris

2 - 26

Las propiedades de idioma se encuentran en la barra principal de herramientas.

Haga clic en el botón "Idioma" para modificar el idioma del documento.

chapter2.pmd 3/04/2006, 15:4026

Page 47: Read Iris

2 - 27

MANUAL DEL USUARIO

(Esta opción también permite acceder a los modos de reconocimiento - rápidoy preciso. Hablaremos más de ellos más adelante...)

Para pasar directamente a un idioma pulse la letra inicial de éste: si estáseleccionado el español y desea localizar el danés, pulse la letra "D" para irdirectamente hasta él. Si varios idiomas tienen la misma inicial, pulse la letravarias veces para recorrer las opciones. Por ejemplo, Readiris lee waray y wolof.Si pulsa "W" una vez, seleccionará el waray, si vuelve a pulsar "W" seleccionaráel wolof, y pulsando "W" una tercera vez volverá al waray. (Para ir a otra letra,por ejemplo la "T", pulse primero la tecla Retroceso.)

Readiris no se limita ni con mucho al español: ¡se pueden utilizar hasta 126idiomasidiomasidiomasidiomasidiomas! Se pueden utilizar todos los idiomas americanos y europeos, incluyendolos idiomas centroeuropeos, cirílicos (“rusos”), bálticos, el griego y el turco.

Opcionalmente, puede reconocer documentos escritos en lenguas asiáticaslenguas asiáticaslenguas asiáticaslenguas asiáticaslenguas asiáticas.El software opcional “Módulo de OCR asiático” permite el reconocimiento deljaponés, el chino simplificado, el chino tradicional y el coreano. (El chinosimplificado se habla en la República Popular de la China y en Singapur, mientrasque el chino tradicional se utiliza en Hong Kong, Taiwan, Macao y entre lascomunidades chinas de ultramar.)

Cabe señalar que también se distingue entre las variedades británica ynorteamericana - ¿o deberíamos decir “internacional”? - de la lengua inglesa, asícomo entre el español de España y el de Méjico, entre otros.

Se requiere la configuración adecuada de Windows para mostrar en pantallacaracteres de idiomas “exóticos”, como los basados en el alfabeto cirílico, losidiomas asiáticos, el griego, el turco, etc. Quizá deba instalar el componente desoporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de WWWWWindowsindowsindowsindowsindows para que su sistema operativo puedaprocesar dichos idiomas.

En un sistema operativo Windows XP, 2000 y Windows NT 4.0, seleccione elicono "Opciones Regionales (y Idiomas)" en el menú "Panel de Control".

chapter2.pmd 3/04/2006, 15:4027

Page 48: Read Iris

2 - 28

En un sistema operativo Windows ME y 98, seleccione el icono "Agregar oQuitar Programas" de "Panel de Control" para ver si el módulo "CompatibilidadMultilingüe" está instalado.

chapter2.pmd 3/04/2006, 15:4028

Page 49: Read Iris

2 - 29

MANUAL DEL USUARIO

Para visualizar y editar documentos en lenguas asiáticas, deberá instalar unaversión asiática del sistema operativo Windows o utilizar Word 2003, Word 2002o Word 2000 para visualizar y editar este tipo de documentos, dado que los paquetesOffice 2003, Office XP y Office 2000 fueron específicamente diseñados paratrabajar con documentos en muy diversos idiomas.

Nada de esto es necesario para ver documentos en formato PDFdocumentos en formato PDFdocumentos en formato PDFdocumentos en formato PDFdocumentos en formato PDF: AdobeAcrobat y Adobe Reader se actualizan automáticamente cuando deben leersedocumentos escritos en idiomas “exóticos” - ruso, japonés, etc.

chapter2.pmd 3/04/2006, 15:4029

Page 50: Read Iris

2 - 30

Consulte el archivo “Léame”archivo “Léame”archivo “Léame”archivo “Léame”archivo “Léame” de Readiris para obtener más informaciónsobre este tema.

La selección del idioma adecuado para el documento es imperativa. En funciónde la selección del idioma, el programa sabe qué juegos de símbolos juegos de símbolos juegos de símbolos juegos de símbolos juegos de símbolos debereconocer. El soporte multilingüe garantiza un reconocimiento correcto decaracteres “exóticos” como ç, ß, γ y ø.

Asimismo, el programa hace un extenso uso de bases de datos lingüísticasbases de datos lingüísticasbases de datos lingüísticasbases de datos lingüísticasbases de datos lingüísticaspara convalidar sus resultados. Supongamos que se debe leer la palabra "presi-dente" y una mancha de tinta hace que la "r" parezca una "f". Al buscar en elléxico español, Readiris detectará de forma autónoma que está leyendo la palabra"presidente" y que no tiene sentido reconocer el símbolo "f". Por supuesto, estatécnica de técnica de técnica de técnica de técnica de “autoaprendizajeautoaprendizajeautoaprendizajeautoaprendizajeautoaprendizaje” depende en gran medida del contexto lingüístico.

A menudo, la lingüística resulta muy útil para resolver casos ambiguoscasos ambiguoscasos ambiguoscasos ambiguoscasos ambiguos, comouna "O" que puede confundirse erróneamente por un '0'. Otro ejemplo es la letra"l" y el número '1' que tienen una forma idéntica en muchas fuentes; piense porejemplo en los textos escritos con antiguas máquinas de escribir. El contextolingüístico ayuda a determinar si se trata de una "l" o de un '1'.

La ilustración a continuación muestra varias formas de '1' y "l". Las formas dela primera línea carecen de ambigüedad, las formas de la segunda son ambiguas,pero la lingüística permite resolverlas. Si no basta con el contexto, el usuario debeintervenir.

RRRRREADIRISEADIRISEADIRISEADIRISEADIRIS CAMBIACAMBIACAMBIACAMBIACAMBIA DEDEDEDEDE IDIOMAIDIOMAIDIOMAIDIOMAIDIOMA CUANDOCUANDOCUANDOCUANDOCUANDO ESESESESES NECESARIONECESARIONECESARIONECESARIONECESARIO

Pero eso no es todo: Readiris puede cambiar de idioma a media frase sinintervención del usuario. Cuando aparecen palabras occidentales en documentosescritos utilizando caracteres griegos, cirílicos o asiáticos - muchos nombres propios

chapter2.pmd 3/04/2006, 15:4030

Page 51: Read Iris

2 - 31

MANUAL DEL USUARIO

no modificables, nombres de marcas, etc. se escriben respetando su grafía latina-, Readiris puede adaptarse automáticamente al alfabeto apropiado. O sea, esposible activar simultáneamente un alfabeto mixtoalfabeto mixtoalfabeto mixtoalfabeto mixtoalfabeto mixto de caracteres griegos, cirílicoso asiáticos y latinos.

Asegúrese de seleccionar "Griego-Inglés" o la propiedad adecuada de cirílico- por ejemplo "Bielorruso-Inglés". En otras palabras, si selecciona únicamente"Griego" o "Bielorruso" como idioma del documento, ¡no espere que salgan bienlos caracteres latinos!

He aquí un ejemplo en el que un texto en ruso contiene algunas palabrasinglesas: abra el archivo de imagen ALPHABETS.TIF y reconozca la páginacorrespondiente si desea verlo usted mismo.

chapter2.pmd 3/04/2006, 15:4031

Page 52: Read Iris

2 - 32

El resultado final es parecido a éste cuando se abre con el tratamiento detextos - quizá debe seleccionar una fuente fuente fuente fuente fuente cirílica para mostrar correctamente eltexto ruso en pantalla.

chapter2.pmd 3/04/2006, 15:4032

Page 53: Read Iris

2 - 33

MANUAL DEL USUARIO

Para mezclar otros idiomasmezclar otros idiomasmezclar otros idiomasmezclar otros idiomasmezclar otros idiomas, simplemente seleccione el idioma con el mayornúmero de caracteres. Si tiene un documento en el que, digamos, una traduccióningles está junto al texto francés, debe seleccionar el idioma francés para garantizarque se reconozcan los caracteres acentuados como ç, é y ù.

DDDDDEFINIREFINIREFINIREFINIREFINIR LASLASLASLASLAS CARACTERÍSTICASCARACTERÍSTICASCARACTERÍSTICASCARACTERÍSTICASCARACTERÍSTICAS DELDELDELDELDEL DOCUMENTODOCUMENTODOCUMENTODOCUMENTODOCUMENTO

Una vez seleccionado el idioma, pasaremos a las otras características deldocumento. Puede afinar el reconocimiento especificando algunas de lascaracterísticas del documento - el tipo de fuente y el espacio entre caracteres.(Estas opciones no se aplican a los documentos asiáticos.) Expliquemos lo queesto significa.

chapter2.pmd 3/04/2006, 15:4133

Page 54: Read Iris

2 - 34

Empecemos con el mando "Tipo de Fuente" en el menú "Configuración". Eltipo de fuente distingue los documentos “normales” de los documentosdocumentosdocumentosdocumentosdocumentosmatricialesmatricialesmatricialesmatricialesmatriciales. Los símbolos matriciales de calidad “borrador”, tambiéndenominados “9 agujas”, están formados por puntos aislados y separados y sureconocimiento requiere rutinas altamente especializadas.

La impresión con matriz de agujas “calidad de carta”, también denominado“25 agujas”, requiere la configuración “normal” al igual que las calidades decalidades decalidades decalidades decalidades deimpresión impresión impresión impresión impresión imprenta, mecanografiado, impresión láser e impresión con chorro detinta.

La opción "Automático" significa que Readiris detectarará por sí mismo el tipode fuente. Deje Readiris detectar automaticamente el tipo de los caracteres entodos los casos - ¡a no ser que este seguro que va a leer documentos matriciales!(Obviamente, "Automático" es el valor por defecto.)

La etiqueta emergente del botón "Reconocer-Guardar" indica cuál es el el tipode letra activo. Cuando no se muestra ningún mensaje, se usará la calidad deimpresión “normal”; cuando aparece el mensaje "Matricial", significa que estáactivado el modo de lectura para textos impresos con impresora matricial.

El ancho de fuente ancho de fuente ancho de fuente ancho de fuente ancho de fuente puede establecerse con la opción "Espacio entreCaracteres" en el menú "Configuración".

chapter2.pmd 3/04/2006, 15:4134

Page 55: Read Iris

2 - 35

MANUAL DEL USUARIO

Con fuentes fijas (o fuentes “monoespacios”), todos los símbolos de la fuentetienen el mismo ancho. Una "i" ocupa el mismo espacio hori-zontal que una "w", como sucede en esta frase. Piense enlos documentos escritos con una máquina de escribir, en la que el carro se mueveuna distancia fija para cada símbolo escrito.

Un ancho proporcional significa que un carácter depende de su forma. Lossímbolos como “m” y “w” son más anchos y ocupan más espacio horizontal enuna línea que caracteres “delgados” como “l” ó “j”. Virtualmente todos los libros,revistas y periódicos están impresos en ancho proporcional.

La solución más sencilla es dejar esta opción siempre en el valor por defecto"Automático", que significa que Readiris detectará automáticamente el ancho delos caracteres.

VVVVVELOCIDADELOCIDADELOCIDADELOCIDADELOCIDAD CONTRACONTRACONTRACONTRACONTRA PRECISIÓNPRECISIÓNPRECISIÓNPRECISIÓNPRECISIÓN

Ha una opción final que podemos configurar antes de empezar con elreconocimiento - el modo de reconocimientomodo de reconocimientomodo de reconocimientomodo de reconocimientomodo de reconocimiento. De hecho, ya hemos tenido laposibilidad de hacerlo cuando indicamos el idioma del documento con el botón"Idioma". Este botón también permite seleccionar el equilibrio deseado entrevelocidad y precisión. (Estos modos de reconocimiento especializado no son com-patibles con documentos realizados mediante impresión matricial o en algún idiomaasiático.)

chapter2.pmd 3/04/2006, 15:4135

Page 56: Read Iris

2 - 36

El modo de reconocimiento rápido es el más apropiado para documentos conuna buena calidad de impresión (y de escaneado). Por ejemplo, hablamos denítidos documentos impresos con impresora láser y escaneados con la resolucióny el brillo adecuados... El modo de reconocimiento preciso debería seleccionarsecuando la calidad de imagen es inferior; hablamos ahora de faxes, instantáneastomadas con una cámara digital u otras imágenes de baja resolución, etc. Elmodo de reconocimiento preciso garantiza unos resultados de OCR óptimos paratodo tipo de documentos, pero tarda más en procesar los documentos.

El modo de reconocimiento preciso está activado por defecto. El mensajeemergente del botón "Reconocer-Guardar" indica cuál es el modo dereconocimiento activo.

chapter2.pmd 3/04/2006, 15:4136

Page 57: Read Iris

2 - 37

MANUAL DEL USUARIO

¡R¡R¡R¡R¡READIRISEADIRISEADIRISEADIRISEADIRIS SESESESESE HACEHACEHACEHACEHACE CADACADACADACADACADA VEZVEZVEZVEZVEZ MÁSMÁSMÁSMÁSMÁS INTELIGENTEINTELIGENTEINTELIGENTEINTELIGENTEINTELIGENTE!!!!!

Una vez seleccionado el idioma del documento y establecidas las característicasdel documento, active el aprendizaje interactivo y pulse el botón "Reconocer-Guardar".

El progreso del OCR se indica en la pantalla. Puede pulsar el botón de paradao pulsar la tecla Escape para interrumpir el reconocimiento de texto.

Al término del reconocimiento, Readiris entra en la fase interactiva deaprendizaje en la cual se activa el aprendizaje pulsando el botón "Aprendizaje" dela barra principal de herramientas. El aprendizaje interactivo está desactivadopor defecto.

(El aprendizaje interactivo no está disponible para los documentos de lenguasasiáticas, pues carece de sentido en estos idiomas, que se componen de miles desímbolos diferentes - además habrían de poder introducirse los ideogramas medianteun teclado occidental, ¡cosa nada fácil!)

chapter2.pmd 3/04/2006, 15:4137

Page 58: Read Iris

2 - 38

El aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes puede mejorar considerablemente la precisióndel sistema de reconocimiento. Si el usuario intenta reconocer formulariosdistorsionados o desfigurados como los que se encuentran en documentos realeso bien formas estilizadas de fuentes que Readiris no reconoce de forma óptima,este aprendizaje puede resolver este “fallo” temporal.

El aprendizaje del usuario también se utiliza para que el sistema aprendasímbolos especiales símbolos especiales símbolos especiales símbolos especiales símbolos especiales que Readiris no es capaz de reconocer, como símbolosmatemáticos y científicos y dingbats. Algunos ejemplos: Readiris puede aprendera reconocer el símbolo "π" como "pi" o el dingbat " " como "Tel". (Sin embargo,la lista de símbolos reconocidos no puede extenderse a los símbolos "π" y " ".)

El texto reconocido aparece progresivamente en pantalla y el sistema se detieneen los caracteres dudosos, o - si se trata de caracteres unidos (“ligaduras”) - encadenas de caracteres dudosas. Los caracteres dudosos siempre se presentanen su contexto y se destacan. Los caracteres no reconocidos se representan conuna tilde.

chapter2.pmd 3/04/2006, 15:4138

Page 59: Read Iris

2 - 39

MANUAL DEL USUARIO

Lo primero que debe hacer es comprobar si ha activado el diccionario defuentes y el modo de diccionario adecuados - éstos se indican siempre en el títulode la ventana de aprendizaje. Si no es así, haga clic en el botón "Cancelar" - eldocumento vuelve a aparecer con la división por zonas con la que se fue creado- active el diccionario de fuentes o el modo de diccionario adecuados y vuelva aejecutar el reconocimiento. (Pronto se explicará el funcionamiento de losdiccionarios de fuentes.)

De ser necesario, introduzca un carácter (o cadena de caracteres) en lugar dela forma incorrecta o desconocida y pulse uno de los siguientes botones.

AprenderAprenderAprenderAprenderAprenderEstá de acuerdo con la solución propuesta o la corrige. El programa guarda

este carácter dudoso en el diccionario de fuentes como carácter “seguro”, definitivo.

chapter2.pmd 3/04/2006, 15:4139

Page 60: Read Iris

2 - 40

Los reconocimientos posteriores no requerirán su intervención, la forma seconsiderará aprendida de una vez por todas.

En el ejemplo anterior, el sistema se detiene en un carácter sucio y pulsamos"Aprender" para aceptar una forma que no puede confundirse con otros caracteres.

Descartar Descartar Descartar Descartar Descartar AprendizajeAprendizajeAprendizajeAprendizajeAprendizajeEstá de acuerdo con la solución propuesta o la corrige. La diferencia respecto

al botón "Aprender" consiste en que el símbolo aprendido obtiene el calificativode “inseguro” en el diccionario. Para su reconocimiento futuro, el sistemapropondrá la solución “apprendida”, pero aún requerirá una confirmación.

Este botón se utiliza para aquellos símbolos que pueden confundirse con otros:una "e" desfigurada que puede confundirse con una "c", una "t" dañada que puedeparecerse a una "r", etc.

chapter2.pmd 3/04/2006, 15:4140

Page 61: Read Iris

2 - 41

MANUAL DEL USUARIO

La "e" que se muestra anteriormente está muy dañada - de hecho es muyparecida al símbolo "c", por lo que debe pulsar el botón "Descartar Aprendizaje"a fin de no confundirlo con el símbolo "c".

BorrarBorrarBorrarBorrarBorrarLa forma que aparece en pantalla se elimina del resultado. Este botón se

utiliza para ignorar el “ruido” presente en los documentos - puntos, manchas decafé, etc. - que pueden reconocerse como puntos, comas y otras cosas, así comopara borrar los símbolos no deseados.

DeshacerDeshacerDeshacerDeshacerDeshacerPara volver y corregir errores. Puede deshacer las últimas 32 decisiones.

TTTTTerminarerminarerminarerminarerminarEl proceso de aprendizaje concluye, pero el reconocimiento de caracteres

continua en modo automático. En lo sucesivo, todas las decisiones adoptadas porel usuario son aceptadas sin confirmación por parte del usuario.

Pulse este botón cuando vea que el reconocimiento es sumamente preciso yno requiere una corrección detallada.

CancelarCancelarCancelarCancelarCancelarNo confunda el botón "Terminar" con el botón "Cancelar". Con "Cancelar" no

se genera un resultado y vuelve a comenzar desde el principio, con "Terminar" secrea el texto, sólo que no ha sido corregido en sus detalles.

PPPPPAPELAPELAPELAPELAPEL DEDEDEDEDE LOSLOSLOSLOSLOS DICCIONARIOSDICCIONARIOSDICCIONARIOSDICCIONARIOSDICCIONARIOS DEDEDEDEDE FUENTESFUENTESFUENTESFUENTESFUENTES

Los resultados de cada sesión de aprendizaje se conservan temporalmente enla memoria del ordenador, pero pueden y deben guardarse en archivosdenominados “diccionarios” para su uso ulterior.

chapter2.pmd 3/04/2006, 15:4141

Page 62: Read Iris

2 - 42

(¡No confunda los diccionarios de fuentes con los léxicos! Los diccionarios defuentes contienen formas de caracteres adquiridas durante la fase interactiva deOCR, mientras que los léxicos son bases de datos lingüísticas que ayudan alreconocimiento.)

Debe cargar en memoria estos diccionarios de fuentes si desea reconocerdocumentos similares para aprovechar la información adicional que contienen;de esta forma, Readiris toma en consideración la información almacenada enestas bibliotecas de fuentes. ¡Podría decirse que Readiris se vuelve más inteligentecada vez que la usa!

¿Cómo funciona esto? El funcionamiento de los diccionarios de fuentes estácontrolado por el menú "Aprendizaje": tiene que seleccionar un diccionario con elmando "Diccionario" y determinar su modo de funcionamiento.

Los diccionarios diccionarios diccionarios diccionarios diccionarios de fuentes están limitados a 500 formas y le recomendamosque elabore distintos diccionarios para cada aplicación, por ejemplo, por tipo de

chapter2.pmd 3/04/2006, 15:4142

Page 63: Read Iris

2 - 43

MANUAL DEL USUARIO

documento. Por defecto, los diccionarios tienen la extensión *.dus. El aprendizajecarece de efectos si el diccionario está lleno: los resultados no se conservan en lamemoria ni se transcriben en el diccionario.

Dentro de la opción "Diccionario" o directamente en el menú "Aprendizaje"puede seleccionar un modo de diccionario. Existen tres modos de diccionario:nuevo, añadir y de lectura.

Si selecciona "Nuevo Diccionario", indicará que los resultados del aprendizajedeben guardarse en un nuevo diccionario. (Si selecciona un diccionario existente,su contenido se borrará.)

El modo “añadir” indica que los resultados del aprendizaje se guardarán endiccionario existente: el reconocimiento utiliza la información que ya contiene eldiccionario y se le añaden nuevas formas de fuentes. En otras palabras, estaopción le permite elaborar un diccionario de fuentes en varios pasos.

(Si introduce un nombre de archivo para un nuevo diccionario y activa el modo“añadir”, se creará un diccionario de fuentes vacío y deberá completarlo.)

Con la última opción "Consultar Diccionario", el diccionario funciona en modode “sólo lectura” y se aprovecha el diccionario sin añadirle nuevas formas.

Seleccione el modo nuevo si desea reconocer una sola página. Para reconocermuchas páginas del mismo tipo - con las mismas fuentes y la misma calidad deimpresión - seleccione el modo “nuevo” para la primera página, el modo “añadir”para unas cuantas páginas más y el modo “de lectura” para el resto del documentoo documentos.

La etiqueta emergente del botón "Aprendizaje" siempre indica el diccionariode fuentes que está activado y el modo en que opera éste.

chapter2.pmd 3/04/2006, 15:4143

Page 64: Read Iris

2 - 44

Al entrar en aprendizaje interactivo, el diccionario y su modo de funcionamientose indican en el título de la ventana; pulse el botón "Cancelar" y vuelva a comenzarsi éstos son incorrectos.

EEEEENVÍONVÍONVÍONVÍONVÍO DEDEDEDEDE RESULRESULRESULRESULRESULTTTTTADOSADOSADOSADOSADOS AAAAA LALALALALA APLICACIÓNAPLICACIÓNAPLICACIÓNAPLICACIÓNAPLICACIÓN DEDEDEDEDE TRABAJOTRABAJOTRABAJOTRABAJOTRABAJO

Con el aprendizaje interactivo concluye el reconocimiento de caracteres. SiMicrosoft Word es el programa receptor de datos por defecto, el procesador de

chapter2.pmd 3/04/2006, 15:4144

Page 65: Read Iris

2 - 45

MANUAL DEL USUARIO

textos se ejecuta automáticamente (si fuese necesario) una vez concluido elreconocimiento, y se inserta el texto reconocido.

Puede que en pantalla se muestre una barra de progresión del reconocimiento.(Esto dependerá de del tamaño del documento y de la complejidad del formatoque haya de realizarse.)

La imagen escaneada se visualiza de nuevo una vez efectuada la división enzonas para su posterior procesamiento y permanece en su sitio hasta que seescanee una nueva imagen.

De hecho, ha convertido un documento en papel en un archivo digitalmodificable, ¡y en un tiempo 40 veces inferior al que habría empleado si hubieratenido que volver a mecanografiarlo! Ahora compárelo con la imagen que tieneen la ventana de Readiris.

En realidad, Readiris le ofrece tres métodos diferentes a la hora de guardar elresultado del reconocimiento: por un lado, enviar directamente el documentoreconocido a una aplicación. Por otro, guardar el resultado en un archivo externoy, por último, copiar el resultado en el portapapeles de Windows.

El destino de salidadestino de salidadestino de salidadestino de salidadestino de salida se selecciona con el botón "Formato" de la barra deherrramientas principal (o con la opción "Formato Texto" del menú "Configuración").

chapter2.pmd 3/04/2006, 15:4145

Page 66: Read Iris

2 - 46

La función "Enviar a" permite un vínculo directo de OCR entre el escáner ylas aplicaciones para Windows. ¡Con ella podrá enviarenviarenviarenviarenviar directamente el documentoque acaba de escanear a un procesador de textos, hoja de cálculo o programa denavegación, a Adobe Reader, etc.!

chapter2.pmd 3/04/2006, 15:4146

Page 67: Read Iris

2 - 47

MANUAL DEL USUARIO

Una vez concluido el reconocimiento, se ejecuta la aplicación de destino y eldocumento reconocido se visualiza en un nuevo archivo de texto o en un libro detrabajo.

chapter2.pmd 3/04/2006, 15:4147

Page 68: Read Iris

2 - 48

No olvide que la función "Enviar a" también permite enviar el texto reconocidoal portapapeles portapapeles portapapeles portapapeles portapapeles de Windows, de forma que no es absolutamente imprescindibleexportar el resultado de la lectura, ni guardarlo en un archivo externo...

GGGGGUARDARUARDARUARDARUARDARUARDAR LOSLOSLOSLOSLOS RESULRESULRESULRESULRESULTTTTTADOSADOSADOSADOSADOS ENENENENEN UNUNUNUNUN ARCHIVOARCHIVOARCHIVOARCHIVOARCHIVO DEDEDEDEDE TEXTTEXTTEXTTEXTTEXTOOOOO

Es posible guardar el resultado del OCR en un archivo “externo”. Readirisreconoce una gran variedad de los formatos de archivo ofrecidos por losprocesadores de texto, hojas de cálculo y aplicaciones web más conocidos. (En-tre otros, Readiris es compatible con WordML y SpreadsheetML, los nuevosformatos de texto de Microsoft Office 2003.)

La opción "Guardar y Abrir" es muy parecida a la función "Enviar a", puestoque le permite abrir el documento reconocido cuando ya se ha guardado.

chapter2.pmd 3/04/2006, 15:4248

Page 69: Read Iris

2 - 49

MANUAL DEL USUARIO

Sin embargo, el método usado para dirigir la aplicación deseada es distinto. Enesta ocasión, los tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de WWWWWindowsindowsindowsindowsindows determinan qué aplicación seiniciará. Es como si hiciera doble clic sobre el archivo de salida desde el Exploradorde Windows... (Con la opción "Enviar a", Readiris dirige directamente lasaplicaciones específicas deseadas.)

chapter2.pmd 3/04/2006, 15:4249

Page 70: Read Iris

2 - 50

La opción "Enviar por E-mail" crea un nuevo mensaje de correo electrónicocorreo electrónicocorreo electrónicocorreo electrónicocorreo electrónicoy añade el documento reconocido como archivo adjunto del mensaje. ¿Conoceun método más rápido para distribuir un documento en papel...?

chapter2.pmd 3/04/2006, 15:4250

Page 71: Read Iris

2 - 51

MANUAL DEL USUARIO

CCCCCREACIÓNREACIÓNREACIÓNREACIÓNREACIÓN DEDEDEDEDE DOCUMENTDOCUMENTDOCUMENTDOCUMENTDOCUMENTOSOSOSOSOS PORPORPORPORPORTÁTILESTÁTILESTÁTILESTÁTILESTÁTILES

Veamos con más atención uno de los formatos reconocidos: el formato PDFformato PDFformato PDFformato PDFformato PDFde de de de de Adobe Adobe Adobe Adobe Adobe AcrobatAcrobatAcrobatAcrobatAcrobat. Readiris le permite crear documentos PDF basados entexto y basados en imágenes.

chapter2.pmd 3/04/2006, 15:4251

Page 72: Read Iris

2 - 52

¿Cúal es la diferencia entre los dos? Cuando selecciona el formato "PDFTexto", Readiris crea un archivo PDF que contiene el resultado del texto. (Es

chapter2.pmd 3/04/2006, 15:4252

Page 73: Read Iris

2 - 53

MANUAL DEL USUARIO

posible que haya gráficos, pero sólo cuando aparecen zonas gráficas en la página- fotografías, ilustractiones, etc.) En otras palabras, la imagen de la página noforma parte del documento PDF, compuesto de una sola capa. Por contra, elformato "PDF Imagen", que es también de una sola capa, sólo contiene la imagenescaneada, ¡sin incluir los resultados del OCR!

chapter2.pmd 3/04/2006, 15:4253

Page 74: Read Iris

2 - 54

Los formatos "PDF Texto-Imagen" y "PDF Imagen-Texto" ofrecen otrosresultados: Readiris crea un archivo PDF en el que se pueden hacer búsquedas y

chapter2.pmd 3/04/2006, 15:4254

Page 75: Read Iris

2 - 55

MANUAL DEL USUARIO

que contiene el texto reconocido y la imagen de la página. En los archivos PDF“texto-imagen”, el texto se coloca encima de la imagen de la página en el archivoPDF de doble capa; por contra, en los archivos del tipo “imagen-texto”, el textose coloca debajo de la imagen de la página. ¡Utilice la opción "Buscar" de AdobeReader y lo comprobará rápidamente!

Los archivos PDF del tipo “texo-imagen” son de hecho bastante sofisticados:los píxeles del texto reconocido se borran para crear un documento legible. Y esque, por ejemplo, mostrar el texto reconocido en color negro encima de mapas debits de caracteres negros daría como resultado un texto con una fuerte sombra...

chapter2.pmd 3/04/2006, 15:4255

Page 76: Read Iris

2 - 56

Si desea comprobarlo usted mismo, le invitamos a reconocer la imagen demuestra BACKGROUND.JPG.

Todos los archivos PDF basados en texto codifican las URL de páginas weby las direcciones de correo electrónico como enlaces visibles: haga clic en ellospara visitar la página web en cuestión o para enviar un mensaje de correo

chapter2.pmd 3/04/2006, 15:4256

Page 77: Read Iris

2 - 57

MANUAL DEL USUARIO

electrónico al contacto. (De hecho, el resto de formatos de texto “enriquecido”de Readiris - Word, WordML, HTML, etc. - recrean también los hipervínculos.)

Haga clic en el botón "Formato" para ver algunas opciones relacionadas conel formato PDF: "Crear Marcadores" e "Incrustar Fuentes". (En cuanto se hayaseleccionado el formato PDF, se aplica el formato automático - y no se puededesactivar.)

La opción "Crear Marcadores" permite crear marcadores marcadores marcadores marcadores marcadores por página paracada elemento del documento, tanto los gráficos como las zonas de texto y tablas.Para las zonas de texto, Readiris aplica un algoritmo inteligente que crea un título,un “externo” para cada zona; las tablas y gráficos llevan simplemente un número.(Otro elemento de navegación de los documentos PDF, las miniaturasminiaturasminiaturasminiaturasminiaturas de página,se pueden crear de manera dinámica con el programa Adobe Reader.)

chapter2.pmd 3/04/2006, 15:4257

Page 78: Read Iris

2 - 58

La opción "Incrustar Fuentes" inserta fuentes en los archivos PDF. Al incrustarfuentes, se evita la sustitución de las mismas cuando el lector examina e imprimeel documento reconocido. Asegura que el lector - cualquiera que sea laconfiguración de su ordenador - vea el texto con las fuentes originales. Sin em-bargo, al insertar fuentes se aumenta (un poco) el tamaño de los documentosreconocidos.

Otra función de Readiris con un interés especial a la hora de generar documentosPDF es la utilización de propiedades del documentopropiedades del documentopropiedades del documentopropiedades del documentopropiedades del documento. Las propiedades deldocumento contienen el título del documento, el nombre y la organización de suautor, el asunto, algunas palabras clave y comentarios, etc. Las propiedades deldocumento se utilizan obviamente para clasificar y buscar archivos.

chapter2.pmd 3/04/2006, 15:4258

Page 79: Read Iris

2 - 59

MANUAL DEL USUARIO

El mando "Propiedades del Documento" del menú "Archivo" permitirá editarestas propiedades. Tenga también en cuenta que puede definir las propiedadesdel documento a generar más tarde, cuando guarde los resultados delreconocimiento...

chapter2.pmd 3/04/2006, 15:4259

Page 80: Read Iris

2 - 60

Recuerde que las propiedades del documento no sólo se pueden definir paradocumentos PDF: los documentos en los formatos Word (*.doc), RTF (“RichText Format”), WordML (*.xml), SpreadsheetML (*.xml) y HTML tambiéndisponen de propiedades del documento - aunque menos completas que las de losdocumentos en formato PDF. (Y, como es de suponer, los formatos de texto“pobres” como los documentos de texto con codificación Texto (ANSI) o TextoMS-DOS (ASCII) no permiten definir propiedades.)

... ... ... ... ... OOOOO RECONOCIMIENTORECONOCIMIENTORECONOCIMIENTORECONOCIMIENTORECONOCIMIENTO DEDEDEDEDE DICHOSDICHOSDICHOSDICHOSDICHOS DOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOS

Veámoslo en el otro sentido. Dado que Readiris ofrece un reconocimientocompleto del formato PDF Adobe Acrobat, no sólo le permite generar archivosPDF, ¡sino que también puede leerlos!

Puede que la conversión de los documentos PDFconversión de los documentos PDFconversión de los documentos PDFconversión de los documentos PDFconversión de los documentos PDF sea una de las principalesaplicaciones de Readiris. Existen diversas razones que lo justifican. En primerlugar, es una manera de convertir imágenes en texto: ya que los documentos PDFcon imágenes abiertos ejecutan el reconocimiento y guardan el resultado del OCRen un documento de texto (en cualquier formato de texto reconocido). Los archivosde texto se pueden editar, mientras que los archivos con imágenes no son editables.

En segundo lugar, le permite convertir archivos PDF con imágenes en archivosPDF de texto. Para ello debe ejecutar el reconocimiento de archivos PDF con“sólo imágenes” y guardar los resultados del OCR... ¡como documentos PDF detexto! Los archivos PDF de texto se pueden buscar y editar, mientras que con losarchivos PDF con “sólo imágenes” esto no es posible.

Finalmente, la conversión de archivos PDF es una manera de “desbloquear”el contenido del PDF. Piense en los documentos PDF de “sólo lectura”, cuyotexto normalmente es inaccesible. Con los archivos PDF desprotegidos, se puederecuperar el contenido (copiar y guardar en un archivo texto), mientras que elcontenido de los archivos “sólo lectura” no se puede extraer. Dichos documentossólo se pueden ver e imprimir.

Deben tenerse en cuenta dos detalles importantes: Readiris no abre documentosPDF protegidos con contraseña, ni siquiera en el caso de que Readiris haya roto

chapter2.pmd 3/04/2006, 15:4260

Page 81: Read Iris

2 - 61

MANUAL DEL USUARIO

el resto de barreras de seguridad del documento. (Para ser más específicos, las“contraseñas maestras” que definen los permisos de los documentos PDF nosuponen ningún problema para Readiris, pero las “contraseñas del usuario”necesarias para abrir ciertos documentos PDF sí que suponen un problema.) Porotra parte, Readiris no puede convertir documentos PDF que contengan imágenescomprimidas en formato JPEG 2000.

Proceda del modo habitual: cargue los archivos PDF en la memoria al tiempoque abre imágenes previamente escaneadas - faxes, instantáneas realizadas consu cámara digital, etc. Haga clic en el botón de parada o pulse la tecla Esc parainterrumpir el proceso de carga entre dos páginas. (Esto también es válido paraimágenes en formato TIFF con múltiples páginas y faxes en formato DCX.)

Sin embargo, existe una opción específica relacionada con los archivos PDF,que permite abrirlos como documentos en color o en blanco y negro. ¡Se ofreceesta opción porque explorar documentos en color es mucho más lento!

chapter2.pmd 3/04/2006, 15:4261

Page 82: Read Iris

2 - 62

En segundo lugar, es posible que desee indicar qué páginas desea convertir Sisu objetivo es, por ejemplo, capturar sólo un capítulo de una publicación en formatoPDF muy extensa, no tendría demasiado sentido cargar todo el libro en Readiris…Indicar el intervalo de páginasintervalo de páginasintervalo de páginasintervalo de páginasintervalo de páginas adecuado puede ahorrarle mucho tiempo. (Esto,una vez más, también es válido para imágenes en formato TIFF con múltiplespáginas y faxes en formato DCX.)

Los documentos PDF basados en texto, en general, ofrecen una calidadexcelente; el modo de reconocimiento rápido es suficiente para realizar laconversión con éxito. Sin embargo, la calidad de los archivos PDF basados en

chapter2.pmd 3/04/2006, 15:4262

Page 83: Read Iris

2 - 63

MANUAL DEL USUARIO

imágenes depende de las características de los documentos originales en papel,del brillo y la resolución del escaneado, etc.

Si le interesa, puede probar con el archive SAMPLE.PDF, que encontrará enla carpeta de imágenes de Readiris.

RRRRRECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTOOOOO DEDEDEDEDE VVVVVARIASARIASARIASARIASARIAS PÁGINASPÁGINASPÁGINASPÁGINASPÁGINAS

Después del OCR, el documento escaneado se visualiza de nuevo con la divisiónen zonas para su posterior procesamiento.

A partir de este momento, puede abrir el texto reconocido con su procesadoro editor de textos, importarlo a un programa de maquetación (“DTP” - “desktoppublishing”) o a cualquier otra aplicación de tratamiento de texto, archivarlo ycompartirlo, colocarlo en un servidor de Intranet, etc. Compárelo con la imagenque hay en el interior de la ventana de Readiris.

Pero ¿cómo se guarda el texto de las páginas adicionales? En otras palabras,¿cómo se procesan los documentos compuestos de varias páginas? Es muy sencillo:vaya ejecutando las páginas reconocidas y guarde los resultados en el mismoarchivo. (Asegúrese de que el documento no está abierto para poder escribir enél.) No olvide tampoco activar el modo “añadir” en el diccionario de fuentes, deforma que pueda continuar cómodamente con el aprendizaje de fuentes.

Conforme vaya escaneando páginas (o abriendo archivos gráficos), tendráque decidir si quiere iniciar un nuevo documento o completar el que está abiertoen ese momento.

chapter2.pmd 3/04/2006, 15:4363

Page 84: Read Iris

2 - 64

Si responde "no", seguirá añadiendo páginas al documento abierto; si responde"sí", creará un nuevo documento. Esta última respuesta corresponde a la función"Nuevo Documento" del menú "Archivo".

Pero existe un sistema más eficaz para reconocer varias páginas sin tener queescanearlas ni realizar su OCR una por una: ¡se trata del procesamiento directode documentos de múltiples páginasdocumentos de múltiples páginasdocumentos de múltiples páginasdocumentos de múltiples páginasdocumentos de múltiples páginas!

Para escanear de una sola vez un documento de varias páginas, deberá activarel alimentador de documentos del escáner, mediante la opción "ADF" (alimentadorautomático de documentos) bajo el botón "Escáner".

Sitúe todas las páginas en el alimentador automático de documentos y empiecea escanear: se escanearán de la primera a la última página.

Si su escáner plano no dispone de alimentador de documentos, el escaneadoescaneadoescaneadoescaneadoescaneadoa intervalosa intervalosa intervalosa intervalosa intervalos le permite escanear documentos de múltiples páginas de maneraeficiente. El escáner digitaliza automáticamente otra página transcurrida unacantidad de segundos definida por el usuario. El intervalo permite reemplazar lapágina que había en la pantalla por otra nueva.

(El escaneado a intervalos resulta muy útil al escanear un libro (de grandesdimensiones): sus manos estarán demasiado ocupadas colocando adecuadamenteel libro en la plataforma del escáner plano para poder utilizar el ratón...)

Indique, en la configuración del escáner, el intervalo de tiempo que necesitapara colocar otra página en la pantalla del escáner. Haga clic en el botón "Escáner"

chapter2.pmd 3/04/2006, 15:4364

Page 85: Read Iris

2 - 65

MANUAL DEL USUARIO

y defina un valor adecuado para la opción "Escanear Otra Página a Continuaciónx Segundo(s)".

Haga clic en el botón "Escanear" parar iniciar la digitalización. Haga clic en elbotón "Detener" del cuadro de diálogo de escaneado a intervalos para detener elproceso de escaneado automático.

Readiris le ofrece la máxima flexibilidad: puede omitir el intervalo de escaneadopara escanear inmediatamente un documento, o congelar el proceso para hacer o

chapter2.pmd 3/04/2006, 15:4365

Page 86: Read Iris

2 - 66

atender una llamada telefónica. Haga clic en el botón "Pausa" del cuadro dediálogo de escaneado a intervalos para detener temporalmente el proceso deescaneado a intervalos. Haga clic en "Reanudar" cuando desee seguir con elescaneado automático, o haga clic en "Escanear Ahora", en el cuadro de diálogode escaneado a intervalos, para poder escanear inmediatamente: ¡el intervalo detiempo se reduce!

También puede abrir múltiples imágenes previamente escaneadas. Para ello,seleccione primero una de ellas y, mientras mantiene pulsada la tecla Ctrl, vayaescogiendo las restantes. Para seleccionar un rango continuo de imágenes,seleccione la primera de ellas y, mientras mantiene pulsada la tecla Mayús, escojala última.

Puede hacer lo mismo desde el Explorador de Windows: seleccione variosarchivos de imágenes, haga clic con el botón derecho del ratón y seleccione laopción "Reconocer" del menú contextual. Si repite esta misma operación, todaslas imágenes que envíe a Readiris se añadirán al documento en uso hasta queseleccione el mando "Nuevo Documento".

chapter2.pmd 3/04/2006, 15:4366

Page 87: Read Iris

2 - 67

MANUAL DEL USUARIO

Puede, incluso, abrir imágenes previamente escaneadas arrastrándolas desdeel Explorador de Windows hasta el área de trabajo de Readiris. También aquíocurre como citamos anteriormente: puede repetir esta operación cuanto quiera,y todas las imágenes que envíe a Readiris se añadirán al documento en uso hastaque seleccione el mando "Nuevo Documento".

Readiris ordena las imágenes automáticamente: la imagen 001.tif precede a la002.tif que precede a la 003.tif, etc.

El panel de documentospanel de documentospanel de documentospanel de documentospanel de documentos muestra estadísticas estadísticas estadísticas estadísticas estadísticas e información acerca detodas las páginas escaneadas - la imagen original y su resolución, el tiempoempleado en los procesos de escaneado y reconocimiento, etc. El panel dedocumentos se puede ocultar y volver a mostrar utilizando la opción pertinentedel menú "Ver".

chapter2.pmd 3/04/2006, 15:4367

Page 88: Read Iris

2 - 68

Con el panel de documentos también podrá saber qué imagen se encuetracargada en la memoria. Si se abrió una imagen de múltiples páginas, está claroque habrá un sólo archivo para todas las imágenes. Si se digitalizan documentos,el panel de documentos simplemente menciona el modelo de escáner.

Para cambiar el tamaño de una columna, arrastre el cursor deredimensionamiento de columnas. (No es posible cambiar el orden de lascolumnas.) También puede situar el cursor encima de una columna demasiadoestrecha para visualizar los datos: ¡un mensaje emergente mostrará toda lainformación!

Puede ver la misma información para todas las páginas con el mando"Información", situada en el menú "Archivo", o de manera independiente paracada página situando el cursor encima de la miniatura de la página que desee enla barra de herramientas de páginabarra de herramientas de páginabarra de herramientas de páginabarra de herramientas de páginabarra de herramientas de página, situdada en la parte izquierda de lapantalla. Esta barra de herramientas aparece en el momento que empiezan aprocesarse páginas y da acceso a las diversas opciones de página (utilizando elbotón derecho del ratón).

chapter2.pmd 3/04/2006, 15:4368

Page 89: Read Iris

2 - 69

MANUAL DEL USUARIO

La página activa en un determinado momento queda resaltada en el panel dedocumentos y en la barra de herramientas de página, y su nombre aparece en labarra de título de Readiris.

Para eliminar una página, coloque el cursor del ratón encima de la misma en elpanel de documentos y pulse la tecla Supr. O coloque el cursor del ratón encimade su miniatura de la barra de herramientas de página y pulse la tecla Supr. (Otambién puede seleccionarla en la barra de herramientas de página, hacer cliccon el botón derecho del ratón y seleccionar la opción "Eliminar Página" del menúcontextual.)

Puede imprimirimprimirimprimirimprimirimprimir rápidamente las imagénes imagénes imagénes imagénes imagénes escaneadas utilizando el mando"Imprimir" de la barra de herramientas de imagen (o con el mando "Imprimir lasImágenes" del menú "Archivo") si necesita hacerse una idea general de sudocumento.

Puede imprimir la página actual o todas las páginas. Selecciones el número depáginas o miniaturas que quiera imprimir.

chapter2.pmd 3/04/2006, 15:4369

Page 90: Read Iris

2 - 70

Pero tampoco tiene por qué imprimir todas las páginas: el panel de documentos(y los mandos pertinentes del menú "Edición" (y los mandos contextuales depágina de la barra de herramientas de página) le permite excluir páginas(temporalmente). Haga clic en el número de página en cuestión en el panel dedocumentos para excluirla del proceso de impresión (y reconocimiento). Vuelvaa hacer clic sobre ella para volverla a incluir. Para conseguir una mayor flexibilidad,el menú "Edición" ofrece opciones equivalentes que se aplican a todas las páginas.

Las miniaturas de las páginas excluidas serán tachadas. Tenga en cuenta quesiempre funciona la impresión de la página actual, incluso si esta opción está“desactivada” en ese momento.

chapter2.pmd 3/04/2006, 15:4370

Page 91: Read Iris

2 - 71

MANUAL DEL USUARIO

(La exclusión de páginas también se aplica al reconocimiento: cuando pongaen marcha el proceso de OCR, las páginas excluidas (temporalmente) no sereconocerán.)

Abra la imagen de prueba MULTIPAGE.TIF e inicie el reconocimiento. Laspáginas van apareciendo unas tras otras. En la barra de título de Readiris seindica el número de la página activa.

chapter2.pmd 3/04/2006, 15:4371

Page 92: Read Iris

2 - 72

Si el aprendizaje interactivo está en funcionamiento, éste irá reconociendo yaprendiendo página por página. Para la primera de ellas se iniciará un diccionario"nuevo", y en las sucesivas irá completándose este último.

A partir del momento en que pulse el botón "Terminar", el sistema irá tomandodecisiones sin que el usuario tenga que validarlas. En otras palabras, se interrumpeel aprendizaje interactivo para todas las páginas y el reconocimiento del documentocontinuará en modo automático.

El resultado del reconocimiento efectuado en documentos con varias páginasqueda guardado en un único archivo de salida. (Si se envía el resultado delreconocimiento a una aplicación de salida, se crearán varias páginas dentro de unúnico documento.)

Al menos, ese es el caso cuando la opción "Crear Un Archivo por Página"esté desactivada al guardar el documento reconocido. Esta opción tratará eldocumento como si cada página estuviera guardada en un archivo diferente. Si elusuario pone el nombre texto.doc al archivo, los archivos se denominarán texto-1.doc, texto-2.doc, etc. (Esta opción sólo se encuentra disponible cuando se creaun archivo externo, y no cuando se envían los resultados del OCR a una aplicacióndestino.)

chapter2.pmd 3/04/2006, 15:4372

Page 93: Read Iris

2 - 73

MANUAL DEL USUARIO

EEEEEDICIÓNDICIÓNDICIÓNDICIÓNDICIÓN DEDEDEDEDE DOCUMENTDOCUMENTDOCUMENTDOCUMENTDOCUMENTOSOSOSOSOS DEDEDEDEDE MÚLMÚLMÚLMÚLMÚLTIPLESTIPLESTIPLESTIPLESTIPLES PÁGINASPÁGINASPÁGINASPÁGINASPÁGINAS

El usuario puede editar documentos de múltiples páginas para corregir,principalmente, errores ocurridos en la fase de escaneado. Podrá eliminar páginasdel documento o moverlas a otra posición.

En primer lugar, veamos cómo desplazarnos. Para ir a una página, haga clicen la misma en el panel de documentos o en la barra de herramientas de página.(O bien lleve el cursor a la miniatura, haga clic con el botón derecho del ratónpara que aparezca el menú contextual y seleccione la opción "Seleccionar Página".)

Para ir a la página anterior, utilice la tecla RePág; para avanzar hasta la páginasiguiente emplee AvPág. Pulse Inicio para ir a la primera página, y Fin para ir a laúltima página. O utilice las funciones correspondientes en el menú "Ver".

Vamos ahora a editar el documento. Para eliminar una página, coloque elcursor del ratón encima de la misma en el panel de documentos y pulse la teclaSupr, o coloque el cursor del ratón encima de su miniatura de la barra deherramientas de página y pulse la tecla Supr. (O también puede seleccionarla enla barra de herramientas de página, hacer clic con el botón derecho del ratón yseleccionar la opción "Eliminar Página" del menú contextual.)

chapter2.pmd 3/04/2006, 15:4373

Page 94: Read Iris

2 - 74

Y le recordamos que podrá excluir páginas temporalmente, pero no borrarlas,del proceso de reconocimiento (y de impresión de imágenes): el panel dedocumentos, la barra de herramientas de página y el menú "Edición" incluyen losmandos necesarios.

Para subir una página dentro de un documento, utilice el mando "Subir laPágina". Si, por el contrario, desea bajarla, seleccione el mando "Bajar la Página".

Para mover una página a una ubicación completamente distinta en eldocumento, arrastre su icono a esa nueva ubicación.

chapter2.pmd 3/04/2006, 15:4374

Page 95: Read Iris

2 - 75

MANUAL DEL USUARIO

AAAAABRIRBRIRBRIRBRIRBRIR UNUNUNUNUN NUEVONUEVONUEVONUEVONUEVO DOCUMENTODOCUMENTODOCUMENTODOCUMENTODOCUMENTO

Para cerrar el documento activo, puede utilizar el mando "Nuevo Documento"del menú "Archivo".

Esta función “limpia completamente la pizarra”. Cualquier documento cargadoen memoria - ya tenga una o múltiples páginas - se eliminará completamente. Apartir de entonces, podrá crear uno nuevo.

Sin embargo, también puede crear un nuevo documento directamente desdeel documento activo. Mientras no haya ejecutado el OCR, el sistema entiende

chapter2.pmd 3/04/2006, 15:4375

Page 96: Read Iris

2 - 76

que usted desea añadir páginas al documento. Por ejemplo, puede escanear todaslas páginas que se encuentren en el alimentador del escáner, colocar más páginasen el alimentador y continuar con el procedimiento. Todas las páginas escaneadascompondrán un único documento. O bien, podrá escanear varias páginas y añadiralgunos archivos gráficos, como por ejemplo, faxes. Estas páginas siguen formandoun solo documento; todo lo que tiene que hacer es cambiar el origen de la imagensegún vaya siendo necesario. Para ello utilice el botón "Fuente".

Una vez realizado el OCR, si reinicia el proceso de escaneado (o la carga deimágenes), empezará un nuevo documento o completará el que esté en esemomento en uso.

RRRRRECONOCIMIENTOECONOCIMIENTOECONOCIMIENTOECONOCIMIENTOECONOCIMIENTO DEDEDEDEDE ZONASZONASZONASZONASZONAS DEDEDEDEDE TEXTOTEXTOTEXTOTEXTOTEXTO

Una vez que sabemos cómo reconocer páginas y procesar documentos demúltiples páginas, tenemos que preguntarnos si se puede reconocer menos deuna página con la misma facilidad. La respuesta es sí. Para ello, haga clic con elbotón derecho del ratón y elija la opción "Copiar como Texto" del menú contex-tual: la ventana del texto bajo el cursor del ratón será reconocida y enviada alportapapeles.

chapter2.pmd 3/04/2006, 15:4376

Page 97: Read Iris

2 - 77

MANUAL DEL USUARIO

Se aplicará la configuración del sistema actual - idioma, modo dereconocimiento, tipo de fuente, etc. El resultado del OCR se colocará en elportapapeles como texto “en corpo”, no formateado.

OOOOORGANIZACIÓNRGANIZACIÓNRGANIZACIÓNRGANIZACIÓNRGANIZACIÓN DELDELDELDELDEL TEXTTEXTTEXTTEXTTEXTOOOOO RESULRESULRESULRESULRESULTTTTTANTEANTEANTEANTEANTE

Guardar o exportar el texto requiere algo más que indicar simplemente unmétodo de exportación o un nombre para el archivo resultante. También debe

chapter2.pmd 3/04/2006, 15:4377

Page 98: Read Iris

2 - 78

seleccionarse un formato de archivo y determinarse la apariencia del textoreconocido. Es decir, tiene que elegir lo que quiere hacer con el texto antes deiniciar el programa correspondiente.

Algunas opciones del botón "Formato" le permitirán determinar la aparienciadel texto resultante.

El flujo de texto flujo de texto flujo de texto flujo de texto flujo de texto del documento resultante es determinado directamente porla opción "Fusionar Líneas en los Párrafos".

Mantenga activada esta opción para que Readiris detecte los párrafos. Deesta forma, Readiris aplicará el ajuste de línea ajuste de línea ajuste de línea ajuste de línea ajuste de línea típico de los tratamientos detexto; de lo contrario se añade un retorno de carro (código CR o EOL) tras cadalínea y las palabras separadas por guiones quedan tal cual. Por defecto, la detecciónde párrafos está activada.

Para explicar esto, he aquí un ejemplo. Si las primeras tres líneas de unacolumna son "El nuevo presi-", "dente saludó desde el balcón." y "Su esposa vinoa acompañarlo.", la detección de párrafos le ofrece el siguiente resultado: "Elnuevo presidente saludó desde el balcón. Su esposa vino a acompañarlo." Laspartes separadas por el guión de la palabra "presidente" fueron unidas y se añadióun espacio al final de la frase, creando así un flujo natural de texto.

Si la detección de párrafos no estuviese activada, se habría mantenido el diseñooriginal con un retorno de carro añadido al final de cada línea.

Esta opción no está disponible cuando el formato PDF está seleccionado:siempre se almacenan los archivos PDF Adobe Acrobat línea por línea.

(El botón "Formato" contiene algunas opciones que aún no hemos explicado;lo haremos pronto.)

chapter2.pmd 3/04/2006, 15:4378

Page 99: Read Iris

2 - 79

MANUAL DEL USUARIO

CCCCCONFIGURACIÓNONFIGURACIÓNONFIGURACIÓNONFIGURACIÓNONFIGURACIÓN DELDELDELDELDEL ESCÁNERESCÁNERESCÁNERESCÁNERESCÁNER

Ahora debe configurar su escáner. Se supone que el escáner y los controladoresnecesarios han sido instalados correctamente.

Si la licencia de su software Readiris va unida a un modelo de escáner,probablemente este paso resulte innecesario, ya que su escáner puede estarconfigurado para Readiris.

Haga clic en el botón "Escáner" de la barra principal de herramientas.

Haga clic en el botón "Tipo de Escáner" para determinar el modelo demodelo demodelo demodelo demodelo deescánerescánerescánerescánerescáner.....

(No dude en ponerse en contacto con el fabricante del equipo o con sudistribuidor si siguiera teniendo problemas con los controladores del escáner. La

chapter2.pmd 3/04/2006, 15:4479

Page 100: Read Iris

2 - 80

mayoría de fabricantes permiten descargar las últimas versiones de loscontroladores directamente desde su página web.)

Si selecciona la opción "<Image>" (imagen) como “escáner” - las imágenesya escaneadas funcionan como origen de las imágenes en todo momento - notiene que seleccionar el disco como origen de imagen con el botón "Fuente" de labarra principal de herramientas.

El botón "Configurar" sólo está disponible si su escáner lo permite. Para accedera algunos parámetros avanzados de escaneado con escaners Twain, haga clic enel botón "Configurar" y seleccione el origen Twain. (También puede utilizar laopción "Seleccionar Fuente" del menú "Archivo".)

Una vez seleccionado el escáner, la misma ventana le permitirá establecer laresolución de escaneado, el formato y la orientación de la página y el brillo y elcontraste. Asimismo, tendrá ocasión de indicar si va a utilizar el alimentador delescáner. Con escaners Twain, todos los parámetros de escaneado a menudo seestablecen dentro del interfaz Twain.

Establezca el brillo brillo brillo brillo brillo y, si dispone de él, el contrastecontrastecontrastecontrastecontraste.Si activa la opción "Apaisado" indicará que la página tiene dicha orientación y

no la vertical. En realidad, la orientación de la página se aplica a los formatosreducidos de página: en un escáner plano de formato A4, se pueden escanearpáginas de formato A5 (la mitad del tamaño del A4) en orientación vertical yhorizontal, pero obviamente sólo puede escanear la superficie completa de unapágina A4 en una única dirección.

chapter2.pmd 3/04/2006, 15:4480

Page 101: Read Iris

2 - 81

MANUAL DEL USUARIO

Por último, la opción "Invertir" le permitirá generar imágenes “invertidas”imágenes “invertidas”imágenes “invertidas”imágenes “invertidas”imágenes “invertidas”en la modalidad de escaneado en blanco y negro - puede activar esta opción paraprocesar páginas enteras en las que aparezca texto blanco sobre fondo negro.

Ya hemos hablado del escaneado a intervalos. Solamente recordar que es unaforma muy eficaz de escanear documentos de múltiples páginas cuando se utilizaun escáner plano sin alimentador de documentos.

PPPPPONGAONGAONGAONGAONGA COLORESCOLORESCOLORESCOLORESCOLORES ENENENENEN SUSSUSSUSSUSSUS TEXTTEXTTEXTTEXTTEXTOSOSOSOSOS DIGITDIGITDIGITDIGITDIGITALIZADOSALIZADOSALIZADOSALIZADOSALIZADOS!!!!!

Readiris suporta sin ningún problema imágenes en blanco y negro, en escalade grises y en color. Escoja, pues, la modalidad de colormodalidad de colormodalidad de colormodalidad de colormodalidad de color que mejor se adaptea sus necesidades. Si va a incluir en los documentos dibujos, escanee en blanco ynegro, si desea incorporar fotografías en blanco y negro, escanee en escala degrises y para insertar fotografías en color, escanee en color.

Pero ¿cuál es la razón para reducir la profundidad de las imágenes en la fasede escaneado? Ni que decir tiene que las imágenes en escala de grises y en colorse escanean con más lentitud y requieren más memoria RAM que las imágenesen blanco y negro.

Escanear en escala de grises y en color no es sólo útil para guardar imágenescon suficiente calidad, y para conservar los colores del texto escaneado duranteel proceso de reconocimiento. ¡A veces, también puede ser útil - o incluso necesario- para obtener buenos resultados con el OCR! Cuando el texto está impresosobre un fondo coloreado, el hecho de escanear en color puede generar esosmatices tonales de los que carecen las imágenes en blanco y negro. Cuando elcontraste entre el texto y el fondo es reducido, este último puede crear cierto“ruido”; ¡lo que dificultará enormemente el reconocimiento, o lo hará imposible!

chapter2.pmd 3/04/2006, 15:4481

Page 102: Read Iris

2 - 82

Piense, por ejemplo, en un texto negro impreso sobre fondo oscuro. Si escaneaun texto así en blanco y negro, por mucho que intente ajustar el brillo del escáner,no podrá deshacerse del color de fondo sin perder también la información deltexto...

Readiris genera una versión en blanco y negro de cada imagen en escala degrises o en color. Sus rutinas inteligentes resuelven incluso casos muyproblemáticos. Así es como se digitalizan las imágenes “difíciles”.

chapter2.pmd 3/04/2006, 15:4482

Page 103: Read Iris

2 - 83

MANUAL DEL USUARIO

Para visualizar una imagen escaneada en blanco y negro, deshabilite la opción"Visualizar Documento en Color" del menú "Ver".

Aunque, en realidad, usted no verá ninguna imagen en blanco y negro en lapantalla de su ordenador, ¡incluso si se escanean imágenes binivel! Esto se debea que Readiris optimiza las imágenes para una perfecta legibilidad en pantalla. Latécnica especializada de visualización de alta resoluciónvisualización de alta resoluciónvisualización de alta resoluciónvisualización de alta resoluciónvisualización de alta resolución de I.R.I.S. conviertelas imágenes en blanco y negro en imágenes en escala de grises.

Se suavizan y difuminan las imágenes en escala de grises y en color.

chapter2.pmd 3/04/2006, 15:4483

Page 104: Read Iris

2 - 84

Como consecuencia, no será necesario ampliarlas, incluso en portátiles conpantallas de cristal líquido u PC de escritorio con pantallas de gama baja.

Aumente la imagen a tamaño real (o más) para ver la imagen “pura”, tal comoe escaneó.

AAAAAPPPPPARAARAARAARAARATTTTTOSOSOSOSOS DISTINTDISTINTDISTINTDISTINTDISTINTOSOSOSOSOS, , , , , RESOLUCIÓNRESOLUCIÓNRESOLUCIÓNRESOLUCIÓNRESOLUCIÓN DISTINTDISTINTDISTINTDISTINTDISTINTAAAAA

Sea como sea su modo de digitalización, utilice una resoluciónresoluciónresoluciónresoluciónresolución de escaneadode 300 ppp para aplicaciones normales. Cuando el documento que vaya a escaneartenga un tipo de letra pequeño (menos de 10 puntos), o sea de mala calidad,utilice mejor una resolución más alta, de 400 ppp.

Readiris lee tamaños de punto tamaños de punto tamaños de punto tamaños de punto tamaños de punto entre 6 y 72 puntos (0,21 y 2,54 cm.).

Readiris reconoce asimismo “letras descendentesletras descendentesletras descendentesletras descendentesletras descendentes” (“drop letters”),mayúsculas de gran tamaño que cubren varias líneas. (Desde luego, éstas nopueden ser superiores a 72 puntos.) Incluso se reconocen las mayúsculasdescendentes invertidas...

chapter2.pmd 3/04/2006, 15:4484

Page 105: Read Iris

2 - 85

MANUAL DEL USUARIO

Dado que el OCR óptimo requiere una resolución de entre 300 y 400 ppp,Readiris le avisa cuando escanea imágenes con una resolución inferior a 200 pppo superior a 800 ppp. Entre otras cosas, la resolución de imagen de estos archivosse marca en color rojo en el panel de documentos.

Readiris puede corregir los imágenes escaneadas con demasiados detalles.Para llevar a cabo la corrección, active la opción "Optimizar la Resolución parael OCR" en la configuración del escaneado. Siempre que la resolución de laimagen de los escaneados supere los 600 ppp, la resolución se reduce para elproceso del OCR.

Existen otras maneras de evitar este aviso: cuando lee faxesfaxesfaxesfaxesfaxes (que presentanuna resolución de 100 o 200 ppp), cuando genera imágenes con una cámaradigital (cuya resolución se desconoce) y cuando abre imágenes en las que elencabezamiento del archivo contiene una resolución incorrecta. Para procesareste tipo de imágenes sin ningun problema, active la opción "Procesar como 300ppp". Este parámetro sirve para digitalizar directamente y abrir imágenespreviamente escaneadas.

chapter2.pmd 3/04/2006, 15:4485

Page 106: Read Iris

2 - 86

Cuando digitaliza imágenes con una cámara digital cámara digital cámara digital cámara digital cámara digital en lugar de un escáner,es imprescindible activar una opción específica. (Este parámetro sirve otra vezpara digitalizar directamente y abrir imágenes previamente escaneadas.)

Así, optimiza la imagen antes de reconocerla. Existen varias dificultades en elmomento de digitalizar con cámaras digitales: generan imágenes con bajaresolución - incluso cuando dispone la cámara muy cerca al documento - y entodo caso no se conoce la resolución de la imagen.

Incluso así, le recomendamos que active el modo de reconocimiento preciso,mediante el botón "Idioma", para reconocer correctamente estas imágenes conéxito.

Tendrá que tener en cuenta algunos elementos delicados a la hora de digitalizarcorrectamente imágenes escaneadas con una cámara digital.

Antes de todo, seleccione la resolución de imagen más alta posible. Genere,por ejemplo, imágenes con una resolución de 2.600 x 2.000 con una cámara de 5MP que también pueda hacer fotos con resoluciones de 2.100 x 1.550 y 1.600 x

chapter2.pmd 3/04/2006, 15:4486

Page 107: Read Iris

2 - 87

MANUAL DEL USUARIO

1.200. Luego, active el modo “macro” de su cámara para los primeros planos -siempre es así cuando fotografia documentos. (Este modo ha sido diseñado paracapturar flores, insectos, etc.) En el caso contrario las imágenes serían imprecisase ilegibles.

Utilice el zoom óptico e ignore el digital. Cuando se utiliza el zoom óptico, lalente amplia la imagen. Como resultado, la calidad de la imagen aumenta. Porcontra, el zoom digital reduce la resolución y la calidad de la imagen: las técnicasde interpolación se aplican para añadir “falsos” píxeles de manera artificial a lainstantánea.

Tendrá que limitarse a pequeñas compresiones o a ninguna: una compresiónimportante reduce la nitidez del texto digitalizado. Puede agrandecer para poderrecortar sus documentos - algunas cámaras vienen incluídas con un programapara restablecer la fotografía orginal (“photo stitching”), pero no es útil paracapturar un documento.

Mantenga la cámara directamente encima del documento para evitar capturarel documento bajo un cierto ángulo. Sin embargo, evite que la sombra del aparatoo de su mano sea proyectada en el documento. Genere imágenes estables. Piensetambién en colocar su cámara en un trípode cuando sea necesario.

Desactive el flash cuando fotografia papel brillante, o sino puede ser que laimagen sea demasiado pálida. Generalmente, mejor vale adaptar el brillo y contraste

chapter2.pmd 3/04/2006, 15:4487

Page 108: Read Iris

2 - 88

al entorno - luz del día, luz de una lámpara, luz de neón, etc. (Algunas cámaraspuede ser calibradas filmando un documento blanco.)

Para comprobarlo, abra la imagen DIGITAL.JPG en la carpeta de imágenesde Readiris y ejecute el reconocimiento.

chapter2.pmd 3/04/2006, 15:4488

Page 109: Read Iris

2 - 89

MANUAL DEL USUARIO

GGGGGUARDARUARDARUARDARUARDARUARDAR LALALALALA CONFIGURACIÓNCONFIGURACIÓNCONFIGURACIÓNCONFIGURACIÓNCONFIGURACIÓN PREDETERMINADAPREDETERMINADAPREDETERMINADAPREDETERMINADAPREDETERMINADA

Defina correctamente todos los parámetros de escaneado y haga clic en laopción "Guardar la Configuración por Defecto" del menú "Archivo" parasobrescribir la configuración por defecto por la configuración actual. (En casoque esta configuración no fuese tampoco la adecuada, siempre podrá restablecerla configuración inicial con la opción correspondiente...)

chapter2.pmd 3/04/2006, 15:4489

Page 110: Read Iris

2 - 90

Los archivos de configuración no sólo contienen la configuración configuración configuración configuración configuración del escáner,sino que también determinan si desea utilizar el aprendizaje interactivo, el idiomay las propiedades de los documentos, qué modos de reconocimiento y de salida seutilizarán - por ejemplo, enviar el texto a la aplicación WordPad -, etc. En pocaspalabras, todos los ajustes operativos de Readiris se almacenan en los archivosde configuración.

GGGGGUARDARUARDARUARDARUARDARUARDAR PROPIEDADESPROPIEDADESPROPIEDADESPROPIEDADESPROPIEDADES ESPECÍFICASESPECÍFICASESPECÍFICASESPECÍFICASESPECÍFICAS

Obviamente, la configuración predeterminada se utilizará cada vez que seinicie el programa, pero puede guardar propiedades específicas para no tener queredefinir estos parámetros de funcionamiento. Las opciones "GuardarConfiguración" y "Cargar Configuración" del menú "Archivo" se encargan deello.

He aquí un ejemplo: si periódicamente debe reconocer documentos en españolcon un diseño específico, le recomendamos que cree un archivo de configuraciónpara dicho tipo de documento. A continuación seleccione "Español" como idiomadel documento, cargue una división en zonas concreta para no tener que trazarlas mismas ventanas a cada página, desactive el aprendizaje, pero active undiccionario de fuentes en modo “de lectura” porque algunas tipos de fuentes seusan de forma sistemática, etc.

Si no está seguro de la configuración actual, no necesita pasar revista a todoslos menús y opciones para descubrirlas. Utilice la opción "Información" del menú"Archivo" para obtener una sinopsis de las mismas.

chapter2.pmd 3/04/2006, 15:4490

Page 111: Read Iris

2 - 91

MANUAL DEL USUARIO

Este mando también muestra la inoformación que se puede encontrar en elpanel de documentos para todas las páginas.

EEEEESCANEARSCANEARSCANEARSCANEARSCANEAR DOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOS

Ahora que el escáner está correctamente configurado, vamos a empezar aescanear documentos. Hay algunos aspectos de los que debe estar informado.

En primer lugar, tenga cuidado con la inclinación de las líneas. Aunque elanálisis de página y el reconocimiento admiten cierto grado de inclinación, ladivisión en ventanas y el OCR de una página pueden verse dificultados si lainclinación de las líneas es excesiva. Una pequeña inclinación (menos de 0,5º) notiene ninguna importancia: la fidelidad del OCR no se ve afectada.

El mando "Restablecimiento de Páginas" del botón "Opciones" (y del menú"Configuración") determina si las páginas escaneadas con alguna inclinación van

chapter2.pmd 3/04/2006, 15:4491

Page 112: Read Iris

2 - 92

a restablecerserestablecerserestablecerserestablecerserestablecerse, se arreglarán automáticamente. (Las pequeñas inclinacionesno se tendrán en cuenta.) Esta opción se encuentra desactivada por defecto.

Si ha olvidado activar esta opción, utilice el botón "Restablecer la Página" dela barra de herramientas de imagen (o la opción del mismo nombre del menú"Acción") para “rectificar” las páginas escaneadas con alguna desviación.

Este restablecimiento de líneas tarda algunos segundos, dado que, en primerlugar, se analiza la imagen para detectar el posible ángulo de inclinación.Seguidamente se recompone la imagen en color o en escala de grises (así comosu versión en blanco y negro) y, por último, vuelve a ejecutarse el análisis depágina.

Cada vez que necesite ajustar la orientación de la página, puede usar lasherramientas de rotación rotación rotación rotación rotación de la barra de herramientas de imagen. (Los mandoscorrespondientes se encuentran en el menú "Ver".) Existen tres direcciones derotación: a la izquierda, a la derecha e inversión. La rotación tarda algunos segundosen actualizar la imagen en sí y no sólo lo que se muestra en pantalla.

Sin embargo, Readiris puede corregir por usted las páginas mal orientadas.Active la opción "Detectar la Orientación de las Páginas" bajo el botón "Opciones"(o en el menú "Configuración") y Readiris orientará la página cuando sea necesario.

chapter2.pmd 3/04/2006, 15:4492

Page 113: Read Iris

2 - 93

MANUAL DEL USUARIO

Si desea comprobar cómo funciona esta opción, utilice la imagen DESKEW.JPGque se encuentra en la carpeta de imágenes de Readiris. Desactive los opciones"Restablecemiento de Páginas" y "Detectar Orientación de las Páginas" antes deabrir la imagen y deje que Readiris restablezca la Torre de Pisa... tal como laconocemos.

chapter2.pmd 3/04/2006, 15:4493

Page 114: Read Iris

2 - 94

Recuerde también que el panel de documentos indica qué ángulo de inclinaciónse corrigió y qué rotaciones se llevaron a cabo.

chapter2.pmd 3/04/2006, 15:4594

Page 115: Read Iris

2 - 95

MANUAL DEL USUARIO

AAAAAJUSTEJUSTEJUSTEJUSTEJUSTE DEDEDEDEDE LASLASLASLASLAS IMÁGENESIMÁGENESIMÁGENESIMÁGENESIMÁGENES ESCANEADASESCANEADASESCANEADASESCANEADASESCANEADAS

Como ya hemos indicado, las imágenes en color o escala de grises setransforman automáticamente en imágenes en blanco y negro mediante avanzadasrutinas inteligentes. En caso de que siguiera siendo necesario, el usuario puedeafinar aún más la imagen, con vistas a un mejor OCR. Seleccione para ello laopción "Ajustar Imagen" del menú "Acción".

Cuando seleccione esta opción, se visualizará automáticamente la versión enblanco y negro de la imagen - es como si desactivara la opción "VisualizarDocumento en Color". Hay algunos conceptos de cierta complejidad, que pasamosa desarrollar con detalle seguidamente.

chapter2.pmd 3/04/2006, 15:4595

Page 116: Read Iris

2 - 96

La opción "Alisar Imagen de Color" da a las imágenes en color o escala degrises un aspecto más homogéneo y para ello “rasea”, es decir, suaviza lasdiferencias relativas de intensidad, con lo que el contraste queda más afinadoentre el primer plano - texto - y el fondo - un color, ilustraciones, etc.

Puede que este dispositivo de preprocesamiento preprocesamiento preprocesamiento preprocesamiento preprocesamiento le parezca muy técnico ydifícil de entender, pero es realmente funcional, ya que con algunos modelos deescáner se necesita esta reducción de nitidez para reconocer imágenes en colory escala de grises. A veces, el único modo de separar el texto del fondo de color

chapter2.pmd 3/04/2006, 15:4596

Page 117: Read Iris

2 - 97

MANUAL DEL USUARIO

consiste en suavizar las diferencias. Abajo tiene un ejemplo de imagen que esilegible si no se suaviza la imagen.

Se puede también suavizar las imágenes previamente escaneadas cuando secargan en la memoria.

Ocupémonos ahora del brillobrillobrillobrillobrillo. Este ajuste determina el brillo general de laimagen: cualquier oscurecimiento o aumento en el brillo de la imagen se aplica atodos los píxeles. El objetivo es deshacerse del fondo de página. Le daremos dosejemplos. En el primero, todas las zonas de la imagen son oscuras. En consecuencia,hacemos más clara la imagen para elimar el fondo de página; el primer plano (eltexto) sigue siendo lo suficientemente oscuro como para que el proceso debinarización lo detecte. En el segundo ejemplo, tenemos una imagen tan clara que

chapter2.pmd 3/04/2006, 15:4597

Page 118: Read Iris

2 - 98

en la imagen escaneada ni se ve el texto que está en primer plano, por lo queoscurecemos la imagen para que el texto sea legible.

El contraste contraste contraste contraste contraste determina la diferencia relativa entre las zonas más claras y lasmás oscuras de la imagen. (El texto generalmente es más oscuro que el fondo,siendo el caso contrario cuando se trata con texto invertido.) El objetivo es hacerque las formas de los caracteres se distingan claramente de los fondos (de color).He aquí un ejemplo en el que se debe aumentar el contraste, dado que laconfiguración por defecto resulta en caracteres rotos.

Observe que no se ejecuta ningún ajuste de imagen hasta que no haga clic enel botón "Aplicar". Al pulsar "Aceptar" se ejecutará el ajuste y se cerrará laventana. Éste es un ejemplo en el que se ha aclarado drásticamente una imagen

chapter2.pmd 3/04/2006, 15:4598

Page 119: Read Iris

2 - 99

MANUAL DEL USUARIO

en blanco y negro. ¡Naturalmente, sin pretender en ningún momento que el OCRsea de calidad!

Estas opciones conciernen a las imágenes en color y en escala de grises,mientras que la última de ellas, "Limpiar", concierne exclusivamente a las imágenesen blanco y negro. Por “limpieza” entendemos la eliminación de esa “suciedad”(motas) que ocasionan algunos píxeles innecesarios.

chapter2.pmd 3/04/2006, 15:4599

Page 120: Read Iris

2 - 100

Asegúrese de no borrar motas demasiado grandes, pues si no podría eliminartambién los puntos de las "i", o partes de letras obtenidas mediante impresorasmatriciales, etc.

Para conseguir la mejor calidad de imagen con vistas a un buen OCR, coloquela ventana de ajuste de imagen donde no moleste para apreciar los arreglos quevaya haciendo. Seguidamente, ajuste los parametros y vaya pulsando "Aplicar"hasta conseguir una imagen clara y nítida.

DDDDDEJEEJEEJEEJEEJE QUEQUEQUEQUEQUE ELELELELEL ASISTENTEASISTENTEASISTENTEASISTENTEASISTENTE TRABAJETRABAJETRABAJETRABAJETRABAJE PORPORPORPORPOR USTEDUSTEDUSTEDUSTEDUSTED

Pasemos ahora a capturar documentos. En lugar de configurar uno a uno losparámetros, utilizaremos el asistente de OCRasistente de OCRasistente de OCRasistente de OCRasistente de OCR. Éste es un sistema muy sencillopara reconocer páginas.

Haga clic en el botón "Asistente OCR" de la barra de herramientas principal(o seleccione la opción "Asistente OCR" del menú "Acción").

El asistente lo ayudará durante el proceso de reconocimiento. Bastará conresponder a unas simples preguntas para obtener rápidos resultados.

chapter2.pmd 3/04/2006, 15:45100

Page 121: Read Iris

2 - 101

MANUAL DEL USUARIO

Observe que el asistente de OCR se ejecuta cada vez que inicia Readiris;para que esto no ocurra, desactive la opción "Activar el Asistente al Iniciar", queaparece en la primera pantalla del asistente. (También puede desactivarlo usandola misma opción del menú "Configuración".)

RRRRREADIRISEADIRISEADIRISEADIRISEADIRIS REPRODUCEREPRODUCEREPRODUCEREPRODUCEREPRODUCE ELELELELEL DISEÑODISEÑODISEÑODISEÑODISEÑO DEDEDEDEDE SUSSUSSUSSUSSUS DOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOSDOCUMENTOS

El asistente de OCR realiza el proceso de reconocimiento de formaprácticamente automática, ¡pero el reconocimiento “automático” no debeconfundirse con el formato automático! “Formato automático” significa queReadiris reproduce una copia facsímil copia facsímil copia facsímil copia facsímil copia facsímil del documento escaneado, aplicando elformato de las palabras, párrafos y páginas del documento original.

chapter2.pmd 3/04/2006, 15:45101

Page 122: Read Iris

2 - 102

Se utilizan tipos de letra iguales a los del documento original (serif y sans serif,proporcionales y fijos, normales y condensados, superíndice y subíndice). Semantienen los tamaños y estilos (negrita, cursiva, subrayado, superíndice ysubíndice) durante el reconocimiento. Se reproducen las tabulaciones y lajustificación (izquierda, centrada, derecha o justificada) de cada bloque de texto.Lo mismo ocurre con las viñetas y la numeración. Todas las direcciones de correoelectrónico y de páginas web serán detectadas y se establecerán comohipervínculos en el texto creado. La colocación de columnas, bloques de texto ygráficos será la misma del documento original.

En otras palabras, Readiris le permite archivar una copia fiel de sus documentos,¡pero ahora en forma de archivo de texto digital, modificable y compacto, enlugar de una imagen escaneada!

Así pues, la clasificación de ventanas sólo se aplica parcialmente al realizar el“formato automático”. Es decir, ¡puede incluir y excluir zonas, pero cualquierreclasificación no será tenida en cuenta!

Para familiarizarse con esta función, abra el archivo de imagenAUTOFORMAT.JPG, que se encuentra en la carpeta de imágenes de Readiris.

chapter2.pmd 3/04/2006, 15:45102

Page 123: Read Iris

2 - 103

MANUAL DEL USUARIO

Haga clic en el botón "Formato" de la barra de herramientas principal y envíeel resultado del reconocimiento a Microsoft Word o bien seleccione el formatoWord (*.doc), WordML (*.xml) o RTF (“Rich Text Format”). En segundo lugar,seleccione "Volver a Crear el Documento Original" como opción de formato. (Laopción "Fusionar Líneas en los Párrafos" está activada por defecto para realizar

chapter2.pmd 3/04/2006, 15:45103

Page 124: Read Iris

2 - 104

el ajuste de líneas dentro de los párrafos.) (El mensaje emergente del botón"Formato" indica el modo de salida y el formato de texto seleccionados.)

Que la reconstrucción del formato sea posible o no depende del modo desalida. Algunos formatos “pobres” que generan texto “simple”, como Texto(ANSI), Texto formato MS-DOS (ASCII), etc., no pueden utilizar los códigosavanzados de formato y, por consiguiente, no pueden ofrecer un formatoautomático. Por otro lado, el formato PDF Adobe Acrobat se diseñó para copiarel aspecto de los documentos. Así pues, los documentos PDF implican, pornaturaleza, el formato automático.

Al abrir el texto reconocido con un tratamiento de textos, el texto tiene estaapariencia, sin intervención alguna del usuario. (Para ver este efectocorrectamente, el modo “WYSIWIG” del procesador de textos, denominadogeneralmente “diseño de página”, se activa automáticamente.)

chapter2.pmd 3/04/2006, 15:45104

Page 125: Read Iris

2 - 105

MANUAL DEL USUARIO

En pocas palabras, Readiris no sólo reconoce sus textos, sino que puede tambiénformatearlos. Ahora, el OCR ya no es un simple reconocimiento de textos, ¡sinoque también es un auténtico reconocimiento de documentosreconocimiento de documentosreconocimiento de documentosreconocimiento de documentosreconocimiento de documentos!

chapter2.pmd 3/04/2006, 15:45105

Page 126: Read Iris

2 - 106

UUUUUTILICETILICETILICETILICETILICE COLUMNASCOLUMNASCOLUMNASCOLUMNASCOLUMNAS ENENENENEN LUGARLUGARLUGARLUGARLUGAR DEDEDEDEDE CUADROSCUADROSCUADROSCUADROSCUADROS

La opción de formato "Utilizar Columnas y No Cuadros" determina cómo serealiza el “formato automático”: los bloques de texto, las tablas y los gráficospueden almacenarse en cuadros o en columnascolumnascolumnascolumnascolumnas que pueden editarse.

Los “cuadros” son contenedores de texto separados que sirven para colocarvarios bloques de texto, de gráficos y de tablas en una página. El texto en columnaspasa de forma natural de una columna a la siguiente y es mucho más fácil deeditar.

Imaginemos ahora que en el documento escaneado hay columnas reales.Cuando el sistema es incapaz de detectar columnas en el documento original,¡este modo de formato utiliza igualmente cuadros por defecto!

Si quiere probarlo, puede utilizar la imagen COLUMNS.TIF de la carpeta deimágenes de Readiris.

chapter2.pmd 3/04/2006, 15:45106

Page 127: Read Iris

2 - 107

MANUAL DEL USUARIO

La opción "Insertar Saltos de Columna" mejora la recreación de columnas:dermina si desea o no insertar un código de fin de columna entre ellas. Con loscódigos de fin entre columnas, cualquier texto que se edite, añada o borrepermanecerá dentro de su columna; ningún texto fluirá de forma automática a la

chapter2.pmd 3/04/2006, 15:45107

Page 128: Read Iris

2 - 108

siguiente columna. Aquellos textos que vayan después de un espacio entrecolumnas serán colocados al principio de la columna siguiente.

Active esta opción si quiere conservar los fino de columnas en el mismo lugaren el que se hayan detectado en el documento reconocido - independientementede la edición de texto que se realice después del OCR. En periódicos y revistas,las columnas de una página se corresponden casi siempre a distintos artículos.Por lo tanto, no es buena idea permitir que el texto fluya automáticamente de unacolumna a la siguiente.

Desactive esta opción cuando haya dividido el texto en columnas: así seasegurará la fluidez natural del texto de una columna a la siguiente.

Hay un aspecto en el que puede decidir no recrear el formato del documentooriginal: el tamaño de página de los documentos que se producirán. ¿Qué queremosdecir con esto? Veamos algunos ejemplos: usted escanea páginas de tamañoCarta pero genera documentos de tamaño A4 porque considera que este formatoresulta más fácil de imprimir, ya que la impresión de documentos de tamañoCarta requiere alimentación manual. O, por ejemplo, usted es abogado y escaneadocumentos de tamaño Carta que guarda en formato Legal.

Esta es la razón por la cual Readiris le permite definir el tamaño de página queprefiera para los documentos que produce. Haga clic en el botón "Tamaño delPapel" en el cuadro de diálogo "Formato".

chapter2.pmd 3/04/2006, 15:45108

Page 129: Read Iris

2 - 109

MANUAL DEL USUARIO

Seleccione los tamaños de papel aplicables y excluidos: los tamaños de papelpreferidos se pueden utilizar para dar formato a los documentos reconocidos,mientras que los formatos excluidos no se utilizarán. Ordene los tamaños depapel aceptados: Readiris pasa por los diferentes tamaños de papel en el ordenindicado, y utiliza el primer tamaño de papel en el que pueda caber el documentoescaneado. El botón "Por Defecto" vuelve a aplicar la configuración por defecto.(¡Esto incluye su configuración de Windows!)

Recuerde que esta opción no se puede utilizar con los archivos en formatoHTML, un formato de texto pensado para Internet que no tiene formatos depágina. Tampoco es compatible con los archivos PDF, que utilizan tamaños depágina propioas para recrear con precisión el documento original.

FFFFFORMAORMAORMAORMAORMATTTTTOOOOO DEDEDEDEDE TEXTTEXTTEXTTEXTTEXTOSOSOSOSOS, 2ª , 2ª , 2ª , 2ª , 2ª PPPPPARARARARARTETETETETE

Las otras opciones de diseño son "Crear Texto Continuo" y "Conservar elFormato de Palabras y Párrafos".

chapter2.pmd 3/04/2006, 15:46109

Page 130: Read Iris

2 - 110

Como ilustra el icono de la derecha, crear texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo significa crearun texto “continuo”, sin formato. El texto será capturado, pero se ignorarátotalmente el formato. Utilice esta opción cuando necesite capturar un texto perono su diseño.

El cuerpo del texto es también lo que usted selecciona cuando reconocerápidamente una zona del texto haciendo clic con el botón derecho, y seleccionarála opción "Copiar como Texto": una vez realizado el reconocimiento, pegará ustedel cuerpo del texto en su aplicación de texto.

La opción "Conservar el Formato de Palabras y Párrafos" representa un caminointermedio: durante el reconocimiento se mantiene el formato de palabrasformato de palabrasformato de palabrasformato de palabrasformato de palabras -tipo de letra, el tamaño de letra y el estilo. Asimismo, también se mantiene elformato de párrafoformato de párrafoformato de párrafoformato de párrafoformato de párrafo - tabulaciones y justificación.

Pero no hay que confundir este formato con el formato automático “completo”:la primera opción coloca los párrafos uno tras otro y no reproduce columnas, nicopia la posición relativa de las diferentes zonas.

EEEEEXPORXPORXPORXPORXPORTTTTTARARARARAR ELELELELEL TEXTTEXTTEXTTEXTTEXTOOOOO VVVVVARIASARIASARIASARIASARIAS VECESVECESVECESVECESVECES

En realidad, podrá exportar los resultados del OCR varias veces sin tener querepetir el reconocimiento. Cambie el formato del texto y las opciones de formatocon el botón "Formato" y haga de nuevo clic en el botón "Reconocer-Guardar".En este caso, no se ejecutará OCR, a menos que haya usted definido nuevas

chapter2.pmd 3/04/2006, 15:46110

Page 131: Read Iris

2 - 111

MANUAL DEL USUARIO

ventanas o haya modificado las existentes. De lo contrario, Readiris sólo cambiaráel formato de los resultados OCR y los guardará en el nuevo formato del texto olos enviará a la aplicación de llegada que usted haya seleccionado.

Lo mismo se aplicará para cualquier otro elemento que usted cambie: cuandoañada una página a su trabajo OCR, sólo se reconocerá esa página. Si crea unanueva zona de texto en una página, sólo será reconocida esa zona antes de quelos resultados se exporten.

Por ejemplo, usted podría reconocer un documento de 10 páginas y guardarloen un archivo de Word, escanear el resumen de la primera página y enviarlo porcorreo electrónico a un compañero impaciente, escanear el anexo - una tabla - yguardar todos los resultados en un archivo HTML para colgarlo en la página webde su empresa.

GGGGGUARDARUARDARUARDARUARDARUARDAR GRÁFICOSGRÁFICOSGRÁFICOSGRÁFICOSGRÁFICOS PORPORPORPORPOR SEPSEPSEPSEPSEPARADOARADOARADOARADOARADO

En nuestro ejemplo, el gráfico se incluía en el documento reconocido; que estosea así o no, dependerá de la opción de formato "Incluir Gráficos". Los gráficosque hay en el texto se podrán volver a guardar dependiendo del modo de salida.Los formatos de texto “pobres” como Texto (ANSI), etc. no almacenan gráficos.

Aún así, con Readiris puede guardar gráficos sin llevar a cabo el reconocimientode texto. Dado que el programa Readiris genera imágenes en blanco y negro,,,,, enescala de grises o en color, con él pueden capturarse dibujos y fotografías muyfácilmente.

chapter2.pmd 3/04/2006, 15:46111

Page 132: Read Iris

2 - 112

¿Cómo? Trace una zona de gráfico alrededor de las ilustraciones, caricaturas,etc. que desee capturar. Hágalo de la misma forma que traza una ventana detexto o de tabla, pero en este caso seleccione la herramienta "Ventana de Gráfico".

A continuación elija la opción "Guardar Gráficos" en el menú "Archivo".

Se le pedirá que especifique un nombre de archivo. Determine el formatográfico que desee usar. Seleccione un formato que pueda utilizar con su softwarede retoque. Dispone de los formatos JPEG, TIFF y Zsoft Paintbrush (*.pcx).

Active la opción "Escala de Grises/Color" que permite guardar las imágenesbien en color, bien en escala de grises. Al guardar gráficos en blanco y negro enel formato TIFF, se utiliza la compresión de Grupo 4. Al guardar gráficos enescala de grises o en color en el formato TIFF, se utiliza la compresión JPEG y elusuario puede definir la calidad JPEG (nivel de compresión).

chapter2.pmd 3/04/2006, 15:46112

Page 133: Read Iris

2 - 113

MANUAL DEL USUARIO

Para enviar un gráfico al portapapeles mejor que guardar un archivo de imagen,haga clic con el ratón sobre una ventana de gráfico y seleccione la opción "Copiarcomo Gráfico": la zona del gráfico que se haya seleccionado con el ratón estálista para ser pegada.

chapter2.pmd 3/04/2006, 15:46113

Page 134: Read Iris

2 - 114

RRRRRECREARECREARECREARECREARECREAR COLUMNASCOLUMNASCOLUMNASCOLUMNASCOLUMNAS, , , , , CUADROSCUADROSCUADROSCUADROSCUADROS, , , , , ETCETCETCETCETC. . . . . DEDEDEDEDE COLORCOLORCOLORCOLORCOLOR

Readiris también ofrece otra forma de añadir color a los documentos quegenere: la opción "Conservar los Colores del Fondo" conserva los colores delfondo de página durante el proceso de reconocimiento. (Esta opción implica quese conserven también los colores del texto.)

chapter2.pmd 3/04/2006, 15:46114

Page 135: Read Iris

2 - 115

MANUAL DEL USUARIO

Siempre que el documento original tuviese algún color de fondo, el resultadoserá un color de fondo uniforme en cada párrafo. Esta función es compatible conlos formatos de salida Word (*.doc), RTF (“Rich Text Format”), WordML (*.xml)y HTML. Sin embargo, recuerde que, con esta función, no se conservarán losdetalles de, por ejemplo, una fotografía a página completa ubicada en el fondo deun documento. (Reconozca la imagen de muestra COLORS.JPG para hacer unaprueba...)

chapter2.pmd 3/04/2006, 15:46115

Page 136: Read Iris

2 - 116

CCCCCONSERONSERONSERONSERONSERVVVVVARARARARAR LOSLOSLOSLOSLOS COLORESCOLORESCOLORESCOLORESCOLORES DELDELDELDELDEL TEXTTEXTTEXTTEXTTEXTOOOOO

Y hay aún otra forma de añadir color a los documentos que genere: puedeconserver los colores del textocolores del textocolores del textocolores del textocolores del texto.

La opción de formato "Conservar los Colores del Texto" para preservar loscolores originales del texto durante todo el proceso de reconocimiento: apareceráun título de color rojo en el documento generado, etc.

chapter2.pmd 3/04/2006, 15:46116

Page 137: Read Iris

2 - 117

MANUAL DEL USUARIO

chapter2.pmd 3/04/2006, 15:46117

Page 138: Read Iris

2 - 118

LLLLLECTURAECTURAECTURAECTURAECTURA DEDEDEDEDE FFFFFAXESAXESAXESAXESAXES YYYYY RECONOCIMIENTRECONOCIMIENTRECONOCIMIENTRECONOCIMIENTRECONOCIMIENTOOOOO DIFERIDODIFERIDODIFERIDODIFERIDODIFERIDO

Al guardar imágenes en archivos graficos se abre otra posibilidad: puede guardarla página completa y realizar un reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido más adelante. Esofue lo que hicimos con las imágenes escaneadas para nuestro curso.

Escanee simplemente el documento y seleccione la opción "Guardar Toda laPágina como Imagen" del menú "Archivo" para guardar una única página. Elprograma le pedirá en qué formato desea guardar la página: PDF, JPEG, TIFF oZSoft Paintbrush (*.pcx).

Seleccione la opción "Guardar todas las páginas como imagen" para guardarun documento de múltiples páginas. Dispondrá de dos formatos de archivo: PDFy TIFF de múltiples páginas. Pero también puede seleccionar los formatos desalida PDF Imagen o TIFF con el botón "Formato".

chapter2.pmd 3/04/2006, 15:46118

Page 139: Read Iris

2 - 119

MANUAL DEL USUARIO

(La exclusión de páginas también se aplica al reconocimiento: cuando pongaen marcha el proceso de OCR, las páginas excluidas (temporalmente) no seincluirán en el archivo de imagen de multiples páginas.)

Ahora puede seleccionar el disco como origen de la imagen y abrir el archivográfico con el botón "Abrir" (o con la opción equivalente del menú "Acción"). (Siutiliza la opción "Abrir" del menú "Archivo", ni siquiera tiene que actualizar elorigen de la imagen.)

Como el programa reconoce imágenes en color, en escala de grises y enblanco y negro, Readiris le permite abrir documentos PDF de Adobe Acrobat yarchivos de imagen con los formatos fax DCX (una versión multipágina del formatoPaintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (nocomprimidos o comprimidos con los métodos LZW, PackBits, Grupo 3, Grupo 4 oJPEG), TIFF de múltiples páginas, mapas de bits de Windows (*.bmp) y ZSoftPaintbrush (*.pcx).

Esta capacidad resulta especialmente útil para convertir sus faxes faxes faxes faxes faxes en archivosde texto editables. Readiris usa su máxima capacidad para reconocer faxes. Elprograma detecta las resoluciones típicas de fax - 100 x 200 ppp (“calidad nor-mal”), 200 x 200 ppp (“calidad fina”) y 200 x 400 ppp (“calidad superfina”) - y

chapter2.pmd 3/04/2006, 15:46119

Page 140: Read Iris

2 - 120

preprocesa automáticamente estas imágenes para asegurar unos resultados deOCR óptimos.

Sin embargo, de ser posible, pida a sus corresponsales que envíen sus faxescon calidad “fina”, puesto que dichos faxes darán mejores resultados de OCR.Nuestro secundo consejo ya le resultará familiar: active el modo de reconocimientopreciso, que encontrará haciendo clic en el botón "Idioma", y podrá reconocer losfaxes con éxito.

No olvide que puede abrir imágenes directamente desde el Explorador deWindows haciendo clic con el botón derecho del ratón en un archivo gráfico yseleccionando la opción "Reconocer" del menú contextual. También puedearrastrarlos con el ratón desde el Explorador de Windows hasta la zona de imágeneso sobre el icono de Readiris, y se abrirán automáticamente.

RRRRRECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTOOOOO DEDEDEDEDE TTTTTABLASABLASABLASABLASABLAS

Hasta ahora hemos reconocido textos y faxes y hemos guardado gráficos.Ahora procesaremos una tabla. Coja una tabla con cifras y escanéela, o bienabra la imagen de muestra TABLES.JPG que se encuentra en la carpeta deimágenes de Readiris.

En realidad, la imagen TABLES.JPG contiene dos tablas ¡y no es unacoincidencia! El análisis de página las divide en ventanas de tabla y Readiris lasreconstruirá reproduciéndolas celda a celda en un programa de hoja de cálculo oinsertando una tabla en el archivo del procesador de textos que usted prefiera.

Daremos algunos ejemplos. Empezaremos con la tabla con cuadrícula o“enmarcada”; es decir, la que tiene bordes alrededor de las celdas.

chapter2.pmd 3/04/2006, 15:46120

Page 141: Read Iris

2 - 121

MANUAL DEL USUARIO

Utilice el botón "Ordenar" para seleccionar la tabla y ejecute el reconocimientocon cualquier nivel de formato. Da igual que cree cuerpo de texto, que conserveel formato de las palabras y los párrafos o que recree el documento fuente: latabla se recreará. Abra un procesador de textos y verá el resultado: ¡las célulasy los bordes han sido creados por Readiris uno a uno! (Naturalmente, tambiénpuede incluir párrafos de texto normales en este archivo.)

chapter2.pmd 3/04/2006, 15:46121

Page 142: Read Iris

2 - 122

Pasemos ahora al ejemplo de las tablas “sin cuadrícula” - o sea, las que notienen bordes alrededor de las celdas. ¡Observe que, pese a todo, el análisis depágina la detecta! Otro aspecto muy interesante de esta tabla es que su contenidoes totalmente numérico.

chapter2.pmd 3/04/2006, 15:46122

Page 143: Read Iris

2 - 123

MANUAL DEL USUARIO

Para una precisión óptima de reconocimiento, limite el reconocimiento a lossímbolos numéricos símbolos numéricos símbolos numéricos símbolos numéricos símbolos numéricos con el botón "Idioma". (El modo numérico no esestrictamente numérico, incluye los símbolos “0” a “9”, “+”, “*”, “/”, “%”, “,”(coma), “.” (punto), “(”, “)”, “-”, “=”, “$”, “£”, “¥” y el símbolo “•”.)

chapter2.pmd 3/04/2006, 15:47123

Page 144: Read Iris

2 - 124

Dado que esto sólo puede hacerlo cuando la tabla no contiene ningún carácteralfabético - de lo contrario, las porciones de texto no se reconocerían correctamente- , podemos activar el modo numérico solamente para reconocer esta tabla, perono el resto del documento. (En consecuencia, utilice el botón "Ordenar" paraseleccionar la tabla.)

En esta ocasión, enviaremos directamente el resultado del reconocimiento alprograma de hoja de cálculo Microsoft Excel. Seleccionaremos, pues, Excel comoaplicación de salida mediante el botón "Formato".

La hoja de cálculo se inicia automáticamente y el resultado es idéntico al de latípica estructura de tabla con filas y columnas, en la que podrá procesar datosinmediatamente.

chapter2.pmd 3/04/2006, 15:47124

Page 145: Read Iris

2 - 125

MANUAL DEL USUARIO

Puede ocurrir que el análisis de página a veces no detecte como tal algunatabla sin cuadrícula y por tanto no la sitúe en una zona de tabla. Esto se debe aque el espacio entre columnas es muy amplio. Readiris pretende de esta maneraevitar la posible confusión con bloques de texto en los que haya columnas y notablas. Para trazar una ventana de tablas manualmente, haga clic en la herramienta"Ventana de Tabla" de la barra de herramientas de imagen y siga el procedimientohabitual. Una vez más, la etiqueta emergente del botón le indicará el número deventanas de tabla.

En los dos ejemplos anteriores, seleccionamos la primera tabla y, a continuación,la segunda, con el botón "Ordenar" para limitar el reconocimiento a los datosrequeridos. Tuvimos que excluir la otra tabla y cualquier texto que esté “alrededor”de las tablas. De hecho, este paso manual no es necesario cuando generamosresultados en formato SpreadsheetML, el nuevo formato de tabla basado en XMLde Microsoft Office 2003. (Podemos hacerlo enviando los resultados delreconocimiento a Microsoft Excel 2003 y generando archivos SpreadsheetML.)

chapter2.pmd 3/04/2006, 15:47125

Page 146: Read Iris

2 - 126

Algunas opciones sólo son aplicables a este formato de tabla.

La opción "Ignorar Todo Texto Fuera de Tablas" guarda las tablas e ignora elresto de resultados del reconocimiento. Todos los datos del interior de las tablasse capturan, mientras que los datos situados fuera de la(s) tabla(s) - bloques detexto, gráficos, códigos de barras, etc. - se ignoran con este modo de salida.Siempre que las zonas de tabla estén correctamente definidas, no importa quéventanas detecta el análisis de página.

Con esta opción, puede deshacerse del texto situado alrededor de las tablas demanera instantánea, sin necesidad de realizar operaciones manuales. Pero, incluso

chapter2.pmd 3/04/2006, 15:47126

Page 147: Read Iris

2 - 127

MANUAL DEL USUARIO

así, aún tenemos dos tablas en la misma página. ¿Podemos guardarlas por separadosin realizar más operaciones adicionales? ¡Claro que sí! Active la opción deSpreadsheetML "Crear una Hoja de Cálculo por Tabla" para colocar cada tablaen una hoja independiente. Cuando el texto reconocido en el exterior de las tablasse incluye, lo encontrará en otra hoja; los hipervínculos le permitirán saltar deltexto a las tablas y viceversa de manera instantánea.

Si el documento reconocido contiene varias páginas, verá que esta estructurase repite en cada página.

La opción alternativa es "Crear una Hoja de Cálculo por Página", que haceque se cree una sola hoja por cada página escaneada. Si una página contienetablas y texto, todo se colocará en la misma hoja de cálculo. Tenga en cuenta quesólo las cifras situadas dentro de las tablas se codificarán como números, y siempreque la opción "Convertir Cifras en Números" esté activada. El texto situado dentroy fuera de las tablas sigue siendo... texto.

chapter2.pmd 3/04/2006, 15:47127

Page 148: Read Iris

2 - 128

La opción "Convertir Cifras en Números" codifica las cifras reconocidas comonúmeros. Como consecuencia, es posible ejecutar operaciones aritméticas enestas celdas. Las celdas de texto (en cualquier tabla) siguen siendo lo que eran -texto. (Excel ejecuta operaciones matemáticas - calcular sumas, promedios, etc.- exclusivamente en datos codificados como números. Dentro de Excel, sólo seañade texto para aumentar la claridad de los datos y para imprimir.)

Asimismo, Readiris sustituye las comas por puntos y viceversa. Vamos a verun ejemplo: usted exporta una tabla en inglés (o inglés de EE.UU.) a un PC en elque la configuración internacional es español. Readiris reconoce "1.....25" y"1,,,,,000,,,,,000" correctamente, pero recodifica los números como "1,,,,,25" y "1.....000.....000"en la hoja de cálculo. (En caso que tenga dudas acerca de la configuración de susistema, compruebe la configuración regional de Windows (en el "Panel de Con-trol") para ver cómo representarán los idiomas, las fechas, las horas y los númerossus programas compatibles con datos internacionales.)

Tenga también en cuenta que la opción "Conservar los Colores del Texto" esaplicable al formato SpreadsheetML, del mismo modo que la opción de formato"Conservar los Colores del Fondo". En otras palabras, puede recrear los coloresdel texto y el color de fondo de cada celda.

RRRRRECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTECONOCIMIENTOOOOO DEDEDEDEDE TEXTTEXTTEXTTEXTTEXTOSOSOSOSOS ESCRITESCRITESCRITESCRITESCRITOSOSOSOSOS AAAAA MANOMANOMANOMANOMANO

Hasta ahora hemos reconocido documentos escaneados, tablas, faxes,instantáneas tomadas con una cámara digital, hemos guardado gráficos y hemos

chapter2.pmd 3/04/2006, 15:47128

Page 149: Read Iris

2 - 129

MANUAL DEL USUARIO

convertido documentos PDF. Sin embargo, Readiris tiene aún otra funcionalidad:el reconocimiento de textos escritos a mano.

En realidad, deberíamos hablar de textos manuscritos y no escritos a mano. Eltérmino “escritura a mano” se utiliza para describir un texto continuo escrito amano, en “cursiva”. Los símbolos que forman una palabra o una cadena decaracteres se tocan, por lo que es imposible saber dónde termina un símbolo ydónde empieza otro. En los “manuscritos”, las “letras de palo seco” (“block let-ters”) están separadas entre ellas, por lo que el programa de reconocimientopuede aislar más fácilmente los caracteres individuales.

Es necesario utilizar software muy especializado - software de “ICR” (“Intel-ligent Character Recognition”, reconocimiento inteligente de caracteres) - parareconocer los símbolos manuscritos. ¡Esta potente tecnología de ICR de I.R.I.S.se basa en más de un millón de muestras de escritura! Readiris es compatible contodos los estilos de escritura naturales, ya sean americanos o europeos. No requiereningún estilo impuesto.

El reconocimiento de textos manuscritos se limita a los numerales (0-9), lasmayúsculas (A-Z) y los signos de puntuación “,” (coma), “.” (punto) y “-” (guión).

¿Significa esto que sólo puede tomar notas en inglés? No, también puedeescribir notas en español, francés, alemán, italiano, etc. siempre que no escribaacentos ni diéresis en los caracteres en mayúscula. Por ejemplo, Readiris noreconocerá “TÉLÉCOPIE À 4H”, “PÜNKTLICH IN ÖSTERREICH” o “PIÙQUALITÀ”, pero sí que reconocerá “TELECOPIE A 4H.”, “PUENKTLICHIN OESTERREICH” y “PIU QUALITA”. Aun así, no puede tomar notas engriego, ruso, etc.: ¡sólo se reconoce el alfabeto latino!

Si los resultados obtenidos distan de ser óptimos puede utilizar el patrón deescritura optimizado de I.R.I.S. y adaptar su estilo de escritura. Consulte la ayudaen línea de Readiris para descubrir las reglas de escritura. Escriba las mayúsculas

chapter2.pmd 3/04/2006, 15:47129

Page 150: Read Iris

2 - 130

con claridad, con trazos regulares, de modo que su escritura manual se parezca lomáximo posible a los caracteres impresos. (¡Tenga especial cuidado al escribirlas letras A, G y Q!)

Unos pocos y sencillos consejos pueden enseñarle por qué se producen lassustituciones y cómo evitarlas. El patrón de escritura en blanco de I.R.I.S. puedeutilizarse como “plantilla” a página completa en la que escribir las letras de paloseco con un espaciado regular y con el tamaño adecuado. Puede encontrar elpatrón en blanco para reimprimir y editar en el CD-ROM de Readiris.

chapter2.pmd 3/04/2006, 15:47130

Page 151: Read Iris

2 - 131

MANUAL DEL USUARIO

Ahora ya sabemos cómo podemos tomar notas en una reunión de modo quedespués las pueda leer nuestro ordenador. ¿Qué dedemos hacer para poderreconocerlas después con Readiris? Trace una ventana de manuscrito alrededordel texto manuscrito en cuestión y ejecute el reconocimiento. (Puede probarlocon la imagen de muestra HANDPRINTING.TIF.)

chapter2.pmd 3/04/2006, 15:47131

Page 152: Read Iris

2 - 132

Las características del documento - idioma, tipo de fuente, ancho de loscaracteres - no se tienen en cuenta en los textos manuscritos. El usuario estálimitado al juego de caracteres inglés - ¡o, mejor dicho, “latino”! - básico de letras(mayúsculas) de palo seco. Tampoco se utiliza el aprendizaje interactivo: elaprendizaje no tiene demasiado sentido en un contexto en el que todo el mundotiene su propio estilo de escribir. (Tal como hemos indicado anteriormente, latecnología de ICR de I.R.I.S. se basa en más de un millón de muestras deescritura...)

chapter2.pmd 3/04/2006, 15:47132

Page 153: Read Iris

2 - 133

MANUAL DEL USUARIO

LLLLLECTURAECTURAECTURAECTURAECTURA DEDEDEDEDE BARRASBARRASBARRASBARRASBARRAS YYYYY ESPESPESPESPESPACIOSACIOSACIOSACIOSACIOS

¡Y es que Readiris también lee códigos de barras! Los códigos de barras queaparecen en las imágenes escaneadas se pueden leer e incluir como datosreconocidos en el interior de los documentos generados.

chapter2.pmd 3/04/2006, 15:47133

Page 154: Read Iris

2 - 134

Los códigos de barras están formados por barras paralelas con espacios entreellas. Combinaciones predefinidas de barras y espacios representan caracteresespecíficos. Hay varios estándares o “simbologías” de códigos de barras. Readirises compatible con todas las simbologías de códigos de barras más utilizadas.

Sólo tienen suficiente calidad los códigos de barras imprimidos con impresorasláser o de inyección de tinta. Excluya los códigos de barras imprimidos conimpresoras matriciales: no tienen suficiente contraste y su resolución acostumbraa ser como máximo de 60 ppp. Readiris reconoce mejor los códigos de barrascon un buen contraste; las barras negras sobre un fondo blanco dan los mejoresresultados. La mayoría de tipos de códigos de barras requieren una “zonatranquila” alrededor del código. Los códigos de barras no dan nunca resultadosparciales: la falta de una barra, la falta de un carácter de inicio o de final o undígito de control incorrecto siempre dará un error de lectura, un resultado nulo.

Trace una ventana de código de barras alrededor de los códigos de barras - elanálisis de página no los detecta - y ejecute el reconocimiento. Readiris leerá loscódigos de barras y los incluirá en el texto resultante. También puede hacer cliccon el botón derecho del ratón sobre una zona de código de barras y seleccionarel mando "Copiar como Datos" del menú contextual; Readiris leerá el código debarras y lo enviará al portapapeles... (Los caracteres de control de algunosestándares se verifican pero no se incluyen en el resultado de la lectura.) Laimagen de muestra BARCODE.TIF puede servirle para hacerse una idea másclara de esta función.

chapter2.pmd 3/04/2006, 15:47134

Page 155: Read Iris

2 - 135

MANUAL DEL USUARIO

La opción "Códigos de Barras" del menú "Configuración" determina qué tiposde código de barras - el término exacto es “simbologías” - se reconocerán y si loscaracteres de control de algunos códigos de barras se verificarán y eliminarán delos resultados del reconocimiento. Utilice el botón "Por Defecto" para restablecerla configuración por defecto.

chapter2.pmd 3/04/2006, 15:48135

Page 156: Read Iris

2 - 136

CCCCCÓMOÓMOÓMOÓMOÓMO OBTENEROBTENEROBTENEROBTENEROBTENER AAAAAYUDAYUDAYUDAYUDAYUDA ENENENENEN LÍNEALÍNEALÍNEALÍNEALÍNEA

Con esto concluimos nuestra sinopsis general de Readiris. Es posible que estemanual no contenga información de último minuto. Por ello le recomendamos queconsulte el sistema de ayuda en línea para más información sobre Readiris.

Para ello vaya el menú "Ayuda". La opción "Temas de Ayuda" y su macro, latecla F1, le permiten navegar a través de los numerosos temas de ayuda.

chapter2.pmd 3/04/2006, 15:48136

Page 157: Read Iris

2 - 137

MANUAL DEL USUARIO

El resto de opciones del menú "Ayuda" le indican cómo obtener asistenciatécnica para el producto, cómo ponerse en contacto con I.R.I.S., cómo accederdirectamente a la página web de I.R.I.S., etc.

chapter2.pmd 3/04/2006, 15:48137

Page 158: Read Iris

2 - 138

chapter2.pmd 3/04/2006, 15:48138