1277715195

8

Click here to load reader

Transcript of 1277715195

Page 1: 1277715195

Coleccionables deAplicaciones Informáticas

Edición 1 - MS Office

Edición 2 - Herramientas generales

Edición 3 - Herramientas de traducción

Edición 4 - Lenguaje de etiquetas (archivos *.*ml)

Edición 5 - Motores de búsqueda

Edición 6 - Archivos de diseño (DTP)

Edición 7 - Estándares

Col

ecci

onab

les

deA

plic

acio

nes

Info

rmát

icas

Colegio de Traductores Públicos de la Ciudad de Buenos Aires

Edición 5 -Motores de búsqueda

Page 2: 1277715195

2

¿Qué son?Un motor de búsqueda es una pieza de software que per-mite encontrar y visitar los sitios relacionados con unapalabra clave -o keyword- introducida al sistema por elmismo usuario. También se los denomina buscadores.

Básicamente, están compuestos por bases de datosgigantescas que contienen información sobre el conte-nido de los sitios que integran la Web.

¿Qué tipos de motores hay?Según como trabajen encontraremos:

1. Buscadores propiamente dichos o spiders2. Directorios Índices, Catálogos 3. Sistemas Mixtos (directorio y motor de búsqueda) 4. Metabuscadores5. Multibuscadores6. Buscadores de portal

1. Buscadores propiamentedichos o spidersLa mayoría de los grandes buscadores internacionalesque todos usamos y conocemos entran dentro de estadenominación. Requieren muchos recursos para sufuncionamiento. Las arañas recorren páginas y recopi-lan información sobre su contenido, y las presentan cla-sificadas por orden de relevancia. Por ejemplo, si bus-camos una palabra, [traducción], los resultados de labúsqueda nos mostrarán las páginas que contenganesta palabra en alguna parte del texto.

En algunos casos registran todas las páginas del sitio,y en otros, sólo algunas. Además, las arañas van reco-pilando las actualizaciones, cuya periodicidad depen-de del motor en cuestión. Por este motivo, puede su-ceder que algunos sitios no aparezcan actualizados.El orden de relevancia, es decir, el orden en que semuestran los resultados de la consulta, está determi-nado por diversos factores que dependen de cadabuscador. Pueden existir distintos parámetros, peroexisten muchísimas estrategias, que las distintas em-presas elaboran para lograr los primeros puestos.

Ejemplos de buscadores "spiders"Google, Altavista, Lycos

2. Los DirectoriosSon motores buscadores totalmente distintos a lasarañas. Son listas de recursos organizados por cate-gorías temáticas que se estructuran jerárquicamenteen un árbol de materias que permite visualizar los con-tenidos desde los más generales, en las ramas supe-riores, a los más específicos, en las ramas inferiores.Más que buscar información sobre contenidos de lapágina, los resultados serán referencias a los conteni-dos y a la temática de la Web. Es decir, si buscamos"traducción", aparecerán los sitios que de una forma uotra estén relacionados con la temática de la traducción.

Su tecnología es muy barata y sencilla. Pero el costode operación es relativamente alto, ya que dependende la operación manual.

La clasificación y categorización requieren una inter-vención humana y en muchos casos, debido a la hete-rogeneidad de los temas tratados, algunas páginaspresentan problemas de categorización ya que losíndices suelen mantener su base de datos de formamanual.

Motores de búsqueda

Page 3: 1277715195

3. Los sistemas mixtosBuscador - DirectorioSon una mezcla entre buscadores y directorio. Ademásde tener características de buscadores, presentan las pá-ginas registradas clasificadas en catálogos según su con-tenido: Informática, cultura, sociedad, que a su vez se di-viden en subsecciones. Hoy en día los grandes buscado-res, van en esa dirección.

Ejemplos: Excite, Voila, InfoseekEn la actualidad, todos los motores tienden hacia estossistemas mixtos

4. MetabuscadoresEn realidad, los metabuscadores hacen sus búsquedasen auténticos buscadores, analizan los resultados de lapágina y presentan sus propios resultados.

Los metabuscadores permiten buscar en varios buscado-res al mismo tiempo. No almacenan las descripciones depáginas en sus bases de datos, sino que contienen losregistros de los motores de búsqueda y la informaciónsobre ellos, adecuando su expresión a los diferentes mo-tores para remitir la consulta. Cuando reciben la respues-ta, envían al usuario el resultado que fue previamentesometido a un filtrado para eliminar y depurar los enlacesrepetidos y ordenados. Los más repetidos ocuparán losprimeros puestos ya que el metabuscador consideraráque son los más relevantes por estar dados de alta enmayor número de buscadores.

Copernic (www.copernic.com), sigue siendo un metabus-cador interesante con muchas categorías de búsqueda yversiones gratuitas y aranceladas.

Ejemplo: Search.com, www.copernic

5. MultibuscadoresPermiten lanzar varias búsquedas en motores seleccio-nados respetando el formato original de los buscadores.Se limitan a colocar en una página web una lista con losbuscadores más comunes y con una ventana de textopara que el usuario envíe la cadena de búsqueda introdu-cida a cada uno de ellos. Muestra los resultados según elbuscador.

Ejemplo: Gooyaglehoo. http://www.gooyaglehoo.com/

6. Buscadores de PortalBajo este título, englobamos los buscadores específicosde sitio. Aquellos que buscan información sólo en su por-tal o sitio web. Podríamos considerarlos como un directo-rio. Trabajan sobre la base de expresiones regulares yconsultas SQL. Son muy útiles para los temas de admi-nistración.

El avance de la tecnología es demasiado veloz, y haymuchas empresas dedicadas al desarrollo de motores debúsqueda. Por este motivo, periódicamente nos sorpren-den con nuevos programas, y nuevas categorías, cuyoúnico fin es encontrar más fácilmente la información quebuscamos, o en los casos de las empresas de marketing,mostrar mejor los productos y buscar permanentementepotenciales clientes.

¿Cómo trabajan? Los buscadores automáticos están compuestos portres partes:

Los robots que se encargan de recorrer la Redescrutándola

La base de datos que construyen estos robots

El motor de búsqueda que facilita la consulta a labase

Los robots son programas que buscan o rastreancontinuamente todos los servidores de la WWW, enGopher (uno de los sistemas de Internet para recupe-rar información que precedió a la World Wide Web), yFTP, que alimentan una base de datos. Los robots ac-tualizan estas bases y añaden nuevas páginas o refe-rencias cuando ha cambiado o bien, cuando ya noexiste. Google por ejemplo, guarda la página inicial yaunque la página ya no exista en la opción "caché",se puede ver la información original.

Cuando abrimos la página de un buscador, encontra-mos un formulario para definir nuestra búsqueda ysus posibles opciones. Ingresamos la palabra o pala-bras clave que son las que describen los conceptos,ideas o términos que buscamos. El motor nos devuel-ve los resultados en función de cómo hayamos defini-do nuestra búsqueda.

Los buscadores temáticos o especializados estáncompuestos por:

una base de datos creada a partir de los URL remi-tidos

una estructura jerárquica que facilita la consulta

De todas maneras, se tiende más a utilizar un siste-ma mixto con buscadores automáticos

Actualización de los datos

Ingreso a la RedLa mayoría de los motores de búsqueda actualizan susbases de datos con la información recopilada por sus ara-ñas, al menos una vez al mes. Esto es importante si tene-

3

edic

ión

5- M

otor

es d

e bú

sque

da

Page 4: 1277715195

mos un sitio web relativamente nuevo: si el sitio se sube, porprimera vez en la Red, al final de un 'rastreo', y las arañas nolo encuentran, habrá que esperar hasta la actualización si-guiente para entrar a formar parte de la base de datos. Unavez incorporado a la base de datos, todavía llevará una o dosactualizaciones más antes de que se estabilice en los resulta-dos de las búsquedas.

La mayoría de los motores de búsqueda, también tienen lo quese llama listados frescos. Éstas son actualizaciones rápidasy cortas que generalmente no pondrán al día un sitio entero,pero agregarán las páginas nuevas y aquellas que hayancambiado.

Durante muchos años, en la era pre-internet, usábamos nues-tros "motores de búsqueda" mentales para buscar terminolo-gía e investigar los escasos recursos disponibles. Hoy In-ternet nos abre una puerta a un mundo donde sucede todo locontrario: estamos invadidos por una sobreabundancia de re-cursos y el desafío es, precisamente saber cómo encontrarlos.

En un artículo publicado en el ITI bulletin (www.iti.org.uk) dejulio de este año, Michael Benis comenta que la estrategiaesencial de toda búsqueda debería ser:

buscar seleccionar verificar

Por más compleja que sea la búsqueda o la situación, estemétodo es la base para asegurarnos de que la terminología yla información que obtenemos sean correctas. En un entornoconvencional, esta estrategia implicaría la búsqueda del tér-mino en cuestión en diccionarios y enciclopedias bilingües ymonolingües, corroborar definiciones, verificar los resultadosde nuestras búsquedas en los recursos monolingües corres-pondientes, y verificarlo en los materiales de referencia. Claroque en la época digital, todos estos procesos, son mucho másrápidos y ágiles.

Una de las grandes ventajas de la Internet para los traducto-res, ha sido el gran número de bases de datos terminológicasque nos ponen a nuestro alcance las unidades de traducciónde los departamentos gubernamentales. Canadá y la UniónEuropea encabezan esta lista. Son fuentes confiables y nosofrecen diccionarios que constituyen recursos indispensablespara el traductor. Salvo en el caso de Termium (que prevé unarancel anual) el resto es totalmente gratis. Por supuesto,además de estos diccionarios oficiales existe otra enormecantidad de diccionarios en Internet que profesionales, em-presas, o simplemente individuos ponen a nuestra disposi-ción, y que pueden ayudarnos a resolver una búsqueda siem-pre y cuando verifiquemos lo que estamos buscando, y fun-damentalmente, con una fuente confiable.

¿Cómo busco? Cuando se introduce una frase o palabra, el motor busca-rá en su base de datos y devolverá resultados en un ordenque estará determinado por su propio algoritmo.

Para las búsquedas precisas, los motores tienen su propiolenguaje de interrogación y suelen permitir acotar las bús-quedas utilizando interfaces sencillas de búsqueda quepermiten la introducción de texto en alguna de estasvariantes:

Todas las palabras: permite recuperar los resultadosque contengan todas las palabras que se introducen en lacaja de interrogación. Por ejemplo, "colegio de traducto-

4

Otros programasAsk.comEste motor de búsqueda está obteniendo buenos resultados,y permite hacer búsquedas no sólo de webs, sino también deimágenes, noticias, blogs, enciclopedias, y más.

CodigoFuente.netCodigoFuente.net es un espacio para la búsqueda y registrode Código Fuente, software libre, clases, librerías, funciones,Programas gratis y procedimientos de: ASP, ASP.NET, C++,Java, Csharp, Delphi, Perl, PHP, Python, Cold fusion,JavaScript, XML y otros lenguajes de programación, comple-tamente en español.

DogpilePortal mediante el cual se pueden realizar búsquedas en múl-tiples buscadores a la vez.

KrugleDirectorio dedicado exclusivamente a programadores, contie-ne motor de búsqueda para todo lo relacionado con lenguajesde programación, código que puede reusarse, y mucho más.

MSNMSN, la red de Microsoft, es otro de los buscadores máspopulares.

OhlohUna nueva clase de directorio de software, que combina con-tenido comunitario con un motor de búsqueda que indexacambios en los repositorios de proyectos de software libre,analizando código y extrayendo reportes muy interesantes.También permite socializar con otra gente que tenga los mis-mos intereses de software, y también permite buscar informa-ción de cada programador.

Desde el escritoriodel traductor

Page 5: 1277715195

res" se ubicarán resultados que incluyan todos los términos,aunque estén separados: colegio de traductores, aunque nonecesariamente en ese orden exacto.

Alguna de las palabras: permite recuperar los resulta-dos que contienen alguna de las palabras. Por ejemplo, lainterrogación: "colegio de traductores" los resultados se pre-sentarán con colegio o traductores.

La frase exacta: es la más adecuada para búsqueda pornombres propios y expresiones que deben ser buscadas enel orden especificado. Para introducirla se suelen utilizarcomillas. Por ejemplo, la consulta: "colegio de traductores”,sólo mostrará resultados donde aparezca exactamente esafrase.

La búsqueda booleana: se trata de un tipo de interroga-ción que incluye alguno de los operadores lógicos.

Los buscadores también permiten acotar la búsqueda por unaserie de operadores lógicos, así encontramos:

LógicosDe proximidadDe existencia De exactitud

Operadores lógicos Los operadores lógicos o booleanos facilitan este objetivo. Paralos ejemplos siguientes usaremos dos conjuntos de elementos:los profesionales y los traductores.

1. Y lógico (AND) En el resultado aparecerán únicamente los documentos quecontentan estas dos palabras clave. Es un operador de re-ducción.

Ejemplo: profesionales AND traductores(En algunos buscadores también se puede usar & en lugarde AND)

2. NO lógico (NOT) Excluye los elementos de una de las dos palabras clave debúsqueda.

Ejemplo: profesionales AND NOT traductores(En algunos buscadores también se puede utilizar ! en lugarde NOT.)

3. O lógico (OR) Indica al buscador que en los resultados de la búsquedaaparezca por lo menos una de las palabras clave. Es unoperador de ampliación.

Ejemplo: profesionales OR traductores

Es decir los profesionales o traductores. Nos devolverá las páginas que contengan algún elementode los dos o los dos(Algunos buscadores también permiten usar | en vez de OR).

Cuando no indicamos ningún operador entre las palabras,los buscadores lo interpretan como si hubiéramos colocadoOR.

Es muy útil para buscar varias formas de escritura simultá-neamente.

Ejemplo: España OR Spain OR Espagne

Operadores de proximidad Para obtener resultados precisos, el operador de proximidad,nos permite especificar la relación entre elementos presentesde nuestra búsqueda.

1. Cerca (NEAR) Es similar al Y lógico, pero además exige que entre ambaspalabras no haya más de 10 palabras.

Ejemplo: profesionales NEAR traductores Es decir que las palabras profesionales y traductores apa-rezcan relativamente juntas.

Es ideal para buscar, por ejemplo, nombres y apellidos.

2. Junto (ADJ) Es la intersección de los dos conjuntos de búsqueda queademás están adyacentes. Se parece al Y lógico pero ade-más exige que entre ambas palabras no haya otra .

Ejemplo: profesionales ADJ traductores Es decir que las palabras profesionales y traductores apa-rezcan juntas.

Se puede usar comillas para obtener un resultado idénti-co "profesionales traductores"

También se puede usar un guión entre las palabras quedesea juntar profesionales-traductores.

Operadores de existencia 1. Presencia. Especifica palabras que deben aparecer en el resultado. Esútil cuando necesitamos que una determinada palabra clave,de tal forma que si no está presente en él, no se incluirá enla lista de resultados.

Habitualmente se añade al inicio de la palabra clave el signomás (+), sin dejar espacio.

Ejemplo:+olímpico baloncesto fútbol voleibol balonmano

5

edic

ión

5- M

otor

es d

e bú

sque

da

Page 6: 1277715195

6

2. Ausencia Es útil cuando necesitamos que una determinada pala-bra clave no esté presente en el documento, de tal for-ma que si está, no lo incluirá en la lista de resultado.

Habitualmente se indica añadiendo el signo menos - alinicio de la palabra clave, sin dejar espacio.

Ejemplo: juventud –racismo

Podemos obtenerlo también a través de estos dosoperadores lógicos: juventud AND NOT racismo

Operadores de exactitud 1. Familia Se trata de una especie de comodín, que permite realizarla búsqueda también en documentos en los cualeslas palabras clave aparecen como parte de otras pala-bras. Con la opción Substrings en Yahoo o el signo (*).

De esta manera, una búsqueda de "educa" incluirá tam-bién en la respuesta "educador" y "educativo".

Esto es ideal si no se sabe cómo se escribe exactamen-te la palabra que se quiere buscar. A diferencia de estoscasos mencionados, el comodín de Google (*) permiteencontrar palabras completas, no familias de palabras.

Es muy útil por ejemplo, para buscar la palabra que si-gue, nombres de instituciones. etc.: colegio * traductores,mostrará colegio para traductores, de traductores, contraductores, etc.

2. Truncar la palabraPara encontrar sólo aquellas referencias que tengan lapalabra exacta y no extensiones, se debe seleccionar laopción Complete words en Yahoo, y en Lycos usar elpunto (.) al final de la palabra que se busca, para limi-tarla. Por ejemplo "ciudad" encontrará referencias quecontengan la palabra "ciudad" pero no así "ciudadano"ni "ciudadanía".

GoogleEncontrar todos estos recursos es un desafío. En la mayoría de los casos, se resuelve fácilmente con el uso de algunode los motores de búsqueda que mencionamos en la primera parte de este coleccionable. El más popular sigue siendoGoogle, con el que se pueden realizar búsquedas bastante complejas, entre otras:

Para buscar la definición de una palabra (en cualquier idioma), se puede escribir "define:" seguido de la palabraclave de búsqueda. Por ejemplo, define:localization mostrará este resultado:

Page 7: 1277715195

7

edic

ión

5- M

otor

es d

e bú

sque

da

Es posible buscar palabras o frases dentro de una pági-na en especial, como la de un cliente. Por ejemplo, "trojanhorse site:www.symantec.com" mostrará este resultado(aplicable a cualquier idioma):

Para buscar palabras en un sitio y en la dirección del sitio,se puede utilizar "inurl:". Por ejemplo, si queremos buscarla palabra "enfiteusis" y, que además aparezca en un glo-sario, escribimos "enfiteusis inurl:glosario", y se obtendráeste resultado:

Además de buscar en glosarios, también pueden buscar enpáginas de clientes, empresas, etc.

Para la conversión de unidades (millas a kilómetros, porejemplo), basta con escribir "x miles", "x yards", etc... El resulta-do va a ser algo así:

Para buscar palabras en un tipo de archivo en especial:supongamos que se quiere buscar la palabra "localization" en unarchivo PDF, si escribimos "localization filetype:pdf" se obten-drá algo así:

Listados: http://labs.google.com/sets. Nos permite encontrar o completar listas de un conjunto de ele-mentos (por ejemplo: si necesitamos una lista de marcas de au-tomóviles, con incluir dos, Google completa el resto).

Page 8: 1277715195

Com

isión

deA

plic

acio

nes

Info

rmát

icas

info

com

isio

nes@

trad

ucto

res.

org.

ar

ww

w.tr

aduc

tore

s.or

g.ar

CTP

CB

A- C

oleg

io d

e Tr

aduc

tore

s Pú

blic

os d

e la

Ciu

dad

de B

ueno

s A

ires

Google Desktop: http://desktop.google.com/ Desde este sitio, se baja el programa. Está diseñado con lamisma tecnología de Google, es una herramienta de bús-queda instantánea pero... en los archivos de nuestra propiacomputadora. Permite buscar en correos electrónicos deOutlook, Outlook Express y en archivos de Word, Excel,PowerPoint y texto; también realiza búsquedas paralelas enel disco duro de nuestra computadora y en Internet. Yahoo,también tiene una herramienta similar.

Answers.com: www.answers.comEs otra herramienta útil y a través de la cooperación conGoogle permite utilizar el buscador de Google y, al mismotiempo, poder buscar palabras y hacer preguntas desde lossitios que estamos consultando.

Otros usos de los motores de búsqueda

Pero además, los motores de búsqueda son muy útiles nosólo para buscar términos, sino para verificar el uso, el esti-lo, las palabras que se utilizan con un determinado verbo, oel adjetivo más común para un sustantivo, y el análisis de losresultados, podría permitirnos esbozar hasta un registro deuso, y obtener información que no podemos conseguir enlos diccionarios.

Si utilizamos motores de búsqueda con mucha frecuencia,una herramienta útil, es Practisearch, que permite consultarel motor de búsqueda favorito con sólo seleccionar la fraseen cuestión [desde cualquier programa, por ejemplo, Word,presionando una tecla de acceso rápido y luego enter].

La Web invisible. Ideal para investigadores

La "Web visible" es lo que podemos "ver" con los motores debúsqueda, que presentan el contenido del sitio como resul-tado de una búsqueda. Lo que no se incluye en la mayoríade los casos, es el contenido de las bases de datos, porejemplo. Si incluimos en los términos de búsqueda database(o base de datos) o directory podremos ver recursos de in-vestigación útiles que los motores no pueden encontrar deotra forma, ya que las arañas de los motores de búsquedano pueden catalogar el contenido que, por ende, queda rele-gado a lo que denominamos "Web invisible". Al final de estecoleccionable, se detalla una lista de sitios Web, que inclu-yen sitios y programas utiles para buscar en la "Web invisi-ble", como Direct Search, u OAIster, y permite buscar enlas bases de datos de universidades o viejos artículos queno han sido generados en formato electrónico, y fueronescaneados.

Las búsquedas avanzadasEste tipo de búsquedas no sólo permiten encontrar termino-logía sino textos especializados que nos pueden confirmar elestilo, las elecciones tanto técnicas como estratégicas quedeberemos hacer y, al mismo tiempo, podemos investigarsobre el tema que estamos traduciendo. Por ejemplo tome-mos la biblioteca EUR-Lex en línea de la legislación de laUnión Europea. En este sitio se pueden buscar archivos htmlde la legislación de la Unión Europea en todos los idiomasoficiales. Y cada uno de estos archivos incluye los enlaces alas traducciones correspondientes en todos estos idiomas.

De esta manera, una vez que encontramos el término, tam-bién encontraremos la traducción oficial del mismo términoen la lengua meta.

Algunos otros recursosDiccionarios en línea

Termium - Base de datos trilingüewww.termium.gc.ca

IATE - Base de datos terminológica multilingüehttp://iate.europa.eu

ITU - Diccionario multilingüe Termite de telecomuni-caciones www.itu.int/terminology/index.html

UNITERMBase de datos de las Naciones Unidas http://www.un.org/spanish/unterm/

Recursos de investigación en líneaServidor Web del Parlamento Europeo

www.europarl.europa.euBiblioteca en línea de legislación de la Unión

Europeahttp://eur-lex.europa.eu/en/index.htm

Sitios y programas de búsquedas útilesBabilón

www.babylon.comDirect Search (Web invisible)

www.freepint.com/gary/direct.htmGoogle

www.google.comMedline Medscape search

http://search.medscape.comMetacrawler

www.metracrawler.comOmega First

www.omega-first.co.uk

Web InvisibleInternetinvisible.com (en español)

http://www.internetinvisible.com/InvisibleWeb.com (en inglés)

http://www.invisibleweb.comInvisible Web Directory (por temas)

http://www.invisibleweb.net/Complete Planet: The Deep Web Directory (contie-

ne unas 70.000 bases de datos de la Red profunda yotros recursos especializados)http://aip.completeplanet.com

Direct Search (es una compilación de enlaces e in-terfaces de búsqueda de recursos que contienen datosque no son fácilmente accesibles o "buscables" por losbuscadores generalistas)http://www.freepint.com/gary/direct.htm

OAISTERhttp://www.oaister.org

Otras FuentesRicardo Baeza Yates. (www.dcc.uchile.cl/~rbaeza/inf/webfaces.gif)

(www.hipertexto.info/documentos/tipos_buscador.htm#indices)ITI bulletin (www.iti.org.uk)