Metodos de Busqueda de Información

17
INFORMATICA II COORDINACION DE INFORMATICA GUIA DE TRABAJO UNIDAD I TEMA: METODOLOGÍA DE BÚSQUEDA DE INFORMACIÓN EN INTERNET CORPORACION UNIVERSITARIA RAFAEL NUÑEZ

Transcript of Metodos de Busqueda de Información

INFORMATICA II

COORDINACION DE INFORMATICA

GUIA DE TRABAJO

UNIDAD I

TEMA:

METODOLOGÍA DE BÚSQUEDA DE INFORMACIÓN

EN INTERNET

CORPORACION UNIVERSITARIA RAFAEL NUÑEZ

INTRODUCCION

Actualmente una de las problemáticas más frecuentes al momento de realizar una

búsqueda en Internet, es el enorme crecimiento que existe en la WEB, A través

de Internet, es posible acceder de inmediato a muchísima información en forma

de textos, fotos, sonidos y videos provenientes de los más diversos puntos del

planeta.

Desafortunadamente, la información no se encuentra organizada, sino que está

almacenada allí. Esta Problemática ha generado la necesidad de encontrar algunos

métodos y herramientas que faciliten estas búsquedas.

Para esta tarea sólo hay que aprender a utilizar los buscadores (también llamados

motores de búsqueda o en inglés, search engines). Parte de las horas que

pasamos delante del ordenador buscando información se pueden ahorrar

aprendiendo a usarlas, otra gran parte la podemos utilizar examinando y filtrando

datos completamente importantes para nosotros.

BUSCADORES

Imagen1. Como funciona internamente un buscador.

¿Qué es un buscador?

Los Buscadores O Motores de Búsqueda (search engines), son herramientas

especializadas en localizar datos distribuidos en toda Internet. Son un servicio

esencial.

¿Cómo está organizada la información en Internet?

En una biblioteca seria engorrosa la búsqueda de un tema en específico, si

recopilamos “todos los libros que en alguna de sus páginas contengan el tema a

buscar” la tarea seria humanamente imposible. Pero si esa consulta la realizamos

en un buscador de la Web, este nos responderá que existe una aproximación

numérica Ej. “2.355.140” de páginas que contiene información del tema.

Las claves del arte de buscar no consisten simplemente en conectarse al

buscador, ni en recorrer miles de documentos, sino en aprender a detallar los

pedidos de búsqueda con la precisión necesaria para obtener respuestas precisas.

Los buscadores constan de tres partes:

• Los robots que recorren la red para explorar. Son programas que buscan

continuamente por todos los servidores de Internet construyendo un índice de lo

hallado. También son conocidos como «arañas» por su continuo desplazamiento

sobre la red o telaraña.

• La base de datos que es construida por los robots. Contiene todas las direcciones

electrónicas o «URL» encontrados, y asociados a ellos, la información relativa

sobre sus contenidos:

Título.

Parte de texto.

Hiperenlaces.

Descriptores o palabras claves.

Esta base de datos es actualizada continuamente por los robots que añaden

nuevas páginas o referencias y borran las que ya no existen.

• El motor de búsqueda que facilita la consulta a la base de datos. Es la parte que

se ve cuando se realiza la búsqueda. Después de introducirle una petición de

búsqueda, el motor de búsqueda la coteja con la base y devuelve una lista ordenada

de coincidencias.

Formular la pregunta adecuada es el requisito fundamental para obtener la

respuesta justa.

Existen, básicamente, dos métodos de búsqueda: por palabra clave (keywords) y

por temas (o Directorios).

Los diversos Buscadores almacenan la información de una o ambas formas. La

diferencia básica entre ellos radica en cómo organizan el contenido para realizar la

búsqueda.

Los buscadores por tema: Estos organizan el contenido en áreas

generales y sub-temas, y se puede buscar en ellos ingresando en cada

categoría. Por ejemplo, para buscar información sobre teléfonos de alta

gama, primero habrá que seleccionar la sección Tecnología; dentro de ésta,

telefonía y después teléfonos de alta gama).

Los buscadores por palabra clave: solicitan al visitante uno o más

términos para utilizar como criterio de la búsqueda, y luego retornan las

páginas halladas en cuyos textos se incluyen estas palabras (por ejemplo,

textos que contengan la palabra “teléfonos”)

COMO BUSCAR INFORMACIÓN EN INTERNET.

Para la búsqueda de información no hay requerimientos específicos. Sólo se debe

establecerse una conexión a Internet, como se hace habitualmente, y acceder a la

dirección electrónica o URL de algún buscador. y colocarla en la ventanita de

“dirección” del navegador.

Imagen 2. Autor: María Victoria Zumaqué Castillo

Luego de entran en la página del buscador, podrá comenzar su búsqueda.

Colocando el tema en la barra de búsqueda del buscador.

Imagen 3. Autor: María Victoria Zumaqué Castillo

Si se ingresa una sola palabra, por ejemplo, “teléfono”, aparecerán miles de enlaces

con páginas que citan a ese tema .por ejemplo en este caso arrojaría

205.000.000 páginas que será imposible recorrerlas todas.

Imagen 4. Autor: María Victoria Zumaqué Castillo

Pero, si se ingresan varias palabras, la búsqueda se estrechará hacia sub-temas

más específicos. Y en este caso el número de enlaces cera de 1.040.000.

Imagen 5 y 6. Autor: María Victoria Zumaqué Castillo

Si a un considera que son demasiados enlaces para recorrerlos todos, deberá

buscar nuevamente, agregando más palabras. En tal caso, vuelva hacia atrás,

cambie las palabras y busque nuevamente.

Los buscadores por palabra clave más conocidos

Google: (http://www.google.com/): excelente buscador en Español, con

grandes capacidades de refinar (mejorar) sus resultados (ver “trucos” más

adelante).

Alta Vista (http://www.altavista.com): muy completo y favorito de los

cibernautas más fanáticos. Ofrece la opción de traducir los textos

encontrados.

Lycos (http://www.lycos.es/): uno de los más completos y actualizados

Cómo buscar por tema

Las búsquedas por tema son, generalmente, más lentas que por palabra clave, ya

que exigen estrechar la búsqueda, tema por tema, hasta llegar al punto de interés.

Sin embargo, son más precisas y resultan ideales cuando se quiere obtener una

gran variedad de fuentes.

La dificultad fundamental en este tipo de método es que, a veces, no resulta fácil

determinar bajo qué categoría puede estar incluido un tema, o bajo qué forma está

organizada la información, dificultando el hallazgo.

El primer paso para una búsqueda por tema consiste en acceder al sitio web del

buscador que ofrezca este método: una vez allí podrá ver que las opciones

consisten de una serie de grandes temas genéricos, por ejemplo: arte, negocios y

economía, computadoras e Internet, educación, entretenimiento, Salud, noticias,

ciencias, cultura etc.

Si elige uno de estos temas, una nueva página mostrará los sub-temas en los

que, a su vez, se descompone la categoría seleccionada. Y se podrá seguir hasta

llegar a enlaces a páginas web que contengan información concreta relacionada

con el tema solicitado.

Buscadores por tema (directorios) más conocidos

El buscador por tema más famoso es Yahoo (http://www.yahoo.com). La

versión en español para la Argentina se encuentra en

http://www.yahoo.com.ar.

Otro muy popular es Olé, http://www.ole.es.

Dmoz (www.dmoz.org) está sólo en inglés, y se trata de un interesante

experimento colaborativo donde las mismas personas ayudan a clasificar

los sitios web.

Infospace (www.infospace.com) es otro muy conocido.

Biwe (http://biwe.cesat.es). Buscador en Internet de web españoles. Se

engloba dentro del tipo de directorio de categorías. Incluye la utilidad

BiweExpree que permite buscar en Biwe sin estar en él (esto es, se

realiza la búsqueda mientras se visitan otras páginas).

Terra (http://www.terra.es). Ofrece un interfaz de botones y categorías,

así como una opción de búsqueda. Los usuarios pueden realizar altas y

modificaciones.

Ozu (http://www.ozu.es): Es un buscador por índice (similar a yahoo). Se

mantiene mediante las aportaciones de nuevos web de los usuarios que

lo visitan. Interfaz sencilla e incluye búsquedas.

BUSQUEDA MEDIANTE OPERADORES.

Otra forma de obtener los resultados deseados es mediante el ajuste de la

búsqueda, para ampliarla, reducirla o dirigirla, según los resultados

obtenidos.

Existen tres clases de operadores que lo facilitan:

Lógicos o Booleanos.

De proximidad.

De existencia.

Operadores Lógicos o Booleanos.

Para obtener unos resultados precisos, el operador lógico permite especificar

la relación entre elementos presentes en nuestra búsqueda de la siguiente

forma:

• Uniendo dos o más palabras clave mediante «Y» lógico ó «AND». La

búsqueda sólo nos devolverá las páginas que contengan ambos elementos.

No devolverá las páginas que sólo contengan uno de los dos o ninguno.

También se puede usar «&» en vez de «AND». (Ejemplo: talleres y autobús,

talleres & autobús, talleres and autobús).

• Uniendo dos o más palabras clave mediante «NO» lógico ó «NOT». La

búsqueda sólo devolverá las páginas que contengan el primer elemento y

no el segundo. (ej.: talleres no autobús).

• Uniendo dos o más palabras clave mediante «O» lógico ó «OR». La

búsqueda devolverá las páginas que contengan algún elemento de los dos

o los dos. No devolverá las páginas que no contengan ningún elemento de

los dos. También se puede utilizar «|» en vez de «OR». Cuando no se

indica ningún operador entre palabras, los buscadores lo interpretan como

si hubiéramos colocado «OR». Es muy útil para buscar varias formas de

escritura simultáneamente. (Ejemplo: España OR Spain OR Espagne.).

Operadores de proximidad.

Para obtener unos resultados precisos, el operador de proximidad permite

especificar la relación entre elementos presentes de nuestra búsqueda.

• Uniendo dos o más palabras clave mediante «Cerca» ó «NEAR». Se

parece al «Y» lógico pero además exige que entre ambas palabras no haya

más de

10 palabras. Este operador lo tiene el buscador Alta Vista en su modalidad

de búsqueda avanzada. Resulta muy útil para buscar nombres y apellidos.

• Uniendo dos o más palabras clave mediante «Junto» ó «ADJ». Se parece

al «Y» lógico pero además exige que entre ambas palabras no haya otra

palabra.

• Buscando mediante frases. Se parece al «Y» lógico pero además exige

que la secuencia de palabras sea idéntica. Ejemplo: «estudiantes europeos

conectados a Internet». Es decir que la frase aparezca igual. Se puede usar

el guion para concatenar y obtener un resultado idéntico (estudiantes

europeos- conectados-a-Internet). Resulta muy útil para la búsqueda de un

texto concreto.

Operadores de existencia.

Estos operadores son de dos tipos:

• Presencia. Especifica palabras que deban aparecer en el resultado.

Podemos exigir la presencia de alguna palabra clave en el documento, de

tal forma que si no está presente en él no se incluirá en la lista de resultado.

Habitualmente se añade al inicio de la palabra clave el signo más (+).No se

pone ningún espacio entre el + y la palabra a buscar. Por ejemplo:

+olímpico baloncesto fútbol voleibol balonmano.

• Ausencia. Se puede exigir la ausencia de alguna palabra clave en el

documento, de tal forma que si está presente en él no lo incluirá en la lista

de resultado. Habitualmente se indica añadiendo el signo menos - al inicio

de la palabra clave. Por ejemplo: -juventud racismo También se puede

obtener a través de estos dos operadores lógicos: juventud AND NOT

racismo.

METABUSCADORES

Imagen7. Como funciona un Meta-buscador Internamente.

El metabuscador es un sistema que localiza información en los motores de

búsqueda más usados. A diferencia de los buscadores que recopilan información

de las páginas mediante su indexación, como Google, y de los que mantienen un

amplio directorio temático, como Yahoo, los metabuscadores no disponen de una

base de datos propia que mantener sino que utilizan las de varios buscadores

para encontrar la información solicitada por el usuario. Después muestra una

combinación de las mejores páginas que ha devuelto cada buscador. En otras

palabras un metabusacdor es un buscador de buscadores.

Ventajas

La ventaja principal de los metabuscadores es que amplían de forma notoria el

ámbito de las búsquedas que realizamos, proporcionando mayor cantidad de

resultados. La forma de combinar los resultados depende del metabuscador

empleado.

Desventajas

Una de las desventajas importantes es que cada buscador dispone de su propia

sintaxis de búsqueda y en el metabuscador no se puede hacer distinción entre las

diferentes sintaxis de cada buscador. Por lo tanto, al buscar información muy

específica es mejor emplear buscadores de los que conozcamos la sintaxis.

Al tener que buscar en varias fuentes, las búsquedas suelen tardar más que un

buscador normal.

Los Metabuscadores más utilizados.

Estos son algunos metabuscadores que resaltamos por alguna de sus características:

Vivisimo (http://www.vivisimo.com): Sus fuentes son los principales

buscadores internacionales, Alltheweb, Yahoo y MSN entre otros y presenta los resultados agrupados automáticamente por categorías. A pesar de estar en inglés es muy fácil de utilizar.

IxQuick (http://www.ixquick.com): Combina los resultados basándose en los 10 primeros sitios web recibidos de los diferentes buscadores. Sus principales fuentes son Alltheweb, ODP (Open Directory Project) y MSN, entre otros. Este buscador se encuentra en Español.

Lomejor (http://www.lomejor.com.ar): Este metabuscador orientado para la búsqueda de contenidos en español dispone entre sus fuentes los mejores buscadores internacionales, españoles y argentinos. Como son Google, Terra Argentina, Yahoo, Alltheweb y Altavista, entre otros.

www.copernic.com. Posiblemente es uno de los buscadores más utilizados

actualmente. Tiene una versión gratuita y otra de pago. Para poder utilizarlo

es necesario instalarlo en nuestro ordenador. Trabaja con varios motores de

búsqueda, que muestran toda la información relativa al tema buscado.

Permite búsquedas de webs, de direcciones de correo electrónico, etc.

http://www.kartoo.com. Es un metabuscador de información web que

presenta sus resultados en forma de mapas conceptuales. Se puede elegir

entre varios idiomas para hacer nuestras búsquedas: castellano, inglés,

francés, italiano, alemán, portugués y brasileño. Una vez hecha la petición

de búsqueda, Kartoo analiza e interroga los motores de búsqueda más

pertinentes, selecciona las webs y las presenta en forma de mapa. Los

sitios encontrados son presentados en esferas más o menos grandes según

su pertinencia. Así, al revisar el resultado, las palabras claves mostradas

se iluminan y una descripción breve del sitio web aparece a la izquierda

de la pantalla. Igualmente, en la parte izquierda aparecen una serie de

palabras clave por temas; podremos refinar la búsqueda haciendo clic en

dichos temas. Al final de la página tenemos una flecha para pasar al

siguiente mapa.

www.metacrawler.com. Es uno de los metabuscadores más utilizados. Al

ser uno de los primeros, permite la búsqueda por frases.

www.webcrawler.com. Incorpora un buscador de fotos y de noticias.

GLOSARIO

NAVEGADOR: Un navegador o navegador web (del inglés, web browser) es una

aplicación que opera a través de Internet, interpretando la información de archivos

y sitios web para que éstos puedan ser leídos (ya se encuentre esta red mediante

enlaces o hipervínculos)

ENLACE:

URL: Un Localizador de Recursos Uniforme, es una secuencia de caracteres, de

acuerdo a un formato modélico y estándar, que se usa para nombrar recursos en

Internet para su localización o identificación,

SUB-TEMAS: Un subtema es una idea que sustenta un tema principal. Por lo

general son varios subtemas que explican el tema central.

WEB: World Wide Web (WWW) o Red informática mundial es un sistema de

distribución de información basado en hipertexto o hipermedios enlazados y

accesibles a través de Internet.

INFORMACIÓN: Es un conjunto organizado de datos procesados, que constituyen

un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe

dicho mensaje.

WILDCARD SYMBOL: Un carácter comodín es un especial carácter que

representa uno o más caracteres. Los caracteres más usados son el comodín

asterisco (*), que normalmente representa cero o más caracteres en una cadena

de caracteres y el signo de interrogación (?), Que normalmente representa

cualquier carácter. Por ejemplo, en la búsqueda:

puede pinchar para tener acceso o conectar con otro documento.

Un enlace o link es texto o imágenes en un sitio web que un usuario

BIBLIOGRAFIA

BERNAL Jessica, APONTE Jhonnatan METODOS DE BUSQUEDA EN INTERNET

NRC: 825 http://www.slideshare.net/Jhonnatann/metodos-de-busqueda-en- internet-12050161

Natalia S. Stark “MOTORES DE BÚSQUEDA EN INTERNET” http://www.unlu.edu.ar/~tyr/tyr/TYR-motor/stark-motor.pdf

Roxana Bassi, Versión 0.98 al 18 de octubre de 200. “CÓMO BUSCAR INFORMACIÓN EN INTERNET” http://www.links.org.ar/weblinks/buscar.pdf

BUESQUEDA DE INFORMACIÓN EN RED. http://www.educastur.princast.es/fp/hola/hola_bus/cursos/curso14/do cumentos/Busqueda_informacion_en_la_red%20_hola_.pdf

METABUSCADORES. http://www.consoft.es/noticias/news_text.asp?id=33219

REFERENCIAS WEB

1. Imagen1. http://signos21.files.wordpress.com/2009/12/buscadores.gif

2. Imagen7.http://es.conocimientoengrupo.wikia.com/wiki/Como_funcionan_lo

s_metabuscadores?file=Meta.png

3. Ejemplos de Meta buscadores: http://personal.us.es/juanj/buscadores/metabuscadores.htm

FICHA DE CONTROL DEL DOCUMENTO

FECHA DOCUMENTO FECHA ULTIMA REVISION

PARTE O SECCIO

DESCRIPCION DEL CAMBIO

ENCARGADO REVISADO

08/01/2012 MARIA ZUMAQUE

XIBIA HURTADO

Creación del documento.

02/07/2013 MARIA ZUMAQUE

XIBIA HURTADO

02/07/2013 Contenido, Glosario, Bibliografía, Actividades.

Modificación de contenido, Aplicación del Modelo Instruccional, Actualización de glosario, bibliografía y actividades.

03/08/2013 JUAN MERIÑO

XIBIA HURTADO

04/08/2013 Bibliografía, Contenido, Actividades.

Actualización de la bibliografía y retiro de las actividades de la guía para agregarlas a la plataforma.

06/02/2015 XIBIA HURTADO