INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui...

51
INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino

Transcript of INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui...

Page 1: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

INTERNET Y EL

”WORLD WIDE WEB”:

Herramientas de Búsqueda

INTERNET Y EL

”WORLD WIDE WEB”:

Herramientas de Búsqueda

Preparado por:

Prof. Edgar Lopategui Corsino

Page 2: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Datos Preliminares• Las predicciones de NUA apuntan a un

problema de exceso de información y menos efectividad en los mecanismos de búsqueda

• Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute)

• Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda

• Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web

Page 3: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Algunas Observaciones• La internet/WWW no posee toda la

información del mundo

• No siempre se encuentra lo que se desea

• Algunos resultados de búsquedas no son útliles

• La búsqueda puede ser imprecisa e inconsistente

• Es imprescindible evaluar la calidad de los resultados, cuando se trate de información

Page 4: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Conceptos Fundamentales

• Un Banco de Datos es:– Una colección de información– Organizado para aumentar su valor– La guía telefónica es un ejemplo

Page 5: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Estructura de un Banco de Datos

• Registros (e.g., entradas en una guía telefónica)

• Campos (e.g., nombre, dirección, número telefónico)

• Organización (alfabético, jerárquico, numérico, etc.)

Page 6: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Estructura de un Banco de Datos

• Una página del web es un registro• Los campos puede ser:

– Título– URL– Encabezado– Texto– Gráficos

Ejemplo

Page 7: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Opciones de Búsqueda en el Web

• Curioseando (“Browsing”)• Con una dirección (URL) a la mano:

– Dada por otra persona– Encontrada en un libro o registro

de direcciones de Internet/Web– Utilizando alguna herramienta de

búsqueda

Page 8: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Herramientas de Búsqueda en el Web

Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final

el lugar donde se encuentera la información

* Descripción *

Page 9: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Páginas que proveen espacios o formas para entrar palabras

orientadas a localizar documentos y otras utilidades

en las bases de datos en formato HTML a través de la Internet

Herramientas de Búsqueda en el Web

* Descripción *

Page 10: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Programas de computadoras que permiten buscar y colectar información de lugares en el “Web”

• Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles

Herramientas de Búsqueda en el Web

* Descripción *

Page 11: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Herramientas de Búsqueda

NINGUNA HERRAMIENTA

DE BÚSQUEDA ES

TOTALMENTE

EFECTIVA

Page 12: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Tipos de Herramientas

• Motores de búsqueda o “Robots”• Megabuscadores (Meta-Índices)• Directorios (Índices)

Page 13: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

“Robots” de Búsqueda

Programa de computadora que atraviesa la base de datos disponibles en los

documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna

pieza de información, como puede ser un documento, una imagen o un

programa de computadora

* Descripción *

Page 14: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos

“Robots” de Búsqueda

* Descripción *

Page 15: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web

• Son un Producto Comercial• Generales y abarcadores:

– Banco de datos grandes

• Requiere el uso de palabras claves

Características“Robots” de Búsqueda

Page 16: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Páginas del Web (URLs, encabezados, texto, enlaces)

• Archivos de imágenes y sonido• Mensajes de texto completo de grupos de

noticias (“newsgroup”)• Lista de archivos de servidores ftp

Banco de Datos

“Robots” de Búsqueda

Page 17: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

¿Cómo Deciden a Dónde Ir?

• Depende del “robot” que sea, todos usan diversas estrategias

• Comienzan por buscar en su propia lista de localizadores (URL’s)

• Siguen por las páginas “Whats New” y los lugares más populares en el Web

Page 18: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Relevancia de los Resultados Catalogados• Los resultados se enumeran según su

relevancia

• Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda

• Puede significar que una palabra clave aparece en la página WWW

Page 19: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Factores que Influyen en los Resultados• El tamañotamaño de la base de datos• La frecuencia con que se actualiza• Las capacidades de búsqueda disponibles• Velocidad de respuesta• Diseño de la interfaz• La forma en que despliega los resultados• La cantidad de ayudas que brinde• La composición de los meta-datosmeta-datos

Page 20: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Cobertura de los Robotsen el Web

HotBot 34 porcientoAltaVista 28 porcientoNorthem Light 20 porcientoExcite 14 porcientoInfoseek 10 porcientoLycos 3 porciento

Recurso: NEC Research Institute, 1998

Page 21: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Características Generales de los “Robots” y Otros Mecanismos• Se enriquecen y actualizan automáticamenmte• Ordenamiento por relevancia• Uso de múltiples palabras• Truncamiento• Sensitividad a la mayúsculas• Usos de comandos booleanos• Utilización de booleanos sustitutos• Uso de frases• Empleo de campos de acción

Page 22: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Se debe especificar el campo donde el término debe aparecer:– Título: Salud y Medicina– URL: www.saludmed.com

• Ayuda aumentar la calidad de los resultados

Búsqueda de Campo

“Robots” de Búsqueda

Page 23: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Búsquedas realizadas con la raíz de una palabra

• Ejemplo:Comput resulta en:– Computadora– Computación

• Evitar los plurares en cada búsqueda

Truncación

“Robots” de Búsqueda

Page 24: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Crean relaciones entre

términos/palabras de

búsqueda en la base de

dados localizadas en el Web

Operadores Lógicos Booleanos

“Robots” de Búsqueda

Page 25: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Te permiten buscar el resultado de:– La intersección de dos

términos/palabras de búsqueda– La combinación de dos palabras– La exclusión de una palabra de la

búsqueda

Operadores Lógicos Booleanos

“Robots” de Búsqueda

Page 26: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Conectores Booleanos:– “and”: Todas las plalabras deben de estar

contenidas en los documentos – “or”: Cualquiera de las palabras deben

estar contenidas en los documentos– “not” Remueve los documentos que

contienen una palabra dada

Operadores Lógicos Booleanos

“Robots” de Búsqueda

Page 27: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando

• Ejemplo:– Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación

Conectores Booleanos: “AND”

“Robots” : Operadores Booleanos

Page 28: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Especifica que una o la otra o ambas de las palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando

• Ejemplo:– Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas

Conectores Booleanos: “OR”

“Robots” : Operadores Booleanos

Page 29: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados

• Ejemplo:– Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web

Conectores Booleanos: “NOT”“Robots” : Operadores Booleanos

Page 30: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Empleados entre dos palabras de búsqueda para indicar que la palabra

debe estar contenida en los documentos de la base de datos

dentro de una distancia específica de cada una para el pareo en dicho

banco de datos

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

Page 31: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Características:Características:– Seguridad cerca de la encriptación– Ayuda con la relevancia– Asocia una palabra con la otra– Puede determinar cuan cerca (e.g.,

distancia entre dos palabras claves):* Dentro de tres palabras, etc

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

Page 32: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Componentes:– Una palabra o letra que indica la

dirección– Un número que indica la distancia en

palabras

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

Page 33: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Comandos de Aproximación: “NEAR”– Se usan para acercar o aproximar dos

palabras dadas– Ejemplos:

*university NEAR3 college Parea cualquier banco de dados en la cual la palabra university y college se encuentran contenidas entre tres o menos palabras de cada una en cualquier dirección

Operadores Lógicos Booleanos“Robots” de Búsqueda

Page 34: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Utilizados para sustituir los conectores booleanos AND, OR y NOT

• Símbolos empleados:

+ -

Operadores Lógicos Booleanos: SustitutosSustitutos

“Robots” de Búsqueda

Page 35: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Ejemplo:+computadora+disco duro(es equivalente a: computadora AND disco duro)

Operadores Lógicos Booleanos: SustitutosSustitutos

“Robots” de Búsqueda

Page 36: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el

orden en el cual los operadores Booleanos son aplicados

Operadores Lógicos Booleanos: De AgrupamientoDe Agrupamiento

“Robots” de Búsqueda

Page 37: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Comillas Dobles (“”):– Los documentos encontrados por la búsqueda deben

de contener las palabras dentro de las comillas dobles exactamente como se entraron

• Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World

Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

Page 38: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Paréntesis ():Agrupa palabras y operadores en una cadena debúsqueda para definir el orden en el cual losoperadores Booleanos deben aparecer

• Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

Page 39: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Ejemplo:– Se desea buscar información con referente a

un visualizadior Web (navegador):• Cadena de busqueda que se debe entrar:Cadena de busqueda que se debe entrar: browser AND (inTERNET or Web):browser AND (inTERNET or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

Page 40: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Alta Vista:Alta Vista: http://altavista.digital.com• Hot Bot:Hot Bot: http://www.hotbot.com• InfoSeek:InfoSeek: http://www.infoseek.com• Excite:Excite: http://www.excite.com• Google:Google: http://www.google.com• Lycos:Lycos: http://www.lycos.com• LookSmart:LookSmart: http://www.looksmart.com

“Robots” de Búsqueda - Parte I:

Page 41: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• GoTo: GoTo: http://www.goto.com

• WebCrawler:WebCrawler: http://www.webcrawler.com

• Open Text:Open Text: http://www.opentext.com

• DejaNews:DejaNews: http://www.deja.com

• InfoHiway:InfoHiway: http://www.infohiway.com

• ThunderStone:ThunderStone: http://www.thunderstone.com

• ScrubTheWeb:ScrubTheWeb: http://www.scrubtheweb.com

• Northern Light:Northern Light: http://www.nothernlight.com

“Robots” de Búsqueda: Parte II

Page 42: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Netscape: Netscape: http://search.netscape.com/

• About..com:About..com: http://search.about.com/

• Voila:Voila: http://world.voila.com/

• HispaVista:HispaVista: http://buscar.hispavista.com

“Robots” de Búsqueda: Parte III

Page 43: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

• Biwe: Biwe: http://biwe.cesat.es

• Encuentrelo:Encuentrelo: http://encuentrelo.com

• Telepolis:Telepolis: http://www.telepolis.com

• MexSearch:MexSearch: http://www.yellow.com.mx

• Señas:Señas: http://www.combios.net/senyas

• MexWeb:MexWeb: http://www.mty.itesm.mx/Mexweb

• LatinWorld:LatinWorld: http://www.latinworld.com

• Mundivia:Mundivia: http://www.mundivia/es/mundi2.html

“Robots” de Búsqueda: Español

Page 44: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Megabuscadores• Realizan búsquedas simultáneas en

varios “Robots”:

Programas que ejecutan búsquedas

simultáneas en múltiples herramientas

• No tienen una base de datos propia

• Remueven los duplicados

Page 45: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Megabuscadores: Parte I • MetaCrawler:MetaCrawler: http://www.metacrawler.com

• SavvySearch:SavvySearch: http://www.savvysearch.com

• Beaucoup:Beaucoup: http://www.beaucoup.com

• Dogpile:Dogpile: http://www.dogpile.com

• ProFusion:ProFusion: http://www.profusion.com

• All-in-One Search:All-in-One Search:– http://www.allonesearch.com– http://www.unam.mx/allinone/

Page 46: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Megabuscadores: Parte II • StartingPoint:StartingPoint: http://www.stpt.com

• MetaFind:MetaFind: http://www.metafind.com

• Inference Find:Inference Find: http://www.infind.com

• Mamma:Mamma: http://www.mamma.com

• Cyber411:Cyber411: http://www.c4.com/index.html?cyber411=1

• AskJeeves: AskJeeves: http://www.ask.com

Page 47: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Directorios (Índices)• Son creados manualmente sin la ayuda de

ningún “Robot”• Son más precisos que los “robots” pues son

personas quienes compilan y mantiennen la información

• Proveen una lista de materiales organizada alfabéticamente:– Basados en listas o catálogos– Organizados jerárquicamente por materias

• Son más pequeños en contenido en comparación con los “Robots”

Page 48: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Directorios (Índices)• Banco de datos de lugares de internet• Estos lugares son sometidos por sus creadores

o evaluadores• Organizados en categoría• Pueden incluir un robot de búsqueda para

buscar en su banco de datos• Son similares a catálogos o páginas amarillas• Los sitios en el web cobren el mismo tópico

agrupados en uno• Son buenos para curiosear (“browsing”)

Page 49: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Directorios (Índices): Parte I

• Yahoo!:Yahoo!: http://www.yahoo.com

• Magellan:Magellan: http://magellan.mckinley.com/

• Snap:Snap: http://www.snap.com

• Web Help:Web Help: http://www.webhelp.com/

Page 50: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Directorios (Índices): Parte II• Argus Clearinhouse:Argus Clearinhouse:

http://www.clearinghouse.net/

• World Wide Web Virtual Library:World Wide Web Virtual Library: http://www.vlib.org/

• Britannica.com:Britannica.com: http://www.britannica.com

• Librarians’ Index to the Internet:: Librarians’ Index to the Internet:: http://lii.org/

Page 51: INTERNET Y EL ”WORLD WIDE WEB”: Herramientas de Búsqueda Preparado por: Prof. Edgar Lopategui Corsino.

Recomendaciones para Lograr Búsquedas Efectivas

• Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente

• Identifique sus términos antes de iniciar la búsqueda

• Considere sinonimos, palabras relacionadas y variaciones tales como plurales

• Aprenda a utilizar los conectores booleanos.• Utilice comandos de aproximación y símbolos de

truncada cuando estén disponibles• No se limite a usar una sola herramienta de

búsqueda.