INTERNET Y EL WORLD WIDE WEB: Navegación y Búsqueda Preparado por: Prof. Edgar Lopategui Corsino .

Post on 14-Apr-2015

7 views 0 download

Transcript of INTERNET Y EL WORLD WIDE WEB: Navegación y Búsqueda Preparado por: Prof. Edgar Lopategui Corsino .

INTERNET Y EL

”WORLD WIDE WEB”:

Navegación y Búsqueda

INTERNET Y EL

”WORLD WIDE WEB”:

Navegación y Búsqueda

Preparado por:

Prof. Edgar Lopategui Corsino

http://www.saludmed.com/Informat/Internet/Busqueda.html

Navegación• Representa un método aleatorio para efectuar

búsquedas en la internet. • No se posee un plan estratégico específico,

simplemente se comienza a realizar clics a diversos menús o enlaces que lleva a varias páginas Web.

• Se entrar y camina por el ciberespacio de la Internet/Web al examinar (curiosar, hojear, "browse") este mundo virtual.

Datos Preliminares• Las predicciones de NUA apuntan a un

problema de exceso de información y menos efectividad en los mecanismos de búsqueda

• Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute)

• Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda

• Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web

Algunas Observaciones• La internet/WWW no posee toda la

información del mundo

• No siempre se encuentra lo que se desea

• Algunos resultados de búsquedas no son útliles

• La búsqueda puede ser imprecisa e inconsistente

• Es imprescindible evaluar la calidad de los resultados, cuando se trate de información

Conceptos Fundamentales

• Un Banco de Datos es:– Una colección de información– Organizado para aumentar su valor– La guía telefónica es un ejemplo

Estructura de un Banco de Datos

• Registros (e.g., entradas en una guía telefónica)

• Campos (e.g., nombre, dirección, número telefónico)

• Organización (alfabético, jerárquico, numérico, etc.)

Estructura de un Banco de Datos

• Una página del web es un registro• Los campos puede ser:

– Título– URL– Encabezado– Texto– Gráficos

Ejemplo

Buscar• Un proceso organizado y lógico mediante el cual se

implementa un plan estratégico previamente planificado para encontrar en la Internet/Web aquello que desee el usuario, el cual puede ser un documento, una imagen, un archivo de música, la dirección de una persona, entre otros.

• En la búsqueda se emplean sistemas de rastreo o herramientas de búsquedas (generales o especializadas por materia).

• Este método es más eficiente y comunmente produce resultado más específicos.

Recomendaciones para Lograr Búsquedas Efectivas

• Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente

• Identifique sus términos antes de iniciar la búsqueda

• Considere sinónimos, palabras relacionadas y variaciones tales como plurales

• Aprenda a utilizar los conectores booleanos.• Utilice comandos de aproximación y símbolos de

truncada cuando estén disponibles• No se limite a usar una sola herramienta de

búsqueda.

Opciones de Búsqueda en el Web

• Curioseando (“Browsing”)• Con una dirección (URL) a la mano:

– Dada por otra persona– Encontrada en un libro o registro

de direcciones de Internet/Web– Utilizando alguna herramienta de

búsqueda

Herramientas de Búsqueda en el Web

Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final

el lugar donde se encuentera la información

* Descripción *

Páginas que proveen espacios o formas para entrar palabras

orientadas a localizar documentos y otras utilidades

en las bases de datos en formato HTML a través de la Internet

Herramientas de Búsqueda en el Web

* Descripción *

• Programas de computadoras que permiten buscar y colectar información de lugares en el “Web”

• Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles

Herramientas de Búsqueda en el Web

* Descripción *

Herramientas de Búsqueda

NINGUNA HERRAMIENTA

DE BÚSQUEDA ES

TOTALMENTE

EFECTIVA

Tipos de Herramientas

• Motores de búsqueda o “Robots”• Megabuscadores (Meta-Índices)• Directorios (Índices)

“Robots” de Búsqueda

Programa de computadora que atraviesa la base de datos disponibles en los

documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna

pieza de información, como puede ser un documento, una imagen o un

programa de computadora

* Descripción *

Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos

“Robots” de Búsqueda

* Descripción *

• Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web

• Son un Producto Comercial• Generales y abarcadores:

– Banco de datos grandes

• Requiere el uso de palabras claves

Características“Robots” de Búsqueda

• Páginas del Web (URLs, encabezados, texto, enlaces)

• Archivos de imágenes y sonido• Mensajes de texto completo de grupos de

noticias (“newsgroup”)• Lista de archivos de servidores ftp

Banco de Datos

“Robots” de Búsqueda

¿Cómo Deciden a Dónde Ir?

• Depende del “robot” que sea, todos usan diversas estrategias

• Comienzan por buscar en su propia lista de localizadores (URL’s)

• Siguen por las páginas “Whats New” y los lugares más populares en el Web

Relevancia de los Resultados Catalogados• Los resultados se enumeran según su

relevancia

• Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda

• Puede significar que una palabra clave aparece en la página WWW

Factores que Influyen en los Resultados• El tamañotamaño de la base de datos• La frecuencia con que se actualiza• Las capacidades de búsqueda disponibles• Velocidad de respuesta• Diseño de la interfaz• La forma en que despliega los resultados• La cantidad de ayudas que brinde• La composición de los meta-datosmeta-datos

Características Generales de los “Robots” y Otros Mecanismos• Se enriquecen y actualizan automáticamenmte• Ordenamiento por relevancia• Uso de múltiples palabras• Truncamiento• No son sensibles a las mayúsculas• Usos de comandos booleanos• Utilización de booleanos sustitutos• Uso de frases• Empleo de campos de acción

• Se debe especificar el campo donde el término debe aparecer:– Título: Salud y Medicina– URL: www.saludmed.com

• Ayuda aumentar la calidad de los resultados

Búsqueda de Campo

“Robots” de Búsqueda

• Búsquedas realizadas con la raíz de una palabra

• Ejemplo:Comput resulta en:– Computadora– Computación

• Evitar los plurares en cada búsqueda

Truncación

“Robots” de Búsqueda

Crean relaciones entre

términos/palabras de

búsqueda en la base de

dados localizadas en el Web

Operadores Lógicos Booleanos

“Robots” de Búsqueda

• Te permiten buscar el resultado de:– La intersección de dos

términos/palabras de búsqueda– La combinación de dos palabras– La exclusión de una palabra de la

búsqueda

Operadores Lógicos Booleanos

“Robots” de Búsqueda

• Conectores Booleanos:– “AND”: Todas las plalabras deben de estar

contenidas en los documentos – “OR”: Cualquiera de las palabras deben

estar contenidas en los documentos– “NOT” Remueve los documentos que

contienen una palabra dada

Operadores Lógicos Booleanos

“Robots” de Búsqueda

• Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando

• Ejemplo:– Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación

Conectores Booleanos: “AND”

“Robots” : Operadores Booleanos

• Especifica que una o la otra o ambas de las palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando

• Ejemplo:– Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas

Conectores Booleanos: “OR”

“Robots” : Operadores Booleanos

• Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados

• Ejemplo:– Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web

Conectores Booleanos: “NOT”“Robots” : Operadores Booleanos

http://www.saludmed.com/Informat/Internet/BusqEjer.html#Busqueda-Ejer#3

Ejercicios: Operadores Booleanos

Empleados entre dos palabras de búsqueda para indicar que la palabra

debe estar contenida en los documentos de la base de datos

dentro de una distancia específica de cada una para el pareo en dicho

banco de datos

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

• Características:Características:– Seguridad cerca de la encriptación– Ayuda con la relevancia– Asocia una palabra con la otra– Puede determinar cuan cerca (e.g.,

distancia entre dos palabras claves):* Dentro de tres palabras, etc

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

• Componentes:– Una palabra o letra que indica la

dirección– Un número que indica la distancia en

palabras

Operadores Lógicos Booleanos: De ProximidadDe Proximidad

“Robots” de Búsqueda

• Comandos de Aproximación: “NEAR”– Se usan para acercar o aproximar dos

palabras dadas– Ejemplos:

*university NEAR3 college Parea cualquier banco de dados en la cual la palabra university y college se encuentran contenidas entre tres o menos palabras de cada una en cualquier dirección

Operadores Lógicos Booleanos“Robots” de Búsqueda

• Utilizados para sustituir los conectores booleanos AND, OR y NOT

• Símbolos empleados:

+ -

Operadores Lógicos Booleanos: SustitutosSustitutos

“Robots” de Búsqueda

• Ejemplo:+ computadora + disco duro(es equivalente a: computadora AND disco duro)

Operadores Lógicos Booleanos: SustitutosSustitutos

“Robots” de Búsqueda

http://www.saludmed.com/Informat/Internet/BusqEjer.html#Busqueda-Ejer#2

Ejercicios:Operadores Lógicos Booleanos:

SustitutosSustitutos

Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el

orden en el cual los operadores Booleanos son aplicados

Operadores Lógicos Booleanos: De AgrupamientoDe Agrupamiento

“Robots” de Búsqueda

• Comillas Dobles (“”):– Los documentos encontrados por la búsqueda deben

de contener las palabras dentro de las comillas dobles exactamente como se entraron

• Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World

Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

• Paréntesis ():Agrupa palabras y operadores en una cadena debúsqueda para definir el orden en el cual losoperadores Booleanos deben aparecer

• Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

• Ejemplo:– Se desea buscar información con referente a

un visualizadior Web (navegador):• Cadena de busqueda que se debe entrar:Cadena de busqueda que se debe entrar: browser AND (internet or Web):browser AND (internet or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser

“Robots” de BúsquedaOperadores Lógicos Booleanos:

De AgrupamientoDe Agrupamiento

• Alta Vista:Alta Vista: http://altavista.digital.com• Hot Bot:Hot Bot: http://www.hotbot.com• InfoSeek:InfoSeek: http://www.infoseek.com• Excite:Excite: http://www.excite.com• Google:Google: http://www.google.com• Lycos:Lycos: http://www.lycos.com• LookSmart:LookSmart: http://www.looksmart.com

“Robots” de Búsqueda - Parte I:

• GoTo: GoTo: http://www.goto.com

• WebCrawler:WebCrawler: http://www.webcrawler.com

• Open Text:Open Text: http://www.opentext.com

• DejaNews:DejaNews: http://www.deja.com

• InfoHiway:InfoHiway: http://www.infohiway.com

• ThunderStone:ThunderStone: http://www.thunderstone.com

• ScrubTheWeb:ScrubTheWeb: http://www.scrubtheweb.com

• Northern Light:Northern Light: http://www.nothernlight.com

“Robots” de Búsqueda: Parte II

• Netscape: Netscape: http://search.netscape.com/

• About..com:About..com: http://search.about.com/

• Voila:Voila: http://world.voila.com/

• HispaVista:HispaVista: http://buscar.hispavista.com

“Robots” de Búsqueda: Parte III

• Biwe: Biwe: http://biwe.cesat.es

• Encuentrelo:Encuentrelo: http://encuentrelo.com

• Telepolis:Telepolis: http://www.telepolis.com

• MexSearch:MexSearch: http://www.yellow.com.mx

• Señas:Señas: http://www.combios.net/senyas

• MexWeb:MexWeb: http://www.mty.itesm.mx/Mexweb

• LatinWorld:LatinWorld: http://www.latinworld.com

• Mundivia:Mundivia: http://www.mundivia/es/mundi2.html

“Robots” de Búsqueda: Español

Megabuscadores• Realizan búsquedas simultáneas en

varios “Robots”:

Programas que ejecutan búsquedas

simultáneas en múltiples herramientas

• No tienen una base de datos propia

• Remueven los duplicados

Megabuscadores: Parte I • MetaCrawler:MetaCrawler: http://www.metacrawler.com

• SavvySearch:SavvySearch: http://www.savvysearch.com

• Beaucoup:Beaucoup: http://www.beaucoup.com

• Dogpile:Dogpile: http://www.dogpile.com

• ProFusion:ProFusion: http://www.profusion.com

• All-in-One Search:All-in-One Search:– http://www.allonesearch.com– http://www.unam.mx/allinone/

Megabuscadores: Parte II • StartingPoint:StartingPoint: http://www.stpt.com

• MetaFind:MetaFind: http://www.metafind.com

• Inference Find:Inference Find: http://www.infind.com

• Mamma:Mamma: http://www.mamma.com

• Cyber411:Cyber411: http://www.c4.com/index.html?cyber411=1

• AskJeeves: AskJeeves: http://www.ask.com

Directorios (Índices)• Son creados manualmente sin la ayuda de

ningún “Robot”• Son más precisos que los “robots” pues son

personas quienes compilan y mantiennen la información

• Proveen una lista de materiales organizada alfabéticamente:– Basados en listas o catálogos– Organizados jerárquicamente por materias

• Son más pequeños en contenido en comparación con los “Robots”

Directorios (Índices)• Banco de datos de lugares de internet• Estos lugares son sometidos por sus creadores

o evaluadores• Organizados en categoría• Pueden incluir un robot de búsqueda para

buscar en su banco de datos• Son similares a catálogos o páginas amarillas• Los sitios en el web cobren el mismo tópico

agrupados en uno• Son buenos para curiosear (“browsing”)

Directorios (Índices): Parte I

• Yahoo!:Yahoo!: http://www.yahoo.com

• Magellan:Magellan: http://magellan.mckinley.com/

• Snap:Snap: http://www.snap.com

• Web Help:Web Help: http://www.webhelp.com/

Directorios (Índices): Parte II• Argus Clearinhouse:Argus Clearinhouse:

http://www.clearinghouse.net/

• World Wide Web Virtual Library:World Wide Web Virtual Library: http://www.vlib.org/

• Britannica.com:Britannica.com: http://www.britannica.com

• Librarians’ Index to the Internet:: Librarians’ Index to the Internet:: http://lii.org/

Ejercicios:

http://www.saludmed.com/

Informat/Internet/

BusqEjer.html#Busqueda-Ejer#1

Directorios (Índices):