Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos...
-
Upload
renata-garcia -
Category
Documents
-
view
6 -
download
1
Transcript of Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos...
![Page 1: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/1.jpg)
Sistemas de búsqueda y Sistemas de búsqueda y
recuperación de recuperación de InformaciónInformación
Eva Mª Méndez RodríguezEva Mª Méndez Rodríguez Universidad. Carlos III de Madrid
Getafe, 1999
![Page 2: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/2.jpg)
Sistemas de búsquedaTipología
Recursos Web
Software y ficherosPersonas e institucionesListas de distribuciónNews
• Directorios / índices• generales• especializados
• Buscadores• Metabuscadores• Agentes inteligentes• Portales• WebRings
![Page 3: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/3.jpg)
Metabuscadores:Metabuscadores:búsqueda múltiplebúsqueda múltiple
ej: Metacrawler
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
![Page 4: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/4.jpg)
Metabuscadores Caracterización
– Permiten formular búsquedas simultáneas en un determinado número de motores de búsqueda.
– Se les denomina también motores de búsqueda en paralelo, megamotores, o metabuscadores.
– Cuando un usuario lanza la búsqueda, el metabuscador las dirige a sus motores asociados componiendo una lista de aciertos, que representan, en teoría, las mejores respuestas a la pregunta.
– Posteriormente pueden llevar a cabo otras tareas, como asignar u ordenar por relevancia, formatearlas de forma consistente, verificar la accesibilidad o eliminar enlaces muertos.
– La lista final indica el motor que ha generado la respuesta y pueden agruparse los resultados por ese criterio.
![Page 5: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/5.jpg)
Metabuscadores Ventajas e inconvenientes
En principio, dada la multiplicidad de motores parecen la solución óptima.
Pero al depender de los tiempos de respuesta y de la efectividad de sistemas sobre los que no se tienen control, no es sorprendente que en ocasiones fallen.
![Page 6: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/6.jpg)
Metabuscadores Alcance:
– Trabajan para poder presentar resultados manejables, por eso no es sorprendente que las listas de resultados sean breves.
Calidad:– Dependen extremadamente de las
posibilidades de indización de los motores con los que trabaja.
– Si el motor genera basura degrada la calidad del metabuscador.
![Page 7: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/7.jpg)
Metabuscadores Control:
– Los motores usan distintos procedimientos de búsqueda. Una petición genérica contra varios, no ofrece las mismas posibilidades que los resultados obtenidos con las funciones avanzadas de cada motor.
Velocidad:– Si un motor es lento, impone retrasos en la
presentación de resultados. Soluciones:– Metacrawler incorpora un mecanismo para verificar que los resultados
que obtiene son accesibles y relevantes antes de presentarlos en pantalla.
– SavvySearch toma en cuenta el tiempo de proceso de los motores y da preferencia a los más rápidos.
![Page 8: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/8.jpg)
Metabuscadores:¿Cuándo usarlos?
Cuando se busque sobre una materia poco común
Cuando no se ha tenido suerte con otros servicios
Cuando no se quieran formular búsquedas complejas
Cuando se quieran recuperar tantos documentos como sea posible con una sola pregunta
![Page 9: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/9.jpg)
MetaCrawler www.metacrawler.com
Definición:– Es un servicios web que trabaja con
diferentes motores de búsqueda.
Alcance:– Usa Lycos, Webcrawler, Excite, AltaVista,
Yahoo, Infoseek.– Puede buscar en Web, productos
informáticos, ficheros o en News.
![Page 10: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/10.jpg)
MetaCrawler www.metacrawler.com
Uso:– Posee una única ventana desde la que
formular las búsquedas. Al introducir los términos el usuario puede decidir si quiere que los aciertos tengan cualquiera de los introducidos, todos o que los términos sean considerados una frase.
– Los resultados los presenta listados y normalizados eliminando elementos de publicidad.
![Page 11: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/11.jpg)
MetaCrawler www.metacrawler.com
Uso avanzado:– Permite limitar las búsquedas por países, nº
de aciertos, tiempo de duración de la búsquedas (en minutos), o por el número de acierto que debe proporcionar cada motor de búsqueda.
– Permite seleccionar los motores contra los que lanzar la pregunta:Altavista, Excite, Yahoo, Infoseek, Lycos, Thunderstone, Webcrawler.
![Page 12: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/12.jpg)
Otros metabuscadores SavySearch: http://www.savvysearch.com/
Internet Sleuth: http://www.isleuth.com/
Profusion: http://www.profusion.com
Cyber411: http://www.cyber411.com
Metafind: http://www.metafind.com
Inference Find: http://www.infind.com/
All-in-One Search: http://www.allonesearch.com/
Ask Jeeves: http://www.aj.com/ ESPAÑOLES:
Metabusca: http://metabusca.com
![Page 13: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/13.jpg)
Diferenciación
Metabuscadores: Lanzan la misma búsqueda a distintos sistemas, aunando los resultados.
Multibuscadores: Permiten lanzar la búsqueda a varios buscadores pero de forma individual (primero uno, después otro...) simplificación de interface pero funcionamiento autónomo.
Buscopio: http://www.buscopio.com
![Page 14: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/14.jpg)
Agentes:Agentes:la búsqueda inteligentela búsqueda inteligente
ej. RoboshopperPointcast
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
![Page 15: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/15.jpg)
Agentes Inteligentes:¿Qué son?
– Los agentes inteligentes son programas que realizan tareas de acuerdo con los planteamientos de los usuarios.
– Las posibilidades son muy amplias, desde desarrollar rutinas de trabajo hasta tratar esas rutinas como preferencias o incluso negociar en nombre del usuario.
Software personal que asiste en la búsqueda de información en Internet con una autoridad
delegada de sus usuarios.
![Page 16: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/16.jpg)
Agentes Inteligentes:Caracterización
– La característica que los distingue es la habilidad de “tomar decisiones” según un conjunto de reglas internas y sin intervención del ususario.
– Los agentes pueden tener esta característica de autonomía en mayor o menor grado. El grado de autonomía puede llegar a que tomen iniciativas: por ejemplo suministrar al usuarios información sin que la solicite, pero que quizás sea de su interés.
![Page 17: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/17.jpg)
Agentes Inteligentes: Acceso
– El agente puede ser un programa cliente, o un servidor web.
– Existen múltiples clientes, algunos son gratuitos (Poitcast) , otros son de pago (Webcompass).
– Otros agentes son accesibles a través del URL: Jango, aunque exigen registrarse en muchos casos.
![Page 18: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/18.jpg)
Agentes Inteligentes:Alcance
– Las tareas que pueden llevar a cabo son muy variadas:
• Enriquecen el browsing del usuario sugiriéndole enlaces basados en anteriores conductas.
• Dan valor añadido a las búsquedas convencionales como las realizadas en Altavista, Lycos, Infoseek
• Lanzan preguntas contra diferentes motores, filtran y reordenan los resultados de forma eficiente.
![Page 19: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/19.jpg)
Agentes Inteligentes:Alcance
– Localiza el mejor precio de un determinado producto en las tiendas online.
– Controlan bases de datos Web y proporcionan actualizaciones de su contenido.
– Compila periódicos personalizados.– Visita a bases de datos seleccionadas por el
usuario y descarga automática de todas las páginas o de parte para consulta offline.
![Page 20: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/20.jpg)
Agentes Inteligentes:Alcance
– Localización de personas con intereses similares.
– Vigilar los sitios preferidos del usuario y avisarle cuando se produce un cambio.
– Generar mapas o guías de la estructura hipertextual de un servidor.
– Comprobar y priorizar el correo electrónico, tomar decisiones basadas en el contenido del correo y actuar en consonancia.
![Page 21: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/21.jpg)
Agentes Inteligentes:Uso
– Algunos agentes poseen sus propios conjuntos de reglas y criterios o las tareas que pueden desarrollar se circunscriben a una.
– Otros, por el contrario, deben ser “entrenados”. Es decir, las instrucciones se las proporciona el usuario. Este proceso puede consumir bastante tiempo, pero al finalizar, el usuario tiene un “traje a su medida”.
![Page 22: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/22.jpg)
Agentes InteligentesServidorServidor
BargainFinder:• Fue un servicio experimental creado por
Anderson Consulting (junto con otros como LifestyleFinder, InfoFinder, NewsFinder, etc). Tenía la función de obtener el mejor precio de CDs.
Roboshopper:• Software que permite comparar precios de
distintos tipos de productos en distintas tiendas digitales.
![Page 23: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/23.jpg)
Otros sistemas de Otros sistemas de búsqueda:búsqueda:
•Buscadores temáticos
•Webrings
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
![Page 24: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/24.jpg)
Buscadores temáticos:
Un buscador temático o especializado es aquel que centra toda su actividad alrededor de una materia muy concreta. Este tipo de buscadores tratan por todos los medios de recoger en sus bases de datos toda la información que pueda haber en la Red (y a veces incluso fuera de ella) sobre la materia de que tratan.
![Page 25: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/25.jpg)
Buscadores temáticos Permiten obtener de forma sencilla toda la
información existente sobre una materia. La información ordenada y con unos
resúmenes mucho mejores y más completos. Organizados para presentar en primer lugar
las mejores páginas sobre los temas que tratan (Tratamiento de la información suele ser manual)
Todo ello mejora mucho la calidad de la información ante la especificidad.
![Page 26: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/26.jpg)
Buscadores temáticos: Se debe combinar su uso, con el de otros
buscadores más generales, ya que en algunas ocasiones, el hecho de que sean, iniciativas temáticas particulares, pone en tela de juicio su exhaustividad.
Es necesario conocer su existencia y URL concreto, o bien partir de un buscador general que nos puede hacer llegar a él.
Buscopio: http://www.buscopio.com
![Page 27: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/27.jpg)
Anillos web Los webrings son grupos de webs sobre una
misma temática que se han ido formando o construyendo por iniciativa de los propios diseñadores de páginas web con un contenido temático específico.
Hay anillos sobre tantos y diferentes temas como podamos imaginar (más de 23.000 anillos web en todo el mundo), que constituyen hoy en día una alternativa (prometedora) para la búsqueda de información en Internet.
![Page 28: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/28.jpg)
Anillos web Sólo contienen webs relevantes sobre la temática
concreta de la que tratan. El nivel de ruido es =0, en general.
El sistema de índices de la mayoría de los servidores de anillos web está perfectamente estructurado y cada índice contiene información detallada sobre diversas cuestiones de interés
No requieren complejas sintaxis de búsqueda. Si algo no se encuentra en un anillo sobre un tema,
éste nos llevará a otro de la misma temática que quizás si recoja el aspecto que nos interesa
Resulta una de las mejores opciones para el acercamiento a una materia.
![Page 29: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/29.jpg)
Anillos web Si un web relevante sobre un tema no se adhiere al
anillo web, no se localizará. Sigue habiendo muchas páginas web que no se
interconectan a través de enlaces a otras similares, con lo cual siempre habrá que recurrir a índices o motores de búsqueda si se desea una búsqueda más exhaustiva.
Tienen muchas limitaciones en cuanto a la búsqueda (no booleanos)
Si se busca un web determinado, los buscadores de anillos son inútiles. Sólo permiten buscar por términos definitorios no por nombres de sitios ni por dominios.
![Page 30: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999.](https://reader033.fdocuments.es/reader033/viewer/2022061305/54b1c2e8497959490f8b4791/html5/thumbnails/30.jpg)
Principales Webrings:
WebRing: http://www.webring.org
Looplink:http://www.looplink.com
Ringsurf: http://www.ringsurf.com
The Rail: http://www.therail.com