Herramientas de búsqueda de información en Internet

8
1. ¿Qué es un buscador? 2. ¿Cuáles son sus elementos y que hace cada uno de ellos? 3. ¿Cuáles son los buscadores más importantes? 4. ¿Qué es un metabuscador? 5. ¿Cómo funciona? 6. ¿Cuáles son los metabuscadores más importantes? 7. ¿Qué es un directorio? 8. ¿Quienes los confeccionan? 9. ¿Cuáles son los directorios más importantes? 1) los buscadores localizan las páginas web y todos los documentos relacionados en ellas 2) Araña o Robot La araña es un pequeño programa que recorre toda la Web siguiendo los enlaces que vinculan unas páginas con otras. Su trabajo consiste en descargar copias de las páginas que encuentran en el índice o catálogo. Índice o catálogo El índice o catálogo es donde queda almacenada toda la información recogida por las arañas. Cuando realizamos una búsqueda, ésta no se ejecuta sobre el contenido actual de la Web, sino sobre el índice generado por el buscador a partir del contenido o caché de la Web almacenado en su catálogo. Entre los factores básicos que los buscadores analizan para identificar la categoría de búsqueda (Palabras claves por las que la página de empresa será encontrada) en la que debería ser clasificada una determinada página y el orden (Lo cerca que estará del primer puesto por esas palabras clave) que debería ocupar en los resultados, se incluyen la densidad y prominencia de las palabras clave así como la proximidad

Transcript of Herramientas de búsqueda de información en Internet

Page 1: Herramientas de búsqueda de información en Internet

1. ¿Qué es un buscador?2. ¿Cuáles son sus elementos y que hace cada uno de ellos?3. ¿Cuáles son los buscadores más importantes?4. ¿Qué es un metabuscador?5. ¿Cómo funciona?6. ¿Cuáles son los metabuscadores más importantes?7. ¿Qué es un directorio?8. ¿Quienes los confeccionan?9. ¿Cuáles son los directorios más importantes?

1) los buscadores localizan las páginas web y todos los documentos relacionados en ellas

2) Araña o Robot

La araña es un pequeño programa que recorre toda la Web siguiendo los enlaces que vinculan unas páginas con otras. Su trabajo consiste en descargar copias de las páginas que encuentran en el índice o catálogo.

Índice o catálogo

El índice o catálogo es donde queda almacenada toda la información recogida por las arañas. Cuando realizamos una búsqueda, ésta no se ejecuta sobre el contenido actual de la Web, sino sobre el índice generado por el buscador a partir del contenido o caché de la Web almacenado en su catálogo.

Entre los factores básicos que los buscadores analizan para identificar la categoría de búsqueda (Palabras claves por las que la página de empresa será encontrada) en la que debería ser clasificada una determinada página y el orden (Lo cerca que estará del primer puesto por esas palabras clave) que debería ocupar en los resultados, se incluyen la densidad y prominencia de las palabras clave así como la proximidad entre ellas. También es importante para un buscador filtrar las palabras que, aún repitiéndose mucho en el sitio Web, no sirven para identificar el tema de una página Web.

Page 2: Herramientas de búsqueda de información en Internet

- Interfaz de búsqueda

El objetivo de cualquier buscador es presentar las coincidencias más relevantes ante la consulta hecha por un usuario. Para ello, es importante que el buscador sea capaz de determinar exactamente, a partir de los términos  clave empleados en la consulta, cuál es exactamente el tipo de información que está solicitando el usuario.

A partir de los términos introducidos en el campo de búsqueda, el buscador realiza un primer análisis extrayendo prefijos y sufijos para obtener la raíz de las palabras, eliminando terminaciones verbales para identificar correctamente los verbos, etc.

3) los más importantes son Google ,Lycos y Bing

4) El Metabuscador es un sistema que localiza información en los motores de búsqueda más usados y carece de base de datos propia y usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada uno.

5)Cada uno de los motores de metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos. Los metabuscadores realizan una base de datos virtual a partir de la información que recopilan de los buscadores normales (los cuales utilizan bases de datos físicas para su propósito).

Partiendo de la búsqueda que pide el usuario, se la mandan a los buscadores (utilizando la interfaz que proporcione cada uno de ellos) y almacenan la información virtualmente basándose en un algoritmo propio del metabuscador. Este algoritmo, y el volumen de buscadores que abarcan - algunos se centran en los buscadores más famosos, mientras que otros incluyen búsquedas en grupos de noticias o buscadores menos utilizados - es lo que realmente distingue a unos metabuscadores de otros (además de la presentación de la información al usuario).

6) Clusty es un metabuscador desarrollado por la misma empresa del metabuscador Vivísimo. Clusty utiliza inteligencia artificial para agrupar las páginas y organizarlas como un árbol jerárquico. A su vez, las ramas son desplegables, lo cual permite ir profundizando los resultados seleccionados en

Page 3: Herramientas de búsqueda de información en Internet

forma natural. Clusty no es un buscador sino un sistema para clasificar la información de otros buscadores o fuentes de información distintas ( hasta un total de 12). Entre estas fuentes de información se incluye alguna tan novedosa como la Wikipedia.

Copernic es posiblemente el mejor metabuscador. Hay versiones gratuitas (Copernic Agent Basic) y pagadas; corresponde a programas que deben ser bajados e instalados en cada computador. Permite especificar el número máximo de aciertos en cada buscador consultado. Una ventaja importante es que los resultados de cada búsqueda quedan guardados para ser consultados posteriormente. Se puede integrar con Internet Explorer

Double Trust es la mínima forma de un metabuscador: presenta los resultados de búsquedas con Google y Yahoo, divididos en tres grupos: los que son entregados por ambos buscadores, y los que son entregados por solamente uno de ellos, y viceversa (huérfanos).

ez2find presenta resultados de búsqueda en AlltheWeb, Teoma, Google, Yahoo!, AltaVista, Wisenut, ODP, and MSN, los ordena y remueve los que se duplican. También enlaza con categorías relevantes en el directorio Open Directory.ez2Find agrupa automaticamente los results en categorías, y también accede a alrededor de 1000 bases de datos

Fazzle es un excelente metabuscador, el que permite buscar en diferentes tópicos o regiones geográficas principales. Mediante la opción Downloads se puede buscar programas (software) sobre un tópico determinado.

Ixquick presenta los 10 mejores aciertos de cada uno de los buscadores que consulta. No entrega resultados repetidos. Traduce cada búsqueda a las diferentes sintaxis de los buscadores. Acepta expresiones Booleanas.

Kartoo es un metabuscador con interfaz gráfica de presentación muy atractiva.

Page 4: Herramientas de búsqueda de información en Internet

SurfWax es otro excelente metabuscador, comparable con Copernic. Usa tecnología de vanguardia, entregando un resumen muy ilustrativo sobre la búsqueda realizada.

Vivísimo es un metabuscador de última generación desarrollado en la Universidad Carnegie-Mellon. Agrupa los resultados en carpetas.

WebCrawler es un metabuscador muy popular. Usa los siguientes buscadores: Google, Yahoo, MSN Search, Ask.com y About.com.

ZapMeta es un metabuscador de reciente aparición, simple y amistoso. Permite seleccionar los buscadores que consulta, así como acceder, mediante la opción Quick View a la página de un resultado sin salir de la lista completa de resultados.

7) En informática, un directorio es una agrupación de archivos de datos, atendiendo a su contenido, a su propósito o a cualquier criterio que decida el usuario. Técnicamente el directorio almacena información acerca de los archivos que contiene: como los atributos de los archivos o dónde se encuentran físicamente en el dispositivo de almacenamiento.

8)Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de seleccion y caterizacuon jeraquizada por parte de los editores

9)los directorios más importantes son : yahoo, DMOZ, portal SEO,excite

Page 5: Herramientas de búsqueda de información en Internet

Herramienta resultadoGoogle (www.google.com.ar)

Bing (www.bing.com)

Page 6: Herramientas de búsqueda de información en Internet

InfoSpace (http://msxml.excite.com/)

Ixquick (https://www.ixquick.com/esp/)

Page 7: Herramientas de búsqueda de información en Internet

Yahoo (yahoo.com.ar)