Métodos de búsqueda en internet

8

Transcript of Métodos de búsqueda en internet

Page 1: Métodos de búsqueda en internet
Page 2: Métodos de búsqueda en internet

La cifra existente de documentos en Internet, que por su magnitud parece escapar a nuestra imaginación, ha hecho que la solución a los problemas relacionados con la eficiencia en los métodos de búsqueda de la información sea, hoy en día, un tema relevante de investigación es por esta razón que se hace inminente adquirir ciertos conocimientos acerca de estas herramientas que nos brinda Internet como lo son los buscadores.

Son gigantescas bases de datos que contienen información sobre cientos de miles de páginas de Internet. Se clasifican por distintos niveles de categorías y subcategorías, facilitándonos así el proceso de localización. Cada dirección almacenada en un Buscador tiene asociada una serie de palabras clave, que en definitiva, serán las que nos permitan Llegar hasta ellas. En un buscador puedes distinguir un espacio o cuadro de texto y diferentes categorías que nos servirán para limitar la búsqueda según el segmento de información que más nos interese. El resto de elementos que componen la página son, en su mayoría, servicios de valor añadidos del Web (Ej. Correo electrónico –Email) o publicidad que no intervienen en las capacidades de búsqueda del sistema.

En la red se encuentra mucha información útil, pero no siempre es la que deseamos. Un buscador va a identificar el término pero no el contenido del web, por tanto, si deseas limitar tu búsqueda a información más específica, debes utilizar métodos avanzados de búsqueda.

Page 3: Métodos de búsqueda en internet

Índices temáticos: Son sistemas de búsqueda por temas o categorías jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras clave). Tienen un directorio navegable de temas. Dentro de cada directorio podemos encontrar páginas relacionadas con ese tema.

Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda por la red. El rastreo de la web lo hace un programa, llamado araña ó motor (de ahí viene el nombre del tipo de buscador). Este programa va visitando las páginas y, a la vez, creando una base de datos en la que relaciona la dirección de la página con las 100 primeras palabras que aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace por palabras clave

Page 4: Métodos de búsqueda en internet

Metabuscadores o multibuscadores: No tienen una base de datos propia, lo que hacen es buscar la página en unos cuantos motores de búsqueda e índices y combinar los resultados de la búsqueda en esos buscadores. Un ejemplo de metabuscador es Metacrawler.

Metabuscadores: Lo que hacen, es realizar búsquedas en otros sitios, analizan los resultados de la página, y presentan sus propios resultados. No suelen ser bien venidos por los portales. Para utilizar los servicios gratuitos de un buscador de esta forma, es necesario pedir permiso. El motivo es el siguiente:El Buscador, pone el dinero para opera el servicio, los contenidos que utilizará el metabuscador, y no percibe nada a cambio. Al eliminar la publicidad, no se obtienen ingresos. Solo gasto y pérdida de visitantes que utilicen este servicio de búsqueda.

Los Spiders: La mayoría de grandes sitios internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.

Page 5: Métodos de búsqueda en internet

Los Directorios: Una barata tecnología, que es ampliamente utilizada por la cantidad de programas scripts en el mercado. No se requieren muchos recursos de informática. Están muy extendidos en la red por estos motivos. En cambio, se requiere más soporte humano y mantenimiento.

Los sistemas mixtos Buscador - Directorio: Son una mezcla entre spider y directorio. Además de tener características de arañas, presentan las webs registradas en catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.

Buscadores de Portal: Bajo este título, se engloban los sistemas específicos de sitio. Aquellos que buscan información solo en su portal o sitio web. Podrían considerarlos como un directorio. No obstante, como están basados en expresiones regulares y consultas SQL.

http://cai.bc.inter.edu/tecnicas_de_busqueda_en_internet.htm

http://www.buscarportal.com/articulos/motores_busqueda.html

Page 6: Métodos de búsqueda en internet

Por lógica Booleana se entiende ciertas operaciones lógicas que son utilizadas en las bases de datos para los procesos de búsquedas. En estos procesos se utilizan también relaciones entre descriptores tales como "ADJACENT" y "NEAR".

Los siguientes son operadores lógicos boléanos:AND Ambos descriptores deben estar presentes. Ejemplo: Brasil AND educación OR Puede estar una sola palabra o concepto presente, o pueden estar ambos. Ejemplo: “educación postgraduada” OR postgrado. NOT Excluye conceptos. Ejemplo: educación NOT distancia. La palabra o el concepto "distancia "queda excluido.

El operador “AND” lo podemos representar por el área común (color gris en la gráfica) que comparten ambos conceptos o descriptores. Como resultado de la búsqueda al utilizar este operador, se obtendrán sólo los documentos que incluyan los dos descriptores.

También se utilizan signos como “+” o “-“, denominados operadores boléanos implícitos. El signo “+”tiene el sentido del “AND” y el signo “-“ excluye el concepto que tenga dicho signo delante. Cuando no se sitúan los signos “+” o el “-“ se considera por el motor de búsqueda que estamos ante un “OR”. Estos signos: “+” y “-“, se utilizan en búsquedas poco complejas.

Page 7: Métodos de búsqueda en internet

Para precisar la búsqueda podemos utilizar las comillas "" entre las palabras o conceptos empleados en la búsqueda. Esto indica que queremos aquellos sitios y páginas que concuerden exactamente con lo que hemos escrito. Las comillas (“”) indican que deben respetarse el orden de las palabras y el empleo de las mayúsculas y minúsculas. De esta forma, no es lo mismo "Educación a Distancia"que "educación a distancia".

El asterisco " * " se comporta como una especie de comodín en las búsquedas, de modo que si escribimos: Foto*, el buscador incluirá en el resultado de la búsqueda términos como Fotógrafo, Fotográfica, Fotomecánica, etcétera

La lógica booleana es una lógica de conjuntos y nos sirve, principalmente, para definir formas de intersección entre conjuntos.En este caso, los conjuntos serian lo que quedan definidos por una palabra, es decir, serian conjuntos definidos por intensión. Si uso la palabra "psicoanálisis", esta recubre todo el conjunto de elementos, para el caso, páginas web, en las que dicha palabra se encuentre incluida. Así, a partir de diferentes palabras se definen conjuntos de páginas agrupadas por el hecho de incluir (o no) esa determinada palabra. Estos conjuntos tendrán, entre si, elementos en común, y elementos que no. Una manera de precisar o afinar nuestra búsqueda consistirá en utilizar estos operadores booleanos para precisar el campo de nuestro interés.

Page 8: Métodos de búsqueda en internet

Las principales opciones como se mencionaba anteriormente son:

OR - se suman los conjuntos definidos por dos palabras, es decir, la respuesta será todas aquellas referencias donde aparezcan, indistintamente, UNA U OTRA de las palabras indicadas para búsqueda.

AND - se trata de la intersección de los conjuntos definidos por las dos palabras, es decir, solo aquellas referencias que contengan AMBAS palabras a la vez

NOT - en este caso, aquellas referencias que tengan la primera palabra y no la segunda, es decir, un primer conjunto, amputado de su parte común con otro. La principal utilidad que puede tener la opción NOT es la de eliminar todas las referencias de algún tipo de dominio: por ejemplo, si pensamos que nuestra búsqueda supone páginas puramente académicas y que muy difícilmente pueda encontrarse en algún sitio web comercial, al poner "NOT .com" nos ahorraremos todas las referencias que hayan sido inicialmente seleccionadas por contener palabras con la misma raíz que aquellas que estamos usando para realizar una búsqueda.

NEAR - La utilidad de NEAR, que por otra parte está implementada en muy pocos lugares, nos permite buscar en forma mas precisa definiciones compuestas. Por ejemplo, no nos va a dar lo mismo si buscamos por "neurosis" y "obsesiva" con AND que con NEAR. En el primer caso tendremos todas las referencias donde se hable de neurosis y de obsesión; pero no serán, forzosamente, referencias a la neurosis obsesiva. Es mas probable que obtengamos mejores resultados usando el NEAR.

http://psiconet.com/enlaces/internet/boole.htm