Búsqueda y Obtención de Información

23
Búsqueda y Obtención de Información

description

Búsqueda y Obtención de Información. Contenido de esta presentación. Búsquedas avanzadas Booleanas. Entornos. Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas. Las Consecuencias. Es letal - PowerPoint PPT Presentation

Transcript of Búsqueda y Obtención de Información

Búsqueda y Obtención de Información

L. Codina - UPF

2

Contenido de esta presentación

Búsquedas avanzadas Booleanas

Octubre 2013

L. Codina - UPF

3

Entornos

Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas

Octubre 2013

L. Codina - UPF

4

Las Consecuencias

Es letal Mucha información (ruido) Perder información (silencio)

Necesitamos Solamente información relevante (precisión), pero Toda la información relevante (exhaustividad)

Octubre 2013

L. Codina - UPF

5

Las Soluciones

Necesitamos Conocer las fuentes

Fuentes críticas de cada sector de actividad o rama del conocimiento Saber buscar

Conocer los principios unificadores de la búsqueda Ecuaciones de búsqueda

Uso efectivo de los formularios de búsquedas avanzadas

Octubre 2013

L. Codina - UPF

6

Búsqueda simple

Palabra(s) clave(s) Un único término

Ejemplos: web Problema: ruido

Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) Ejemplos: web móvil Problema: falsas coordinaciones

Frase Una frase o una palabra clave compuesta rodeada por comillas

Ejemplos: “la web móvil y los medios de comunicación” Problema: silencio

Recomendación general Uso de búsquedas avanzadas

Octubre 2013

L. Codina - UPF

7

Búsquedas avanzadas

Booleanas

Octubre 2013

L. Codina - UPF

8

Parametrizadas

Palabras claveRestricción por campos o parámetrosLos más habituales

Título Tema Fecha de publicación Autor Lengua

Ejemplo Título: “cine musical” Entre: 1960 y 1980

Octubre 2013

L. Codina - UPF

9

Parametrizadas

Catálogos:Catálogo Athenea de la UPO http://athenea.upo.es/REBIUN http://rebiun.absysnet.com/ Bases de datos:ISOC del CSIC En http://athenea.upo.es/ buscar ISOCDialnet: http://dialnet.unirioja.es/

Buscadores académicos:SCIRUS http://www.scirus.com/

Octubre 2013

L. Codina - UPF

10

Booleanas - 1

Basada en álgebra de BooleOperadores principales

AND OR NOT

Forma simple t1 OP t2 Dónde:

t1 es una palabra clave OP es uno de los operadores principales (AND, OR, NOT)

Concepto de ecuación t1 OP t2 = conjunto de documentos

Octubre 2013

L. Codina - UPF

11

Booleanas - 2

Forma compuesta (t1 OP t2) OP (t3 OP t4) Ejemplos

(cine OR vídeo) AND (ayudas OR becas) (sitcom OR “comedia de situación”) AND (niños OR adolescentes)

Octubre 2013

L. Codina - UPF

12

Booleanas - 3

Uso AND > reduce resultados y aumenta precisión OR > aumenta resultados y reduce precisión NOT > reduce resultados y aumenta precisión

Balance: AND > aumenta precisión pero elimina información OR > aumenta resultados pero incrementa el ruido NOT > reduce el ruido pero elimina información

Octubre 2013

L. Codina - UPF

13

Cuadro resumen

Operador Resultados Precisión Ruido

AND - + -OR + - +NOT - + -

Octubre 2013

L. Codina - UPF

14

Problemas - 1

AND > Falsamente intuitivo No corresponde necesariamente con el uso del “y” gramatical Ejemplo: “necesito información sobre la obras de teatro y novelas

que han sido adaptadas para cine y televisión” Traducción booleana incorrecta:

(teatro AND novela) AND (cine AND televisión) Problema: el usuario perderá información muy relevante

Traducción booleana correcta: (teatro OR novela) AND (cine OR televisión) Ventaja: el usuario consigue una gran precisión sin pérdida de

información

Octubre 2013

L. Codina - UPF

15

Búsquedas Combinadas

Combinan ecuaciones Parametrizadas Booleanas

Ejemplo (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-

2012) Interpretación: buscamos artículos sobre la web móvil y la

publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años.

Octubre 2013

L. Codina - UPF

16

Ejemplo: CSIC

Formulario de búsqueda combinada en CSIC

Octubre 2013

L. Codina - UPF

17

Problemas - 2

OR Anti intuitivo

término 1 o bien término 2, o ambos cuantos más términos, más ruido, no menos

En la lengua natural, la partícula “O” puede tener dos significados: Incluyente Excluyente

Cómo operador booleano siempre es incluyente

Octubre 2013

L. Codina - UPF

18

Problemas 3

NOT Anti intuitivo Puede destruir información: elimina por igual información relevante y

no relevanteEjemplo: “necesito información sobre publicidad de

refrescos, pero siempre que sean bebidas para adultos”Con la ecuación: (refrescos AND publicidad) NOT jóvenes

Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos”

Octubre 2013

L. Codina - UPF

19

Ejercicio 1

Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?:a) (becas AND ayudas) AND (cine AND vídeo)b) (becas OR ayudas) AND (cine OR vídeo)

Octubre 2013

L. Codina - UPF

20

Ejercicio 2

Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?:a) perros AND gatosb) perros OR gatos

Octubre 2013

L. Codina - UPF

21

Ejercicio 3

¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?:• (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos))

Octubre 2013

L. Codina - UPF

22

Ejercicio 4

¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM”

Octubre 2013

L. Codina - UPF

23

Ejemplo de sistemas relevantes

Motores académicos Scirus Google Scholar

Bases de datos académicas (multidisciplinares) Dialnet CSIC

Bases de datos profesionales (Humanistas) Historical Abstracts Fondo antiguo de la USE: http://fondosdigitales.us.es/ Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ Cartoteca Digital http://cartotecadigital.icc.cat/ Portal de Humanidades Liceus

http://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 Acceso a Pares http://pares.mcu.es/ Europeana http://www.europeana.eu/portal/ Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol

Octubre 2013