Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

19
17/11/2010 Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia 1 Documento BIBLIOTECA-HEMEROTECA MEMORIA PASIVA ANÁLISIS EXTERNO - datos identificación ANÁLISIS INTERNO - indización ANÁLISIS DOCUMENTAL BANCO DE DATOS MEMORIA ACTIVA USUARIO Perfil de búsqueda LENGUAJE

description

INT

Transcript of Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

Page 1: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

1

Documento

BIBLIOTECA-HEMEROTECA

MEMORIA PASIVA

ANÁLISIS EXTERNO- datos identificación

ANÁLISIS INTERNO- indización

ANÁLISIS DOCUMENTAL

BANCO DE

DATOS

MEMORIA ACTIVA

USUARIO

Perfil debúsqueda

LENGUAJE

Page 2: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

2

SISTEMA DE RECUPERACIÓN DE INFORMACIÓN. (SRI)

Evaluación de un SRIGrado de éxito

Coeficiente de exhaustividad

Coeficiente de precisión

Coeficiente de exhaustividad = (a / a+c) % (38 / 38+11)% = 77,40%, (pérdida = 22,6%)(10-30%)

Coeficiente de precisión = (a / a+b) % (38 / 38+7)% = 84,4%, (ruido = 15,6 %)(10-20%)

Documentos Relevantes No relevantes TotalRecuperados A (38) B (7) a+bNo recuperados C (11) d c+d

Page 3: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

3

ECUACIÓN DE BÚSQUEDA / 1

Supone concretar una estrategia de búsqueda

Suele ser específica para cada base de datos, o cada grupo de bases

Tiene relación directa con el programa de recuperación a utilizar

Hay una serie de características básicas

Page 4: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

4

OPERADORES BOOLEANOSSon tres:

Y/AND: INTERSECCIÓN: Restringen la búsqueda. Se tienen que cumplir todos los criterios

O/OR: ADICIÓN: Son sumativos, recogen cualquier documento que tenga alguno de ellos

NO/NOT: EXCLUSIÓN: Elimina determinados conceptos. Se usa muy poco, plantea problemas.

Page 5: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

5

OPERADORES BOOLEANOS. DIAGRAMAS DE VENN

Médicos que trabajan en Zaragoza

Total Médicos

incluidos en labase de datos

consultada

Total personas quetrabajan en Zaragoza

incluidos en labase de datos

consultada

AND

Page 6: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

6

Médicos que trabajan en Zaragoza o en Pamplona

Total médicos quetrabajan en Pamplona

incluidos en labase de datos

consultada

Total médicos quetrabajan en Zaragoza

incluidos en labase de datos

consultada

OR

OPERADORES BOOLEANOS. DIAGRAMAS DE VENN

Page 7: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

7

Médicos que trabajan en Zaragoza pero no en el Hospital Royo Villanova

Total médicos quetrabajan en Zaragoza

incluidos en labase de datos

consultada

Total médicos quetrabajan en el Hospital

Royo Villanova incluidos en la base de datos

consultada

NOT

OPERADORES BOOLEANOS. DIAGRAMAS DE VENN

Page 8: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

8

Mucho menos utilizados que los booleanos

Muy variables según programas

Los más utilizados NEAR o ADJ(Adjunct)

En algunos casos se puede señalar hasta cuanto la proximidad: 3, 4 palabras, etc.

OPERADORES DE PROXIMIDAD

Page 9: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

9

OPERADORES DE PROXIMIDAD

WITH Recupera registros presentes en el mismo campo

NEAR/ADJ Recupera registros presentes en la misma frase

IN Recupera registros en un campo especificado

Page 10: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

10

TRUNCAMIENTO / 1Supone la posibilidad de quitar letras de una palabra y sustituirlas por un signo.

Se deben dejar siempre el mayor número de letras posible, nunca menos de 4

Los más usados: *, ?, $

Hay hasta tres tipos de truncamiento: inicial, final y medio.

Page 11: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

11

TRUNCAMIENTO / 2

FINAL: es el más frecuente, presente en la mayoría de programas. Muy usado para singulares o plurales, masculinos o femeninos.

INICIAL: uso muy infrecuente.

MEDIO: uso escaso. Generalmente para sustituir un problemas ortográficos.

Page 12: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

12

TRUNCAMIENTO / 2

FINAL: es el más frecuente, presente en la mayoría de programas. Muy usado para singulares o plurales, masculinos o femeninos.

INICIAL: uso muy infrecuente.

MEDIO: uso escaso. Generalmente para sustituir un problemas ortográficos. Ñ

Page 13: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

13

OTROS ELEMENTOS / 1

“..........................”

Muy utilizadas.

Indican que la búsqueda no es de una palabra, sino de todas las que hay dentro del entrecomillado y en ese orden

Page 14: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

14

OTROS ELEMENTOS / 2( ) Para ecuaciones complejas.

A relacionar con los operadores booleanos o de proximidad

Cada unidad es independiente

Da una respuesta que después se relaciona con otros paréntesis

Muy útiles, facilitan mucho las ecuaciones

Page 15: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

15

Medline-PubmedMedline: Es la base de datos bibliográfica producida por la

National Library of Medicine (NLM) de los Estados Unidos de

América≃ 5.000 revistas de biomedicina≃ 18.000.000 referencias

Pubmed: Es un sistema de búsqueda desarrollado en el NationalCenter for Biotechnology Information (NCBI) y alojado en la NLM.

Medline

Premedline

Genbank. Secuencias genéticas National Institutes of Health (NIH)

Complete genome

Page 16: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

16

Manuales de ayuda Herramientas de búsqueda Acceso a otros recursos

Page 17: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

17

Resultado de búsqueda libre, frase entrecomillada

Término de búsqueda Resultados Texto completo Revisiones

"Lung cancer" 61.500 13.308 8.635

"Cancer lung" 164 30 20

"Pulmonary cancer" 978 46 50

"Cancer pulmonary" 25 1 4

"Pulmonary neoplasm" 218 35 16

"Neoplasm pulmonary" 185.258 33.557 19.900

"Lung neoplasm" 187 30 27

"Neoplasm lung" 2 0 0

"Cancer pulmon" 4 2 0

Page 18: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

18

Pubmed - MeSHMedical Subject Heading (MeSH): Descriptores en ciencias de la salud que configuran el Thesauro de Pubmed.

Es un vocabulario controlado de términos biomédicos que identifican el contenido de cada uno de los artículos.

Contiene unos 33.000 términos que reflejan cambios en la práctica médica y cambios en la terminología.

A partir de los subencabezamientos (subheadings) se puede concretar uno o varios aspectos específicos de cada término.

Ayudan a perfilar la búsqueda y descubrir facetas del tema que no se habían considerado.

Los resultados obtenidos suelen ajustarse con mayor precisión a la información requerida.

Page 19: Bases de Datos Biom Dicas y Sistema de Recuperaci n de La Informaci n SRI

17/11/2010Dr. M. Moreno Vernis. Dpto. Ciencias de la Documentación e Historia de la Ciencia

19

Uso de etiquetas de campo (tags)Smith [au]; (fever [ti] OR hypethermia [ti])