Categorización y Recuperación de Categorización y Recuperación de Información Médica en la WebInformación Médica en la Web
Alberto H. F. LaenderDepartamento de Ciência da Computação
Universidade Federal de Minas Gerais
Belo Horizonte - Brasil
Taller de Telemedicina e Informática MédicaMérida, Venezuela27 de Abril de 2001
2
Tópicos
• Introducción
• Búsqueda de Información Médica
• Categorización de Información Médica
• Sistemas de Recuperación de Información
• medScopio: Un Nuevo Paradigma para Búsqueda de Información Médica
• Conclusiones
• Referencias Bibliográficas
Introducción
• Con la expansión de la Internet es cada vez mayor el volumén de información médica disponible en la Web:
– Sítios médicos (ej., Medscape, WebMD, Salutia, etc.);
– Sítios de asociaciones de profesionales médicos (ej., WMA, AMA, AMB, etc.);
– Sítios de organizaciones médicas gubernamentales (ej., OPAS, OMS, etc.)
– Sítios de hospitales y instituciones de investigación médica (Johns Hopkins Hospital, UCLA Medical Center, etc.);
– Bibliotecas médicas digitales (ej., MEDLINE, BIREME, etc.).
Introducción
• Herramientas disponibles non son apropiadas para búsqueda de información médica.
• Herramientas genéricas (máquinas de búsqueda y directórios):– Domínio de búsqueda muy amplio;
– Baja precisión de las respuestas;
– Búsqueda limitada a documentos disponibles en la Web;
– Categorización muy genérica (ej., Yahoo!).
• Herramientas especializadas:– Limitan la búsqueda a una base de datos (ej., PubMed) o
utilizam técnicas de meta-búsqueda para acceso a múltiples fuentes (ej., MWSearch, MedNets).
Búsqueda de Información MédicaHerramientas Disponibles
• Máquinas de búsqueda genéricas:– Google, TodoBR, AltaVista, TodoCL, Inktomi
• Directórios:– Yahoo!, C@dê?
• Bibliotecas digitales:– MEDLINE (PubMed), BIREME (BVS)
• Sítios de meta-búsqueda:– MWSearch, MedNets, MedMiner
Búsqueda de Información MédicaMáquinas de Búsqueda Genéricas
Búsqueda de Información MédicaDirectórios: Yahoo!
Búsqueda de Información Médica Directórios: Yahoo!
Búsqueda de Información Médica Bibliotecas Digitales: PubMed (MEDLINE)
Búsquedade Información Médica Sítios de Meta-Búsqueda
Búsqueda de Información Médica Sítios de Meta-Búsqueda
Búsqueda de Información MédicaRequisitos Deseados
• Acceso integrado a múltiples fuentes de información médica (sítios médicos y bibliotecas médicas).
• Búsqueda por especialidad médica.
• Documentos categorizados y indexados por tópicos (preferencialmente basados en algun vocabulário médico controlado).
• Ambiente de consulta multilingüe y amigable.
• Respuestas ordenadas por critérios de relevancia.
Categorización de Información Médica
• Proceso de clasificación de información que utiliza códigos, conceptos y categorias del ambiente médico estandarizados a través de vocabulários controlados.
• Ejemplos de vocabulários controlados: – Medical Subject Headings (MeSH)
– Systematized Nomenclature of Medicine (SNOMED)
– Unified Medical Language System (UMLS)
– International Classification of Diseases (ICD)
– Medical Dictionary for Regulatory Activities (MedDRA)
Categorización de Información Médica Modelo HiMeD
• Utilizado para categorización automática de información médica textual de acuerdo con vocabulários controlados como ICD y MeSH.
• Componentes principales:– Vocabulários: Términos Especializados (Ve), Términos Non-
Especializados (Vn) y Categorias (C);
– Diccionários: Sinónimos (S), Siglas (Sg), Términos de Descarte (D) y Variaciones Morfológicas (Mt);
– Grafo de Asignación de Categorias (G);
– Consulta Especializada (Ce);
– Asignación de Categorias (A).
Categorización de Información Médica Modelo HiMeD
• Ejemplos de componentes del modelo HiMeD:
– Ve = {“Algida”, “Asiatica”, “Antimonial”, ..., “Cholerae”,
“Cólera”, ..., “Maligna”, “Morbus”, “Petilencial”, ”Vibrio”};
– C = {001, 001.0, 001.1, 001.9, 985, 985.4};
– S = {(“Distúrbio Convulsivo”, “Convulsão”),
(“Sialismo”, “Sialectasia”), ...};
– Sg = {(“ARJ”, “Artrite Reumatóide Juvenil”);
(“AVC”, “Acidente Cerebrovascular”), ...};
– D = {artículos y preposiciones de la lengua portuguesa};
– Mt = {(ção, ções, Sufixo), (fão, fã, Sufixo), ...}.
Categorización de Información Médica Modelo HiMeD - Algoritmo de Asinalamiento
Substuir Siglas, Siônimos e Variações Morfológicas
Início caminhar sobre o texto do documento médico Para cada termo lido Faça montar uma janela de tamanho ao redor do termo; Encontrar um caminho completo no índice CID com os termos dentro da janela de tamanho ; Se caminho encontrado, assinalar códigos indicados; Fim Para; Fim.
DocumentoMédico
"O paciente apresentaevidências laboratoriais debexiga neurogênica e de ITUcrônica ... "
"O paciente apresentaevidência laboratorial debexiga neurogênica e deinfecção do trato urináriocrônica ... "
Eliminar Termos deDescartes
"paciente apresenta evidêncialaboratorial bexiganeurogênica infecção do tratourinário crônica ... "
" paciente apresenta evidência laboratorial
bexiga neurogênica
infecção trato urinária crônica ... "
Lista de CódigosAssinaladosordenados
1. 599.02. 344.6
Sistemas de Recuperación de InformaciónComponentes Básicos
medScopio: Un Nuevo Paradigma para Búsqueda de Información Médica
• Disponible en:
– www.medscopio.com.br
• Características principales:– Acceso integrado a los principales sítios y bibliotecas
médicas disponibles en la Web;
– Más de 11 milliones de documentos categorizados y indexados de acuerdo con términos de la ICD;
– Ambiente de consulta bilingüe;
– Respuestas ordenadas de acuerdo con las más modernas técnicas de recuperación de información.
medScopioPágina de Consulta
medScopioPágina de Respuesta
medScopioRefinamiento de una Consulta
medScopio Refinamiento de una Consulta (cont.)
Conclusiones
• El volumén de información médica disponible en la Web es cada vez mayor.
• Herramientas de búsqueda disponibles non son apropiadas.
• Necesidad de herramientas que soporten adecuadamente el proceso de búsqueda de información médica.
• medScopio:– acceso integrado a múltiples fuentes de información;
– documentos categorizados de acuerdo con tópicos de la ICD;
– ambiente de consulta biligüe;
– documentos de respuestas ordenados por relevancia.
Referencias Bibliograficas
Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Addison Wesley, Harlow, England, 1999.
Cimino, J.J. Vocabulary and Health Care Information Technology: State of the Art. Journal of American Society for Information Science 46, 10 (1995), 777-782.
Hersh, W.R. Information Retrieval: A Health Care Perspective, Computers and Medicine. Springer-Verlag, New York, 1995.
Lima, L. R. S., Laender, A.H.F. and Ribeiro-Neto, B. A Hierarchical Approach to the Automatic Categorization of Medical Documents. Proceedings of the Seventh ACM International Conference on Information and Knowledge Management, Bethesda, Maryland, 1998, pp. 132-139.
Ribeiro-Neto, B., Laender, A.H.F. and Lima, L.R.S. An Experimental Study in Automatically Categorizing Medical Documents. Journal of the American Sociaty for Information Science and Technology 52, 5 (2001), 391-401.
Agradecimientos
• Agradesco la contribución de los demás miembros del equipo de desarrollo del medScopio:– Berthier Ribeiro-Neto
– Luciano Lima
– Hermes de Freitas Junior
– Rodrigo Vale
Top Related