Tecnologías semánticas en sanidad

33
Presentación Daedalus Tecnología Semántica de Daedalus en el sector de la Sanidad Madrid, 2014

description

Daedalus desarrolla tecnología para extraer significado de contenidos no estructurados. En el sector de e-Salud (e-Sanidad), la tecnología semántica permite explotar automáticamente la información de la Historia Clínica Electrónica (HCE). Esta presentación cubre la experiencia de Daedalus en: • Monitorización de contenidos online sobre salud • Enriquecimiento semántico (etiquetado) de historia clínica • Anonimización de historias clínicas • Búsqueda multimedia en historias clínicas • Detección de interacciones entre medicamentos • Analítica de texto y de datos en el sector de salud

Transcript of Tecnologías semánticas en sanidad

Page 1: Tecnologías semánticas en sanidad

Presentación Daedalus

Tecnología Semántica de Daedalus en el sector de la Sanidad

Madrid, 2014

Page 2: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad

Daedalus desarrolla tecnología para extraer el significado y estructurar todo tipo de contenido multimedia.

Nuestros clientes pueden así rentabilizar sus contenidos automatizando sus procesos.

2

Page 3: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad Operaciones

•  ¿Cuántos datos estructurados se procesan de la Historia Clínica Electrónica? ¿Y con los no estructurados, qué se hace?

•  Aplicaciones:

•  Soporte a la codificación ICD9/10, SNOMED CT, CIMA, …

•  Sistemas de ayuda a operadores humanos: procesos de codificación (p.ej.: diagnósticos en partes de alta en urgencias)

3

No Estructurados Estructurados

Page 4: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad Monitorización !  En EEUU

4

75%

Internet Información sobre salud

42%

Redes Sociales Información sobre salud

Page 5: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad Monitorización !  En España

5

Page 6: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad Monitorización

!  ¿Qué monitorizar?

6

Fármacos

Enfermedades

Reacciones a medicamentos

Page 7: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS en Sanidad Monitorización

!  ¿A quién interesa?

7

Farmacéuticas

Centros de Salud (hospitales, clínicas

privadas)

Administradores de blogs, foros, …

Page 8: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

PROYECTOS Y EXPERIENCIAS

Page 9: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

HEALTH DASHBOARD

Page 10: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Health Dashboard

10

Page 11: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

AUTOMATIZACIÓN DE PROCESOS SOBRE HISTORIAS CLÍNICAS

Page 12: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

!  Objetivo: Interoperabilidad semántica

!  Elementos: •  Vocabularios: UMLS " SNOMED CT, ICD-9, ICD-10, CIE-9, CIE-10, LOINC •  Arquetipos: modelos clínicos reutilizables, openEHR •  Plantillas: vistas sobre los arquetipos, HL7 •  Modelos de Referencia: especificación para la definición de arquetipo, ISO13606

!  El tratamiento lingüístico automático ayuda a estructurar la Historia Clínica: •  Etiquetado automático según vocabularios •  Relación de informes clínicos con plantillas •  Tratamiento multiligüe basado en tecnología Daedalus

12

Automatización de procesos sobre HC

Page 13: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Caso de uso: clasificación automática de informes médicos

!  Ejemplo de aplicación: asignar automáticamente códigos ICD a informes radiológicos.

•  ICD (International Statistical Classification of Diseases and Related Health Problems), estándar de la Organización Mundial de la Salud

!  Objetivo: •  Análisis de la justificación de pruebas médicas para empresas aseguradoras

!  Datos del caso: •  Datos de informes de urología de pacientes •  Periodo de 1 año •  978 documentos y 45 etiquetas ICD-9-CM con 94 combinaciones •  Proporcionado por el Departamento de Radiología del Hospital para Niños de

Cincinnati

13

Automatización de procesos sobre HC

Page 14: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

ANONIMIZACIÓN DE HISTORIAS CLÍNICAS

Page 15: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

!  Objetivo: Facilitar el análisis y explotación de la información contenida en las Historias Clínicas.

!  Tecnología de procesamiento lingüístico para detección de nombres de personas, direcciones, teléfonos con el fin de ocultar la identidad de los pacientes en transacciones médicas.

15

Anonimización de Historias Clínicas

Page 16: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

BÚSQUEDA MULTIMEDIA SOBRE HISTORIAS CLÍNICAS

Page 17: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Búsqueda de información por voz

!  Acceso a la información mediante voz: •  Reconocimiento de voz aplicado a sistemas de búsqueda de datos en historiales

y documentación médica en general.

17

Transcripción

Archivo

Búsqueda

Búsqueda Multimedia sobre Historias Clínicas

Page 18: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Búsqueda sobre contenidos en audio o vídeo !  Ejemplo de aplicación:

!  DALI, Digital Audio Library Indexing

18

Búsqueda Multimedia sobre Historias Clínicas

Page 19: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Búsqueda en Historias Clínicas a partir de texto

!  Localización de información:

•  Ofrece alternativas de búsqueda en situaciones en las que no se obtienen resultados.

•  Construcción de posibles alternativas que corrijan errores ortográficos comunes, calculando la similitud entre los términos de búsqueda y los términos de indización y ofreciendo posibilidades de selección al usuario (del tipo “usted quiso decir…”)

•  Búsqueda semántica mediante ontologías de dominio como SNOMED.

19

Búsqueda Multimedia sobre Historias Clínicas

Page 20: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Caso de uso: Búsqueda sobre historias e imágenes médicas

!  Búsquedas sobre una colección de casos médicos compuestos por:

•  imágenes (50.000 aprox.) •  descripciones textuales de los casos (en inglés y francés)

!  Para buscar se emplean sólo imágenes (radiografías, escáneres …) y, en ocasiones, texto

!  Contexto del trabajo: experimentos en el foro europeo CLEF (Cross Language Evaluation Forum) de búsqueda de información

20

Búsqueda Multimedia sobre Historias Clínicas

Page 21: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Caso de uso: Búsqueda sobre historias e imágenes médicas !  Experimentos en ImageCLEFMed (foro europeo CLEF)

21

Búsqueda Multimedia sobre Historias Clínicas

Page 22: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Caso de uso: Búsqueda sobre historias e imágenes médicas

22

!  Ejemplos de búsqueda multilingüe de información en experimentos ImageCLEFMed (foro europeo CLEF)

Búsqueda Multimedia sobre Historias Clínicas

Page 23: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

EXPERIENCIA PILOTO SOBRE ETIQUETADO DE INFORMES

Page 24: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

¿Qué hemos hecho?

Experiencia piloto sobre Etiquetado de Informes

!  Obtener recursos necesarios en el formato adecuado para la infraestructura de Textalytics. Basado en UMLS.

!  Construir un etiquetador, capaz de analizar el texto de entrada, extraer sintagmas nominales y obtener el código que les corresponde atendiendo a su similitud con las entradas de los recursos.

!  A partir de los informes reales proporcionados por un Hospital, se han transcrito combinando técnicas OCR con proceso manual, se ha tomado nota de los códigos y éstos se han empleado para evaluar el prototipo de etiquetador que se muestra a continuación.

24

Page 25: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Recursos lingüísticos

Experiencia piloto sobre Etiquetado de Informes

•  Términos en español

•  Combinación de SNOMED Inglés – ICD9 inglés y SNOMED español

•  Explotación de relaciones semánticas (same_as) referidas a conceptos

UMLS Dicc.

ICD9 ES

25

Page 26: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Recursos lingüísticos

Experiencia piloto sobre Etiquetado de Informes

!  Filtrado de UMLS para obtener términos en español y el código ICD9 que les corresponde.

!  Filtrado del thesauro resultante, formado por más de 45.000 términos. !  De esos términos y expresiones, muchos son palabras comunes, polisémicas,

que conducen a un sobre-etiquetado. Se filtran apoyándose en los diccionarios de K-Site Core, quedando en alrededor de 25.000 términos.

!  Se emplean datos de frecuencia de aparición de palabras en el thesauro para filtrar palabras con escaso contenido semántico.

!  Se prevé incluir un diccionario adicional con acrónimos y abreviaturas en el dominio médico.

26

Page 27: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Arquitectura prototipo

STILUS Fuzzy

Dicc. ICD9 ES

STILUS Core

Preproceso

Resultado Texto Entrada

27

Experiencia piloto sobre Etiquetado de Informes

Page 28: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Arquitectura solución

STILUS Fuzzy

Dicc. ICD9 ES

STILUS Core

Preproceso

Resultado

Texto Entrada

Reglas y Patrones

28

Experiencia piloto sobre Etiquetado de Informes

Page 29: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Arquitectura Solución

!  Algunos elementos:

1. Preprocesado: Análisis lingüístico del texto de entrada mediante Stilus Core para identificar sintagmas nominales.

2. Reglas Inferencia para identificar códigos ICD9 mediante caracterizaciones.

Ej.: Si la frase contiene estructuras “número”+”unidad de medida”, al menos un medicamento y la palabra ‘tratamiento’ entonces le corresponde el código V58.69

29

Experiencia piloto sobre Etiquetado de Informes

Page 30: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Conclusiones

Estudiar necesidades (¿posibilidad de acotar? ¿secciones del informe? ...)

Aún queda camino por recorrer Obtener reglas según metodología de etiquetado

Especificar la intervención manual

Precisión inicial en entorno desatendido superior al 60%

Experiencia piloto sobre Etiquetado de Informes

30

Page 31: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

QUIENES SOMOS

Page 32: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

Quiénes Somos

!  Desde 1998 ofrecemos soluciones, productos y servicios para la sociedad de la información

!  Sociedad anónima de capital nacional privado

!  Nuestra principal línea de actividad se centra en la extracción de significado a partir de contenidos multimedia con el objetivo de rentabilizar al máximo los contenidos gestionados por nuestros clientes.

!  Clientes: grandes empresas en todos los sectores: medios, defensa, telecomunicación, energía, administración pública…

!  Vocación: innovación, con participación activa en proyectos de I+D nacionales y europeos

32

Page 33: Tecnologías semánticas en sanidad

Tecnología de Daedalus en el sector de la Sanidad

DAEDALUS, S.A. Oficina Central: López de Hoyos 15 28006 Madrid

Depto. Técnico: Edificio Vallausa II Albufera 321 28031 Madrid

Tel: +34 913.32.43.01 [email protected] http://www.daedalus.es

33