Presentacion_ExamenGrado

31
Diseño y Desarrollo de un Módulo Diseño y Desarrollo de un Módulo para la Generación de Estadística para la Generación de Estadística Operativas del área de Operativas del área de Neonatología” Neonatología” Tesista: Enriue Martíne! T"lle! Director de tesis: M en #$ María %$ %&ud 'igueroa Codirector de tesis: M$#$E (eatri! Olivares )epa*ua +ocales: M en #$ #elia ,o-ero Torres M,T$ .gnacio /ópe! Martíne! Enero 0122

description

Data Minning, Weka

Transcript of Presentacion_ExamenGrado

  • Diseo y Desarrollo de un Mdulo para la Generacin de Estadsticas Operativas del rea de NeonatologaTesista: Enrique Martnez TllezDirector de tesis: M en C. Mara A. Abud Figueroa

    Codirector de tesis: M.C.E Beatriz Olivares ZepahuaVocales:M en C. Celia Romero Torres MRT. Ignacio Lpez Martnez

    Enero 2011

  • AGENDA.Introduccin.Planteamiento del problema.Objetivo general.Tecnologas Utilizadas.Arquitectura del Mdulo de Neonatologa.Estadsticas Operativas.Desarrollo del Proceso KDD.Casos de prueba y resultados.Conclusiones.

  • IntroduccinEl uso de Estadsticas Operativas dentro del HRRB, se refleja en el apoyo que brinda tanto a directivos como a mdicos para el conocimiento de la tasa de mortalidad o incidencia de los Recin Nacidos.Dentro de este sistema se hace uso de Minera de Datos .Para hacer posible lo anterior se requiere apoyarse en tcnicas de Minera de datos tales como agrupamiento, clasificacin y redes Neuronales entre otras.

  • Planteamiento del ProblemaOptimizar tiempo, generando Estadsticas Operativas. Obtener predicciones de la mortalidad y morbilidad de un recin nacido, con base a variables especficas tanto del Recin Nacido como de la Madre. El uso de tcnicas de Minera de datos como lo es: la tcnica de clasificacin utilizando algoritmos como Naive Bayes, rboles de Decisin o Lazy KStar.

  • Objetivo GeneralDesarrollar un mdulo que proporcione la probabilidad de Mortalidad y Morbilidad de los Recin Nacidos del HRRB, utilizando tcnicas de Minera de Datos y la generacin de Estadsticas Operativas a travs de Servicios Web.

  • Tecnologas UtilizadasIDE .- NetBeans 6.5Servidor de Aplicaciones Glassfish v2 (Servicios Web)Weka como herramienta de Minera de DatosPostgreSql 8.3 (Interfaz grfica PGADMIN)Soa Editor. (para la descripcin de servicios web (WSDL))Java.

  • Arquitectura del Mdulo de NeonatologaNeonatologaEstadsticasMinera de Datos

  • Estadsticas OperativasEl fallecimiento de un RN antes de cumplir 28 das de vida se denomina muerte del neonato, las causas principales son el nacimiento prematuro (antes de 37 semanas de gestacin), el bajo peso, complicaciones respiratorias (Asfixia Perinatal y Membrana Hialina); debido a esto es importante llevar un control estadstico en donde el especialista pueda observar ampliamente los factores que determinan cada padecimiento y de alguna manera evaluar las tcnicas de reanimacin aplicadas y reducir los ndices de mortalidad.

  • Estadsticas OperativasTasa de Mortalidad de la Comunidad.Tasa de Mortalidad del HRRB.Incidencia de EMHIncidencia de AsfixiaTasa de Mortalidad de EMH por Peso entre 1 y 1.5Tasa de Mortalidad de EMH por Peso entre 1.5 y 2.Tasa de Mortalidad Especfica por AsfixiaTasa de Mortalidad por PesoTasa de Mortalidad de la U.C.I.N.Tasa de Mortalidad de EMH.

  • Caso de PruebaTasa de Mortalidad de EMH

    Recin Nacidos PrematurosDificultad para respirarFalta de desarrollo en los pulmones.

  • Proceso KDD (Knowledge Discovery in Databases) Seleccin de Datos.De 1500 a 2500 Recin Nacidos (Fallecidos y no Fallecidos).Se valora su estado fsico y mental (Apgar y Silverman).25% del total nacidos vivos tienen o desarrollan una complicacin o padecimiento.Desafortunadamente de ese total de un 10% a un 15% fallecen.Unidad de Cuidados Intensivos de Neonatologa. O Cuidados Intermedios de Neonatologa.

  • Proceso KDD (Knowledge Discovery in Databases)

    AoRecin NacidosVivosTotal de Ingresos UCINTotalDefunciones dentro de UCINPorcentaje de Mortalidad dentro deUCINPorcentajeMortalidad de losNacidos Vivos200116154135814.04%3.59%200216864005614.00%3.32%200318024725411.44%3.00%200416043313911.78%2.43%20051860446378.30%1.99%200626275366712.50%2.55%200729495606110.89%2.07%20082789514499.53%1.76%200929005636412.45%2.20%

  • Proceso KDD (Knowledge Discovery in Databases) Limpieza de Datos.

  • Proceso KDD (Knowledge Discovery in Databases) Preparacin de Datos.- Eleccin de las variables de peso.Mortalidad.- Antecedentes Maternos, edad de la madre (madre), peso, edad gestacional y Apgar (R.N.).Morbilidad.- Peso, Apgar, y sexo (R.N.), ruptura de membrana, diabetes, anemia y tipo de parto.

  • Eleccin de datos

  • Aplicacin del algoritmo de Minera de Datos.Para el entrenamiento y validacin del modelo se utiliz Weka como herramienta que contiene diversas tcnicas de Minera de Datos, utilizando para esto algoritmos tiles para la obtencin de predicciones tales como Naive Bayes, Lazy K-Star y J48.

  • Entrenamiento del modelo predictivo

    J48

    Naive Bayes

  • K-Star

  • Validar Modelo (desde lnea de comandos de Weka)java weka.classifiers.bayes.NaiveBayes -T data/NaiveBayes.arff -l data/NaiveBayes.model -p 0

  • Validar Modelo (desde lnea de comandos de Weka)

  • Caso de Prueba (Mortalidad)Peso de 1.87 kgSexo Masculino.Edad gestacional 30 semanas.Prueba de Apgar 4 pts.Edad materna 36.Preeclampsia.Ruptura de membranaEl sistema predice que con estos valores tiene una probabilidad de 76.71% de que fallezca.

  • ResultadosPrediccin Mortalidad

  • Prediccin Mortalidad

  • Caso de Prueba MorbilidadPeso 1.45 kg. Sexo femenino.Edad gestacional 34 semanasApgar 9 pts.Edad materna 16 aos Tipo de parto vaginal. Ruptura de membrana.El sistema predice que con estos valores tiene una probabilidad de 56.21% de enfermar.

  • Prediccin MorbilidadResultados

  • Prediccin Morbilidad

  • ConclusionesComo conclusin se puede asegurar que el uso de Minera de Datos es propiamente para descubrir las relaciones entre los datos, pero eso es slo cuando se empieza con el arduo trabajo que implica el preparar, filtrar, pre procesar y entrenar los datos. En realidad el resultado predictivo es la combinacin de la experiencia de los expertos de un rea especifica (Neonatologa) y el uso de las tcnicas de minera de datos.

  • GRACIAS

    **