Post on 13-Feb-2016
1
RESUMEN
INTRODUCCIÓN
El Temblor Esencial y la Enfermedad de Parkinsonson considerados dos trastornos de movimientodiferentes, el primero asociado a un temblorcinético/postural y el segundo a un temblor dereposo. Sin embargo, en la literatura médica hacennotoria la potencial relación que puede existir entreambas enfermedades. El hecho de que pacientes conla EP presenten un temblor postural igual al TE, queuna enfermedad sea un factor de riesgo para eldesarrollo de la otra, que ambas enfermedadescompartan características neurodegenerativas y elsolapamiento semiológico del temblor provoca queel diagnóstico clínico no sea fiable y surge lanecesidad de implementar métodos de InteligenciaArtificial para analizar y cuantificar el temblor y enbase a su medida, clasificarlo. Brindando a losmédicos una herramienta práctica y eficaz, paraasegurar un tratamiento adecuada del paciente, y asímejorar su calidad de vida.
OBJETIVO
Desarrollar una metodología que permitaautomatizar la clasificación del temblor esencial ytemblor parkinsoniano, utilizando las Máquinas deSoporte Vectorial, para el apoyo al diagnósticoclínico garantizando al paciente una atención ytratamientos adecuados.
METODOLOGÍA
Se parte de una base de datos conformada por lasseries temporales de un conjunto de pruebas, donde
cada prueba está constituida por una serie depatrones (formas geométricas) ejecutadas en formaestática (manteniendo una postura), cinética(siguiendo la trayectoria del patrón) y dinámica(fuerzas generadas artificialmente) sobre la manodel paciente. Los datos generados en estas pruebasfueron registrados y almacenados por el sistemaDIMETER, que utiliza un dispositivo háptico llamadoPHAMToN para la adquisición de los datos. Para lacaracterización del temblor se utilizó el PSD y losPoliespectros; el Análisis de ComponentesPrincipales disminuyó la dimensionalidad de losvectores; la distancia de Mahalanobis y el coeficientede Curtosis proporcionaron el medio para laseparación de los valores atípicos. La Máquina deSoporte Vectorial proporcionó el modelo declasificador utilizando los vectores característicospreviamente analizados.
RESULTADOS
Del análisis de los resultados obtenidos en lasdiferentes hipótesis y ensayos, dan cuenta que laspruebas estáticas y cinéticas son suficientes paracaracterizar el temblor y crear un clasificador SVMcon una buena capacidad de generalización,obteniendo en la fase de clasificación un error del0%.
PALABRAS CLAVES: Temblor Esencial, Enfermedadde Parkinson, Temblor Fisiológico, Máquinas deSoporte Vectorial, PSD, Poliespectro, Análisis deComponentes Principales, Distancia de Mahalanobis,Coeficiente de Curtosis.
2
ABSTRACT
INTRODUCTION
Essential Tremor and Parkinson's disease areconsidered two different movement disorders, thefirst associated with a kinetic / postural tremor andthe second to a resting tremor. However, in themedical literature makes evident the potentialrelationship that may exist between the twodiseases. The fact that PD patients present apostural tremor equal to TE, a disease is a risk factorfor the development of the other, both diseasesshare neurodegenerative characteristics, andsemiological overlapping of tremor causes theclinical diagnosis is unreliable and there is a need toimplement Artificial Intelligence methods to analyzeand quantify tremor and based on its measures,classify. Providing physicians with a practical andeffective tool to ensure appropriate patient care,and improve their quality of life.
OBJECTIVE
To develop a methodology to automate theclassification of essential tremor and parkinsoniantremor, using Support Vector Machines, to supportthe clinical diagnosis ensuring patient care andtreatments.
METHODOLOGY
We assume a database consists of time series of aset of tests, where each test consists of a series of
patterns (shapes) executed statically (maintaining astance), kinetic (following the trajectory pattern) anddynamic (generated artificially forces) on thepatient's hand. The data generated in these testswere recorded and stored by the DIMETER systemthat uses a haptic device called PHAMToN for dataacquisition. For the characterization of the tremorwas used the PSD and higher order spectra; PrincipalComponent Analysis reduced the dimensionality ofthe vectors; Mahalanobis distance and thecoefficient of kurtosis provided the means forremoval of outliers. The Support Vector Machineclassifier provided the model using the featurevector previously discussed.
RESULTS
Analysis of the results obtained in the differenthypothesis show that the static and kinetic tests aresufficient to characterize the tremor and create aSVM classifier with good generalization ability,getting in qualifying an error of 0%.
KEYWORDS: Essential Tremor, Parkinson's disease,Physiological Tremor, Support Vector Machines, PSD,Higher Order Spectra, Principal Component Analysis,
Mahalanobis distance, Coefficient of Kurtosis.
INTRODUCCIÓN
Mi motivación personal…
¿Por qué tiembla? Fue la pregunta que hice 15 años atrás a mi tía abuela Francisca, algo raro le ocurría.
No era usual ver como su mano empezó a temblar sin que hubiese voluntad de hacerlo. Las condiciones
sociales de un país como el mío nos mantenía al margen del servicio de la salud, intentamos apaciguar
aquel movimiento incontrolable con medicina ancestral, no buscamos ayuda profesional, la escasez de
los recursos económicos familiares lo impedían, pasó el tiempo y como por contagio empezó a temblar
su otra mano y luego sus piernas, pero era solo el principio. Con dificultad podía coger un cubierto, su
autoestima estaba muy afectada, ya la enfermedad no solo afectaba la parte motora sino que su parte
cognitiva también se volvió en su contra. Nuestra preocupación y amor familiar nos llevó a buscar ayuda
de un especialista, Parkinson y no hay cura, ese fue el diagnóstico. A poco tiempo el Papa Juan Pablo II
falleció y supimos que él también padeció esta enfermedad. La falta de especialización de los médicos y
la evolución singular de esta enfermedad en cada persona que la padece, hizo que cada medicamento
que ingería sea rechazado por su organismo y fue muy difícil atinar con el tratamiento adecuado. Son 2
años desde que vine a España en la búsqueda de conocimiento y fue una oportunidad coincidir con un
tema que afectaba a mí ser querido, acepté el reto y hoy soy consciente que pude haber hecho mucho y
que puedo seguir haciendo más por ella. Hoy la enfermedad está muy avanzada me dice que ha dejado
de caminar porque se cae, que le cuesta mucho extender sus piernas y sus brazos, la escucho con voz
titubeante y temblorosa y sé que le cuesta mucho coger el teléfono. Su cuerpo ha cambiado pero sus
sentimientos siguen siendo los mismos de siempre, lo último que me dijo fue "hijo, cuando vuelves,
tengo muchas ganas de verte". Solo tengo que agradecer a la vida por tenerla entre nosotros y
compartir con ella algo que no enferma, no tiembla, no daña, ni duele, el amor.
Existe un gran número de enfermedades de origen neuronal que provocan Trastornos del Movimiento y
pueden desencadenar en una importante pérdida de calidad de vida de las personas. El movimiento más
efímero y simple es el resultado de complejas interacciones entre múltiples circuitos neuronales dentro
del cerebro y la médula espinal, si alguna parte del sistema nervioso se ve afectado aparecen una
variedad de trastornos del movimiento.
Según el Instituto Nacional de Trastorno Neurológicos y Accidentes Cerebrovasculares, indica que el
Temblor es el más común de los trastornos del movimiento y lo define como un movimiento
involuntario y rítmico, que implica la oscilación de una o más partes del cuerpo.
No siempre el temblor es un movimiento anormal. El potencial eléctrico generado en el cerebro por
miles de neuronas, forman ondas cerebrales con diferentes frecuencias. Las neuronas encargadas del
movimiento corporal oscilan a 10 ciclos por segundo, que es el temblor mínimo casi imperceptible que
todas las personas presentan, llamado Temblor Fisiológico. Cuando existen factores como el cansancio,
el nerviosismo, el miedo, etc., el cuerpo segrega adrenalina haciendo que el temblor incremente, pero
continua siendo un temblor normal.
Cuando existen alteraciones en el sistema nervioso y el patrón de activación muscular continuo es
reemplazado por descargas bruscas, rítmicas y breves, el temblor se vuelve anormal, es decir en un
Temblor Patológico. Existen algunos tipos de temblor considerados dentro del temblor patológico, el
Temblor Esencial y el temblor provocado por la Enfermedad de Parkinson son los más comunes dentro
de la población que comprende a las personas de mediana edad y ancianas, afectando a hombres y
mujeres en forma similar.
El incremento de la esperanza de vida experimentada especialmente por los países desarrollados, se
traduce en un problema llamado envejecimiento poblacional, la franja de población mayor a 60 años se
ve aumentada. Según la División de Población del Departamento de Asuntos Económicos y Sociales de la
Secretaría de las Naciones Unidas (2013), la población mundial mayor a 60 años en el 2013 se calculó en
841 millones, se estima que durante 2013-2050 se incremente a 2020 millones, aumentando del 12 a
21% a nivel mundial, del 23 a 34% en Europa, del 20 al 27% en Norteamérica, del 11 a 24% en Asia, del
11 al 25% en América Latina y el Caribe, del 16 al 23% en Oceanía y del 5.4 al 8.9% en África.
Al envejecer la población, trae consigo una serie de cambios en la sociedad, especialmente en la salud,
con un incremento en enfermedades crónicas y neurodegenerativas que afectan a la edad senil, como el
Alzheimer, el Parkinson y el temblor. Estas enfermedades aumentarán su prevalencia y junto a otras
enfermedades propias de la tercera edad sobrecargarán los sistemas de salud del mundo y el costo de
salud per cápita también se verá incrementado.
La prevalencia e incidencia de la enfermedad de Parkinson y de temblor esencial son difíciles de estimar
y varían en los diferentes estudios realizados debido a la heterogeneidad y variabilidad en la
metodología utilizada, a las muestras, a los factores genéticos y ambientales de las poblaciones
estudiadas.
Según la European Parkinson's Disease Association (EPDA), basado en un estudio de prevalencia en los 5
países más poblados de Europa Occidental y 10 países más poblados del mundo, estimó que en el 2005
el número de personas con más de 50 años de edad que padecían Parkinson fue de 4.1 a 4.6 millones y
para el 2030 se proyecta que este valor se incrementará a más del doble, entre 8.7 y 9.3 millones. La
EPDA indica también que 1,2 millones de personas en Europa padecen Parkinson, se prevé que su
incidencia se duplique para 2030 y que el coste anual por el sistema de salud europeo sea de 13.900
millones de euros.
Por otro lado, según el portal norteamericano MEDSCAPE, se estima que el temblor esencial puede ser
de 10 a 20 veces más prevalente que la enfermedad de Parkinson, entre 50-70% de los casos el temblor
esencial se estima que es de origen genético y las mutaciones genéticas en estos casos se prevé que se
transmite de forma autosómica dominante y tiene penetrancia variable. Aunque la edad de inicio de
esta enfermedad es variable la mayoría empieza en la segunda o sexta década de la vida y junto con el
envejecimiento de la población también aumentará el número de casos. En Norteamérica cerca de 5
millones de personas han sido diagnosticadas con temblor esencial, pero se estima que la cifra puede
llegar a 10 millones debido a que muchas personas no buscan atención médica si el temblor es leve o
atribuyen el temblor a la edad avanzada, o al temor de que el impacto del temblor en su calidad de vida
no va a ser tomado en serio. Circunstancias que se repiten alrededor del mundo.
Desde otro punto de vista, el espectro clínico del temblor varía ampliamente entre un fenómeno normal
hasta una forma discapacitante de enfermedades graves. La etiología es múltiple y para el diagnóstico es
necesario la exploración visual y la descripción de las características semiológicas del temblor en virtud
de múltiples criterios como: la condición que activa el temblor (en reposo, postura o movimiento), la
amplitud, la frecuencia (baja, media o alta), la topografía (extremidades, tronco, cabeza), exámenes
neurológicos e historial clínico (inicio del temblor, secuencia de inicio, comorbilidades, historia familiar,
factores que lo exacerban o lo inhiben y consumo de alcohol, medicamentos o drogas).
El diagnóstico clínico del temblor basado en escalas de calificación requiere de la subjetividad y
experiencia del especialista. Puede ser suficiente, pero en muchas de las veces no es aplicable en la
práctica, debido a que existe un solapamiento en la semiología clínica entre los pacientes de temblor
esencial y el temblor parkinsoniano. Además, en algunas publicaciones dan cuenta que ambas
enfermedades podrían estar relacionadas o coexistir en un fenotipo de temblor o que una sea factor de
riesgo para el desarrollo de la otra. Es decir, un subgrupo de pacientes con Parkinson desarrollan un
temblor postural en las manos (propio del temblor esencial) por un largo tiempo antes que aparezcan
los síntomas parkinsonianos, y de la misma manera se encuentra cuerpos de Lewy en algunos pacientes
con temblor esencial cuando éstos son propios de la enfermedad de Parkinson.
Bajo estas circunstancias se requiere que el temblor no sea analizado únicamente de forma cualitativa
como lo hace un diagnóstico clínico, sino que deba ser analizado de forma cuantitativa con el fin de
comparar datos y apoyar al diagnóstico clínico. Es en este punto, donde biomecánica juega un papel
muy importante, mediante dispositivos electrónicos, herramientas y algoritmos matemáticos se
adquiere, procesa y analiza cuantitativamente el temblor.
El avance tecnológico, la gran capacidad de procesamiento y almacenamiento de la información de las
computadoras de hoy en día, junto a técnicas de Inteligencia Artificial y la teoría de toma de decisiones,
tienen la capacidad de generar y extraer el conocimientos sobre distintos problemas del entorno real a
partir del estudio exhaustivo de ciertas bases de datos, dando lugar al diagnóstico automatizado.
Luego de este preámbulo, haciendo referencia al título de esta obra "AUTOMATIZACIÓN EN LABORES DE
CLASIFICACIÓN. APLICACIÓN DE LOS CLASIFICADORES EN LA AYUDA AL DIAGNÓSTICO EN EL AMBIENTE
SANITARIO." Se inició el estudio seleccionando a las Máquinas de Soporte Vectorial (SVM) como la
estructura de aprendizaje automático para la tarea de clasificación de dos clases. Las SVMs fueron
desarrolladas por el Vladimir Vapnik y sus colaboradores en el marco de la Teoría de Aprendizaje
Estadístico (SLT) y bajo el principio de Minimización del Riesgo Estructural (SRM) y no fue hasta 1998 que
empezó a tener auge en varias aplicaciones. Las SVMs pertenecen a la familia de clasificadores lineales,
tienen un fundamento teórico-matemático muy sólido. Tienen una gran capacidad para aprender a
partir de un conjunto de datos experimentales que generalmente son tomados del entorno real y con
una distribución dispersa en un espacio de entrada de alta dimensión. Basan su aprendizaje en la
construcción de un hiperplano en un espacio de características de alta dimensión, los datos de entrada
que generalmente son no separables linealmente son mapeados mediante una función de
características llamado kernel o núcleo a un espacio de características en donde pueden ser separados
linealmente. La función kernel es la esencia de las SVMs, la función objetivo a optimizar es convexa lo
cual garantiza la convergencia y existencia de una única solución. La estructura del hiperplano óptimo se
construye en base a un subconjunto de datos llamados Vectores Soporte (VS); el hiperplano es la función
de separación que clasifica a los datos a sus correspondientes clases dependiendo de la etiqueta.
Posteriormente, con la base de datos de las pruebas realizadas a los pacientes con temblor esencial,
enfermedad de Parkinson y temblor fisiológico que fueron registradas y almacenada por el sistema
DIMETER, se analizaron y caracterizaron con atributos numéricos a cada una de las muestras mediante
herramientas estadísticas. Consecutivamente, se plantearon cuatro hipótesis para la clasificación, las
muestras fueron preparadas y subdivididas en los conjuntos de entrenamiento y prueba. Luego, el
conjunto de entrenamiento fue sometido a una fase de aprendizaje con el algoritmo LIBSVM y
finalmente las muestras del conjunto de prueba a la fase de clasificación.
Este trabajo está dividido en 5 capítulos, procurando abordar cada uno de los temas relevantes,
técnicas, herramientas y procedimientos utilizados durante la investigación.
El Capítulo 1 presenta una descripción de los trastornos del movimiento y trastornos del temblor. Una
revisión de las características, clasificación, etiología, semiología y efecto de los temblores más
frecuentes y motivo de este trabajo como son: el temblor fisiológico, temblor esencial y el temblor
producido por la enfermedad de Parkinson. Se aborda algunos estudios relacionados con el diagnóstico
del temblor, así como los métodos y las técnicas que hoy por hoy utilizan los investigadores para la
medición y análisis del temblor. Finalmente, se hace mención de los trabajos y los resultados obtenidos
por anteriores compañeros que me precedieron en la misma línea de investigación.
En el Capítulo 2 contiene el fundamento de las máquinas de aprendizaje automático, una explicación de
la Teoría de Aprendizaje Estadístico, el desarrollo del principio de minimización del riesgo estructural y la
dimensión VC. Un repaso a la clasificación de patrones y la tarea de clasificación. La descripción y el
fundamento teórico matemático del algoritmo de las SVMs es dado, así como la formulación de las
SVMs de margen rígido y de margen flexible para clasificadores lineales como no lineales. Por último, se
proporciona un ejemplo práctico del clasificador SVM entrenando con varias funciones kernel.
El Capítulo 3 está dedicado a recolectar todas las técnicas y las herramientas que se utilizaron para el
tratamiento de la información. Se da una explicación detallada de cada una de las funciones a utilizar
durante el entrenamiento del clasificador SVM utilizando el software proporcionado en el paquete
LIBSVM. Se describe la Toolbox de Estadística de Orden Superior HOSA y la Toolbox de Procesamiento
de Señales PSD, utilizadas en MATLAB para la caracterización del temblor. Además, se detalla las
técnicas empleadas para el estudio de los datos como son el análisis de componentes principales ACP, la
distancia de Mahalanobis y el coeficiente de Curtosis.
En el Capítulo 4 se detalla el proceso de obtención y preparación de las muestras para el entrenamiento
con la SVM. Se hace una descripción del sistema DIMETER empleado para la adquisición de los datos,
registro y almacenamiento de las pruebas realizadas a los pacientes, así como las condiciones y los
patrones utilizados en la ejecución de cada una de las pruebas. Más adelante se describe el proceso de
filtrado de las señales y la caracterización del temblor mediante atributos numéricos obtenidos a partir
de las estadísticas de segundo orden PSD y las estadísticas de orden superior HOSA. También se hace
una breve referencia sobre el proceso de normalización y estandarización de los datos. Finalmente, se
marcan las pautas para la selección y ajuste de los parámetros de las funciones kernel en base al
procedimiento de validación cruzada, así también se indica el comportamiento asintótico del clasificador
SVM con un kernel Gaussiano RBF.
El Capítulo 5 está dedicado al estudio de las hipótesis planteadas, a la clasificación de las muestras y los
resultados obtenidos en cada una de las hipótesis. Se expone la metodología utilizada en los ensayos. Se
detalla cada una de las fases para el entrenamiento de la SVM. En cada una de las hipótesis se describe
su fundamento teórico, las herramientas y las técnicas matemáticas empleadas para el análisis de las
señales, el procedimiento a seguir, así como el número de muestras y atributos numéricos de cada
vector. Con el propósito de reducir al máximo el error en la clasificación se optó por probar con
diferentes configuraciones entre las pruebas estáticas, cinéticas, dinámicas o en combinación a la
entrada de la SVM. Luego se presentan en tablas los resultados obtenidos para cada modelo clasificador,
los parámetros de ajuste para cada tipo de kernel y la tasa de error cometido tanto en la fase de
entrenamiento como en la fase de clasificación. Al terminar cada hipótesis se hace un análisis de los
resultados en referencia al mejor modelo de clasificador obtenido.
Dentro del Capítulo 6 se presentan un análisis de los resultados globales y se hace una comparación
entre los resultados de las hipótesis planteadas y sobre las configuraciones realizadas con el fin de
mejorar los resultados.
Finalmente, se enuncia las conclusiones del trabajo en cada una de las hipótesis planteadas en relación a
los resultados obtenidos.