Detección y clasificación de señales de tráfico mexicanas ...
DETECCIÓN Y CLASIFICACIÓN DE MICROCALCIFICACIONES EN ...
Transcript of DETECCIÓN Y CLASIFICACIÓN DE MICROCALCIFICACIONES EN ...
1
DETECCIÓN Y CLASIFICACIÓN DE MICROCALCIFICACIONES EN MAMOGRAFÍAS
USANDO TÉCNICAS DE PROCESAMIENTO DE IMÁGENES
T.G.1030
JULIANA LASSO CABRERA
ÁLVARO GERARDO OTERO CAICEDO
DIRECTOR:
ING. LEONARDO FLÓREZ VALENCIA,Ph.D
ASESOR:
JULIAN ARMANDO QUIROGA SEPÚLVEDA
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE ELECTRÓNICA BOGOTÁ D.C, NOVIEMBRE 2011
2
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
CARRERA DE INGENIERÍA ELECTRÓNICA
RECTOR MAGNÍFICO: PADRE JOAQUÍN EMILIO SÁNCHEZ GARCÍA S.J
DECANO ACADÉMICO: ING. FRANCISCO JAVIER REBOLLEDO MUÑOZ
DECANO DEL MEDIO UNIVERSITARIO: PADRE SERGIO BERNAL RESTREPO S.J
DIRECTOR DE CARRERA: ING. JUAN MANUEL CRUZ BOHÓRQUEZ
DIRECTOR DE PROYECTO: ING. LEONARDO FLÓREZ VALENCIA
ASESOR DEL PROYECTO: ING. JULIAN ARMANDO QUIROGA SEPÚLVEDA
3
ARTICULO 23 DE LA RESOLUCIÓN No. 13 DE JUNIO DE 1946
“La Universidad no se hace responsable de los conceptos emitidos por sus alumnos en sus proyectos de
grado.
Solo velará porque no se publique nada contrario al dogma y a la moral católica y por que los trabajos no
contengan ataques o polémicas puramente personales. Antes bien, que se vea en ellos el anhelo de buscar
la verdad y la justicia.”.
4
TABLA DE CONTENIDO
1. INTRODUCCIÓN ..................................................................................................................................... 9
2. MARCO TEÓRICO ................................................................................................................................. 10
2.1 MARCO CONCEPTUAL ......................................................................................................... 10
2.1.1 CÁNCER .................................................................................................................. 10
2.1.2 CÁNCERES MÁS COMUNES EN EL MUNDO ................................................... 10
2.1.3 CÁNCERES MÁS COMUNES EN COLOMBIA ................................................... 11
2.1.4 CÁNCER DE MAMA .............................................................................................. 12
2.1.5 MÉTODOS DEL DIAGNÓSTICO DE CÁNCER DE MAMA ............................... 12
2.1.6 MICROCALCIFICACIONES MAMARIAS ........................................................... 16
2.1.7 ESCALA BIRADS (BREAST IMAGING REPORTING AND DATA SYSTEM) 17
2.2 ESTADO DEL ARTE ............................................................................................................... 19
2.3 PROCESAMIENTO DE IMÁGENES...................................................................................... 20
2.3.1 SEGMENTACIÓN .................................................................................................... 20
3. ESPECIFICACIONES ............................................................................................................................. 26
3.1 MAMOGRAFÍAS ANALIZADAS .......................................................................................... 26
3.2 DIAGRAMA DEL PROYECTO .............................................................................................. 26
3.3 ESPECIFICACIONES Y DESCRIPCIÓN DEL PROYECTO ................................................ 27
3.4 DIAGRAMA DE BLOQUES DE ALGORITMO DE CRECIMIENTO DE REGIONES ..... 27
3.5 DIAGRAMA DE BLOQUES DEL ALGORITMO DE DESCRIPTORES DE FOURIER Y
CLASIFICACIÓN ......................................................................................................................... 28
4. DESARROLLOS ..................................................................................................................................... 28
4.1 DESARROLLO DEL ALGORITMO DE CRECIMIENTO DE REGIONES ......................... 28
4.2 DESCRIPTORES DE FOURIER ............................................................................................ 31
4.2.1 ALGORITMO PARA CLASIFICAR LAS MICROCALCIFICACIONES
ENCONTRADAS EN LAS MAMOGRAFÍAS ............................................................... 31
4.2.2 COMPARACIÓN DE MICROCALCIFICACIONES CON BIRADS .................... 32
4.3 PROTOCOLO DE PRUEBAS ................................................................................................. 32
5. ANÁLISIS DE RESULTADOS .............................................................................................................. 33
6. CONCLUSIONES ................................................................................................................................... 46
7. BIBLIOGRAFÍA ...................................................................................................................................... 47
8. ANEXOS .................................................................................................................................................. 49
ANEXO A. VALORES DE LA DISTRIBUCIÓN DE FISHER [14] ............................................... 49
5
ANEXO B. DISTRIBUCIONES DE PROBABILIDADES [26] ....................................................... 50
ANEXO C. TABLA DE PROBABILIDAD T STUDENT [13]......................................................... 51
ANEXO D. CÓDIGO DE SEGMENTACIÓN Y DESCRIPTOR DE FOURIER .............................. 52
ANEXO E. PRUEBA DE ALGORITMO DE PREPROCESAMIENTO ........................................... 52
ANEXO F. PRUEBAS DE ALGORITMO DE SEGMENTACIÓN Y DESCRIPTOR DE FOURIE 52
ANEXO G. LIBRERÍAS Y HERRAMIENTAS ................................................................................. 52
ANEXO H. MAMOGRAFÍAS Y CALCIFICACIONES .................................................................... 52
6
ÍNDICE DE FIGURAS
Figura 1. Porcentajes de personas con incidencia de los cánceres más comunes en el mundo, estos datos
fueron tomados en una población de 6750061(Miles) personas [15]. .......................................................... 10
Figura 2. Porcentajes de personas que mueren a causa de los cánceres más comunes en el mundo, estos
datos fueron tomados en una población de 6750061(Miles) personas [15]. ................................................ 11
Figura 3. Porcentajes de personas con incidencia de los cánceres más comunes en Colombia, estos datos
fueron tomados en una población de 45012(Miles) personas [16]............................................................... 11
Figura 4. Porcentajes de personas que mueren a causa de los cánceres más comunes en Colombia, estos
datos fueron tomados en una población de 45012(Miles) personas [16] .................................................... 12
Figura 5. Auto-examen de la mama [19] .................................................................................................... 13
Figura 6. Ecografía de la mama [24] ........................................................................................................... 13
Figura 7. Resonancia magnética de la mama [22] ...................................................................................... 13
Figura 8. Biopsia con aguja en la mama [7] ................................................................................................ 14
Figura 9. Tomografía axial (TAC) en la mama [3] ..................................................................................... 14
Figura 10. Mamografía [8] .......................................................................................................................... 15
Figura 11. Mamografía con una microcalcificación benigna [5] ................................................................ 16
Figura 12. Mamografías con microcalcificaciones malignas [5] ................................................................ 17
Figura 13. Diagrama de bloques de método estadístico T-Student ............................................................ 24
Figura 14. Ejemplo de los puntos que describen el contorno de una imagen en el plano ........................... 25
Figura 15. Descripción de la base de datos ................................................................................................. 26
Figura 16. Diagrama de bloques general del proyecto ................................................................................ 26
Figura 17. Diagrama de bloques de crecimiento de regiones ...................................................................... 27
Figura 18. Diagrama de bloques del algoritmo para clasificar las microcalcificaciones encontradas en las
mamografías con las microcalcificaciones que están en el estándar BIRADS ........................................... 28
Figura 19. Píxel semilla con los cuatro vecinos para analizar .................................................................... 28
Figura 20. Primer análisis, con el vecino 1 del píxel semilla ..................................................................... 29
Figura 21. Cola de vecinos por analizar ..................................................................................................... 29
Figura 22. Ejemplo cola de poblaciones, dos regiones con un separador .................................................. 29
Figura 23. Los nuevos píxeles que entran a la cola de vecinos ................................................................... 29
Figura 24. Nueva cola de vecinos ............................................................................................................... 29
Figura 25. Poblaciones por analizar ........................................................................................................... 30
7
Figura 26. Muestra la elipse rodeando la microcalcificación para determinar los radios mayor y menor .. 32
Figura 27. Mamografía a analizar .............................................................................................................. 33
Figura 28. En azul se encuentra la microcalcificación benigna que se encontró en la mamografía de la
figura 27, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..34
Figura 29. Mamografía a analizar .............................................................................................................. 35
Figura 30. En azul se encuentra la microcalcificación benigna que se encontró en la mamografía de la
figura 29, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..36
Figura 31. Mamografía a analizar .............................................................................................................. 37
Figura 32. En azul se encuentra la microcalcificación benigna que se encontró en la mamografía de la
figura 31, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..38
Figura 33. Mamografía a analizar .............................................................................................................. 39
Figura 34. En azul se encuentra la microcalcificación maligna que se encontró en la mamografía de la
figura 33, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..40
Figura 35. Mamografía a analizar .............................................................................................................. 41
Figura 36. En azul se encuentra la microcalcificación maligna que se encontró en la mamografía de la
figura 35, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..42
Figura 37. Mamografía a analizar .............................................................................................................. 43
Figura 38. En azul se encuentra la microcalcificación maligna que se encontró en la mamografía de la
figura 37, en rojo, la mejor elipse que envuelve la microcalcificación, y en Amarillo, la región de interés
que obtuvieron los expertos de la base de datos MIAS..…………………………………………………..44
Figura 39. Análisis de resultados ............................................................................................................... 45
8
ÍNDICE DE TABLAS
Tabla 1. Tipos de BIRADS según la forma y la distribución de las microcalcificaciones[20] ................... 19
Tabla 2. Píxeles semillas en mamografías con calcificaciones malignas .................................................. 30
Tabla 3. Píxeles semillas encontrados en las mamografías con calcificaciones benigna ............................ 31
Tabla 4. Protocolo de pruebas para el proyecto .......................................................................................... 32
Tabla 5. Resultado de los radios del mejor elipse que encierra la microcalcificación ............................... 45
9
1. INTRODUCCIÓN
Actualmente una de las enfermedades que pueden causar la muerte en los seres humanos es el cáncer,
siendo esta una de las enfermedades más difíciles de tratar y en ocasiones imposible de curar.
Específicamente uno de los cánceres más comunes tanto a nivel mundial como en Colombia, es el cáncer
de mama. Según estadísticas presentadas por IARC (International Agency forResearchonCancer), el
cáncer de mama tiene la mayor incidencia en el mundo, y en Colombia es el segundo cáncer con mayor
incidencia después del cáncer de próstata, esto teniendo en cuenta hombres y mujeres. Si hablamos
específicamente de la población de mujeres en este caso el cáncer con mayor incidencia en Colombia es
el cáncer de mama.
El cáncer de mama puede ser curado, si es detectado a tiempo y si se hace un tratamiento con el fin de
curarlo, esto se puede comprobar con las estadísticas de la IARC, donde se muestra una diferencia entre la
incidencia y mortalidad del cáncer de mama dejando ver claramente que este cáncer si puede ser curado.
En la actualidad no se conocen las causas específicas del cáncer de mama. Sin embargo, existen diferentes
suposiciones e hipótesis sobre las razones por las cuales se genera esta enfermedad. Una de las causas del
cáncer de mama son las microcalcificaciones, que son acumulaciones de calcio en la mama de tamaño
pequeño, esta es una de las razones por la cual puede comenzar el cáncer de mama, por lo tanto es
importante que el médico las detecte a tiempo y evalúe si estas microcalcificaciones son malignas o no. Si
se detecta la malignidad de estas se podría hacer un tratamiento con el fin de curar el cáncer en el paciente
y evitar la muerte del mismo.
Para detectar las microcalcificaciones existen diferentes métodos, uno de estos es la mamografía. Dicha
técnica se basa en una imagen de rayos X del seno, en el cual se puede ver la glándula mamaria y
anormalidades.
Debido a que las microcalcificaciones son de un tamaño muy pequeño, en la mayoría de los casos para los
médicos es de gran dificultad verlas, por lo tanto si se tiene una mínima sospecha de que existe
microcalcificación los médicos acuden a hacer biopsias que en la mayoría de los casos pueden llegar a ser
innecesarias. Con el fin de facilitar el diagnóstico del médico, este proyecto propone un método
automático para la clasificación de microcalcificaciones en las mamografías según un estándar que está
aceptado por los radiólogos en todo el mundo, este es el estándar BIRADS (BreastImagingReporting
And Data System), que propone clasificar las microcalcificaciones entre benignas o malignas según la
forma y la distribución de estas.
El principal objetivo de este trabajo es diseñar un sistema de clasificación de microcalcificaciones en
mamografías. Para lograr el objetivo se usa un algoritmo con el fin de detectar en que coordenadas se
encuentran las microcalcificaciones, y se propone algoritmo que compara las formas y distribuciones que
están caracterizadas en BIRADS con las que se encontraron en la mamografía, clasificando así cada
microcalcificación y haciendo más fácil el diagnostico del médico, evitando algunos diagnósticos errados
y biopsias innecesarias.
En el siguiente trabajo se describirá el proceso que se llevó a cabo para conseguir el objetivo propuesto,
las diferentes pruebas que se hicieron y el análisis del resultado del método usado.
10
2. MARCO TEÓRICO
2.1 MARCO CONCEPTUAL
2.1.1 CÁNCER
En la actualidad el cáncer es una de las enfermedades trágicas más comunes, según la OMS en el 2005 el
13% de los fallecimientos en el planeta fue por cáncer. El cáncer es una enfermedad mortal que consiste
en el crecimiento incontrolado de células malignas (tumor) en cualquier parte del cuerpo. Esta
diseminación puede invadir los tejidos y órganos vecinos al tumor afectándolos trágicamente, esta
expansión se conoce como metástasis y se sabe que una vez detectada las probabilidades de sobrevivir
reducen considerablemente [26].
2.1.2 CÁNCERES MÁS COMUNES EN EL MUNDO
El cáncer de mama, es uno de los cánceres más comunes en el mundo, Según IARC, el cáncer con mayor
incidencia en el mundo es el cáncer de mama, sin embargo este no es el cáncer que tiene mayor
mortalidad en el mundo. Esto quiere decir que este cáncer puede curarse evitando la muerte de las
pacientes.
Según un estudio estadístico que hizo IARC en el año 2008 a una población en miles de 6750061
personas en donde 3402841(miles) son hombres y 3347220(miles) mujeres, se hizo un estudio para saber
cuántas personas tenían cáncer y cuantos murieron por causa del cáncer. En la figura 1 se encuentran los
porcentajes de los cánceres con incidencia más comunes en el mundo y la figura 2 muestra los porcentajes
de los cánceres con mayor mortalidad en el mundo.
Figura 1. Porcentajes de personas con incidencia de los cánceres más comunes en el mundo, estos datos fueron tomados en una
población de 6750061(Miles) personas [15].
12,70%
10,90%
9,80%
7,80%
7,10%5,90%4,20%
3,80%
3%
34,80%
Pulmón
Mama
Colon y Recto
Estómago
Próstata
Hígado
Cuello Uterino
Esófago
Vejiga
Otros
11
Figura 2.Porcentajes de personas que mueren a causa de los cánceres más comunes en el mundo, estos datos fueron tomados en una población de 6750061(Miles) personas [15].
2.1.3 CÁNCERES MÁS COMUNES EN COLOMBIA
En Colombia el cáncer de mama es el segundo cáncer con mayor incidencia después del cáncer de próstata
según IARC. Igual que en la población mundial el cáncer de mama no tiene la mayor mortalidad en
Colombia. Con esto se concluye que es de gran ayuda la detección del cáncer de mama a tiempo con el fin
de evitar que mueran personas debido a esta enfermedad.
Los datos que se observan en la en la figura 3 y figura 4, se los obtuvo de IARC, en un estudio que se hizo
en el 2008 a una población en miles de 45012 personas en donde 22162(miles) son hombres y
22849(miles) son mujeres. La figura 3 muestra los porcentajes de los cánceres con mayor incidencia en
Colombia y la figura 4 muestra los porcentajes de los cánceres con mayor mortalidad en Colombia.
Figura 3.Porcentajes de personas con incidencia de los cánceres más comunes en Colombia, estos datos fueron tomados en una población de 45012(Miles) personas [16].
18,20%
6,10%
8,10%
9,70%
3,40%
9,20%
3,60%
5,40%
2%
34,30%
Pulmón
Mama
Colon y Recto
Estómago
Próstata
Hígado
Cuello Uterino
Esófago
Vejiga
Otros
11,40%
11,30%
11,10%
8,10%
7,60%7%
3,90%
3,50%
3,40%
32,50%
Mama
Estómago
Próstata
Cuello Uterino
Pulmón
Colon y Recto
Linfoma no Hodking
Leucemia
Tiroides
Otros
12
Figura 4. Porcentajes de personas que mueren a causa de los cánceres más comunes en Colombia, estos datos fueron tomados en una población de 45012(Miles) personas [16].
2.1.4 CÁNCER DE MAMA
El cáncer de mama es uno de los cánceres con mayor incidencia en el mundo y en Colombia, este cáncer
se debe a tumores que están en alguna parte de la mama. Las pacientes que sufren de este tipo de cáncer
pueden curarse de esta enfermedad si este es detectado al tiempo, para así recurrir a diferentes
tratamientos que ayudan a la eliminación total o parcial de estos tumores malignos.
2.1.5 MÉTODOS DE DIAGNÓSTICO DEL CANCER DE MAMA
Debido a los índices tan elevados de mortalidad en todo el mundo, las investigaciones sobre un
diagnóstico acertado y prematuro son material de investigación de muchos científicos. El cáncer de mama
puede ser diagnosticado por un médico, haciendo diferentes tipos de exámenes. A continuación se
nombran los métodos más conocidas usados para la detección de este cáncer según la Liga Colombiana
contra el Cáncer.
EXAMEN CLÍNICO DE LA MAMA
Es una valoración que da el médico sobre el estado de la mama, se trata de un examen rápido que puede
ayudar a detectar tumores (benignos o malignos).
EL AUTOEXAMEN
Es un método que se debe practicar con frecuencia para prevenir y detectar tumores a tiempo, se
recomienda realizarlo 8 días después de la menstruación. Este proceso lo puede realizar la paciente usando
sus manos y sintiendo si existe algún tipo de masa indeseado, dado el caso que exista esta masa se
recomienda acudir al médico especialista inmediatamente. En la figura 5 se observa el procedimiento que
se debe hacer para el auto examen de la mama [19].
6,20%
14,90%
7,30%
6,30%
12,30%
7%
2,90%
4,60%
0,70%
37,70%
Mama
Estómago
Próstata
Cuello Uterino
Pulmón
Colon y Recto
Linfoma no Hodking
Leucemia
Tiroides
Otros
13
Figura 5. Auto examen de la mama (Tomado de [19]).
ECOGRAFÍA
Es un método que usa ultrasonido. Este método es menos eficiente que la mamografía, pero se emplea
para diferenciar quistes y masas sólidas. Figura 6 muestra como se ve la ecografía de la mama.
Figura 6. Ecografía de la mama izquierda [24].
RESONANCIA MAGNÉTICA NUCLEAR
Este método es usado para observar el tumor en sus fases de desarrollo, con la resonancia magnética se
puede observar la vascularización del tumor. En la figura 7 se muestra el resultado de una resonancia
magnética de la mama.
Figura 7. Resonancia magnética de la mama [22]
Con la punta
de los dedos se
palpa cada
seno en las
direcciones
que se
muestran
14
BIOPSIA
Es un método invasivo que consiste en extraer tejido infectado para confirmar la presencia de la
enfermedad, se debe realizar una vez se haya detectado el tumor mediante uno de los métodos
mencionados anteriormente. La figura 8 muestra como se hace una biopsia con aguja en la mama
Figura 8. Biopsia con aguja en la mama (tomado de [7]).
TOMOGRAFÍA AXIAL COMPUTARIZADA (TAC)
Este método es usado para detectar si ya se produjo metástasis en la mama producida por el tumor
maligno. La figura 9 muestra como se muestra el resultado de un TAC en la mama.
Figura 9. Tomografía axial (TAC) en la mama (Tomado de [29]).
15
MAMOGRAFÍA
La mamografía es una forma de diagnóstico para observar las anomalías que hay en la glándula mamaria y
en la mama en general. Esta imagen se obtiene mediante una dosis baja de rayos X, es una técnica no
invasiva que en ocasiones permite detectar el cáncer en la mama [3]. Por los tejidos que se encuentran en
la mama es difícil ver algunas anomalías mediante la mamografía, debido a que el color tanto de los
tejidos como de algunas anomalías es parecido.
La figura 10 muestra un ejemplo de mamografía, en donde la mama está sin ninguna anormalidad.
Figura 10. Mamografía (Tomada de [8]).
16
2.1.6 MICROCALCIFICACIONES MAMARIAS
Estas son unos depósitos de calcio que se encuentran en la mama de tamaños microscópicos que pueden
ser benignos o malignos, si son malignos pueden causar cáncer de mama.
MICROCALCIFICACIONES BENIGNAS
Las microcalcificaciones benignas pueden darse por causa de alteraciones fibroquísticas1, esta alteración
es hormonal y hace que se inflame el tejido glandular produciendo la aparición de cálculos [23]. Estas
microcalcificaciones se pueden ver con las mamografías pero hay que hacer reconocimiento de forma,
tamaño y distribución para asegurar que son benignas y no necesitan ningún tratamiento de seguimiento.
En la figura 11 se muestra un ejemplo de cómo pueden verse estas microcalcificaciones en una
mamografía.
Figura 11. Mamografía con una microcalcificación benigna [5].
MICROCALCIFICACIONES MALIGNAS
Este tipo de microcalcificaciones son de cierto cuidado porque tienen más probabilidad de causar el cáncer
de mama, estas microcalcificaciones generalmente tienen formas y distribución variables. Estas
microcalcificaciones pueden aumentar de tamaño si aumenta el tumor o cuando se va acercando más a los
tejidos.
Se pueden clasificar estas microcalcificaciones en 3 tipos, calcificaciones moldeadas, calcificaciones
granulares y calcificaciones polvorientas [23].
En la figura 12 se muestra algunas mamografías en las que se encontró microcalcificaciones malignas.
1Alteraciones fibroquisticas: son alteraciones o enfermedades en la mama que son causadas por cambios hormonales
17
Figura 12. Mamografías con microcalcificaciones malignas [5].
CALCIFICACIONES MOLDEADAS
Este tipo de calcificaciones son moldeadas de forma fina, y son ramificadas. Están compuestas por varios
fragmentos pequeños que son diferentes tanto en su densidad, longitud y contorno [11].
CALCIFICACIONES GRANULARES
Este tipo de calcificaciones son heterogéneas, varían su forma a medida que va pasando el tiempo, su
forma, dimensión y densidades son irregulares y están agrupadas muy cerca entre ellas [11].
CALCIFICACIONES POLVORIENTAS
Su nombre se debe a que estas calcificaciones se parecen a partículas de polvo denso, estas calcificaciones
son muy pequeñas por lo tanto difícil de verlas, en las mamografías se ve cuando hay un grupo grande de
este tipo de calcificaciones [11].
2.1.7 ESCALA BIRADS (BREAST IMAGING REPORTING AND DATA SYSTEM)
BIRADS se conoce como un manual propuesto por el Colegio Americano de Radiología, con el fin de
estandarizar los diagnósticos mamográficos. En Colombia la sociedad de radiología recomienda que sea
usada la valoración BIRADS.
Una de las consideraciones que tiene la categoría BIRADS son las calcificaciones, que están divididas en
3 categorías, una de ellas son las calcificaciones típicamente benignas, la segunda categoría son
denominadas calcificaciones con sospecha intermedia y por último se encuentra la categoría de
calcificaciones altamente sospechosas de malignidad. Estas tres categorías se dividen a su vez según su
porcentaje de malignidad que es producto de evaluar la forma o el tamaño de cada calcificación.
En la tabla 1 se observan unas imágenes con su respectiva categoría.
18
BIRADS DESCRIPCIÓN IMAGEN
BR-1 MAMA NORMAL
BR-2 PATOLOGÍA
BENIGNA
BR-3 SUGESTIVA DE
BENIGNIDAD
BR-4A BAJA A MODERADA
SOSPECHA
BR-4B MODERADA
SOSPECHA
19
BR-4C MODERADA A ALTA
SOSPECHA
BR-5 ALTA SOSPECHA
CLÁSICA
Tabla 1. Tipos de BIRADS según la forma y la distribución de las microcalcificaciones [20].
2.2 ESTADO DEL ARTE.
Los estudios sobre las mamografías han sido de gran interés debido a que el cáncer de mama es uno de los
que más tiene incidencia en todo el mundo, por esto se han hecho diferentes estudios e investigaciones con
el fin de facilitar al médico el diagnóstico de este cáncer, teniendo en cuenta que las mamografías
proporcionan la información necesaria para que el médico encuentre anomalías en la mama, se ha tratado
de hacer diferentes algoritmos que encentran anomalías en la mama automáticamente
Se han hecho diferentes estudios para encontrar masas anormales en mamografías así como también se
han hecho estudios en los cuales se hace un pre- procesamiento en las mamografías con el fin de que sea
más fácil para el médico identificar masas que son anormales. Sin embargo aunque se ha trabajado
específicamente en encontrar microcalcificaciones en las mamografías no se ha hecho una clasificación de
éstas, simplemente se las encuentra y ya empieza a ser criterio del médico que tipo de microcalcificación
es. Hay otros estudios en donde el médico observa la mamografía y dice cual es la región de interés donde
posiblemente hay una microcalcificación, cuando ya se tienen las coordenadas donde posiblemente esta la
microcalcificación se hace un procesamiento en la imagen en esa parte para que al médico le sea más claro
ver si hay o no microcalcificación y hacer un estimado si la microcalcificación es benigna o maligna.
En la Universidad Popular del Cesar (Valledupar, Colombia) [18]. Se desarrolló un sistema que puede
detectar microcalcificaciones en mamografías usando la transformada de wavelet y diferentes técnicas de
mejoramiento de contraste. Este algoritmo tuvo una exactitud promedio de 91% de verdaderos positivos, y
un promedio de 10% de falsos positivos, como conclusión el mejor resultado obtenido en este análisis fue
con Wavelet Daubechis de orden 4 (db4) [31].
Otro trabajo importante se hizo en la Universidad de Castilla-La Mancha en Cataluña España, se hizo una
investigación para detectar automáticamente lesiones en la mama [5], en donde se mostró los resultados
obtenidos en el análisis de mamografías, en una detección automática de lesiones en la mama usando
métodos como clusterización por lógica difusa, algoritmo de Fuzzy C-Means (FCM), técnicas de contraste
de filtrado, y filtrado adaptativo [5].
Debido a que este tema de las lesiones en la mama ha sido de gran interés en el mundo, se han hecho dos
tesis acerca del tema. En una de estas esta tesis se hizo una herramienta computacional para ayudar al
diagnóstico de tumores en la mama, ya sean benignos o malignos, para esto segmenta, caracteriza y
clasifica estos tumores, esto se hizo con la ayuda de la transformada de Wavelet para diferenciar y
20
seleccionar los coeficientes de frecuencias altas, medias y bajas y se usó como atributos en los
clasificadores de Bayes y KNN en dos modos de agrupamiento [4].
Y por último otra tesis importante hecha en la Universidad de Málaga, que también hace una detección de
las microcalcificaciones usando la transformada de Wavelet [23].
Debido a que el tema de detección de microcalcificaciones con procesamientos de imagen es un tema que
ya está resuelto. En este proyecto se propone hacer una clasificación de las microcalcificaciones. Para esto
se hace una segmentación para encontrar las microcalcificaciones con un algoritmo de crecimiento de
regiones y por último con el algoritmo de descriptores de Fourier se hace la clasificación según el estándar
BIRADS.
2.3 PROCESAMIENTO DE IMÁGENES
El procesamiento digital de imágenes consiste en aplicar diferentes técnicas para mejorar el aspecto de una
imagen, si se tiene como objetivo solo alguna parte de la imagen a la que se va a hacer el procesamiento
entonces se hace algún tipo de modificación en la imagen para hacer evidente los detalles de interés. El
procesamiento de imágenes transforma la imagen para conseguir lo deseado por el investigador [28].
2.3.1 SEGMENTACIÓN.
La segmentación de imágenes es un problema comúnmente presentado en el campo de procesamiento de
imágenes, muchas veces hay interés en analizar solo ciertas partes de la imagen, siendo las demás partes
de la imagen de poca importancia e innecesarias tenerlas en cuenta. El objetivo principal de la
segmentación es extraer las partes deseadas por el investigador, esto quiere decir identificar en que
coordenadas están y que espacio están ocupando en la imagen.
Entre Las técnicas más usadas de segmentación en una imagen están las siguientes:
UMBRALIZACIÓN BASADA EN HISTOGRAMA.
El histograma de una imagen tiene la información del número de pixeles que tienen las mismas
intensidades, esto quiere decir que el histograma agrupa los pixeles según la intensidad de cada uno de
estos. Para hacer este tipo de segmentación hay que seleccionar un umbral, el cual separe dos regiones. Si
el pixel está por encima del umbral antes preestablecido el pixel recibe un valor y si está por debajo el
pixel tiene otro valor [27].
ALGORITMO DE DIVISIÓN Y FUSIÓN.
En esta técnica de segmentación, la imagen se divide en varias regiones cuadradas. Cada región que
pertenece a la imagen es analizada según el criterio que determina si todos los pixeles pertenecen a esa
región, si cada región es uniforme entonces esta continua igual, de lo contrario es dividida en cuatro partes
iguales y vuelven a ser analizadas, este proceso se repite hasta que las regiones son completamente
uniformes o muy pequeñas. Cuando ya termina este proceso se continua con el de fusión, entonces se
compara dos regiones que estén unidas espacialmente y si cumplen con el criterio, que dice que
pertenecen a la misma región, entonces son unidas, si esto no sucede entonces cada bloque pertenece a dos
regiones diferentes, este proceso continua hasta que ya no existan regiones para fusionar [27].
21
CRECIMIENTO DE REGIONES.
Esta técnica de segmentación es la que se va a implementar en este proyecto, a continuación se presenta la
justificación del porqué se escogió esta técnica.
La investigación de cómo segmentar las masas anormales o microcalcificaciones en la mama como ayuda
de diagnóstico ha sido de gran interés durante los últimos años; por esta razón se han hecho diferentes
estudios e investigaciones sobre cuál método es recomendable usar para segmentar en mamografías, se
han desarrollado diferentes métodos y se han hecho pruebas comparando los resultados de cada método
concluyendo cual es el de mejor aproximación con la realidad. En el artículo en donde se hace esta
investigación, [30] hacen una comparación de 3 algoritmos usados para la segmentación en mamografías
y el análisis del resultado de esta segmentación la hacen dos expertos en radiología. Los tres métodos
descritos en el artículo son:
Crecimiento de regiones con el máximo criterio de probabilidad o también llamado Kinnard
Model.
Un modelo de contorno deformable también (Snake Model).
Modelo estándar.
Aplicaron estos tres métodos a 50 mamografías, y los dos expertos radiólogos examinaron los resultados
concluyendo que el método con mayor precisión y menor porcentaje de error es el método de Kinnard, o
crecimiento de regiones [17].
El algoritmo de crecimiento de regiones presenta una ventaja con respecto a los otros métodos, ya que la
segmentación se puede hacer usando un método estadístico, haciendo que los resultados de este algoritmo
sea más seguro. Para definir si un píxel pertenece a una región se debe definir un criterio que diga si
pertenece o no a la región según la necesidad del investigador, existen dos métodos conocidos y que
tienen un buen desempeño, a continuación se explica los dos métodos:
T-STUDENT: Este proceso compara la población A y la población B, la población A es la región
y la población B son los píxeles vecinos al píxel que se va a analizar si entra o no a la región. Para hacer
esta comparación se usa la prueba de hipótesis, que consiste en plantear una hipótesis la cual se asume
como verdadera, y otra hipótesis que aparentemente es falsa.
La prueba de hipótesis se usa para determinar si las medias de las poblaciones son iguales o no, con un
grado de confianza de un 95%, por lo tanto esta prueba dirá si la media de estas dos poblaciones son
comparables con un error de un 5%.
PROMEDIO MUESTRAL
Para comenzar la prueba lo primero que se debe hacer es encontrar el promedio muestral, de cada
población (el promedio de valor del pixel), entonces se encuentra el promedio con la ecuación 1
X = Xi
ni=1
n 𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧 𝟏
Siendo X el valor de cada pixel en cada población, por tanto se encuentra el promedio de las dos
poblaciones, y n es el número de pixeles de cada población.
Después de encontrar el promedio es necesario encontrar la varianza de la muestra, de cada una de las
poblaciones.
VARIANZA MUESTRAL
Para encontrar la varianza muestral se aplica la ecuación 2
22
Sx2 =
(xini=1 − x )2
n − 1𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧 𝟐
Encontrando estos dos valores se puede empezar a hacer la prueba de hipótesis para ver si las medias de
cada población son iguales con una probabilidad del 95%.
PRUEBA DE HIPÓTESIS
Antes de saber si las medias son iguales es necesario hacer una prueba de hipótesis para las varianzas, ya
que si las varianzas son iguales la prueba de hipótesis para la media se hace de una forma diferente a si las
varianzas poblacionales son diferentes, entonces para definir que procedimiento se usa para la prueba de
hipótesis de la media poblacional es necesario usar la siguiente prueba de hipótesis para la varianza con el
mismo porcentaje de confiabilidad, esto quiere decir con un 95% de confiabilidad.
PRUEBA DE HIPÓTESIS PARA LA VARIANZA
En esta prueba de hipótesis se toma una confiabilidad del 95%, para encontrar si las varianzas son iguales,
primero se usa la ecuación 3
F =SA
2
SB 2 𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧 𝟑
En este procedimiento se tienen dos hipótesis que son las siguientes
22
0 : BAH , donde se supone que las dos varianzas de las dos poblaciones son iguales.
22
BAaH , esta se llama la hipótesis alternativa.
Cuando ya se tiene el resultado de la ecuación3 este resultado se lo compara con el valor de la tabla que se
encuentra en el ANEXO A, si el valor no se encuentra en la tabla se usa la función de densidad de Fitcher
que se encuentra en el ANEXO B.
Comparando el resultado que se obtiene de la ecuación 3, con el resultado de la ecuación 4.
Entonces 0Hes falsa sí
21
fF ;n-1,m-1.
En donde es 5%, para que la probabilidad de esta prueba de hipótesis sea de un 95%, n es la cantidad de
pixeles en un grupo y m es la cantidad de pixeles del otro grupo.
Después de usar esta prueba de hipótesis, según el resultado se desarrolla otro procedimiento para
encontrar si las medias son iguales o no.
PRUEBA DE HIPÓTESIS PARA LA MEDIA
En esta prueba de hipótesis se encuentra si con un 95% de confiabilidad se puede decir que la media de
dos pixeles son iguales, para este procedimiento se tienen las siguientes hipótesis.
BAH :0
BAAH :,
23
Se aplica la ecuación5
T
= A − B
Sp 1
nA+
1
nB
, m 𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧 𝟓
Donde 2 BA nnm
, y
Sp = nA − 1 SA
2 + nB − 1 SB2
nA + nB − 2
Cuando ya se tiene el resultado de T, se encuentra el valor en la tabla del ANEXO C y si este no está ahí
se usa la función de densidad de T de Student que se encuentra en el ANEXO B
Comparando los resultados de las ecuaciones 5 y 6, se decide si se rechaza o no la hipótesis de que las dos
medias son iguales.
Entonces se rechaza 0H cuando 2
tT
con m grados de libertad; o cuando 21
tT
con m grados de
libertad, en donde t se encuentra en la tabla.
Prueba de hipótesis para la media si las varianzas son diferentes pero conocidas.
Para esta prueba, se tiene las siguientes hipótesis:
BAH :0
BAAH :,
Se usa la ecuación 7
T = A − B
SA
2
nA+
SB2
nB
, V 𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧𝟕
En donde
V =
SA2
nA+
SB2
nB
2
S A
2
n A
2
nA−1 +
S B
2
n B
2
nB−1
Después de aplicar la ecuación 7 se compara ese valor con la tabla de probabilidad de T-Student se
compara con el valor que está en la tabla del ANEXO C y si el valor no esta se usa la función de densidad
24
T-Student que se encuentra en el ANEXO B. Entonces se rechaza 0H cuando 2
tT
con m grados de
libertad; o cuando 21
tT
con m grados de libertad, en donde t se encuentra en la tabla.
Figura 13. Diagrama de bloques de método estadístico T-Student.
BHATTACHARYYA: Es un proceso que mide la divergencia de 2 poblaciones estadísticas
definidas por distribuciones de probabilidad. Es comúnmente usado en procesos de identificación de
patrones debido a su sencilla implementación y bajo coste computacional.
𝐷𝐵 =1
8 𝑚1 −𝑚2
𝑇 𝑚1 −𝑚2 +1
2𝑙𝑛
det𝑃
det𝑃1𝑑𝑒𝑡𝑃2
𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧 𝟖
En donde m = Media de la población, P = Varianza de la población y 𝑃 =𝑃1+𝑃2
2 La varianza conjunta de
las 2 poblaciones.
POBLACIÓN A POBLACIÓN B
VARIANZA Y PROMEDIO
MUESTRAL DE
POBLACIÓN B
VARIANZA Y
PROMEDIO MUESTRAL
DE POBLACIÓN A
PRUEBA HIPOTESIS
VARIANZA 95% CONFIABILIDAD
VARIANZAS DE LAS DOS
POBLACIONES SON
IGUALES
VARIANZAS DE LAS DOS
POBLACIONES SON
DIFERENTES
PRUEBA HIPOTESIS
PARA LA MEDIA
ASUMIENDO LAS
VARIANZAS DE LAS DOS
POBLACIONES
DIFERENTES
PRUEBA HIPOTESIS
PARA LA MEDIA 95%
CONFIABILIDAD
ASUMIENDO LAS
VARIANZAS DE LAS DOS
POBLACIONES IGUALES
LAS MEDIAS DE LAS
DOS POBLACIONES
SON IGUALES
LAS MEDIAS DE LAS
DOS POBLACIONES
SON DIFERENTES
PIXEL QUE SE ESTA
EVALUANDO DE LA
POBLACIÓN B NO
PERTENECE A LA
REGION DEL PIXEL DE
LA POBLACIÓN A
PIXEL QUE SE ESTA
EVALUANDO DE LA
POBLACIÓN B
PERTENECE A LA
REGION DEL PIXEL DE
LA POBLACIÓN A
25
RECONOCIMIENTO DE CARACTERÍSTICAS CON DESCRIPTORES DE
FOURIER
Existen diferentes métodos para reconocer las características de objetos en imágenes, entre estos métodos
está el de los descriptores de Fourier que usa la transformada de Fourier para reconocer el contorno de un
objeto [12].
Los descriptores de Fourier son de gran utilidad para encontrar la forma o contorno de las
microcalcificaciones, a continuación se explica el proceso que se debe desarrollar:
En la figura 14 se observa una imagen con N puntos en el plano XY, se puede recorrer el contorno de esta
imagen siguiendo las coordenadas xi , yi en sentido horario. Cada par de coordenadas se puede expresar
con un número complejo así:
S k = x k + jy k Para k = 0,1,2,3,… , N
Con todas las coordenadas se forma un vector complejo así:
𝑆 =
𝑥0 , 𝑗𝑦0
𝑥1 , 𝑗𝑦1
.
.
.𝑥𝑁 , 𝑗𝑦𝑁
Cuando ya se tienen todas las coordenadas que describen la imagen entonces se aplica la ecuación 9 que
es la transformada discreta de Fourier
𝐹 = 𝐷𝐹𝑇 𝑆 = 𝑆 𝑘𝑒 −
2𝜋𝑗
𝑁𝑘𝑚 𝑁−1
𝐾=0 Endonde m = 0,1,2,… , N − 1 𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧𝟗
Los descriptores de Fourier entonces son como los muestra la ecuación 10:
𝑍𝑚 =1
𝑁 𝑆 𝑘𝑒
−2𝜋𝑗
𝑁𝑘𝑚
𝑁−1
𝐾=0
𝐄𝐜𝐮𝐚𝐜𝐢ó𝐧𝟏𝟎
Figura 14. Ejemplo de los puntos que describen el contorno de una imagen en el plano
26
3. ESPECIFICACIONES
3.1 MAMOGRAFÍAS ANALIZADAS
Para coprobar los resultados obtenidos en este proyecto se usó la base de datos de mamografias
digitalizadas MIAS (The Mammographic Image Analysis Society Digital Mammogram Database). Esta
base de datos cuenta con 322 Mamografías anonimas digitalizadas las cuales 204 oerteneces a
mamografias con un diagnostico normal, y 118 con alguna anomalia. De estas ultimas 20 contienen
almenos una microcalsificación repartidas en 11 con presencia de microcalsificaciones benignas y 9 con
malignas. Cada mamografía fue analizada por un grupo de médicos expertos los cuales clasificaron las
anomalías encontradas, en esta descripción podemos encontrar el tipo de tedijo que rodea a la mama, la
clase de anomalía y su ubicación, gracias a esto es posible realizar una comparación del algoritmo
propuesto en este proyecto con el parte médico suministrado por la base de datos.
Figura 15. Descripción de la base de datos
Todas las imágenes procedentes de esta base de datos fueron digitalizadas a 8Bits con una resolución de
50u/pixel.
3.2 DIAGRAMA DEL PROYECTO.
Figura 16. Diagrama de bloques general del proyecto
Algoritmo de
segmentación
Algoritmo de descriptores
de Fourier con el primer
armónico
Según criterio establecido
comparar las
microcalcificaciones
encontradas con las
microcalcificaciones
descritas en BIRADS
27
3.3 ESPECIFICACIONES Y DESCRIPCIÓN DEL PROYECTO
Para empezar nuestro proyecto se hace la segmentación de la mamografía, se usa el algoritmo de
crecimiento de semillas. Finalmente se determina la forma de cada una de las microcalcificaciones usando
descriptores de Fourier para comparar las microcalcificaciones encontradas en la mamografía con las que
estan descritas en BIRADS.
Para lograr el objetivo del proyecto, el cual es clasificar las microcalcificaciones según la escala BIRADS,
se usa un algoritmo que sea rapido y eficiente el cual segmente regiones pequeñas como son las
microcalcificaciones, estas microcalcificaciones deben ser menores a 10 píxeles, para este proyecto el
algoritmo debe hacer un conocimiento de texturas, esto quiere decir que los pixeles que tienen la
microcalcificación no tienen el mismo valor, por tanto no se los puede trabajar con una binarización. Es
necesario hacer un algoritmo de segmentación que segmente texturas las cuales tengan diferentes valores
de píxeles y tengan una distribución normal y se pueda caracterizar con un promedio y una desviación
estandar.
A continuación estan las entradas y salidas de los algoritmos:
Entradas y salidas del algoritmo de crecimiento de regiones.
Entrada Píxeles semillas encontrados por algoritmo de detección
Salida Las microcalcificaciones segmentadas
Entradas y salidas del algoritmo de descriptores de Fourier.
Entrada Microcalcificaciones segmentadas
Salida Contorno de las microcalcificaciones
El proyecto se realiza con dos software, para hacer el algoritmo de crecimiento de regiones que se realiz
en C++, de este algoritmo se obtienen las microcalcificaciones segmentadas y estas entran al algoritmo de
descriptores de Fourier que se realiza con C++.
3.4 DIAGRAMA DE BLOQUES DE ALGORITMO DE CRECIMIENTO DE REGIONES.
Este proceso es iterativo con cada uno de los píxeles semilla
Figura 17. Diagrama de bloques de crecimiento de regiones
Píxel semilla Determinar los 4
vecinos del píxel
semilla
Según un proceso
estadístico se
determina que
píxeles pertenecen
a la región del pixel
semilla
Se obtiene la
microcalcificación
segmentada
28
3.5 DIAGRAMA DE BLOQUES DEL ALGORITMO DE DESCRIPTORES DE FOURIER
Y CLASIFICACIÓN.
Figura 18. Diagrama de 6oques del algoritmo para clasificar las microcalcificaciones encontradas en las mamografías con las
microcalcificaciones que están en el estándar BIRADS.
4. DESARROLLOS
4.1 DESARROLLO DEL ALGORITMO DE CRECIMIENTO DE REGIONES
El proceso del algoritmo de crecimiento de regiones se ilustra en la figura 19.
A partir de unos píxeles semillas, que son escogidos manualmente por el usuario, estos píxeles
aparentemente se encuentran donde aparentemente están las microcalcificaciones. A partir de cada pixel
semilla se hace un proceso de análisis de los cuatro píxeles vecinos al píxel semilla. En la figura 19 se
muestra los pixeles que son analizados:
Vecino 3
Vecino 1 Píxel Semilla Vecino 2
Vecino 4
Figura 19. Píxel semilla con los cuatro vecinos para analizar.
El algoritmo inicia insertando los cinco píxeles para analizar en una cola2 donde se van a ingresar todos
los píxeles vecinos que son analizados, a esta cola se la llama la cola de vecinos. La primera población
será entonces el píxel semilla, vecino 1, vecino 2, vecino 3, vecino 4, y se compara con la población de los
nueve vecinos del pixel que se está analizando. En la figura 20 se observa cómo están divididas estas dos
poblaciones:
2Cola: Estructura donde se pueden extraer o insertar datos.
Extraer la información de
los radios de las elipses que
encierran mejor las
microcalcificaciones en
BIRADS
Extraer la información de
los radios de las elipses que
encierran mejor las
microcalcificaciones
encontradas en las
mamografías
Comparar la información de
los dos objetos para clasificar
a que BIRADS pertenecen las
microcalcificaciones
encontradas en las
mamografías
29
Vecino 3
Vecino 1 Píxel Semilla Vecino 2
Vecino 4
Figura 20. Primer análisis, con el vecino 1 del píxel semilla.
En la figura 21 esta la cola de vecinos en el primer análisis:
Píxel Semilla Vecino 4 Vecino 3 Vecino 2 Vecino 1
Figura 21. Cola de vecinos por analizar.
De esta cola se extrae el vecino 1 que será analizado y se compara las dos poblaciones A y B. Si según un
análisis estadístico previamente establecido el promedio de la intensidad de los píxeles de las dos
poblaciones es igual, entonces las coordenadas del píxel “vecino 1” se agrega a la cola de región, en la
cola de región estarán los pixeles que pertenecen a una región a partir de un píxel semilla, dado que en una
mamografía pueden haber más de una microcalcificación, es decir más de una región, es necesario separar
las regiones dentro de la cola. La figura 22 muestra un ejemplo de cómo se van separando las regiones en
la cola de poblaciones:
V1
Región 1
Separador de regiones
Región 2
Figura 22. Ejemplo cola de poblaciones, dos regiones con un separador.
El píxel “vecino 1” sale de la cola de vecinos y se agregan los cuatro vecinos de este a la cola de vecinos,
la figura 23muestra cómo crece la región y la figura 24 muestra la nueva cola de vecinos.
Vecino 3(1) Vecino 3
Vecino 1(1) Vecino 1 Píxel Semilla/Vecino 2(1) Vecino 2
Veino 4(1) Vecino 4
Figura 23. Los nuevos píxeles que entran a la cola de vecinos
Vecino1 (1): Vecino 1 del vecino 1 del píxel semilla Píxel semilla/Vecino2 (1): Píxel semilla que a su vez es vecino 2 del vecino 1 del píxel semilla
Vecino3 (1): Vecino 3 del vecino 1 del píxel semilla
Vecino4 (1): vecino 4 del vecino 1 del píxel semilla
Veino 4(1) Vecino 3(1) Vecino 1(1) Píxel Semilla Vecino 4 Vecino 3 Vecino 2
Figura 24. Nueva cola de vecinos
Píxeles que pertenecen a las dos poblaciones
Píxeles que pertenecen a la población A
Píxeles que pertenecen a la población B
30
Continúa el algoritmo analizando el “Vecino 2”, lo extrae de la cola de vecinos, la población A es todos
los píxeles que pertenecen a la cola de vecinos y la población B son los nueve píxeles vecinos del píxel
“Vecino 2”.La figura 25 muestra las dos poblaciones que se van a analizar.
Vecino 3(1) Vecino 3
Vecino 1(1) Vecino 1 Píxel Semilla/Vecino 2(1) Vecino 2
Veino 4(1) Vecino 4
Píxeles que pertenecen a las dos poblaciones
Píxeles de la población A
Píxeles de la población B
Figura 25. Poblaciones por analizar.
El proceso sigue iterativamente con el “Vecino3”, sigue el orden de los píxeles que van entrando a la cola
de vecinos, y termina cuando esta cola está vacía.
El algoritmo finaliza, y se extraen los datos que están en la cola de regiones donde se encuentran las
coordenadas de los píxeles que pertenecen a cada región. Estos datos entran al algoritmo de descriptores
de Fourier.
El criterio estadístico que se desarrolla es con T-Student, ya que este permite comparar las dos
poblaciones de una forma rápida y segura con una confiabilidad del 95%.
Los píxeles semillas que se escogen es de acuerdo al criterio de que está en la base de datos MIAS, en
donde están las mamografías de prueba. La tabla 2 y tabla 3 muestra los píxeles semillas escogidos, en la
tabla 2 están las mamografías con calcificaciones malignas y en la tabla 3 las mamografías con
calcificaciones benignas. Es importante destacar que estos pixeles semillas fueron encontrados y
analizados por el grupo de expertos que creó la base de datos, por lo que podemos asumir que estos
puntos pertenecen en realidad a microcalcificaciones benignas o malignas (de acuerdo al caso)
IMAGEN COORDENADAS
PÍXEL ENCONTRADO
SEGÚN DATABASE(x,y)
mdb213 (547, 520) mdb231 (603,538) mdb233 EXISTEN VARIAS
MICROCALCIFICACIONES
mdb238 (522,553) mdb239 (645,755) mdb241 (453,678) mdb245 EXISTEN VARIAS
MICROCALCIFICACIONES mdb249 (544,508)
(575,639) mdb253 (733,564) mdb256 (400,484)
Tabla 2. Píxeles semillas encontrados en las mamografías con calcificaciones malignas.
31
IMAGEN COORDENADAS
PÍXEL ENCONTRADO
SEGÚN DATABASE(x,y)
mdb222 (398,427)
mdb223
(523,482) (591,529)
mdb226 (287,610)
(329,550) (531,721)
mdb227 (504,467)
mdb236 (276,824)
mdb244 (466,567)
mdb248 (378,601)
mdb252
Tabla 3. Píxeles semillas encontrados en las mamografías con calcificaciones benignas.
4.2 DESCRIPTORES DE FOURIER
Para clasificar las microcalcificaciones se aplica el algoritmo de descriptores de Fourier. El diagrama de
bloques de este algoritmo está en la figura 18
4.2.1 ALGORITMO PARA CLASIFICAR LAS MICROCALCIFICACIONES
ENCONTRADAS EN LAS MAMOGRAFÍAS
Con el fin de clasificar las microcalcificaciones encontradas en las mamografías según el estándar
BIRADS, se hace un algoritmo que detecta el contorno de cada microcalcificación que está en BIRADS,
y la compara con la microcalcificación encontrada en la mamografía.
El estándar BIRADS dice que dependiendo de la forma de la microcalcificación se trata de una amenaza a
cáncer o no, con cierto porcentaje.
Para lograr el objetivo de esta clasificación se usan descriptores de Fourier, que son muy útiles para
encontrar el contorno y hacer un reconocimiento de imágenes.
De acuerdo con la Tabla 1, de la sección 2.7 en donde se observa la forma de las microcalcificaciones
según la escala BIRADS, se ve que si la forma de las microcalcificaciones es menos simétrica, entonces
estas son mas malignas, entre más regular sea la forma de la calcificación más benigna es esta.
En la escala BR-1, donde las masas encontradas son de una mama normal, se observan que las formas de
las masas son regulares y muy bien definidas. En la escala BR-2 se ven otro tipo de masas, con formas no
tan regulares como las de BR-1, sin embargo siguen siendo regulares comparadas con las que están en las
siguientes escalas. En la escala BR-3 son redondas completamente y agrupadas, en este caso es probable
que las calcificaciones encontradas sean benignas. La escala BR-4 es la que muestra las
microcalcificaciones malignas comunes, en esta se observan que son varias microcalcificaciones
agrupadas y que tienen una forma irregular, entonces si en la mama se encuentran varios píxeles semillas
y con esa distribución se está hablando de una patología maligna. En la escala BR-5 es una alta sospecha
de calcificación maligna y la forma de esta es alargada.
Para lograr el objetivo de encontrar las calcificaciones malignas, se usa el primer armónico de los
descriptores de Fourier que tiene la información de el centro de masa de la microcalcificación y la encierra
en una elipse y determina el radio mayor y el menor de la elipse, como la escala BR-5 es una calcificación
32
alargada se concluye que si 𝑅𝑚𝑖𝑛
𝑅𝑚𝑎𝑥 es más cercana a cero la microcalcificación es maligna dando la forma de
la escala BR-5. La figura 26 muestra como la elipse rodea la microcalcificación y determina los radios y
según esto clasifica como una microcalcificación BR-5.
Figura 26. Muestra la elipse rodeando la microcalcificación para determinar los radios mayor y menor
Si se encuentran varias calcificaciones y el tamaño de estas es de 10 píxeles o menor, las
microcalcificaciones pertenecen a la categoría BR-4.
4.2.2 COMPARACIÓN DE MICROCALCIFICACIONES CON BIRADS
Cuando ya se tiene la información del contorno de las microcalcificaciones que se encuentran en
BIRADS, se identifican las características del contorno de la microcalcificación encontrada en la
mamografía, se compara con toda la información que se encuentra en las diferentes microcalcificaciones
descritas en BIRADS y se clasifica la microcalcificación.
4.3 PROTOCOLO DE PRUEBAS.
OBJETOS POR ENCONTRAR MAMOGRAFÍA RESULTADOS ESPERADOS CALCIFICACIONES BENIGNAS EN MAMOGRAFÍAS DONDE SOLO
EXISTAN MICROCALCIFICACIONES MALIGNAS.
DEBE SEGMENTAR LA
MICROCALCIFICACIÓN, Y CUANDO SE HAGA LA RELACIÓN DE RADIOS
DE LA ELIPSE DEBE ESTAR MUY
CERCA A CERO. CALCIFICACIONES BENIGNAS EN MAMOGRAFÍAS DONDE SOLO
EXISTAN MICROCALCIICACIONES
BENIGNAS.
DEBE SEGMENTAR LA
MICROCALCIFICACIÓN, Y CUANDO
SE HAGA LA RELACIÓN DE RADIOS DE LA ELIPSE DEBE ESTAR MUY
CERCA A UNO. CALCIFICACIONES MALIGNAS EN MAMOGRAFÍAS DONDE SOLO
EXISTAN MICROCALCIICACIONES BENIGNAS.
DEBE SEGMENTAR LA
MICROCALCIFICACIÓN, Y CUANDO SE HAGA LA RELACIÓN DE RADIOS
DE LA ELIPSE DEBE ESTAR MUY
CERCA A UNO. CALCIFICACIONES MALIGNAS EN MAMOGRAFÍAS DONDE SOLO
EXISTAN MICROCALCIFICACIONES
MALIGNAS.
DEBE SEGMENTAR LA
MICROCALCIFICACIÓN, Y CUANDO
SE HAGA LA RELACIÓN DE RADIOS DE LA ELIPSE DEBE ESTAR MUY
CERCA A CERO. Tabla 4. Protocolo de pruebas para el proyecto
33
5. ANÁLISIS DE RESULTADOS.
El algoritmo de segmentación recorre la microcalcificación que se encuentra en cada mamografía como se
muestra en las figuras 27 hasta la 38, en donde la microcalcificación segmentada se encuentra en color
azul, la región de interés que se obtuvo en la base de datos MIAS está en amarillo, y la elipse que mejor
encierra el contorno de la microcalcificación de color azul.
Los resultados obtenidos para el programa de segmentación se encuentran a continuación. El píxel semilla
que se toma para todas las imágenes, es el dado por el experto de MIAS que se encuentran en la tercera
columna de la tabla 2 y la tabla 3. A partir de estos píxeles se hace la segmentación de cada una de las
microcalcificaciones encontradas.
Figura 27: Mamografía a analizar.
34
Figura 28. En azul se encuentra la microcalcificación benigna segmentada que se encontró en la mamografía de la figura 27, en rojo la mejor
elipse que envuelve la microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos MIAS
35
Figura 29: Mamografía a analizar.
36
Figura 30. En azul se encuentra la microcalcificación benigna segmentada que se encontró en la mamografía de la figura 29, en rojo la mejor
elipse que envuelve la microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos MIAS
37
Figura 31: Mamografía a analizar.
38
Figura 32. En azul se encuentra la microcalcificación benigna segmentada se encontró en la mamografía de la figura 31, en rojo la mejor elipse
que hace el contorno de esta microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos MIAS
39
Figura 33: Mamografía a analizar.
40
Figura 34. En azul se encuentra la microcalcificación maligna segmentada se encontró en la mamografía de la figura 33, en rojo la mejor elipse
que hace el contorno de esta microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos MIAS
41
Figura 35: Mamografía a analizar.
42
Figura 36. En azul se encuentra la microcalcificación maligna segmentada que se encontró en la mamografía de la figura 35, en rojo la mejor
elipse que hace el contorno de esta microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos MIAS
43
Figura 37: Mamografía a analizar.
44
Figura 38. En azul se encuentran las microcalcificaciones malignas segmentadas que se encontraron en la mamografía de la figura 37, en rojo la
mejor elipse que hace el contorno de esta microcalcificación y en amarillo la región de interés que obtuvieron los expertos de la base de datos
MIAS
45
IMAGEN Maligna/Benigna RADIO MENOR DE CADA
MICROCALCIFICACIÓN
ENCONTRADA EN CADA
MAMOGRAFÍA
RADIO MAYOR DE CADA
MICROCALCIFICACIÓN
ENCONTRADA EN CADA
MAMOGRAFÍA
RELACIÓN ENTRE
RADIOS 𝑹𝒎𝒆𝒏𝒐𝒓
𝑹𝒎𝒂𝒚𝒐𝒓
mdb222
Benigna
1,562 2,139 0,730
mdb223
Benigna
Benigna
8,057
2,462
11,165
6,100
0,722
0,404
mdb226
Benigna
Benigna Benigna
1,117
10,952 9,986
1,825
10,954 11,255
0,612
1,000 0,887
mdb227
Benigna
2,606 4,799 0,543
mdb236
Benigna
3,428 6,474 0,530
mdb244
Benigna
4,537 11,777 0,385
mdb248
Benigna
4,098 6,005 0,682
mdb252
Benigna
2,770 4,624 0,599
msb213
Maligna
3,187 8,926
0,357
mdb231
Maligna 5,397 9,117 0,592
mdb238
Maligna 1,452 2,872 0,506
mdb239
Maligna 1,562 2,139 0,730
mdb241
Maligna 10,075 11,235 0,897
mdb249
Maligna Maligna
1,797 1,263
3,548 1,263
0,506 1,000
mdb253
Maligna
1,562
2,139 0,730
mdb256
Maligna 1,562 2,139 0,730
Tabla 5. Resultado de los radios del mejor elipse que encierra la microcalcificación.
Figura 39. Análisis de resultados.
Con los resultados obtenidos es claro que no existe gran diferencia entre la relación de los radios cuando
la microcalcificación es maligna o cuando es benigna. Por lo tanto no es suficiente usar solo el primer
armónico de Fourier, es necesario hacer un procedimiento de descriptores de Fourier normalizado el cual
haga el contorno completo de cada microcalcificación.
46
6. CONCLUSIONES
Con la investigación es claro que el tema de detección de microcalcificaciones es un tema resuelto, ahora
es necesario aportar algoritmos y métodos de clasificarlas con un método estadístico que permita un grado
de confiabilidad alta. Para esto un buen método estadístico que proporciona confiabilidad es el T-Student
para hacer la segmentación continuando con los descriptores de Fourier normalizados.
Al hacer el análisis de la elipse envolvente con el primer armónico de los descriptores de Fourier no es
suficiente, como se observa en la tabla 5 no hay suficiente diferencia entre los radios de las
microcalcificaciones benignas y las malignas. Para lograr una total clasificación de las
microcalcificaciones en la escala BIRADS, es necesario trabajar en imágenes sobre-muestreadas, para
obtener más información de las anomalías.
No es suficiente el primer armónico de los descriptores de Fourier para clasificar las microcalcificaciones.
Es necesario encontrar todos los descriptores, para obtener una mejor información de la forma de las
microcalcificaciones.
Se propone mejorar los resultados del algoritmo de clasificación usando el residuo que se generan al
describir el objeto con el primer armónico. El análisis de este residuo mejoraría la clasificación de las
microcalcificaciones malignas ya que si bien la forma general del objeto puede ser circular, los sobrantes
que rodean a la elipse describirían mejor que tan amorfo es el objeto junto con el primer armónico de los
descriptores de Fourier.
Debido a que el grado de benignidad y malignidad de las microcalcificaciones se describe en la base de
datos y teniendo en cuenta que este grado es dado por un grupo de médicos expertos en el tema, se
concluye que las coordenadas usadas para los pixeles semillas corresponden a la ubicación de una
microcalcificación real en la mama.
47
7. BIBLIOGRAFÍA
[1] Alvarado Valencia Jorge Andres, Obagi Araújo Juan José. “Fundamentos de inferencia estadística”.
Editorial Pontifícia Universidad JAVERIANA
[2] Álvarez G, Damián A, Guevara G, Marta L, Holguín L, Germán A. “Preprocesamiento de imágenes
aplicadas a mamografías digitales”. Scientia Et Technica, Vol XII, Núm.31, Agosto 2006, pp.1-6.
Universidad Tecnológica de Pereira Colombia
[3] American College of Radiology, Radiological Society of North America. “Mamografía”.
Radiologyinfo.org. (http://www.radiologyinfo.org/sp/info.cfm?pg=mammo). Consultado el [15-07-2011].
[4] Brito Díaz Edgar Nahum., “Análisis y segmentación de micro texturas: “Aplicación a
imágenesmamográficas empleando la Transformada Wavelet””. Tesis Maestro en ciencias de la
computación. Universidad Autónoma Metropolitana, México D.F, 17 de Diciembre de 2002.
[5] Bueno Gloria, Caballero Jose M., Cosías Pablo, Martín Alberto, Martínez Antonio. “Detección
automática de lesiones en la mama”. Universidad de Castilla-La Mancha. XXV Jornadas de Automática
Ciudad Real, España, 8-10 de Septiembre de 2004.
[6]C Juárez Lardin, V Ponomaryov, J.L. Sánchez Ramirez, M Martinez Reyes. “Sistema de detección de
microcalcificaciones en imágenes de mamografía” Instituto Politécnico Nacional, Universidad Autónoma
del Estado de Mexico.
[7] http://www.beliefnet.com/healthandhealing/getcontent.aspx?cid=593300 consultado el [16-11-2011]
[8]Doctor Emilio Obaid. (http://www.dremiliobaid.cl/archivo_fotografico/mamografia_cancer.html).
Consultado el [09-11-2011].
[9] Esqueda Elizondo José Jaime, Palafox Maestre Luis Enrique. Fundamentos de procesamiento de
imágenes. Pag 16.
[10] Grupo Milenio. “Detecta oportunamente el Seguro Social 2,186 casos de cáncer de mama”.
Periódico electrónico.( http://impreso.milenio.com/node/8640855). Consultado el [16-06-2011].
[11] Grupo Ángeles Servicios de Salud. “Importancia de las calcificaciones en la Mamografía”, Acta
médica, Vol 2, Número 3, Julio-septiembre 2004.
[12] González Rafael C, Woods Richard E. “Tratamiento digital de imágenes”.
[13]http://www.emp.uva.es/inf_acad/hermer/estad2/material/e2t_tabla_t_de_student.pdf consultado el
[20-11-2011]
[14] http://www.dcb.unam.mx/profesores/irene/Notas/tablas/Fisher.pdf consultado el [20-11-2011]
[15] International Agency for Research on Cancer. “Most frequent cancers: both sexes”
(http://globocan.iarc.fr/factsheets/populations/factsheet.asp?uno=900). Consultado el [11-07-2011].
[16] International Agency for Research on Cancer. “Most frequent cancers: both sexes, Colombia”(
http://globocan.iarc.fr/factsheets/populations/factsheet.asp?uno=170). Consultado el [11-07-2011]
48
[17] Kenneth Byrd, Jianchao Zeng, Mohamed Chouikha. “Performance Assessment of Mammography
Image Segmentation Algorithms”. Howard University, Center for Applied High Performance Computing,
Article IEEE, Washington D.C, 2005.
[18] Leiner Barba J., Ing., Lorena Vargas Q., Ing., Cesar Torres M., Dr., Lorenzo Mattos V., MSc.
“Mammographic Images Analysis through Contrast Enhancement Techniques and Wavelet Transform”.
III Congreso Colombiano de Computación, Medellín, Abril 23 – 25 de 2008.
[19] Liga Colombiana Contra El Cáncer. “Cáncer de mama generalidades”
(http://www.ligacancercolombia.org/pdfs/Material%20Consulta/2008%20-
%20Documento%20tecnico%20mama.pdf). Consultado el [15-07-2011]
[20] María Cristina Crocco, Daniela Stoisa, María Eugenia Lucena, Cecilia Costamagna. “Cáncer de
mama y BIRADS (RX- US- RMI): Puesta al día.”. ANUARIO FUNDACIÓN Dr. J. R.
VILLAVICENCIO, Argentina 2004.
[21] Mária Sainz. “El PET/TAC mejora el pronóstico de un tipo de cáncer de mama”. El Mundo,
España.(http://www.elmundo.es/elmundosalud/2009/02/02/tecnologiamedica/1233589605.html).
Consultado el [16-06-2011].
[22] http://www.euskonews.com/0412zbk/gaia41202es.html consultado el [23-11-2011]
[23]Mata Campos Raul. “Detección de microcalcificaciones mediante análisis multiresolución y
transformada Wavelet”. Departamento de ingeniería de comunicaciones, Escuela técnica superior de
ingenieros de telecomunicación, Universidad de Málaga, España, 2003.
[24] Mónica Ruiz Díaz, Mercedes Torres Tabanera, Sonia Sánchez Gómez, Paula Marínez-Miravete
Eguiluz, Mercedes Sainz Miranda, Encarna Lag Asturiano. “Análisis de valor predictivo positivo (VPP)
para carcinoma de microcalcificaciones mamarias según el nuevo sistema BI-RADS del colegio
americano de radiología”. Hospital La Rioja Salud, Unidad de Patología Mamaria, Sociedad española de
radiología medica.
[25] MIAS DATABASE (http://peipa.essex.ac.uk/info/mias.html). Consultado el [16-01-2011]
[26]Organización mundial de la salud (http://www.who.int/topics/cancer/es/) Consultado el [10-06-2011]
[27] Suárez Bravo Álvaro. “ANÁLISIS DE MÉTODOS DE PROCESAMIENTO DE IMÁGENES
ESTEREOSCÓPICAS FORESTALES”. Proyecto fin de máster en ingeniería informática para la industria.
Facultad de Informática, Universidad Complutense de Madrid, Septiembre 2008.
[28] Tnag Jung. “A Color Image Segmentation algorithm Based on Region Growing”.2nd International
Conference on Computer Engineering and Technology.Xi'an Shiyou, School of Electronic Engineering,
University Xi'an, China, 2010.
[29] (http://www.hospitales.nisa.es/fundacion/cancer-de-mama-la-mas-avanzada-tecnologia-para-una-
mayor-curacion-y-un-mejor-resultado-estetico_90_10.aspx) consultado el (21-11-2011)
[30] Kenneth Byrd, Jianchao Zeng, Mohamed Chouikha. “Performance Assessment of Mammography
Image Segmentation Algorithms”.Howard University - Center for Applied High Performance Computing
[31] (http://bigwww.epfl.ch/demo/suredenoising-color/index.html) consultado el [22-08-2011]
49
ANEXOS
ANEXO A. VALORES DE LA DISTRIBUCIÓN DE FISHER[14]
1 − 𝛼 = 0.95 1 − 𝛼 = 𝑃 𝐹 ≤ 𝑓𝛼 ,𝑣1,𝑣2
50
ANEXO B. DISTRIBUCIONES DE PROBABILIDADES [1].
DISTRIBUCIÓN PARÁMETROS FUNCIÓN DE
DENSIDAD
MEDIA VARIANZA
T- Student 𝒗 𝝐 𝒁+ 𝚪 𝒗+𝟏
𝟐
𝒗𝛑𝚪 𝒗
𝟐 𝟏 +
𝒙𝟐
𝒗
𝒗+𝟏
𝟐
0 𝒗
𝒗 − 𝟐
𝒗 > 2
F de Snedecor 𝒗𝟏,𝒗𝟐 𝝐 𝒁+ 𝚪
𝒗𝟏+𝒗𝟐
𝟐
𝒗𝟏
𝒗𝟐
𝒗𝟏𝟐𝒙𝒗𝟏−𝟐
𝟐
𝚪 𝒗𝟏
𝟐 𝚪
𝒗𝟐
𝟐 𝟏 +
𝒗𝟏
𝒗𝟐𝒙
𝒗𝟏+𝒗𝟐𝟐
𝒙 > 0
𝒗𝟐𝒗𝟐 − 𝟐
𝒗𝟐 > 2
𝟐𝒗𝟐𝟐 𝒗𝟏 + 𝒗𝟐 − 𝟐
𝒗𝟏 𝒗𝟐 − 𝟐 𝟐 𝒗𝟐 − 𝟒
51
ANEXO C. TABLA DE PROBABILIDAD T STUDENT [13].
52
ANEXO D. CÓDIGO DE SEGMENTACIÓN Y DESCRIPTOR DE FOURIER
(Ver carpeta de Algoritmos/Segmentación/mammography/Build/Release/SegmentImage.exe en el
C.D)
ANEXO E. PRUEBA DE ALGORITMO DE PREPROCESAMIENTO
(Ver carpeta de pruebas/Pre procesamiento/Pruebas preprocesamiento.docx en el C.D)
ANEXO F. PRUEBAS DE ALGORITMO DE SEGMENTACIÓN Y DESCRIPTOR DE FOURIER
(Ver carpeta de pruebas/Segmentación y Clasificación en el C.D)
ANEXO G. LIBRERIAS Y HERRAMIENTAS
(Ver carpeta Librerías y Herramientas en el C.D)
ANEXO H. MAMOGRAFIAS Y CALCIFICACIONES
(Ver carpeta Mamografías y Calcificaciones. MIAS Database en el C.D)