Download Modelos deformables Nadia Alejandra Mejía

Document related concepts
no text concepts found
Transcript
Modelos deformables
Nadia Alejandra Mejía-Molina
Maestría en Ingeniería de Sistemas y Computación, Pontificia Universidad
Javeriana
nadia.mejia@javeriana.edu.co
Resumen. Los procesos médicos son apoyados en gran medida
por aplicaciones informáticas que potencian la labor del médico
brindándole información que no puede obtener fácilmente sin
poner en riesgo la vida del paciente. Gran parte de dichas
actividades dependen de un proceso llamado segmentación de
imágenes, el cual permite detectar objetos o figuras en imágenes
médicas para reconstruir modelos completos de dichas figuras o
para detectar órganos y anormalidades en los mismos. De las
técnicas existentes para realizar el proceso de segmentación de
imágenes, los modelos deformables resultan de las más
promisorias, ya que hacen posible realizar procesos de
segmentación de imágenes que permitan al médico experto
apoyar la labor de la máquina y lograr resultados útiles para ser
usados en el diagnóstico.
Palabras Clave: Segmentación de imagines, diagnóstico asistido
por computador, modelos deformables, imágenes médicas.
1
Introducción
En las últimas décadas, la segmentación de imágenes ha tenido un papel muy
importante en la medicina ya que las imágenes segmentadas se usan en una
gran variedad de procesos médicos como detección de enfermedades, estudio
de anatomía, intervenciones asistidas por computador, entre otros [1]. La
visualización
de
imágenes
médicas
permite
obtener
información
potencialmente útil en intervenciones en las que fácilmente se juega la vida de
un paciente. Con la ayuda de este proceso es posible recibir retroalimentación
o información que no se conocía sobre el paciente y evitar situaciones que
puedan arriesgar su seguridad.
Sin embargo, la segmentación de imágenes es un proceso que aún debe
mejorar debido a que hay dificultades en el reconocimiento de formas debido
a la gran variedad existente y a que la calidad de las imágenes médicas no
siempre es adecuada. Comúnmente, las imágenes médicas poseen ruido,
bordes pocos definidos, elementos con bajo contraste y otros defectos que
dificultan la segmentación realizada con técnicas como detección de bordes y
umbralización. [1]
Con el fin de solucionar los problemas que dichas técnicas no solucionan se
han usado ampliamente los modelos deformables y han traído resultados
promisorios. Los modelos deformables pueden ser usados para la
segmentación de imágenes generadas con diversas tecnologías como rayos-X,
tomografías (CT), resonancias magnéticas, ultrasonidos, entre otras.
Los modelos deformables se usan ampliamente por su flexibilidad y porque
pueden ser usados en diversos tipos de figuras con solo modificar los
parámetros de su funcionamiento; por ejemplo, han sido usados en imágenes
de partes del cuerpo como son: cerebro, corazón, cara, arterias, riñones,
pulmones, estómago, hígado, vertebras, tumores e incluso en estructuras
celulares como neuronas y cromosomas. Además, los modelos deformables
permiten hacer el seguimiento de imágenes dinámicas o que se mueven en el
tiempo, por ejemplo, el latido de un corazón; permitiendo de esta forma
visualizar procesos del cuerpo humano y obtener información más
dimensiones.
La siguiente imagen muestra un ejemplo de una segmentación realizada con
modelos deformables, en la cual se segmenta una figura en 2D inicialmente y
luego de varios pasos de procesamiento se genera un modelo en 3D.
Fig. 1. Segmentación de una imagen y generación de su modelo en 3D [2]
2
Generalidades
El término modelos deformables apareció en 1988 en el trabajo realizado
por Terzopoulos y sus colaboradores; sin embargo, la idea de deformar una
figura para encontrar formas en una imagen surgió mucho antes con el trabajo
de Fischler and Elschlager, los Spring-loaded templates y la técnica de
Rubber mask de Widrow [1].
Snakes fue la técnica de deformación de modelos que dio fama al término
modelos deformables y permitió que se volvieran un área activa de
investigación en la segmentación de imágenes [1]. Los modelos deformables
llamados Snakes o active contour models, son contornos planos deformables
basados en la técnica de minimización de energía, que será explicada en
secciones posteriores.
2.1 Qué son
Los modelos deformables son curvas o superficies que definidas dentro
de una imagen se deforman bajo la influencia de fuerzas internas o
externas. Las internas están determinadas por la geometría de la curva o
superficie deformable y son usadas para conservar la estructura del
modelo deformable; las externas están determinadas por la información de
la imagen en la que se encuentra dicho modelo y son usadas para mover el
modelo hacia los bordes de un objeto o forma que se encuentre en la
imagen [1].
La siguiente imagen muestra la segmentación de una imagen cerebral
con un contorno deformable y el resultado final de la reconstrucción del
modelo cerebral.
Fig. 2. Segmentación y reconstrucción de un modelo cerebral [1]
2.2 Técnicas de implementación
2.2.1
Minimización de energía
El modelo planteado para la minimización de energía busca una
curva en la imagen que minimice la suma de fuerzas internas y
externas ejercidas sobre el modelo deformable. Como fue explicado
anteriormente, las fuerzas internas previenen que el modelo
deformable pierda sus características básicas o se deforme demasiado,
mientras que las fuerzas externas (o fuerzas potenciales) hacen que
busque los contornos o bordes de un objeto o figura en la imagen.
Para que el modelo deformable encuentre el borde de la figura, se
inicializa al interior de la imagen y en el proceso es forzado a moverse
hacia la mínima energía potencial.
La formulación matemática de un modelo deformable es una curva
definida por:
(1)
Esta curva se mueve en la imagen con el fin de minimizar la
siguiente función de energía:
(2)
El primer término define la fuerza interna, encargada de conservar
el modelo deformable y hacer que se comporte como un objeto rígido
para que no cambie demasiado fácil. Este término define la tensión y
rigidez del modelo.
El segundo término define la fuerza potencial, que está determinada
por la información que hay en la imagen. Este término toma los
valores más pequeños en los bordes de los objetos o figuras de interés
para la deformación del modelo. La función que define este segundo
término es seleccionada según la naturaleza de los objetos de interés
que haya en la imagen dependiendo de la forma de las figuras y el
contraste de los colores.
Independientemente de la selección de la energía potencial, la
minimización de energías será la misma.
2.2.2
Modelos dinámicos
Este tipo de implementación tiene en cuenta el movimiento y la
forma, por lo tanto permite a los modelos evolucionar en el tiempo
hasta alcanzar un equilibrio, lo cual es de mucho valor en la medicina
pues
varios
órganos
y estructuras anatómicas experimentan
movimientos y deformaciones [9].
El uso de modelos deformables dinámicos hace más intuitiva la
información que presenta y la interacción del usuario con la misma
para usarlo en guías, prácticas, intervenciones o seguimientos.
La formulación matemática de un modelo deformable dinámico usa
principios de mecánicas de Lagrange. Un ejemplo de una snake
dinámica se presenta a continuación.
(3)
En esta ecuación, los primeros dos términos representan las fuerzas
de inercia y amortiguación, los demás representan las fuerzas interna
de estiramiento y flexión, y el término que se encuentra a la derecha
representa las fuerzas externas. El equilibrio se alcanza cuando las
fuerzas internas y externas se balancean y el contorno queda en
reposo [10].
2.2.3
Modelos discretos
Para realizar un procesamiento numérico para hallar la solución que
minimice energía es necesario hacer la energía discreta, para este fin
existen diversos acercamientos, el más común es representar el
modelo en término de combinaciones lineares. A continuación se
presenta la forma discreta de la energía de una snake.
(4)
En esta ecuación K es la matriz de rigidez, P(u) es la versión
discreta del potencial externo. La solución se alcanza dando el valor 0
al gradiente, que equivale a resolver el conjunto de ecuaciones
algebraicas:
(5)
La variable f representa el vector de fuerza externa.
Ahora la versión discreta de la ecuación 3 se podría escribir como
un conjunto de ecuaciones diferenciales de segundo orden para u(t)
como se muestra a continuación.
(6)
En esta ecuación, M es la matriz de masa y C es la matriz de
amortiguación.
2.2.4
Modelos probabilísticos
Otra forma de implementación de los modelos deformables es la
probabilística, la cual permite incluir conocimiento previo sobre el modelo y
calcular la incertidumbre una vez el proceso ha sido realizado a partir de
información de la imagen.
La variable u representa los parámetros del modelo deformable, P(u) es la
probabilidad de ellos.
sera la probabilidad de producir una imagen I a
partir de un modelo u.
Entonces el teorema de Bayes expresa la probabilidad de producir un
modelo a partir de la información de una imagen de la siguiente forma:
(7)
3
Estilos
Existen tres formas de realizar el proceso de deformación de modelos,
manual, automática y semi-automática. Cada una tiene ventajas y desventajas,
y para ellas existen técnicas distintas. A continuación se explica cada estilo de
deformación de modelos.
3.1 Interactiva (manual)
3.1.1
Qué es
La segmentación de imágenes es realizada por un usuario, ojalá con
conocimiento del modelo médico, de manera manual; es decir, el
usuario traza la línea que bordea el objeto que desea reconocer en la
imagen [10].
3.1.2
Ventajas
Debido a que el usuario puede tener un buen conocimiento de la
imagen, sabrá qué figuras hay en ella y podrá reconocer los objetos
con facilidad, al igual que las deformaciones que existan debido a
condiciones de salud del paciente.
3.1.3
Desventajas
Con esta forma de segmentar las imágenes el usuario debe realizar
la segmentación de cada una de las imágenes 2D que pertenezcan a un
modelo 3D; es decir, revisar cada una manualmente y repetir el
proceso en cada plano. Debido a esto, es una técnica demorada pues
depende directamente del número de imágenes por las cuales esté
compuesto un modelo médico en 3D. Si se trata de una imagen en 2D,
el tiempo que toma segmentarla no es mucho, depende de la dificultad
de la imagen, la calidad de la imagen y el conocimiento del usuario
sobre la imagen; pero de ser un modelo 3D, el proceso podría tomar
mucho tiempo, incluso podría tomar días y no resultaría una
herramienta útil para trabajos médicos ya que solo terminaría
entorpeciendo el trabajo del médico [10].
Además del tiempo que puede tomar, la calidad del proceso manual
se puede ver afectada por la fatiga del usuario, por subjetividades o
por falta de interés.
3.2 Automática
3.2.1
Qué es
La segmentación es realizada por un computador haciendo uso de
modelos matemáticos configurados con distintos parámetros según
el tipo de imagen.
3.2.2
Ventajas
El proceso de segmentación automática es mucho más eficiente que
la segmentación manual; el computador tiene la capacidad de
segmentar grandes cantidades de imágenes en menos tiempo que un
humano y realizar operaciones matemáticas con gran rapidez.
Además, la calidad de la segmentación no se verá afectada por la
posible fatiga del usuario o por el contexto en que se realice la
segmentación.
3.2.3
Desventajas
La segmentación automática depende de parámetros específicos
para cada tipo de imagen dependiendo de su naturaleza; por lo tanto,
no es un proceso que se pueda aplicar ciegamente a cualquier modelo
médico.
Otro inconveniente que existe debido a esta parametrización del
método de deformación es que está configurado para reconocer ciertas
figuras, por lo cual podría ignorar deformaciones que haya en el
modelo debido a condiciones médicas del paciente y generar modelos
incorrectos que no permitirán al médico hallar enfermedades o
irregularidades en el cuerpo del paciente.
3.3 Semiautomática
3.3.1
Qué es
La deformación semi-automática integra el trabajo del usuario y el
trabajo de la máquina para producir modelos más cercanos a la
realidad. Este proceso se puede realizar de distintas formas; no todas
integran los dos componentes, el usuario y la máquina, de la misma
forma.
3.3.2
Ventajas
La deformación semi-automática de modelos permite obtener
modelos más exactos debido a que la máquina realiza la deformación
con la ayuda del conocimiento del usuario, el cual puede intervenir el
proceso, dar ayudas a la máquina y corregir la deformación; o puede
funcionar al revés, el usuario realiza la segmentación de las imágenes
con ayuda de la máquina para facilitar el trazado de líneas y brindarle
retroalimentación y ayudas [10].
3.3.3
Desventajas
No es fácil determinar cuál es la mejor forma de integrar al usuario
con la máquina, unas resultan más exitosas que otras dependiendo lo
que se desee obtener; si el usuario realiza la mayor parte del proceso
de segmentación habrá más exactitud y correspondencia con la
realidad apoyada en pequeñas ayudas que brinde la máquina, pero si
la máquina realiza la mayor parte del proceso, este se hará más rápido
con la intervención del usuario para corregirlo pero sin permitirle
cambiar demasiado el resultado.
3.3.4
Técnicas
Este estilo de deformación de modelos fue propuesto con el fin de
tener un proceso de segmentación rápido y preciso, ya que permite
que el conocimiento del médico experto y la máquina apoyen el
proceso para que los modelos se generen correcta y rápidamente.
Existen diversas técnicas de deformación automática como Snakes
[3], Live-wire [6], y otras [11, 12, 13, 14, 15, 16] que permiten
integrar la interacción del usuario; sin embargo, algunas de ellas están
pensadas únicamente para la segmentación en 2D.
3.3.5
Interacción en la actualidad
La segmentación de imagines 3D se realiza plano a plano,
independientemente de la técnica usada (manual o automatic). Es un
proceso que toma mucho tiempo pues depende directamente del
número de planos que conforman la imagen y luego de la
segmentación de ellos, se depende de procesos de post-procesamiento
para conectarlos y formar el modelo 3D [10].
Para solucionar los problemas mencionados, se puede realizar la
segmentación de imágenes 3D haciendo uso de un híbrido de técnicas,
o una técnica semi-automática. En la mayoría de técnicas semiautomáticas el usuario corrige la segmentación realizada por la
máquina luego de que ha sido realizada o el usuario realiza la
segmentación mientras la máquina le brinda información o facilita el
proceso de trazar el modelo en la imagen.
3.3.5.1 Interacción apoyada por la máquina
Este tipo de aplicaciones usualmente permiten al usuario inicializar
un modelo deformable dentro del dominio de la imagen, cerca del
objeto de interés, luego el modelo deformable se deforma para
detectar el objeto; una vez este proceso finaliza los usuarios pueden
interactuar con la técnica de deformación, arreglando manualmente el
resultado del modelo deformable para que se ajuste a la realidad.
Muchas de estas técnicas usan el resultado inicial para luego
realizar aproximaciones en otros planos de la imagen y finalmente
generar un resultado en 3D [10].
Un ejemplo de deformación interactiva de modelos 3D que se
realiza basado en la deformación de planos 2D es TurtleSeg. Esta es
una aplicación de segmentación de imágenes de forma interactiva que
permite al usuario segmentar planos de una imagen 3D con ayuda de
la máquina, que además propone nuevos planos de segmentación
sobre los que el usuario marca los contornos. La máquina extiende la
segmentación a planos intermedios, luego usa los originales y los
intermedios para generar el modelo en 3D [5].
Fig. 1. Segmentación y generación de modelos con TurtleSeg [4]
En la generación del contorno, la máquina propone el camino más
apropiado entre una semilla o seedpoint inicial dada por el usuario y
otros pixeles de la imagen, el usuario propone más seedpoints cada
vez que a su parecer el contorno esté siendo generado de manera
incorrecta. Un método usado para buscar qué camino debe seguir el
contorno es el algoritmo de Graph Search propuesto por Barret y
Mortenson [6].
La técnica de segmentación interactiva en 3D propuesta hasta el
momento por y Hamarneh [7], segmenta varios planos en 2D con la
ayuda del usuario, y luego segmenta de manera automática planos en
el plano ortogonal sobrante, es decir, sobre el cual el usuario no
realizó la segmentación. Los puntos de intersección entre los
contornos generados y el corte ortogonal que no fue segmentado se
usan
como
seedpoints
para
una
operación
automática
de
segmentación.
En la generación de los contornos automáticos se usa el algoritmo
llamado Turtle [8], que puede manejar la organización de puntos
incluso en figuras de estructuras complejas como picos y
concavidades.
La generación de modelos con planos segmentados semiautomáticamente permite a la máquina proponer nuevos planos de
segmentación para mejorar la figura que se ha segmentado hasta el
momento. Es decir, si el usuario no se encuentra satisfecho con el
resultado actual aún es posible segmentar más planos y generar
figuras más acertadas.
Fig. 2. Segmentación automática de planos adicionales [7]
La siguiente imagen presenta el resultado final de la segmentación
de los huesos de una mano.
Fig. 5. Modelo de los huesos de una mano en 3D [4]
4
Aplicaciones
4.1 Detección de movimiento
Los modelos deformables permiten hacer seguimiento de figuras en
movimiento como son las células de sangre, cine-angiografía de arterias
coronarias, cine-mocroscopia de crecimiento de neuritas, entre otras. El uso
más claro en la medicina es hacer seguimiento de órganos que se mueven
como el corazón.
Fig. 6. Motion tracking de un corazón
Otra área de aplicación es el reconocimiento de patrones, como es el
movimiento y deformación de los labios para reconocer lo que una persona
dice [18].
Fig. 7. Motion tracking de labios
4.2 Segmentación de imágenes
La segmentación de imágenes es un proceso necesario para diversas
aplicaciones menos básicas, como es el motion tracking explicado
anteriormente. Este proceso requiere que una imagen sea dividida en
secciones más pequeñas de la misma para reconocer estructuras que la
conforman. Por ejemplo en planos, en los cuales se reconocen los contornos
que componen una figura de interés y luego al unir la segmentación de cada
plano es posible reconstruir un modelo 3D de la figura de interés [10].
La segmentación de imágenes es realizada en mayor parte de forma
interactiva (manual) ya que de ser realizada en condiciones adecuadas brinda
los resultados más útiles para realizar un diagnóstico médico adecuado. Sin
embargo, como ya fue explicado sobre las técnicas manuales, estas pueden
sufrir de subjetividades relacionadas al médico experto que realiza la
segmentación como son el conocimiento insuficiente del modelo, cansancio,
desinterés, etc.
Para la segmentación de imágenes han surgido diversas técnicas e híbridos
de técnicas que responden a problemáticas como el tiempo consumido o la
imperfección de los modelos generados, al igual que responden a las
dificultades que supone segmentar imágenes con baja calidad, bajo contraste,
bordes mal definidos, etc.
5
Conclusiones
La deformación de modelos es una técnica que ha brindado solución a una
gran variedad de problemas inherentes a la segmentación de imágenes; sin
embargo, al abrir campo a la investigación y a la realización de nuevas
aplicaciones en diversos contextos médicos, los modelos deformables también
han creado una gran variedad de temas que requieren soluciones y de
aplicaciones que deben ser mejoradas.
Además, los modelos deformables han surgido con sus propias dificultades
o defectos, que usualmente dependen directamente de la técnica empleada, y
no hay una técnica automática o manual que funcione para cualquier caso de
manera completamente satisfactoria, esto se debe a que ambas tienen
desventajas respecto a la forma en que se ejecutan.
Las técnicas semi-automáticas de momento son la técnica que garantiza
mayor calidad en la deformación de modelos ya que permite realizar un
proceso rápido en ejecución y controlado por el conocimiento del médico
experto; a pesar de eso, estas técnicas aún pueden ser mejoradas para hacer la
interacción del médico en el proceso de segmentación más natural y atractiva,
de forma que el control que se tiene sobre el modelo sea suficiente como para
decir que la máquina trabaja para apoyar al médico y no el médico para
mejorar el proceso de la máquina.
Referencias
1. C. Xu, D. L. Pham, and J. L. Prince, "Medical Image Segmentation Using
Deformable Models," Handbook of Medical Imaging -- Volume 2: Medical
Image Processing and Analysis, pp. 129-174, edited by J.M. Fitzpatrick
and M. Sonka, SPIE Press, May 2000.
2. Blake C. Lucas, Michael Kazhdan, Russell H. Taylor, "Spring Level Sets: A
Deformable Model Representation to Provide Interoperability between
Meshes and Level Sets," IEEE Transactions on Visualization and
Computer Graphics, vol. 19, no. 5, pp. 852-865, May 2013.
3. M. Kass, A. Witkin, and D. Terzopoulos, “Snakes: active contour models,”
Int’l J. Comp. Vis., vol. 1, no. 4, pp. 321–331, 1987.
4. Top, A., Hamarneh, G., Abugharbieh, R. (2013). Turtleseg [Online].
Disponible en: http://www.turtleseg.org/index.php?page=gallery
5. Top, A., Hamarneh, G., Abugharbieh, R. “Spotlight: Automated
confidence-based user guidance for increasing efficiency in interactive
3D image segmentation,” In: Menze, B., Langs, G., Tu, Z., Criminisi, A.
(eds.) MICCAI Medical Computer Vision Workshop, LNCS, vol. 6533, pp.
204–213. Springer Berlin / Heidelberg (2010)
6. W. A. Barrett and E. N. Mortensen, “Interactive live-wire boundary
extraction,” Medical Image Analysis 1(4), pp. 331–341, 1996.
7. G. Hamarneh, J. Yang, C. McIntosh, and M. Langille, “3D live-wire-based
semi-automatic segmentation of medical images,” Proceedings of SPIE
Medical Imaging: Image Processing 5747, pp. 1597–1603, 2005.
8. Miranda
Poon,
Ghassan
Hamarneh,
and
Rafeef
Abugharbieh. “Segmentation of Complex Objects with Non-Spherical
Topologies from Volumetric Medical Images using 3D Livewire,” In SPIE
Medical Imaging, volume 6512, pages 1-10, 2007.
9. T. Mcinerney, “Deformable Models,” in in Handbook of Medical Image
Processing and Analysis, Elsevier, 2009, pp. 145–166.
10. T. McInerney and D. Terzopoulos, “Deformable models in medical image
analysis: a survey,” Medical Image Analysis, vol. 1, no. 2, pp. 91–108, Jun.
1996.
11. T. McInerney and H. Dehmeshki, “User-defined b-spline templatesnakes.,” in MICCAI(2), pp. 746–753, 2003.
12. E. N. Mortensen and W. A. Barrett, “Intelligent scissors for image
composition,” in Computer Graphics Proceeding, Annual Conference
Series, pp. 191–198, ACM, (Los Angeles, CA), Aug. 1995. SIGGRAPH’95.
13. E. N. Mortensen and W. A. Barrett, “Interactive segmentation with
intelligent scissors,” Graphical Models
and Image Processing 60, pp. 349–384, September 1998.
14. T. Mitsunaga, T. Yokoyama, and T. Totsuka, “Autokey: Human assisted
key extraction,” in Computer
Graphics Proceedings, SIGGRAPH’95, Annual Conference Series, pp.
265–272, ACM, (L.A., CA), August
1995.
15. M. Gleicher, “Image snapping,” in Computer Graphics Proceedings,
SIGGRAPH’95, Annual Conference
Series, pp. 183–190, ACM, (L.A., CA), August 1995.
16. A. X. Falco, J. K. Udupa, S. Samarasekera, S. Sharma, B. E. Hirsch, and R.
de A. Lotufo, “User-steered image segmentation paradigms: Live wire
and live lane,” Graphical Models and Image Processing 60, pp. 233–260,
July 1998
17. Blake C. Lucas, Michael Kazhdan, Russell H. Taylor, "Spring Level Sets: A
Deformable Model Representation to Provide Interoperability between
Meshes and Level Sets," IEEE Transactions on Visualization and
Computer Graphics
18. Syin Chan, Chong Wah Ngo, Kok F. Lai, Motion tracking of human mouth
by generalized deformable models, Pattern Recognition Letters, Volume
20, Issue 9, 20 September 1999