Multiresolution image segmentation based on camporend random fields: Application to image coding

La segmentacion de imagenes es una tecnica que tiene como finalidad dividir una imagen en un conjunto de regiones, asignando a cada objeto en la escena una o varias regiones. Para obtener una segmentacion correcta, cada una de las regiones debe cumplir con un criterio de homogeneidad impuesto a priori. Cuando se fija un criterio de homogeneidad, lo que implicitamente se esta haciendo es asumir un modelo matematico que caracteriza las regiones. En esta tesis se introduce un nuevo tipo de modelo denominado modelo jerarquico, ya que tiene dos niveles diferentes sobrepuestos uno sobre el otro. El nivel inferior (o subyacente) modela la posicion que ocupa cada una de las regiones dentro de la imagen; mientras que, por su parte, el nivel superior (u observable) esta compuesto por un conjunto de submodelos independientes (un submodelo por region) que caracterizan el comportamiento del interior de las regiones. Para el primero se usa un campo aleatorio Markoviano de orden dos que modelara los contornos de las regiones, mientras que para el segundo nivel se usa un modelo Gausiano. En el trabajo se estudian los mejores potenciales que deben asignarse a los tipos de agrupaciones que permiten definir los contornos. Con todo ello la segmentacion se realiza buscando la particion mas probable (criterio MAP) para una realizacion concreta (imagen observable). El proceso de busqueda de la particion optima para imagenes del tamano habitual seria practicamente inviable desde un punto de vista de tiempo de calculo. Para que se pueda realizar debe partirse de una estimacion inicial suficientemente buena y de una algoritmo rapido de mejora como es una busqueda local. Para ello se introduce la tecnica de segmentacion piramidal (multirresolucion). La piramide se genera con filtrado Gausiano y diezmado. En el nivel mas alto de la piramide, al tener pocos pixels, si que se puede encontrar la particion optima.