Application of the Dice Coefficient to Accuracy Assessment of Object-Based Image Classification

Abstract A methodology is proposed to assess the accuracy of individual classes within the context of an object-based image classification scenario. The Dice Coefficient (DC) and bootstrapping techniques are employed to assess the level and statistical significance of overlap between reference and candidate image object pairs. Two approaches are used to optimize object extraction parameterization. First, rates of acceptable matches observed for the ensemble of reference objects can be used to estimate conventional measures of performance such as aggregate producer and user accuracies. Second, a novel assessment methodology is proposed that analyzes the significance of changes in the DC of individual overlap cases with changing ordinal threshold. This technique provides useful insights into the gain/loss trade-offs of acceptable matches with changing threshold level. Practical application of these methodologies is presented for the case of evaluating one-to-one reference/image object correspondence. An in-depth accuracy analysis is presented of the identification of 543 core hole drilling sites associated with oil sands development from RapidEye imagery using an image object extraction methodology based on grey-level ordinal thresholding. Although producer accuracy is limited to a maximum value of 69% due to adjacency of many core sites with other manmade structures, a simple shape regularity constraint (fraction of image object pixels that are boundary pixels) results in high user accuracy (87%). Finally, 2 additional issues are raised and discussed. First, selection of an acceptable match (i.e., DC) threshold must take into account differences between reference and image objects arising from their differing extraction approaches. This primarily impacts the boundary pixel portion of an object, which in turn is dependent on object size and shape. Second, for scenarios of targeted object classification, (i.e., most of an image is unclassified), an alternate strategy is utilized for reference-data acquisition. This involves acquiring comprehensive reference information for selected subsites to ensure proper estimates of commission. Résumé. Une méthodologie est proposée pour évaluer la précision des classes individuelles dans le contexte d'un scénario de classification orientée objet d'images. Le Dice Coefficient (DC) et des techniques de bootstrap sont utilisés pour évaluer le niveau et la signification statistique de chevauchement entre des paires images-objets de référence et candidate. Deux approches sont utilisées pour optimiser la paramétrisation de l'extraction des objets. Premièrement, les taux de correspondances acceptables observés pour l'ensemble des objets de référence peuvent être utilisés pour estimer les mesures conventionnelles de performance telles que les précisions agrégées des producteurs et des utilisateurs. Deuxièmement, une nouvelle méthode d'évaluation est proposée. Elle analyse l'importance des changements dans le DC pour les cas de chevauchement individuels avec un seuil d'ordination variable. Cette technique fournit des informations utiles sur les compromis de gain/perte de correspondances acceptables avec un niveau de seuil variable. Une application pratique de ces méthodologies est présentée dans le cas de l'évaluation de la correspondance une à une pour les objets références/images. Une analyse en profondeur de précision est présentée pour l'identification de 543 sites de trou de forage associé au développement des sables bitumineux à partir d'images RapidEye en utilisant une méthodologie d'extraction d'images-objets en fonction du seuillage ordinal du niveau de gris. Bien que la précision de producteur est limitée à une valeur maximale de 69 % en raison de la contigüité de nombreux sites de forage avec d'autres structures artificielles, une contrainte de forme de régularité simple (fraction des pixels d'images-objets qui sont des pixels limites) conduit à une grande précision de l'utilisateur (87 %). Enfin, 2 autres questions sont soulevées et discutées. Tout d'abord, la sélection d'un seuil de correspondance acceptable (à savoir DC) doit tenir compte des différences entre les objets de référence et d'image résultant de leurs approches d'extraction différentes. Cela influe principalement la portion de pixel limite d'un objet qui, à son tour, dépend de la taille et la forme d'objet. Deuxièmement, pour les scénarios de classification d'objets ciblés (à savoir, la majorité d'une image est non classée) une autre stratégie est utilisée pour l'acquisition de données de référence. Cela implique l'acquisition d'informations de référence complètes pour les sous-sites sélectionnés afin de garantir des bonnes estimations de commission.

[1]  Hui Zhang,et al.  Image segmentation evaluation: A survey of unsupervised methods , 2008, Comput. Vis. Image Underst..

[2]  Rita Simões,et al.  Automatic segmentation of cerebral white matter hyperintensities using only 3D FLAIR images. , 2013, Magnetic resonance imaging.

[3]  Mary Freeman,et al.  The effect of input data transformations on object-based image analysis , 2012, Remote sensing letters.

[4]  Benoit M. Dawant,et al.  Morphometric analysis of white matter lesions in MR images: method and validation , 1994, IEEE Trans. Medical Imaging.

[5]  L. R. Dice Measures of the Amount of Ecologic Association Between Species , 1945 .

[6]  Daniel Rueckert,et al.  An evaluation of four automatic methods of segmenting the subcortical structures in the brain , 2009, NeuroImage.

[7]  J. Bartko Measurement and reliability: statistical thinking considerations. , 1991, Schizophrenia bulletin.

[8]  Woei-Chyn Chu,et al.  Performance measure characterization for evaluating neuroimage segmentation algorithms , 2009, NeuroImage.

[9]  Florian Thomas Albrecht Assessing the spatial accuracy of object-based image classifications , 2008 .

[10]  Lorenzo Bruzzone,et al.  A Novel Protocol for Accuracy Assessment in Classification of Very High Resolution Images , 2010, IEEE Transactions on Geoscience and Remote Sensing.

[11]  Volker Walter,et al.  Object-based classification of remote sensing data for change detection , 2004 .

[12]  S. Stehman,et al.  Accuracy Assessment , 2003 .

[13]  Ivan Lizarazo,et al.  Accuracy assessment of object-based image classification: another STEP , 2014 .

[14]  R. Pernar,et al.  Accuracy Assessment of Remotely Sensed Data in Vegetation Mapping Process , 2009 .

[15]  Zhou Wang,et al.  Measuring Intra- and Inter-Observer Agreement in Identifying and Localizing Structures in Medical Images , 2006, 2006 International Conference on Image Processing.

[16]  Stefan Lang,et al.  Object Fate Analysis – a Virtual Overlay Method for the Categorisation of Object Transition and Object-based Accuracy Assessment , 2006 .

[17]  Jayaram K. Udupa,et al.  A framework for evaluating image segmentation algorithms , 2006, Comput. Medical Imaging Graph..

[18]  Koen L. Vincken,et al.  Probabilistic segmentation of white matter lesions in MR imaging , 2004, NeuroImage.

[19]  Trisalyn A. Nelson,et al.  Use of ordinal conversion for radiometric normalization and change detection , 2005 .

[20]  Y. J. Zhang,et al.  A survey on evaluation methods for image segmentation , 1996, Pattern Recognit..

[21]  Cornelia Gläßer,et al.  A framework for the geometric accuracy assessment of classified objects , 2013 .

[22]  Selim Aksoy,et al.  Performance measures for object detection evaluation , 2010, Pattern Recognit. Lett..

[23]  Giles M. Foody,et al.  Status of land cover classification accuracy assessment , 2002 .

[24]  Dirk Tiede,et al.  NOVEL PARAMETERS FOR EVALUATING THE SPATIAL AND THEMATIC ACCURACY OF LAND COVER MAPS , 2012 .

[25]  J. R. Landis,et al.  The measurement of observer agreement for categorical data. , 1977, Biometrics.

[26]  Horst Bunke,et al.  Distance Measures for Image Segmentation Evaluation , 2006, EURASIP J. Adv. Signal Process..

[27]  Andrew W. Fitzgibbon,et al.  An Experimental Comparison of Range Image Segmentation Algorithms , 1996, IEEE Trans. Pattern Anal. Mach. Intell..

[28]  Dirk Tiede,et al.  Spatial and thematic assessment of object-based forest stand delineation using an OFA-matrix , 2012, Int. J. Appl. Earth Obs. Geoinformation.

[29]  P. Gong,et al.  Accuracy Assessment Measures for Object-based Image Segmentation Goodness , 2010 .

[30]  Robert Tibshirani,et al.  Bootstrap Methods for Standard Errors, Confidence Intervals, and Other Measures of Statistical Accuracy , 1986 .

[31]  Xiaole Ji,et al.  A novel method for assessing the segmentation quality of high-spatial resolution remote-sensing images , 2014 .

[32]  Thomas Blaschke,et al.  Object based image analysis for remote sensing , 2010 .

[33]  Bert Guindon,et al.  Quantification of anthropogenic and natural changes in oil sands mining infrastructure land based on RapidEye and SPOT5 , 2014, Int. J. Appl. Earth Obs. Geoinformation.

[34]  Jian Yang,et al.  A discrepancy measure for segmentation evaluation from the perspective of object recognition , 2015 .

[35]  R. G. Oderwald,et al.  Assessing Landsat classification accuracy using discrete multivariate analysis statistical techniques. , 1983 .

[36]  Dongmei Chen,et al.  Change detection from remotely sensed images: From pixel-based to object-based approaches , 2013 .