A Comparison of Different Remotely Sensed Data for Classifying Bedrock Types in Canada’s Arctic: Application of the Robust Classification Method and Random Forests

The Geological Survey of Canada, under the Remote Predictive Mapping project of the Geo-mapping for Energy and Minerals program, Natural Resources Canada, has the mandate to produce up-to-date geoscience maps of Canada’s territory north of latitude 60°. Over the past three decades, the increased availability of space-borne sensors imaging the Earth’s surface using increasingly higher spatial and spectral resolutions has allowed geologic remote sensing to evolve from being primarily a qualitative discipline to a quantitative discipline based on the computer analysis of digital images.  Classification of remotely sensed data is a well-known and common image processing application that has been used since the early 1970s, concomitant with the launch of the first Landsat (ERTS) earth observational satellite. In this study, supervised classification is employed using a new algorithm known as the Robust Classification Method (RCM), as well as a Random Forest (RF) classifier, to a variety of remotely sensed data including Landsat-7, Landsat-8, Spot-5, Aster and airborne magnetic imagery, producing predictions (classifications) of bedrock lithology and Quaternary cover in central Victoria Island, Northwest Territories. The different data types are compared and contrasted to evaluate how well they classify various lithotypes and surficial materials; these evaluations are validated by confusion analysis (confusion matrices) as well as by comparing the generalized classifications with the newly produced geology map of the study area. In addition, three new Multiple Classification System (MCS) methods are proposed that leverage the best characteristics of all remotely sensed data used for classification. Both RCM (using the maximum likelihood classification algorithm, or MLC) and RF provide good classification results; however, RF provides the highest classification accuracy because it uses all 43 of the raw and derived bands from all remotely sensed data. The MCS classifications, based on the generalized training dataset, show the best agreement with the new geology map for the study area. SOMMAIRE Dans le cadre de son projet de Telecartographie predictive du Programme de geocartographie de l’energie et des mineraux de Ressources naturelles Canada, la Commission geologique du Canada a le mandat de produire des cartes geoscientifiques a jour du territoire du Canada au nord de la latitude 60°. Au cours des trois dernieres decennies, le nombre croissant des detecteurs aerospatiaux aux resolutions spatiales et spectrales de plus en plus elevees a fait passer la teledetection geologique d’une discipline principalement qualitative a une discipline quantitative basee sur l'analyse informatique d’images numeriques. La classification des donnees de teledetection est une application commune et bien connue de traitement d'image qui est utilisee depuis le debut des annees 1970, parallelement au lancement de Landsat (ERST) le premier satellite d'observation de la Terre. Dans le cas present, nous avons employe une methode de classification dirigee en ayant recours a un nouvel algorithme appele Methode de classification robuste (MRC), ainsi qu’au classificateur Random Forest (RF), appliques a une variete de donnees de teledetection dont celles de Landsat-7, Landsat-8, Spot-5, Aster et d’imagerie magnetique aeroportee, pour produire des classifications predictives de la lithologie du substratum rocheux et de la couverture Quaternaire du centre de l'ile Victoria, dans les Territoires du Nord-Ouest. Les differents types de donnees sont compares et contrastes pour evaluer dans quelle mesure ils classent les divers lithotypes et materiaux de surface; ces evaluations sont valides par analyse de matrices de confusion et par comparaison des classifications generalisees des nouvelles cartes geologiques de la zone d'etude. En outre, trois nouvelles  methodes par systeme de classification multiple (MCS) sont proposees qui permettent d’exploiter les meilleures caracteristiques de toutes les donnees de teledetection utilisees pour la classification. Tant la methode MRC (utilisant l'algorithme de classification de vraisemblance maximale ou MLC que la methode RF donne de bons resultats de classification; toutefois c’est la methode RF qui offre la precision de classification la plus elevee car elle utilise toutes les 43 les bandes de donnees brutes et derivees de toutes les donnees de teledetection. Les classifications MCS, basees sur le jeu de donnees generalisees d’apprentissage, montrent le meilleur accord avec la nouvelle carte geologique de la zone d'etude.