‘Urban data-mining’ describes a methodological approach to reveal logical or mathematical and partly complex descriptions of patterns and regularities inside a set of geospatial data. The cyclical methodology procedure is characterized by six main tasks following the initial step of data collection: data inspection, structure visualization, structure definition, structure control, operationalization, and knowledge conversion. Geovisualization and spatial analysis supplement the process of knowledge conversion and communication. The multidimensional mining approach is presented as a case study applied to 12 430 German communities to analyse multidynamic characteristics between 1994 and 2004. In particular, Emergent Self Organizing Maps (ESOM) are performed as an appropriate method for clustering and classification. Their advantage is to visualize the structure of data and later on to define a number of feasible clusters. A good evidence-base for decision-makers and the implementation of planning tools would be the spatiotemporal exploration of multidimensional data leading to specific details, explanations and abstractions in the context of dynamic community behaviour. The presented techniques are expected to be of increasing interest for the management and development of building stocks, as well as for urban and regional planning processes. «L'exploration de données urbaines» décrit une approche méthodologique qui vise à révéler les descriptions logiques ou mathématiques et partiellement complexes des schémas et régularités au sein d'un jeu de données géospatiales. Cette procédure qui suit une méthodologie cyclique se caractérise par six tâches principales suivant la tâche initiale de collecte des données: inspection des données, visualisation des structures, définition des structures, contrôle des structures, opérationnalisation et conversion en connaissances. La géovisualisation et l'analyse spatiale complètent le processus de conversion en connaissances et de communication. Cette approche faisant appel à l'exploration de données multidimensionnelles est présentée sous forme d'une étude de cas appliquée à 12430 communes allemandes afin d'en analyser les caractéristiques multidynamiques entre 1994 et 2004. Il est en particulier réalisé des cartes auto-organisatrices émergentes (ESOM), s'agissant d'une méthode adaptée au groupage et à la classification. Elles ont pour avantage de visualiser la structure des données et de définir ultérieurement un certain nombre de groupes réalisables. L'exploration spatio-temporelle de données multidimensionnelles conduisant à des détails, des explications et des abstractions spécifiques dans le contexte d'un comportement communautaire dynamique constituerait une bonne base probante pour les décisionnaires et pour la mise en œuvre d'outils de planification. Il est attendu des techniques présentées qu'elles soient d'un intérêt croissant pour la gestion et le développement des parcs bâtis, ainsi que pour les processus de planification urbaine et régionale. Mots clés: parc bâti, exploration de données, Systèmes d'Information Géographie ou géomatique (SIG), analyse spatio-temporelle, analyse urbaine
[1]
Urska Demsar,et al.
Data mining of geospatial data: combining visual and automatic methods
,
2006
.
[2]
Wei-Yin Loh,et al.
Classification and regression trees
,
2011,
WIREs Data Mining Knowl. Discov..
[3]
Jarkko Venna,et al.
Analysis and visualization of gene expression data using Self-Organizing Maps
,
2002,
Neural Networks.
[4]
A. MacEachren,et al.
Visualization in Modern Cartography: Setting the Agenda
,
1994
.
[5]
Stan Openshaw,et al.
Modifiable Areal Unit Problem
,
2008,
Encyclopedia of GIS.
[6]
Teuvo Kohonen,et al.
Self-organized formation of topologically correct feature maps
,
2004,
Biological Cybernetics.
[7]
S. Siedentop.
Siedlungsstrukturelle Veränderungen im Umland der Agglomerationsräume
,
2003
.
[8]
Alfred Ultsch.
Control for knowledge based information retrieval
,
1987
.
[9]
Heikki Mannila,et al.
Principles of Data Mining
,
2001,
Undergraduate Topics in Computer Science.
[10]
Werner Bätzing,et al.
Die Typisierung der Alpengemeinden nach "Entwicklungsverlaufsklassen" für den Zeitraum 1870 - 1990
,
2001
.
[11]
Alfred Ultsch,et al.
Automatic Acquisition of Symbolic Knowledge from Subsymbolic Neural Networks
,
1993
.
[12]
Alfred Ultsch.
U*C: Self-organized Clustering with Emergent Feature Maps
,
2005,
LWA.
[13]
Petra Perner,et al.
Data Mining - Concepts and Techniques
,
2002,
Künstliche Intell..
[14]
T. Kohonen.
Self-Organized Formation of Correct Feature Maps
,
1982
.
[15]
B. Streich.
Stadtplanung in der Wissensgesellschaft
,
2005
.
[16]
Alfred Ultsch,et al.
Pareto Density Estimation: A Density Estimation for Knowledge Discovery
,
2005
.
[17]
Alfred Ultsch,et al.
Urban Data Mining Using Emergent SOM
,
2007,
GfKl.
[18]
Shashi Shekhar,et al.
A Unified Approach to Detecting Spatial Outliers
,
2003,
GeoInformatica.
[19]
John W. Sammon,et al.
A Nonlinear Mapping for Data Structure Analysis
,
1969,
IEEE Transactions on Computers.
[20]
Alfred Ultsch,et al.
Data Mining and Knowledge Discovery with Emergent Self-Organizing Feature Maps for Multivariate Time Series
,
1999
.
[21]
Nasser M. Nasrabadi,et al.
Pattern Recognition and Machine Learning
,
2006,
Technometrics.
[22]
Chauncy D. Harris,et al.
A Functional Classification of Cities in the United States
,
1943
.
[23]
Trevor Hastie,et al.
The Elements of Statistical Learning
,
2001
.