Designs for Detecting Spatial Dependence

The aim of this article is to find optimal or nearly optimal designs for experiments to detect spatial dependence that might be in the data. The questions to be answered are: how to optimally select predictor values to detect the spatial structure (if it is existent) and how to avoid to spuriously detect spatial dependence if there is no such structure. The starting point of this analysis involves two different linear regression models: (1) an ordinary linear regression model with i.i.d. error terms—the nonspatial case and (2) a regression model with a spatially autocorrelated error term, a so-called simultaneous spatial autoregressive error model. The procedure can be divided into two main parts: The first is use of an exchange algorithm to find the optimal design for the respective data collection process; for its evaluation an artificial data set was generated and used. The second is estimation of the parameters of the regression model and calculation of Moran's I, which is used as an indicator for spatial dependence in the data set. The method is illustrated by applying it to a well-known case study in spatial analysis. El objetivo de este articulo es hallar disenos optimos o semi-optimos para experimentos que buscan detectar dependencia espacial en la data. Las preguntas de investigacion son dos: como seleccionar los valores de prediccion para detectar dependencia espacial (si esta existe), y como evitar detectar dependencia espacial espuria (o falsa). El punto de partida para este analisis esta compuesto por dos modelos de regresion lineal: (1) un modelo de regresion utilizando el metodo de minimos cuadrados ordinarios—el caso no espacial, y (2) un modelo de regresion con un termino de error espacial—conocido como el modelo de error autoreregresivo simultaneo SAR (tambien conocido como Modelo de Error Espacial). El procedimiento puede ser dividido en dos partes principales: la primera utiliza un algoritmo de intercambio para hallar el diseno optimo del proceso de recoleccion de data, el mismo que es evaluado con datos generados artificialmente. En la segunda parte se estiman los parametros del modelo de regresion y se calcula el indice de Moran, el cual es usado como indicador de dependencia. El metodo presentado es aplicado e ilustrado con conocido estudio de caso en el campo del Analisis Espacial 本文旨在探求最优或近优化的实验设计,以检测数据中可能存在的空间相关性。所要回答的问题是:如果确实存在某种空间结构,如何最优地选择预估准则来检测;如果不存在这样的空间结构,如何避免虚假地检测出空间相关性。该分析的起点涉及两个不同的线性回归模型:(1)针对非空间实例的具有独立同分布误差项的普通线性回归模型;(2)具有空间自相关误差项的回归模型,即所谓的联立空间自回归误差模型。其过程可分解为两个主要部分:首先是采用一种交换算法寻求对各种数据收集过程的优化设计,并通过生成和使用人工数据对该算法进行评估;其次是回归模型的参数估计和数据集中空间相关性度量指标Moran 指数I的计算。通过将本方法应用于空间分析一个著名的案例研究中,本文对其进行了示例分析。