Trabajar con datos abiertos en tiempos de pandemia: uso de covidDATA-19

espanolUno de los problemas al trabajar con datos es la falta de uniformidad en los criterios de su recogida, lo que hace que la reutilizacion sea dificil, cuando no imposible. Deben tenerse claros los protocolos de recoleccion y estandarizacion de los datos. Este hecho se ha podido constatar en la situacion de pandemia global provocada por la Covid-19, en la que se han necesitado con urgencia datos uniformes para tomar decisiones rapidas y mantener informada a la poblacion. En este trabajo se observan las dificultades para crear un portal que analiza la evolucion de los datos de la pandemia en Espana. CovidDATA-19 es una web de datos abiertos que presenta visualizaciones interactivas y permite descargar los datos filtrados segun las elecciones del usuario. En su creacion se ha puesto de manifiesto la escasez de fuentes oficiales facilmente reutilizables y la fragilidad de la confianza en los datos en estos momentos de crisis. EnglishOne of the problems when working with data is the lack of uniformity in the criteria for their collection, which makes their reuse difficult if not impossible. Data collection and standardization protocols must be clear. This problem has been seen in the global pandemic caused by Covid-19, in which uniform data have been urgently needed to make rapid decisions and keep the population informed. The difficulties of creating a portal that analyzes the evolution of the data on the pandemic in Spain are discussed. CovidDATA-19 is an open data website that features interactive visualizations and allows filtered data to be downloaded according to the user’s choices. Its development as highlighted the scarcity of easily reusable official sources and the fragility of trust in such data during this crisis.

[1]  P. Vollmar,et al.  Transmission of 2019-nCoV Infection from an Asymptomatic Contact in Germany , 2020, The New England journal of medicine.

[2]  Ricardo Adán Salas Rueda,et al.  Análisis sobre el uso de la red social Facebook en el proceso de enseñanza-aprendizaje por medio de la ciencia de datos , 2019 .

[3]  Yan Bai,et al.  Presumed Asymptomatic Carrier Transmission of COVID-19. , 2020, JAMA.

[4]  Josep Cobarsí-Morales Covid-19: fuentes de información cuantitativa , 2020 .

[5]  J. M. Calabuig,et al.  Kaplan-Meier Type Survival Curves for COVID-19: A Health Data Based Decision-Making Tool , 2020, Frontiers in Public Health.

[6]  D. Torres-Salinas,et al.  Open Access and Altmetrics in the pandemic age: Forescast analysis on COVID-19 literature , 2020, bioRxiv.

[7]  C. Anastassopoulou,et al.  Data-based analysis, modelling and forecasting of the COVID-19 outbreak , 2020, medRxiv.

[8]  Y. Hu,et al.  Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China , 2020, The Lancet.

[9]  E. Dong,et al.  An interactive web-based dashboard to track COVID-19 in real time , 2020, The Lancet Infectious Diseases.

[10]  Daniel Torres-Salinas,et al.  Daily growth rate of scientific production on Covid-19. Analysis in databases and open access repositories , 2020, ArXiv.

[11]  Mohammad Madjid,et al.  Potential Effects of Coronaviruses on the Cardiovascular System: A Review. , 2020, JAMA cardiology.

[12]  Daniel Torres-Salinas,et al.  Ritmo de crecimiento diario de la producción científica sobre Covid-19. Análisis en bases de datos y repositorios en acceso abierto , 2020 .