Gerência de Workflows Científicos: Oportunidades de pesquisa em bancos de dados

O encadeamento de processos por meio de workflows vem sendo usado na modelagem de processos comerciais nos ultimos vinte anos. Mais recentemente, novos sistemas de gerencia de workflows surgiram para apoiar o encadeamento de processos cientificos na realizacao de experimentos. O uso de workflows na area cientifica tem com principal diferenca a orientacao ao fluxo de dados em contra-posicao ao fluxo de controles no ambiente comercial. A gerencia de dados cientificos associada a processos complexos apresenta uma serie de desafios para a concepcao, representacao e execucao desses workflows. Esses desafios fazem parte do documento da SBC dos grandes desafios da computacao nos proximos dez anos, mais especificamente do desafio dois, onde e dito que: "O objetivo deste desafio e criar, avaliar, modificar, compor, gerenciar e explorar modelos computacionais para todos esses dominios e aplicacoes." Neste tutorial, apresentaremos os principais conceitos ligados a workflows cientificos e ao ciclo de vida de um experimento. Mostraremos como os sistemas de gerencia de workflows cientificos (SGWfC) podem apoiar experimentos em suas diversas etapas. Apresentaremos alguns dos principais SGWfC com demonstracoes de uso. Mostraremos um panorama da tecnologia atual no apoio a proveniencia de dados e processos do experimento cientifico. Discutiremos as oportunidades de pesquisa em bancos de dados quanto a gerencia de dados cientificos, aos aspectos de distribuicao de dados e processos em workflows, e a combinacao de dados de proveniencia com dados cientificos, dentre outros.

[1]  Juliana Freire,et al.  Tackling the Provenance Challenge one layer at a time , 2008, Concurr. Comput. Pract. Exp..

[2]  Carole A. Goble,et al.  Recycling workflows and services through discovery and reuse , 2007, Concurr. Comput. Pract. Exp..

[3]  Yong Zhao,et al.  Tracking provenance in a virtual data grid , 2008, Concurr. Comput. Pract. Exp..

[4]  Yolanda Gil,et al.  Provenance trails in the Wings/Pegasus system , 2008, Concurr. Comput. Pract. Exp..

[5]  Bertram Ludäscher,et al.  Provenance in Scientific Workflow Systems , 2007, IEEE Data Eng. Bull..

[6]  Luc Moreau,et al.  The Open Provenance Model , 2007 .

[7]  Cláudio T. Silva,et al.  Provenance for Computational Tasks: A Survey , 2008, Computing in Science & Engineering.

[8]  Cláudio T. Silva,et al.  VisTrails: enabling interactive multiple-view visualizations , 2005, VIS 05. IEEE Visualization, 2005..

[9]  Anil Wipat,et al.  Experiences with e-Science workflow specification and enactment in bioinformatics , 2003 .

[10]  Edward A. Lee,et al.  Scientific workflow management and the Kepler system , 2006, Concurr. Comput. Pract. Exp..

[11]  Cláudio T. Silva,et al.  Managing the Evolution of Dataflows with VisTrails , 2006, 22nd International Conference on Data Engineering Workshops (ICDEW'06).

[12]  Claudia Bauzer Medeiros,et al.  An ontology-based framework for bioinformatics workflows , 2007, Int. J. Bioinform. Res. Appl..

[13]  Juliana Freire,et al.  Provenance and scientific workflows: challenges and opportunities , 2008, SIGMOD Conference.

[14]  Cláudio T. Silva,et al.  VisTrails: Using Provenance to Streamline Data Exploration , 2007 .

[15]  Carole A. Goble,et al.  Seven Bottlenecks to Workflow Reuse and Repurposing , 2005, International Semantic Web Conference.

[16]  Ricardo da Silva Torres,et al.  WOODSS and the Web: annotating and reusing scientific workflows , 2005, SGMD.

[17]  Peter Buneman,et al.  Provenance in databases , 2009, SIGMOD '07.

[18]  Susan B. Davidson,et al.  Zoom*UserViews: Querying Relevant Provenance in Workflow Systems , 2007, VLDB.

[19]  Geoffrey C. Fox,et al.  Examining the Challenges of Scientific Workflows , 2007, Computer.

[20]  Yogesh L. Simmhan,et al.  A survey of data provenance in e-science , 2005, SGMD.

[21]  Adriane Chapman,et al.  Efficient provenance storage , 2008, SIGMOD Conference.

[22]  Roger S. Barga,et al.  Automatic capture and efficient storage of e‐Science experiment provenance , 2008, Concurr. Comput. Pract. Exp..

[23]  Ilkay Altintas,et al.  Provenance Collection Support in the Kepler Scientific Workflow System , 2006, IPAW.

[24]  Rajkumar Buyya,et al.  A taxonomy of scientific workflow systems for grid computing , 2005, SGMD.

[25]  Luc Moreau,et al.  Provenance and Annotation of Data, International Provenance and Annotation Workshop, IPAW 2006, Chicago, IL, USA, May 3-5, 2006, Revised Selected Papers , 2006, IPAW.

[26]  Mark Greenwood,et al.  Taverna: lessons in creating a workflow environment for the life sciences: Research Articles , 2006 .

[27]  Roger S. Barga,et al.  Automatic Generation of Workflow Provenance , 2006, IPAW.

[28]  Wil M. P. van der Aalst,et al.  Workflow Patterns , 2003, Distributed and Parallel Databases.