Datenpartitionierung zur Optimierung der I/O-Parallelität in Non-Standard-Anwendungen

Disk–Arrays sind ein vielversprechender Ansatz zur Uberwindung der viel zitierten “I/O–Krise”. Der Einsatz einer grosen Anzahl kleiner Plattenlaufwerke birgt ein hohes Potential zur Parallelisierung von I/O–Auftragen und tragt damit entscheidend zur Reduzierung der Antwortzeit einzelner I/O–Auftrage bei. Der Schlussel zum erfolgreichen Einsatz dieser Technologie fur Non–Standard–Datenbanksysteme liegt in der Partitionierung und Verteilung der Daten uber die Platten des Disk–Arrays. In diesem Beitrag stellen wir eine Methode zur Partitionierung von Dateien vor, die nicht nur auf die Minimierung der Antwortzeit abzielt, sondern auch die Einhaltung von Durchsatzanforderungen der Anwendungen berucksichtigt. Dabei werden die Grosen der Partitionen fur jede Datei individuell bestimmt. In einer umfassenden Performance–Evaluation auf der Basis von I/O–Traces aus Non–Standard–Anwendungen vergleichen wir unsere Methode der dateispezifischen Partitionierung mit einfacheren Methoden, bei denen die Partitionsgrose global festgelegt wird.

[1]  Andreas Reuter,et al.  Architektur von Datenbanksystemen für Non-Standard-Anwendungen , 1985, BTW.

[2]  Gerhard Weikum,et al.  The COMFORT project , 1993, [1993] Proceedings of the Second International Conference on Parallel and Distributed Information Systems.

[3]  Dina Bitton,et al.  Disk Shadowing , 1988, VLDB.

[4]  Randy H. Katz,et al.  Disk system architectures for high performance computing , 1989, Proc. IEEE.

[5]  Mary Baker,et al.  Measurements of a distributed file system , 1991, SOSP '91.

[6]  Randy H. Katz,et al.  An Analytic Performance Model of Disk Arrays And Its Application , 1991 .

[7]  R. G. G. Cattell,et al.  Next-generation database systems , 1991, CACM.

[8]  Gerhard Weikum,et al.  I/O-Parallelität und Fehlertoleranz in Disk-Arrays, Teil 1: I/O-Parallelität , 1993, Inform. Spektrum.

[9]  P.S. Yu,et al.  Performance analysis of a dual striping strategy for replicated disk arrays , 1993, [1993] Proceedings of the Second International Conference on Parallel and Distributed Information Systems.

[10]  Miron Livny,et al.  Multi-disk management algorithms , 1987, SIGMETRICS '87.

[11]  Asser N. Tantawi,et al.  Asynchronous Disk Interleaving: Approximating Access Delays , 1991, IEEE Trans. Computers.

[12]  Hugh M. Sierra,et al.  An Introduction to Direct Access Storage Devices , 1990 .

[13]  L. Flatto,et al.  Two parallel queues created by arrivals with two demands. II , 1984 .

[14]  Hans-Jörg Schek,et al.  The DASDBS Project: Objectives, Experiences, and Future Prospects , 1990, IEEE Trans. Knowl. Data Eng..

[15]  Wilbur H. Highleyman Performance Analysis of Transaction Processing Systems , 1989, SIGMETRICS Perform. Evaluation Rev..

[16]  Gerhard Weikum,et al.  Dynamic file allocation in disk arrays , 1991, SIGMOD '91.

[17]  Peter Dadam,et al.  Advanced Information Management (AIM): Advanced Database Technology for Integrated Applications , 1989, IBM Syst. J..

[18]  Gerhard Weikum,et al.  The COMFORT Project (Synopsis) , 1993 .

[19]  David A. Patterson,et al.  Maximizing performance in a striped disk array , 1990, ISCA '90.

[20]  Asser N. Tantawi,et al.  Approximate Analysis of Fork/Join Synchronization in Parallel Queues , 1988, IEEE Trans. Computers.

[21]  R. G. G. Cattell,et al.  Introduction to the Special Section on Next-Generation Database Systems. , 1991 .

[22]  Spencer Ng,et al.  Some design issues of disk arrays , 1989, Digest of Papers. COMPCON Spring 89. Thirty-Fourth IEEE Computer Society International Conference: Intellectual Leverage.

[23]  John C. S. Lui,et al.  Performance Analysis of Disk Arrays under Failure , 1990, VLDB.

[24]  Gerhard Weikum,et al.  Automatic tuning of data placement and load balancing in disk arrays , 1992 .

[25]  Gerhard Weikum,et al.  Tuning of striping units in disk-array-based file systems , 1992, [1992 Proceedings] Second International Workshop on Research Issues on Data Engineering: Transaction and Query Processing.

[26]  Randy H. Katz,et al.  A case for redundant arrays of inexpensive disks (RAID) , 1988, SIGMOD '88.

[27]  Jim Gray,et al.  Parity Striping of Disk Arrays: Low-Cost Reliable Storage with Acceptable Throughput , 1990, VLDB.

[28]  Michelle Y. Kim,et al.  Synchronized Disk Interleaving , 1986, IEEE Transactions on Computers.

[29]  Gerhard Weikum,et al.  Dynamic file allocation in disk arrays , 1991, SIGMOD '91.

[30]  Klaus R. Dittrich,et al.  DAMOKLES - Architektur, Implementierung, Erfahrungen , 1991, Inform. Forsch. Entwickl..

[31]  Andreas Reuter Performance and Reliability Issues in Future DBMSs , 1990, IBM Symposium: Database Systems of the 90s.

[32]  Hector Garcia-Molina,et al.  Disk striping , 1986, 1986 IEEE Second International Conference on Data Engineering.

[33]  David A. Patterson,et al.  Computer Architecture: A Quantitative Approach , 1969 .