Power minimization by optimizing data transfers in Turbo-decoders

The power consumption of (embedded) microelectronic systems is dominated by energy-consuming accesses to memories, both on-chip and o -chip. An o -chip memory-access consumes up to 33 times more energy compared to an arithmetic operation. Therefore, the potential to minimize power consumption by rearranging (and eventually avoiding) memory accesses has to be exploited before addressing data-path optimizations. Since their invention in 1993, Turbo-Codes have been a hot topic among coding theorists. The anticipated use in future mobile radio systems also raises interest among implementation specialists. However, although the computational complexity of Turbo-Code's MAP component decoders is well known, the memory accessing scheme is the real bottleneck for low-power implementations, which are essential for building cheap batteryoperated mobile devices. This paper therefore focuses on data-transfer optimizations. The number of data-transfers is a function of system-level parameters, algorithmic transformations, and implementation parameters. It will be shown how the data-transfer related energy consumption of Turbo-decoders can be signi cantly reduced by taking proper design choices. Especially the e ects of algorithmic transformations like windowing and some control/dataow transformations will be discussed. Zusammenfassung. Der Leistungsverbrauch (eingebetteter) mikroelektronischer Systeme wird von energieaufwendigen internen und externen Speicherzugri en dominiert. So ist der Energiebedarf externer Speicherzugri e bis zu 33mal hoher als der einer arithmetischen Operation. Vor der Anwendung von Datenpfadoptimierungen zur Verringerung des Leistungsverbrauchs ist deshalb das Optimierungspotential auszuschopfen, welches sich durch Umordnen und Vermeiden von Speicherzugri en ergibt. Seit ihrer Er ndung im Jahre 1993 werden Turbo-Codes unter Codierungstheoretikern intensiv diskutiert. Neuerdings zieht der erwartete Einsatz in zuk unftigen Mobilfunksystemen auch das Interesse von Implementierungsspezialisten auf sich. Wahrend man sich jedoch der hohen Rechenkomplexitat der MAP-Komponentendecodierer bewu t ist, liegt der wirkliche Engpa beim Speicherzugri sschema, besonders bei Anwendungen, die kritisch hinsichtlich des Leistungsverbrauchs sind, wie z.B. kosteng unstige, batteriebetriebene mobile Endgerate. Der vorliegende Artikel konzentriert sich deshalb auf Datentransferoptimierungen. Die Anzahl der Datentransfers ist eine Funktion von Systemparametern, algorithmischen Transformationen und Implementierungsparametern. Es wird gezeigt, wie der durch Datentransfers verursachte Anteil am Energieverbrauch von TurboDecodierern durch geeignete Entscheidungen wahrend der Implementierungsphase signi kant verringert werden kann. Dabei werden insbesondere die Auswirkungen von algorithmischen Transformationen diskutiert, wie z. B. Fensterung und einige Kontroll-/Daten u transformationen.

[1]  Brendan J. Frey,et al.  Early Detection and Trellis Splicing: Reduced-Complexity Iterative Decoding , 1998, IEEE J. Sel. Areas Commun..

[2]  Hiroto Yasuura,et al.  Voltage scheduling problem for dynamically variable voltage processors , 1998, Proceedings. 1998 International Symposium on Low Power Electronics and Design (IEEE Cat. No.98TH8379).

[3]  A. Glavieux,et al.  Near Shannon limit error-correcting coding and decoding: Turbo-codes. 1 , 1993, Proceedings of ICC '93 - IEEE International Conference on Communications.

[4]  Norbert Wehn,et al.  Implementation aspects of turbo-decoders for future radio applications , 1999, Gateway to 21st Century Communications Village. VTC 1999-Fall. IEEE VTS 50th Vehicular Technology Conference (Cat. No.99CH36324).

[5]  Patrick Robertson,et al.  Optimal and sub-optimal maximum a posteriori algorithms suitable for turbo decoding , 1997, Eur. Trans. Telecommun..

[6]  C. Nicol,et al.  High performance DSPs-what's hot and what's not? , 1998, Proceedings. 1998 International Symposium on Low Power Electronics and Design (IEEE Cat. No.98TH8379).

[7]  Patrick Robertson,et al.  Illuminating the structure of code and decoder of parallel concatenated recursive systematic (turbo) codes , 1994, 1994 IEEE GLOBECOM. Communications: The Global Bridge.

[8]  John B. Anderson,et al.  Concatenated Decoding with a Reduced-Search BCJR Algorithm , 1998, IEEE J. Sel. Areas Commun..

[9]  Thomas D. Burd,et al.  The simulation and evaluation of dynamic voltage scaling algorithms , 1998, Proceedings. 1998 International Symposium on Low Power Electronics and Design (IEEE Cat. No.98TH8379).

[10]  Gibong Jeong,et al.  Optimal quantization for soft-decision turbo decoder , 1999, Gateway to 21st Century Communications Village. VTC 1999-Fall. IEEE VTS 50th Vehicular Technology Conference (Cat. No.99CH36324).

[11]  Herbert Dawid Algorithmen und Schaltungsarchitekturen zur Maximum a Posteriori Faltungsdecodierung , 1996 .