READLEX - ein wörterbuchbasierter Ansatz für die Erkennung und Analyse von Text in strukturierten Dokumenten