When Images Work Faster than Words The Integration of Content-Based Image Retrieval with the Northumbria Watermark Archive

SUMMARIES Information on the manufacture, history, provenance, identification, care and conservation of paper-based artwork/objects is disparate and not always readily available. The Northumbria Watermark Archive will incorporate such material into a database, which will be made freely available on the Internet providing an invaluable resource for conservation, research and education. The efficiency of a database is highly dependant on its search mechanism. Text based mechanisms are frequently ineffective when a range of descriptive terminologies might be used i.e. when describing images or translating from foreign languages. In such cases a Content Based Image Retrieval (CBIR) system can be more effective. Watermarks provide paper with unique visual identification characteristics and have been used to provide a point of entry to the archive that is more efficient and effective than a text based search mechanism. The research carried out has the potential to be applied to any numerically large collection of images with distinctive features of colour, shape or texture i.e. coins, architectural features, picture frame profiles, hallmarks, Japanese artists stamps etc. Although the establishment of an electronic archive incorporating a CBIR system can undoubtedly improve access to large collections of images and related data, the development is rarely trouble free. This paper discusses some of the issues that must be considered i.e. collaboration between disciplines; project management; copying and digitising objects; content based image retrieval; the Northumbria Watermark Archive; the use of standardised terminology within a database as well as copyright issues. Les informations relatives à la fabrication, à l'histoire, à l'origine, à l'identification, à l'entretien et à la conservation d'objets d'art sur papier sont très disparates et souvent difficilement accessibles. Les Archives filigranées de l'Université de Northumbria ont l'intention d'incorporer du matériel d'information dans une banque de données qui sera librement accessible sur Internet fournissant ainsi des ressources inestimables pour la conservation, la recherche et la formation. L'efficacité d'une banque de données dépend fortement de ses mécanismes de recherche. Les mécanismes basés sur des mots sont fréquemment inefficaces lorsqu'un éventail de terminologies descriptives est utilisé, p. ex. dans la description des images ou dans la traduction à partir de langues étrangères. Dans de tels cas un système CBIR (Content-Based Image Retrieval) peut être plus efficace. Les filigranes confèrent au papier des caractéristiques uniques d'identification visuelle ; ils ont été utilisés comme moyen d'accès aux Archives beaucoup plus efficace qu'un mécanisme de recherche basé sur des mots. Le système de recherche présenté ici est susceptible d'être appliqué à toutes grandes collections numériques d'images présentant des caractéristiques différentes de couleur, de forme ou de texture, comme p.ex. des pièces de monnaie, des plans de construction, des profils des cadres de tableaux, des poinçons, des estampes d'artistes japonais etc. Bien que l'installation d'un système électronique d'archives intégrant un système de recherche CBIR pourrait indubitablement faciliter l'accès à de grandes collections d'images et aux données s'y rapportant sa réalisation n'en reste pas moins liée à des problèmes. Cet article énonce certaines des questions qui doivent être prises en compte comme p. ex. la collaboration entre les différentes disciplines concernées, le management du projet, la copie et la numérisation, CBIR, les archives filigranées, la terminologie de la banque de données, les droits d'auteur. Informationen zur Herstellung, Geschichte, Herkunft, Identifizierung, Aufbewahrung und Konservierung von Kunst auf Papier sind weit verstreut und nicht immer leicht verfügbar. Das Wasserzeichenarchiv der Universität Northumbria versucht entsprechendes Material in eine Datenbank einzubringen, die über Internet frei verfügbar und so ein unschätzbares Hilfsmittel für Konservierung, Forschung, Ausbildung sein soll. Der Wert einer Datenbank ist in hohem Maße von ihren Suchmechanismen abhängig. Verbale Suchmechanismen sind oft dann wenig effektiv, wenn nicht eindeutig festgelegte, sondern beschreibende und/oder aus anderen Sprachen übertragene Suchkriterien verwendet werden. In diesen Fällen kann ein CBIR-System (Content Based Image Retrieval) effektiver sein. Wasserzeichen sind für Papier ein einzigartiges visuelles Identifikationsmerkmal; das System wurde eingesetzt als besseres Mittel des Zugangs zu dem Wasserzeichenarchiv als ihn ein auf Text basierende Suchsysteme hätte bieten können. Das hier vorgestellte System ist verwendbar für jede aus zahlreichen Einheiten bestehende Sammlung von Bildern, die sich in Farbe und/oder Form unterscheiden, wie z.B. Münzen, Bauzeichnungen, Bilderrahmenprofile, Echtheits- und Künstlerstempel, u.a.m. Ein maschinenlesbares Archiv mit CBIR-Suchsystem kann ganz sicher den Zugang zu großen Sammlungen von Bildern und ähnlichem Material erleichtern; es zu erstellen ist aber nicht frei von Problemen. Es werden einige dabei zu beachtende Gesichtspunkte diskutiert, wie z.B. Zusammenarbeit der verschiedenen betroffenen Bereiche, Projektplanung, Kopieren und Digitalisieren, CBIR, das Wasserzeichenarchiv, Datenbankterminologie, Urheberrecht.