XML : un formalisme de représentation intermédiaire entre données semi-structurées et représentation par objets

Dans cet article, nous analysons les liens existant entre : (1) des donnees brutes, heterogenes et sans structure fixe, dites donnees semi-structurees (DSS), (2) le langage de description de documents XML, (3) et les systemes de representation de connaissances par objets (RCO). Les besoins de manipuler des DSS et de resoudre des problemes en exploitant des DSS --- integration de bases de donnees, gestion de documents sur le Web, fouille de textes --- ont conduit a l'emergence d'un certain nombre de formalismes de representation. l'etude de ces formalismes montrent qu'ils ont des caracteristiques tres similaires au langage XML et aux systemes de RCO. Nous analysons egalement, comment XML, avec les outils qui lui sont associes et l'essor qu'il connait, peut servir de passerelle entre DSS et RCO, les systemes de RCO servant de base pour la resolution de problemes necessitant des DSS. Nous concluons en discutant les elements importants dont il faut tenir compte pour combiner les avantages de XML et des systemes de RCO dans la prise en compte de DSS et la resolution de problemes impliquant des DSS.