MULTIMEDICA: Extracción de información multilingüe en Sanidad y su aplicación a documentación divulgativa y científica

El proyecto tiene como objetivo la definicion y desarrollo de tecnicas de extraccion y busqueda de informacion a partir de textos en el dominio biomedico, en particular, en dos lineas especiales: en primer lugar, el tratamiento de documentacion cientifica en ingles sobre farmacologia y en segundo lugar, el procesamiento de textos divulgativos sobre salud en idiomas como espanol y arabe. Estas tecnicas de extraccion incluyen el reconocimiento de entidades propias del dominio, aplicacion de patrones y aprendizaje automatico a la extraccion de relaciones semanticas de interes y la integracion de recursos lexicos especificos de sanidad (UMLS, SNOMED, etc.) para la mejora de aplicaciones. Por otro lado, la informacion extraida debe organizarse para su utilizacion en las herramientas de busqueda e integracion de informacion.