DOING@DEFT : cascade de CRF pour l’annotation d’entités cliniques imbriquées (DOING@DEFT : cascade of CRF for the annotation of nested clinical entities)

Cet article presente le systeme developpe par l’equipe DOING pour la campagne d’evaluation DEFT 2020 portant sur la similarite semantique et l’extraction d’information fine. L’equipe a participe uniquement a la tâche 3 : “extraction d’information”. Nous avons utilise une cascade de CRF pour annoter les differentes informations a reperer. Nous nous sommes concentres sur la question de l’imbrication des entites et de la pertinence d’un type d’entite pour apprendre a reconnaitre un autre. Nous avons egalement teste l’utilisation d’une ressource externe, MedDRA, pour ameliorer les performances du systeme et d’un pipeline plus complexe mais ne gerant pas l’imbrication des entites. Nous avons soumis 3 runs et nous obtenons en moyenne sur toutes les classes des F-mesures de 0,64, 0,65 et 0,61.

[1]  E. Brown,et al.  The Medical Dictionary for Regulatory Activities (MedDRA) , 1999, Drug safety.

[2]  Erik F. Tjong Kim Sang,et al.  Introduction to the CoNLL-2002 Shared Task: Language-Independent Named Entity Recognition , 2002, CoNLL.

[3]  Christopher D. Manning,et al.  Nested Named Entity Recognition , 2009, EMNLP.

[4]  John Shawe-Taylor,et al.  Fast string matching using an n‐gram algorithm , 1994, Softw. Pract. Exp..

[5]  Natalia Grabar,et al.  Présentation de la campagne d’évaluation DEFT 2020 : similarité textuelle en domaine ouvert et extraction d’information précise dans des cas cliniques , 2020 .

[6]  José Luís Oliveira,et al.  Biomedical Named Entity Recognition: A Survey of Machine-Learning Tools , 2012 .

[7]  Beatrice Alex,et al.  Recognising Nested Named Entities in Biomedical Text , 2007, BioNLP@ACL.

[8]  Andrew McCallum,et al.  Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data , 2001, ICML.

[9]  Erik F. Tjong Kim Sang,et al.  Introduction to the CoNLL-2003 Shared Task: Language-Independent Named Entity Recognition , 2003, CoNLL.

[10]  James H. Martin,et al.  Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition , 2000 .

[11]  Steven Bethard,et al.  A Survey on Recent Advances in Named Entity Recognition from Deep Learning models , 2018, COLING.

[12]  François Yvon,et al.  Practical Very Large Scale CRFs , 2010, ACL.