论文信息 - Classification non supervisée de documents à partir des modèles Transformeurs

Classification non supervisée de documents à partir des modèles Transformeurs

Résumé. Les plongements de mots pré-entraînés basés sur les modèles Trans-formeur sont maintenant largement utilisés dans l’exploration de textes où ils sont connus pour améliorer de manière significative les tâches supervisées telles que la classification supervisée de textes, la reconnaissance d’entités nommées et la réponse aux questions. Puisque les modèles Transformeur créent plusieurs plongements différents pour la même entrée, un à chaque couche de leur architecture, diverses études ont déjà essayé d’identifier ceux de ces plongements qui contribuent le plus au succès des tâches mentionnées ci-dessus. En revanche, la même analyse des performances n’a pas encore été réalisée dans le cadre non supervisé. Dans cet article, nous évaluons l’efficacité des modèles Transfor-meur sur l’importante de la tâche de classification non supervisée de documents. En particulier, nous présentons une approche clustering ensemble qui exploite toutes les couches du réseau. Des expériences numériques menées sur des ensembles de données réels avec différents modèles Transformeur montrent l’effi-cacité de la méthode proposée par rapport à plusieurs stratégies habituellement utilisées. Cet article est une restitution plus détaillée du papier (Ait-Saada et al., 2021a).

M. Nadif | François Role | Mira Ait-Saada

[1] Mohamed Nadif,et al. How to Leverage a Multi-layered Transformer Language Model for Text Clustering: an Ensemble Approach , 2021, CIKM.

[2] M. Nadif,et al. Ensemble Block Co-clustering: A Unified Framework for Text Data , 2020, CIKM.

[3] Goran Glavas,et al. Probing Pretrained Language Models for Lexical Semantics , 2020, EMNLP.

[4] Betty van Aken,et al. How Does BERT Answer Questions?: A Layer-Wise Analysis of Transformer Representations , 2019, CIKM.

[5] Xiang Lisa Li,et al. Specializing Word Embeddings (for Parsing) by Information Bottleneck , 2019, EMNLP.

[6] Anna Rumshisky,et al. Revealing the Dark Secrets of BERT , 2019, EMNLP.

[7] Iryna Gurevych,et al. Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks , 2019, EMNLP.

[8] Furu Wei,et al. Visualizing and Understanding the Effectiveness of BERT , 2019, EMNLP.

[9] Omer Levy,et al. RoBERTa: A Robustly Optimized BERT Pretraining Approach , 2019, ArXiv.

[10] Omer Levy,et al. What Does BERT Look at? An Analysis of BERT’s Attention , 2019, BlackboxNLP@ACL.

[11] Dipanjan Das,et al. BERT Rediscovers the Classical NLP Pipeline , 2019, ACL.