Automatic Acquisition of Ranked IS-A Relation from Unstructured Text

본 논문에서는 의존 구조 매칭과 약한 지도식 학습 방법을 적용하여 텍스트에서 IS-A 관 계를 자동으로 추출하고 순위화하는 방법을 제안한다. 텍스트에서 잠재적인 IS-A 관계를 표현하는 [관계 표현, 하위어, 상위어]의 삼진관계 리스트를 추출하고, 관계 표현과 IS-A 관계 인스턴스, IS-A 관계 후보, 사이의 상호 관련성을 이용하여 각각의 점수를 반복적으 로 정제한다. 제안한 방법의 대표적인 특징은 다음과 같다. 1) 의존 구조에 기반한 패턴 매칭 방법을 적용하여 정규 표현에 기반한 방법보다 다양한 형태의 삼진관계를 추출할 수 있고, 2) 도메인 코퍼스에서 통계적으로 추출한 어휘 사이의 관련성 정보를 이용하여 도메인에 적합한 IS-A 관계 인스턴스의 순위를 높일 수 있으며, 3) 관계 표현과 관계 인스 턴스의 점수를 상호 관련성에 기반한 방법으로 반복적으로 점수화하여 IS-A 관계 인스턴 스 사이의 변별력을 높일 수 있다. 실험에서 순위화된 관계 인스턴스는 전문가의 판단과 66%이상 일치함을 보였고, 의존 구조를 이용한 유연한 패턴 매칭 방법은 정규표현을 이 용한 방법보다 43.6%의 추가적인 삼진관계를 추출하였다.

[1]  Paul Buitelaar,et al.  RelExt: A Tool for Relation Extraction from Text in Ontology Extension , 2005, SEMWEB.

[2]  Aldo Gangemi,et al.  Unsupervised Learning of Semantic Relations between Concepts of a Molecular Biology Ontology , 2005, IJCAI.

[3]  Marti A. Hearst Automatic Acquisition of Hyponyms from Large Text Corpora , 1992, COLING.

[4]  Philipp Cimiano,et al.  Automatic Acquisition of Ranked Qualia Structures from the Web , 2007, ACL.

[5]  Peter Spyns,et al.  Discovering Knowledge in Texts for the learning of DOGMA-inspired ontologies , 2004 .

[6]  Reinhard Rapp,et al.  The Computation of Word Associations: Comparing Syntagmatic and Paradigmatic Approaches , 2002, COLING.

[7]  Patrick Pantel,et al.  Espresso: Leveraging Generic Patterns for Automatically Harvesting Semantic Relations , 2006, ACL.

[8]  Manabu Okumura,et al.  Towards Large-scale Non-taxonomic Relation Extraction: Estimating the Precision of Rote Extractors , 2006, OntologyLearning@COLING/ACL.

[9]  Christian Jacquemin,et al.  Automatic Acquisition and Expansion of Hypernym Links , 2004, Comput. Humanit..

[10]  Mark Stevenson,et al.  Improving Semi-supervised Acquisition of Relation Extraction Patterns , 2006 .

[11]  Pablo Gamallo,et al.  Mapping Syntactic Dependencies onto Semantic Relations , 2002 .

[12]  Steffen Staab,et al.  Learning Taxonomic Relations from Heterogeneous Sources of Evidence , 2005 .

[13]  Kenneth C. Litkowski,et al.  CL Research Experiments in TREC-10 Question Answering , 2001, TREC.

[14]  Marta Sabou,et al.  Learning web service ontologies: an automatic extraction method and its evaluation , 2005 .

[15]  Wai Lam,et al.  Using Semantic Relations with World Knowledge for Question Answering , 2006, TREC.

[16]  Patrick Pantel,et al.  The Domain Restriction Hypothesis: Relating Term Similarity and Semantic Consistency , 2007, NAACL.

[17]  Enrico Motta,et al.  A hybrid approach for extracting semantic relations from texts , 2006, OntologyLearning@COLING/ACL.