통계 정보를 이용한 구조적 모호성 해소

본 논문은 영어의 구문 구조 분석시 동사구에 의해 야기되는 구조적 모호성을 통계적으로 해소하는 방안과 모호성 해소 결과의 옳고 그름을 예측하는 방법에 대하여 다루고 있다. 모호성 해소에 필요한 의미 지식은 연어의 개념으로 표현되는데, 이것은 말뭉치로부터 자동 습득이 가능하다. 의미 관계의 유무만을 나타내는 단순 연어로는 해소할 수 없는 유형의 모호성이 있기 때문에, 정보 이론적 개념인 상호 정보를 이용하여 단순 연어를 확장하였다. 모호성 해소 결과가 얼마나 신빙성이 있는가를 나타내는데 사용될 수 있는 확신도 개념도 또한 정의하였다.