말뭉치로부터 자동 추출된 문맥 반영 구문 규칙을 이용한 영어 구문 분석
暂无分享,去创建一个
구문 분석 과정에서 애매성은 구문 분석의 효율을 떨어뜨릴 뿐만 아니라 다음 단계에도 부담이 된다. 이런 애매성은 구문 분석의 선호도(parse preference)를 이용하여 해결할 수 있는데 확률 모델은 이런 분석 선호도를 명확하게 정의할 수 있는 모델이다. 따라서 본 논문에서도 구문 분석 과정시 확률 모델을 이용하고자 한다. 본 논문에서는 구문 분석 과정에서의 애매성을 처리하기 위한 확률적 차트 파싱 알고리듬을 제안한다. 이를 위해 먼저, 본 시스템은 이미 구문 분석이 된 문장들로 이루어진 대량의 말뭉치인 Penn Treebank로부터 트라이 그램에 기반하는 문맥 반영 문법규칙을 자동으로 추출하고, 동시에 각 규칙에 대한 문맥을 반영한 조건 확률을 얻는다. 그리고 확률적 예측과 확률 필터를 이용하여 구문 분석을 한다. 구문 분석 후, 순위 매김 함수에 의해 구문 분석 결과에 순위를 정한다. 실험 결과, 본 시스템은 93-94%의 구문 분석 성공율과 84-86%의 순위 매긴 정확성을 가지며, 50% 이상의 불필요한 중간 결과를 제거함으로써 구문 분석의 모호성 해소와 속도 향상에 기여하는 결과를 얻었다.