형태 / 구문 / 의미 정보의 interaction을 이용한 한국어 파서 프로토타입의 설계 및 실험

본 논문은 형태/구문/의미 레벨의 정보의 상호작용에 의해 한국어 문장의 해석과정에서 발생할 수 있는 다양한 종류의 애매성을 해결하는 한국어 파서 프로토타입 시스템의 설계와 구현을 기술한다. 이 시스템은, (1) 각 어휘 항목이 가질 수 있는 형태/구문/의미 레벨의 애매성을 반영하는 사전구조와, (2) 한 어절 내에서의 형태소의 가능한 조합을 모두 추출하고 구문 레벨의 정보를 이용하여 가능성을 filtering하는 형태소 해석기, (3) 형태소 해석기에서 넘어온 정보를 chart로 표현하여 구문구조의 chart 파싱을 행하는 구문분석기, (4) 구문구조의 분석과 함께 수행되면서 구성된 구문구조에 대한 의미 구조를 구성하는 의미해석기 등으로 구성된다. 본 시스템의 입력은 한국어 단문 및 내포문이고, 출력은 의미 표현인데 이 의미표현(C-net)은 약간의 변환작업을 거치면 자연언어처리의 다른 분야에서도 이용할 수 있는 장점이 있다.