영어 - 한국어 기계번역을 위한 연어와 숙어 트랜스퍼 사전

동일한 언어군에 속하는 언들 사이의 기계번역에서는 잘 조직된 트랜스퍼 규칙을 사용한 기계번역 방법이 만족스러운 결과를 산출할 수도 있다. 그러나 영어-한국어와 같이 상이한 언어군에 속하는 언어 간의 기계번역에서는 두 언어 간의 언어적 그리고 표현적 차이로 인하여 트랜스퍼 규칙을 중심으로한 기계번역 방법이 만족할 만한 결과를 산출하지 못한다. 이러한 차이점들을 해결하고 또한 한국어 생성시에 발생하는 의미 모호성(semantic ambiguity) 문제를 해결하기 위하여 새로운 방법을 택하게 되었다. 이 방법은 트랜스퍼 사전을 사용하는 것이다. 사전은 숙어의 연어구조를(collocation structure) 기반으로 하여 구축되었으며 숙어의 번역과 연어구조를 이용한 구-대-구(phrase-to-phrase) 번역을 제공한다. 연어구조는 번역 시스템이 구-대-구번역에서 정확한 표현을 제공하고 또한 의미 모호성을 해결하는데 더 효과적인 방법을 제공한다.