한국어 어휘의미망을 이용한 문맥 의존 철자오류 교정규칙의 일반화

맞춤법 오류어의 유형은 크게 단순 철자오류와 문맥 철자오류로 구분할 수 있다. 이중 문맥 철자오류는 문맥의 의미?통사적 관계를 고려해야만 해당 어휘의 오류 여부를 알 수 있다. 기존 한국어 맞춤법 검사기에서 문맥 철자오류의 검색과 교정을 위해 가장 많이 사용하는 방법은 언어 전문가가 수작업으로 구축한 교정규칙을 이용하는 방법이다. 규칙을 이용한 방법은 그 특성상 오류 교정의 정확도는 매우 높지만, 문맥에 나타난 어휘 간의 정확한 일치를 전제하므로 재현율은 낮다. 본 논문에서는 규칙을 이용한 문맥 철자오류 교정의 재현율 향상을 위해 기존 교정규칙에서 논항의 선택제약 조건을 확장하는 방법을 제안한다. 이를 위해 한국어 어휘의미망의 관계 정보를 이용하여 논항의 선택제약 조건을 충족하는 어휘의 공통 상위 개념을 찾고, 해당 상위 개념의 하위 개념을 문맥에 다시 포함함으로써 문맥 정보를 확장한다. 제안한 방법은 기존 교정규칙의 재현율을 약 10% 높였다.