한글문자 자동인식에 관한 연구

한글은 구조적 특수성과 자모의 유사성, 그리고 필체의 다양성등에 의해 자동인식에 있어서 많은 문제점을 내포하고 있다. 최근에 연구 보고된 바 있는 한글인식기법들은 크게 두가지의 범주로 분류될 수 있다. 첫째 방법은 자모를 추출한 후에 Syntactic rule에 의해 인식하는 것이며 두번째 방법은 Tree grammar를 이용하여 자모추출과 인식을 동시에 수행하는 것이다. 본 연구는 후자를 보완한 것으로써 다음의 기법을 제안하였다. 우선 Tree grammar의 Terminal V_T를 line segment direction과 그 segment의 starting node의 degree의 pair(V_(TL), V_(TD))로 확장하여 인접상태의 정보를 포함하는 grammar를 정의하였고 이를 Top-down parsing에 의해 초성의 segment와 인식을 동시에 수행하고 종성의 인식을 행하였다. 모음의 인식을 위하여는 별도의 segmentation algorithm을 적용하였다. 이러한 방법은 이미 연구된 Tree grammar를 이용한 인식방법에서 문제가 되고 있는 ambiguity의 대부분을 제거할 수 있으며 보다 높은 인식률을 얻을 수 있다. 약간의 제약이 가해진 필기체가 실험에 사용되었으며 그 결과 96%의 인식률을 얻을 수 있었다. 제안된 기법은 자모들이 상호 연결되어 있는 경우에 매우 효율적이고 본 연구실에서 현재 진행되고 있는 Tree grammar inference를 이용한 learning system으로 확장 보강되면 제한없는 필기체의 인식에 사용될 수 있을 것으로 기대된다.