사용자가 입력한 띄어쓰기 정보를 이용한 Structural SVM 기반 한국어 띄어쓰기

대부분의 통계기반 한국어 띄어쓰기 연구들은 사용자가 입력한 띄어쓰기 정보를 사용하지 않고 있으며, 이러한 이유로 사용자가 올바르게 입력한 문장을 띄어쓰기 프로그램이 틀리게 수정하는 문제가 있었다. 본 논문에서는 이러한 문제를 해결하기 위해서 사용자가 입력한 띄어쓰기 정보를 이용한 structural SVM 기반의 한국어 띄어쓰기 방법을 제안한다. 실험 결과, 띄어쓰기 오류가 10% 정도 있는 문장들에 대해서 structural SVM 기반 기본 모델은 어절 단위 정확도가 95.47%이였으나, 본 논문에서 제안하는 모델은 어절 단위 정확도가 98.39%까지 향상되었으며, 입력 문장이 정확할 수록 더욱 높은 성능을 보였다.