상품 리뷰의 속성별 긍정/부정 분류 시스템의 설계 및 구현

최근에는 상품 단위의 오피니언 마이닝 뿐만 아니라 상품의 속성 단위까지 오피니언 마이닝에 대한 연구가 진행 중이다. 상품 단위의 오피니언 마이닝 분야에서는 주로 기계학습 기법이 활용되며, 상품의 속성 단위 오피니언 마이닝 분야에서는 상품 평의 패턴을 활용하는 기법이 있다. 후자는 하나의 오피니언 문장이 미리 구축해놓은 상품 평 패턴 DB에 있는 패턴과 일치되면 그에 따라 긍정 또는 부정으로 분류하는 기법을 말한다. 본 논문에서는 상품 평 패턴 데이터베이스를 이용하여 쇼핑몰에 게재된 각종 상품에 대한 사용자들의 의견을 상품의 속성별로 긍정과 부정으로 분류하는 시스템을 설계 및 구현한다. 이를 위해 국내 주요 쇼핑몰 3곳의 사이트로부터 4가지 카테고리에 대한 65,000건의 상품 평을 수집하였고, 4단계의 과정을 통해 상품의 속성별 평가 문장을 긍정과 부정으로 분류 한다. 4단계는 (1)품사 태깅, (2)속 성명 기준 전/후 패턴 추출, (3) 패턴 일치 검사, (4)상품 속성별 긍정/부정 분류이다. 각 사이트로부터 추출된 상품 평 패턴은 범용성을 증명하기 위해 3곳 사이트의 패턴에 대해서 교차적으로 일치 실험을 수행하였다. 그 결과 상품 평 패턴이 평균적으로 92% 유사한 것으로 밝혀졌다.