웹 커뮤니티 Corpus 분석을 이용한 시맨틱 네트워크 구축 방법과 이를 기반으로한 동적인 의미적 관계도 계산방법

단어간의 의미적 유사도나 관계도(semantic similarity, relatedness)를 계산하는 방법론은 시스템 통합 뿐만 아니라 정보 탐색학 등의 분야에서 널리 활용되고 있다. 웹의 사용이 활성화 됨에 따라 웹 커뮤니티등에서도 키워드 추천이나 자동 키워드 할당 등에 있어 두 단어의 의미적 관계도 계산은 매우 필수적이다. 의미적 유사도 계산의 일반적인 방법은 기존에 존재하는 시매틱 네트워크 모델을 이용해 개념간의 관계도를 계산하는 것이었다. 하지만, 이러한 방법들은 시간이나 문맥의 변화에 따라 동적인 의미적 관계도를 계산해 내는데에는 한계가 있을 수 밖에 없다. 따라서, 본 연구에서는 특정 웹 커뮤니티 상에서 발생한 코퍼스 분석을 통해 시맨틱 네트워크를 구축, 이를 기반으로 웹 커뮤니티의 문맥과 시간에 따른관계도 변화를 반영할 수 있는 의미적 유사도 계산 방식을 제시하였다. 또한 제시한 방법론의 유효성을 검증하기 위해 실제 위키피디아 코퍼스를 이용한 실험 과정과 결과를 제시하였다.