학술정보데이터의 키워드 연관성 분석

학술정보데이터의 키워드 정보는 논문의 주제와 관련된 용어로 구성되어 있으므로 동시 발생된 키워드 정보는 연관어 검색시에 중요한 정보로 활용될 수 있다. 본 논문에서는 대량의 학술정보 매타데이터에서 추출한 키워드 공기정보를 장재의미색인(LSI : Latent semantic indexing)에 기반하여 의미공간에 표상하고, 잠재의미공간에서 키워드 유사도를 측정하여 키워드간의 연관성을 살펴보았다. LSI는 동시 발생 정보를 이용하여 키워드들의 잠재된 의미를 알아내고, 유사한 의미를 가지는 키워드들을 같은 의미공간에 표현한다. 이를 통하여 학술정보데이터의 키워드에 대하여 유사도 값이 높은 키워드들을 연관어 집합으로 구축하고 학술정보서비스에 활용할 수 있는 서비스를 제안한다. 이는 학술정보서비스에서 사용자정보접근성을 향상시키고 부가적인 정보를 제공하는데 효율적일 것이다.