시맨틱 웹 데이터에서 키워드 검색을 위한 구조 질의 랭킹 기법

시맨틱 웹에서 정보를 검색하기 위한 구조 질의(e.g., SPARQL)는 정보를 형식화 하여 다양한 의미의 질의를 정확하게 표현할 수 있지만, 질의 문법이 복잡하다. 그래서 구조 질의에 익숙치 않은 사용자들이 시맨틱 질의를 사용하는 것을 기대하기는 어렵다. 그러므로, 사용자가 손쉽게 시맨틱 질의 할 수 있는 환경을 제공하기 위해 사용자가 키워드 질의를 입력하면, 이를 시맨틱 질의로 변환해서 정보를 검색하는 연구가 활발히 진행 되고 있다. 키워드 질의는 사용하기 간편하지만, 하나의 키워드 질의가 다수의 구조 질의로 변환될 수 있다. 각 질의의 중요도 및 입력된 키워드 질의와의 연관성이 다르기 때문에 이를 측정하여 랭킹하는 방법이 필요하다. 본 연구에서는 시맨틱 웹 데이터에 존재하는 스키마 레벨에서의 트리플 간 연관성을 이용하여, 각 구조 질의를 랭킹하는 방법을 제안한다. 제안하는 방법은 구조 질의 로그에 기반하여 랭킹의 기준이 되는 연관성을 계산하고, 이를 적용하여 구조 질의 랭킹을 수행한다. 이 랭킹 방법은 사용자들의 선호를 반영하고 있기 때문에, 단순히 도메인 온톨로지의 정보만을 활용한 랭킹 방법보다 우수한 성능을 보인다.