도메인 독립 및 종속지식을 이용한 효율적 정보검색

본 연구는 도메인 전문가(domain expert)의 도움없이 초보자가 효과적으로 관련된 문서를 검색할 수 있는 지식기반 정보검색 시스템을 개발하는 것을 목적으로 한다. 이를 위해서 먼저 간단하고 구조적인 방법으로 대부분의 휴리스틱을 나타낼 수 있는 혼성지식 베이스를 제시한다. 이것은 지식을 도메인 독립과 도메인 종속으로 분류하고 이들을 도메인 독립 지식베이스(Ibase)와 도메인 종속 지식베이스(Dbase)에 각각 저장함으로써 이루어진다. Ibase는 색인 용어들 사이에 is-a관계를 나타내는데 그래프에 기초를 둔 시소러스(thesaurus)로써 사용된다. Dbase는 동의어 관계, is-a 관계와는 다른 용어사이의 관계, 복합구(phrase)들의 생성규칙, Ibase를 탐색 하는 휴리스틱들 같은 도메인 특수정보를 나타낸다. 본 연구에서는 위의 구조를 바탕으로 HYKIS(HYbrid Knowledge-based Information retrieval System)라는 시스템을 제안한다. HYKIS에서 검색 절차는 Ibase와 Dbase 의 도웅을 받아 부울(Bool)형태로 주어진 질의에 관련된 문서를 검색하는 것으로 이루어 진다. 본 연구에서는 CACM 데이타 집합을 가지고 HYKIS의 성능을 평가하였는데, 실험결과 HYKIS는 CRCS 시소러스만을 이용한 검색방법보다 훨씬 높은 회상도(recall)와 정확도(precision)를 나타내었다.