저차원 변환을 이용하는 응용에서 효율적인 고차원 벡터 접근에 관한 연구

저차원 변환을 이용한 고차원 벡터 검색에서, 저차원으로 변환된 벡터는 색인 구조를 사용하여 효율적으로 검색이 가능하다. 그러나 일반적으로 저차원 벡터에 대응하는 고차원 벡터는 색인 구조 없이 순차적으로 파일에 저장된다. 따라서, 저차원에서 검색된 후보 벡터에 대해 고차원 거리계산을 하기 위해서는 저차원 후보 벡터의 개수만큼 고차원 벡터를 무작위로 접근 (Random Access) 해야 한다. 데이터 베이스의 규모가 커지고 고차원 벡터에 대한 무작위 디스크 접근 회수가 증가할수록 시스템의 검색 성능이 크게 떨어진다. 이 논문에서는 저차원 변환을 이용하는 응용영역에서 고차원 벡터 접근 비용을 줄이기 위한 방법을 제안한다. 우선 순위 큐를 이용한 방법과 고차원 벡터 클러스터링을 이용한 방법 및 이 두 가지를 조합한 방법을 제안하고 성능을 평가한다.