웹 추천 시스템을 위한 유용한 룰 추출 방법

웹 페이지 추천을 위하여 많은 연구들이 진행되고 있다. 연관규칙은 빈번하며 흥미로운 웹 사이트 방문자들의 이동 규칙을 발견하기 위한 가장 많이 사용되는 방법이다. 하지만 연관규칙은 규칙이 지나치게 많이 생성되는 단점이 있으며 이로 인하여 시스템에 적용하기 어려운 점이 있다. 본 논문에서는 웹 로그에서 적은 수의 정확도가 높은 규칙을 찾기 위한 방법을 제안한다. 웹 페이지 방문자들은 여러 관심사를 갖고 있다. 예를 들어서 여러 개의 MP3 플레이어 상품을 보던 방문자는 다른 관심사인 휴대폰 상품을 방문할 수 있다. 방문자가 방문한 MP3 플레이어들과 휴대폰 간의 유용한 연관규칙을 발견하기 어렵다. 따라서 유전 프로그래밍을 이용하여 방문자의 세션을 관심사 변화에 따라서 분리하여 각 부 세션에서 연관규칙을 찾는다. 쇼핑몰의 로그를 이용하여 방문자의 모든 세션에서 발견된 연관규칙보다 부 세션에서 발견된 연관규칙이 웹 추천 시스템에 유용하다는 것을 보인다.