F-015 Extraction of Latent Preferences for Improving Serendipity in Recommender System

インターネットの普及に伴い,個人・団体が容易に情報 を発信し,収集できるようになり,Web空間上には大量の 情報が存在するようになった.しかしその反面,ユーザに とって大量の情報から自分の目的に合うものを探し出す作 業は困難になりつつある.そのため,推薦システムという 技術が重要視されている[1].推薦システムは,主に協調フ ィルタリング(Collaborative Filtering)と内容ベースフィ ルタリング(Content-Based Filtering)の 2 つの手法を基 に実現されている.協調フィルタリングでは類似ユーザが 好むアイテムは推薦対象ユーザも好むと仮定し,推薦対象 ユーザと嗜好パターンが類似するユーザを調べ,類似ユー ザが高い評価を与えているアイテムを対象ユーザに推薦す る.一方,内容ベースフィルタリングでは,ユーザが過去 に高評価を与えたアイテムの特徴に基づきユーザの嗜好に 合うアイテムを選択する.このように推薦システムはユー ザの嗜好を考慮しつつ,ユーザに必要と思われるアイテム を選択する. 推薦システムを評価するための指標としては,推薦アイ テム集合に対する精度や再現率,ユーザが各アイテムに付 ける評価値(点数)の予測値に対する誤差などが用いられ る.また,推薦アイテムには意外性(serendipity)や目新 しさ(novelty)が必要であるということが指摘されている [1].ここで,意外性や目新しさといった指標は,推薦アイ テムの思いがけなさや予見できなさといった,推薦アイテ ムが対象ユーザにとって思いがけない新たな情報であるか を評価するものである.精度や再現率といった指標は,ユ ーザが実際にアイテムに与えた評価値を利用することで, 定量的に評価することが可能である.一方,意外性や目新 しさといった指標は,主観的な指標であるため,ユーザが アイテムに対して与えた評価値を用いて定量的に評価する ことが難しい. 以上のような背景の下,本研究ではユーザ自身が気付い ていない,もしくは意識していないアイテムの特徴に対す る嗜好を潜在的嗜好と呼び,潜在的嗜好を抽出することで 推薦結果の意外性の向上を図る.具体的には,まずアイテ ムの各特徴に対するユーザごとの嗜好度をユーザプロファ イルとして抽出し,ユーザ間の類似度を協調フィルタリン グで用いられるピアソン相関を利用して定義する.そして, 対象ユーザと類似するユーザの各特徴に対する嗜好度に基 づき,現時点では嗜好が明確でない対象ユーザの嗜好度, すなわち本論文における潜在的嗜好を推定し,アイテムの 推薦に利用する.また,提案システムの有用性を評価する ために,実際に被験者から収集した映画に対する評価値デ ータを用い,提案手法と通常の協調フィルタリングによる 推薦結果の持つ意外性を比較する. 2. 推薦システムの概要