KeyGraph : Automatic Indexing by Segmenting and Unifing Co-Occurrence Graphs

近年,電子図書館やインターネットの発達につれて さまざまな書類が電子的に蓄えられ,ユーザは自宅か らでも大量の文書にアクセスできるようになった.し かし,大量の情報が身近に提供されても,ユーザに そのすべてを読む時間はない.したがって,ユーザに とって重要な文書を計算機が文書データベースから選 び出してくる検索技術は重要な使命を担っている. ここで,検索対象の各文書から内容を要約するキー ワードを抽出しておくことは重要である.というのは, ユーザの検索語(ユーザが自分の興味を表すために入 力した語すなわち単語あるいは熟語の集合)と文書の キーワードとの照合によって,照合時間が文書の全文 と検索語を照合するよりも短縮できるからである.ま た,キーワードが文書の内容の本質を的確に表してい ればキーワード抽出は文書にとって意味のない部分を 捨てることになるので,全文検索よりかえってユーザ の興味を深く満足させる検索結果を得ることができる. 我々は本論文で,文書の主張の内容を表すキーワー ドの抽出をねらう.そのようなキーワードはユーザの 検索語に近い主張をもつ文書を検索するのに役立つの で,ユーザは,自分と同じ考えの著者や,内容は見聞