特定分野の学術論文をピンポイントで抽出し,いかに検索するか? Defect dat@baseの実践例

インターネットの世界だけでなく,科学技術の世界でも情報量(学術論文)の急激な増加が問題となっている。そのような論文大量生産時代には,大量の論文の中から特定の論文をピンポイントで抽出したり,検索したりする技術が重要になってくる。本稿では,ソーシャルブックマーク技術を応用して,物理学・工学領域の中の「半導体の結晶欠陥」に関する重要な学術論文をピンポイントで検索するデータベースシステムDefect dat@baseについて紹介する。また,このデータベースに該当する重要な論文を専門家と同じ精度で学術雑誌から自動的に抽出するために,人間(専門家)とコンピュータの抽出アルゴリズムとの間で,約16,000件の学術論文に対する大規模かつ詳細な抽出比較実験を行い,さらに一般文書との違いについても比較検討した。その研究結果について詳しく述べる。