Automatically Classifying the Reference Records into NDC

本研究では,国立国会図書館(NDL)のレファレンス協同データベースに収録されたレファレンス記録に対するNDC の自動付与実験を行った。手法としては決定木法、ナイーブベイズ法,SVM(Support Vector Machine)法の3つの機械学習法を用いた。5703件のレファレンス記録中の質問文および回答文それぞれに含まれる単語を対象に学習させ,634件を対象に分類したところ,質問文を対象に手法としてはSVM法を用いた場合にわずかに正しく付与される傾向が見られた。ただし,再現率,精度ともに対象や手法による差はそれほど大きくなかった。また,分野カテゴリごとの再現率を調べたところ,分野によって再現率に大きな差があった。分野によっては60%を超える再現率で分類できる場合もあり,機械学習法でレファレンス記録にNDC を付与することが有効であることが明らかになった。