Acquisition of Translation Knowledge of Syntactically Ambiguous Named Entity

本稿では, 前置詞句や等位構造を持つ英語固有表現とそれに対応する日本語表現を対訳コーパスから抽出する方法を提案する.提案方法では, (1) 意味的類似性と音韻的類似性の二つの観点から英語固有表現と日本語表現の対を評価し, 二種類の類似度を統合して全体としての類似度を求める処理と, (2) 前置詞句の係り先や等位構造の範囲が不適格である英語固有表現の抽出を抑制する処理を行なう.読売新聞とThe Daily Yomiuriの対訳コーパスを用いて実験を行ない, 提案方法の性能と上記のような処理を行なわないベースラインの性能を比較したところ, 提案方法で得られたF値0.678がベースラインでのF値0.583を上回り, 提案方法の有効性が示された.