Correct part extraction from speech recognition results using semantic dictance calcuation and speech translation by translation of extracted parts only

音声対話および音声翻訳システムを実現するためには, 自由発話文の音声認識誤り文に対する解析誤りの問題を解決する必要がある. その解決のために, 文法以外の制約を積極的に用いて認識誤り文から正しく認識された部分を特定するしくみを新たに導入し, 特定された部分, 或は, 特定されなかった部分を修復しながら, 文を解析することが必要となる. 本論では, 予め学習された話し言葉の表現パターンと入力文における表現パターンとの意味的類似性を用いて, 認識結果文から正しく認識された部分を特定する手法を提案する. さらに, 本正解部分特定法を音声翻訳システムに導入し, 音声認識結果の正解部分のみを部分翻訳するシステムを作成した. このシステムを用いて正解部分特定法の効果を評価し, その結果から次の効果を確認した. 本正解部分特定法により特定された部分の信頼性は高く, 特定した部分の96%が実際に正解部分であった. また, 特定された部分のみを提示することにより, 誤り文をそのまま誤った意味に理解してしまう割合を半分以上軽減することができた.さらに, 特定された正解部分のみを部分翻訳した結果, 従来翻訳できなかった誤り文の約7割に対して, 正しいかもしくは部分的に正しく意味を理解できる翻訳結果を得ることができた.