Rewrite Support System for Simplifying Japanese News Scripts

NHK はインターネットサイト NEWS WEB EASY で外国人を対象としたやさしい 日本語のニュースを提供している.やさしい日本語のニュースは日本語教師と記者 の 2 名が通常のニュースを共同でやさしく書き換えて制作し,本文にはふりがな, 難しい語への辞書といった読解補助情報が付与されている.本稿では NEWS WEB EASY のやさしい日本語の書き換え原則,および制作の体制とプロセスの概要と課 題を説明した後,課題に対処するために開発した 2 つのエディタを説明する.1 つ は書き換えを支援する「書き換えエディタ」である.書き換えエディタは先行のシ ステムと同様に難しい語を指摘し,書き換え候補を提示する機能を持つが,2 名以 上の共同作業を支援する点,難しい語の指摘機能に学習機能を持つ点,また,候補 の提示に書き換え事例を蓄積して利用する点に特徴がある.他の 1 つは「読解補助 情報エディタ」である.読解補助情報エディタは,ふりがなや辞書情報を自動推定 する機能,さらに推定誤りの修正結果を学習する機能を持つ.以上のように 2 つの エディタは,自動学習と用例の利用により,読解補助情報の推定の誤り,やさしい 日本語の書き方の方針変更などに日々の運用の中で自律的に対応できるようになっ ている.本稿では 2 つのエディタの詳細説明の後,日本語教師および記者を対象に 実施したアンケート調査,およびログ解析によりエディタの有効性を示す. キーワード:やさしい日本語,NEWS WEB EASY,書き換え支援システム,機械学習

[1]  Daphne Koller,et al.  Sentence Simplification for Semantic Role Labeling , 2008, ACL.

[2]  Isao Goto,et al.  Japanese news simplification: tak design, data set construction, and analysis of simplified text , 2015, MTSUMMIT.

[3]  Raman Chandrasekar,et al.  Motivations and Methods for Text Simplification , 1996, COLING.

[4]  Regina Barzilay,et al.  Sentence Alignment for Monolingual Comparable Corpora , 2003, EMNLP.

[5]  Forbes Ave. Pittsburgh Automatic Rewriting for Controlled Language Translation , 2001 .

[6]  Richard H. Wojcik,et al.  An Automated Grammar and Style Checker for Writers of Simplified English , 1992 .

[7]  Tobias Kuhn,et al.  A Survey and Classification of Controlled Natural Languages , 2014, CL.

[8]  David Kauchak,et al.  Simple English Wikipedia: A New Text Simplification Task , 2011, ACL.

[9]  Siobhan Devlin,et al.  Simplifying Text for Language-Impaired Readers , 1999, EACL.

[10]  Kentaro Inui,et al.  Text Simplification for Reading Assistance: A Project Note , 2003, IWP@ACL.

[11]  Advaith Siddharthan,et al.  A survey of research on text simplification , 2014 .

[12]  Siddhartha Jonnalagadda,et al.  Towards Effective Sentence Simplification for Automatic Processing of Biomedical Text , 2009, HLT-NAACL.

[13]  Advaith Siddharthan,et al.  An architecture for a text simplification system , 2002, Language Engineering Conference, 2002. Proceedings.

[14]  Renata Pontin de Mattos Fortes,et al.  Facilita: reading assistance for low-literacy readers , 2009, SIGDOC '09.

[15]  Horacio Saggion,et al.  Automatic Simplification of Spanish Text for e-Accessibility , 2012, ICCHP.

[16]  Matthew Shardlow,et al.  A Survey of Automated Text Simplification , 2014 .