IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アルファサード株式会社の特許一覧

特許7454202センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム
<>
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図1
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図2
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図3
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図4
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図5
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図6
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図7
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図8
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図9
  • 特許-センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-13
(45)【発行日】2024-03-22
(54)【発明の名称】センテンス平易化システム、センテンス平易化方法、およびコンピュータプログラム
(51)【国際特許分類】
   G06F 40/157 20200101AFI20240314BHJP
【FI】
G06F40/157
【請求項の数】 18
(21)【出願番号】P 2023117577
(22)【出願日】2023-07-19
【審査請求日】2023-07-19
【早期審査対象出願】
(73)【特許権者】
【識別番号】515193527
【氏名又は名称】アルファサード株式会社
(74)【代理人】
【識別番号】100125117
【弁理士】
【氏名又は名称】坂田 泰弘
(74)【代理人】
【識別番号】100086933
【弁理士】
【氏名又は名称】久保 幸雄
(72)【発明者】
【氏名】野田 純生
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開2021-121977(JP,A)
【文献】特開2021-121976(JP,A)
【文献】特開2020-170384(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する第一の記憶手段と、
特定の助詞または符号である複数の付加語ごとに、当該付加語が「ましょう」の直後に用いられた際の換言方法を記憶する、第二の記憶手段と、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記第一の記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語の中の「ましょう」の直後に前記複数の付加語のうちのいずれかが用いられる場合に、前記第二の記憶手段に記憶される、当該用いられる付加語の前記換言方法で当該述語を換言することによって、当該換言センテンスを生成する、生成手段と、
を有することを特徴とするセンテンス平易化システム。
【請求項2】
前記生成手段は、前記用いられる付加語が「とも」である場合は、前記述語の中の「ましょう」および当該「とも」を「ます」に置換し、「が、」である場合は、当該「ましょう」および当該「が、」を「ても、」に置換し、「し」または「から」である場合は、当該「ましょう」の直前の動詞または助動詞を終止形に変換しかつ当該「ましょう」および当該「し」または「から」を「でしょうし」または「でしょうから」に置換し、「ね」または「よ」である場合は、当該「ましょう」および当該「ね」または「よ」を、前記述語の主語が一人称であれば「ます」に置換しそうでなければ「てください」または「でください」に置換し、「か?」または「?」である場合は、当該「ましょう」および当該「か?」または「?」を「ますか?」に置換することによって、前記換言センテンスを生成する、
請求項に記載のセンテンス平易化システム。
【請求項3】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段と、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語に用いられる動詞が複数の所定の無アスペクト動詞のうちのいずれかである場合に、当該述語の中の「ましょう」を「ます」または「います」に置換することによって、当該換言センテンスを生成する、生成手段と、
を有することを特徴とするセンテンス平易化システム。
【請求項4】
前記複数の所定の無アスペクト動詞は、サ行変格活用の動詞およびその進行形ならびに「ある」である、
請求項に記載のセンテンス平易化システム。
【請求項5】
前記生成手段は、前記複数の第一の語句のいずれも前記原センテンスに含まれず、かつ、前記述語に用いられる動詞が前記複数の所定の無アスペクト動詞のいずれでもない無アスペクト動詞である場合に、当該述語の中の「ましょう」を「でしょう」に置換することによって前記換言センテンスを生成する、
請求項または請求項に記載のセンテンス平易化システム。
【請求項6】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段と、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が格助詞「が」によって示されかつ当該主語の名詞が複数のタイプのうちのいずれかに該当する場合に、当該述語の中の「ましょう」を「ます」に置換することによって前記換言センテンスを生成する、生成手段と、
を有することを特徴とするセンテンス平易化システム。
【請求項7】
前記複数のタイプは、二人称以外の固有名詞、一人称の名詞、動物の名前、および人を表す名詞である、
請求項に記載のセンテンス平易化システム。
【請求項8】
前記生成手段は、前記主語が前記複数のタイプのいずれにも該当しなければ、前記述語の中の「ましょう」を「てください」または「でください」に置換することによって前記換言センテンスを生成する、
請求項または請求項に記載のセンテンス平易化システム。
【請求項9】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段と、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が係助詞「も」によって示される場合に、当該主語が1つでありかつ敬称を有すれば当該述語の中の「ましょう」を「てください」または「でください」に置換し、当該主語が複数でありかつ二人称の名詞を含めば「てください」または「でください」に置換し、含まれなければ「ます」に置換することによって、当該換言センテンスを生成する、生成手段と、
を有することを特徴とするセンテンス平易化システム。
【請求項10】
前記生成手段は、前記複数の第一の語句のいずれも前記原センテンスに含まれず、かつ、前記述語の主語が格助詞「が」および係助詞「も」のいずれによっても示されない場合に、当該述語の中の「ましょう」を「てください」または「でください」に置換することによって前記換言センテンスを生成する、
請求項または請求項に記載のセンテンス平易化システム。
【請求項11】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化方法であって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を第一の記憶手段に記憶させておき、
特定の助詞または符号である複数の付加語ごとに、当該付加語が「ましょう」の直後に用いられた際の換言方法を第二の記憶手段に記憶させておき、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記第一の記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語の中の「ましょう」の直後に前記複数の付加語のうちのいずれかが用いられる場合に、前記第二の記憶手段に記憶される、当該用いられる付加語の前記換言方法で当該述語を換言することによって、当該換言センテンスを生成する処理を、コンピュータに実行させる、
ことを特徴とするセンテンス平易化方法。
【請求項12】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化方法であって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶手段に記憶させておき、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語に用いられる動詞が複数の所定の無アスペクト動詞のうちのいずれかである場合に、当該述語の中の「ましょう」を「ます」または「います」に置換することによって、当該換言センテンスを生成する処理を、コンピュータに実行させる、
ことを特徴とするセンテンス平易化方法。
【請求項13】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化方法であって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶手段に記憶させておき、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が格助詞「が」によって示されかつ当該主語の名詞が複数のタイプのうちのいずれかに該当する場合に、当該述語の中の「ましょう」を「ます」に置換することによって前記換言センテンスを生成する処理を、コンピュータに実行させる、
ことを特徴とするセンテンス平易化方法。
【請求項14】
「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化方法であって、
「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶手段に記憶させておき、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が係助詞「も」によって示される場合に、当該主語が1つでありかつ敬称を有すれば当該述語の中の「ましょう」を「てください」または「でください」に置換し、当該主語が複数でありかつ二人称の名詞を含めば「てください」または「でください」に置換し、含まれなければ「ます」に置換する処理を、コンピュータに実行させる、
ことを特徴とするセンテンス平易化方法。
【請求項15】
「ましょう」が用いられる述語を有する原センテンスを平易化し、かつ、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段へアクセスすることができるコンピュータに用いられるコンピュータプログラムであって、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成する処理を、前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
【請求項16】
「ましょう」が用いられる述語を有する原センテンスを平易化し、かつ、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段へアクセスすることができるコンピュータに用いられるコンピュータプログラムであって、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語に用いられる動詞が複数の所定の無アスペクト動詞のうちのいずれかである場合に、当該述語の中の「ましょう」を「ます」または「います」に置換することによって、当該換言センテンスを生成する処理を、前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
【請求項17】
「ましょう」が用いられる述語を有する原センテンスを平易化し、かつ、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段へアクセスすることができるコンピュータに用いられるコンピュータプログラムであって、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が格助詞「が」によって示されかつ当該主語の名詞が複数のタイプのうちのいずれかに該当する場合に、当該述語の中の「ましょう」を「ます」に置換することによって前記換言センテンスを生成する処理を、前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
【請求項18】
「ましょう」が用いられる述語を有する原センテンスを平易化し、かつ、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段へアクセスすることができるコンピュータに用いられるコンピュータプログラムであって、
前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、前記複数の第一の語句のいずれも前記原センテンスに含まれないが前記述語の主語が係助詞「も」によって示される場合に、当該主語が1つでありかつ敬称を有すれば当該述語の中の「ましょう」を「てください」または「でください」に置換し、当該主語が複数でありかつ二人称の名詞を含めば「てください」または「でください」に置換し、含まれなければ「ます」に置換することによって、当該換言センテンスを生成する処理を、前記コンピュータに実行させる、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、日本語で記述されたセンテンスを平易にする技術に関する。
【背景技術】
【0002】
近年、日本に滞在し日本語を学んでいる外国人が増加している。しかし、日本語の文書は、漢字、平仮名、および片仮名など多数の種類の文字によって表現され、しかも、英語およびフランス語などの言語とは大きく異なる文法によって表現される。したがって、外国人にとって、日本語の文書は理解しにくいことがある。
【0003】
日本語の文書を十分に理解できないと、日本での生活に支障を来すことがある。特に、災害の情報が得られなければ生命に関わってしまうことがある。
【0004】
例えば、1995年1月に発生した阪神淡路大震災では、日本人だけでなく日本に滞在していた多くの外国人が被害を受けた。その中には、日本語を十分に理解することができず必要な情報を受け取ることができない人がいた。
【0005】
そこで、このような外国人が災害の発生の際に適切に行動することができるように、「やさしい日本語」というルールが案出された。
【0006】
「やさしい日本語」には、難しい言葉を避けて簡単な語を使う、1つの文を短くする、および、文を分かち書きにする、などのルールが含まれている。これらのルールに則して日本語の文書を作成することによって、日本語をまだ十分に理解することができない外国人へ必要な情報をより確実に伝えることができる。現在、これらのルールは、非特許文献1に記載されるように、行政庁によって纏められている。
【0007】
やさしい日本語のルールに則して一から文書を作成してもよいが、ルールを覚えなければならないので、日本語を母国語とする人であっても意外に難しい。また、やさしい日本語の文書およびそうでない文書の両方を作成するのは、時間および労力を要する。特に、災害発生時など緊急を要する場合は、そのような余裕がない。
【0008】
そこで、文書を平易化する技術が提案されている。特許文献1に記載されるセンテンス平易化システムは、日本語で記述されかつ文末が「ましょう」である原センテンスを次のように平易化する。原センテンスの構造を形態素解析および係受け解析によって解析する。そして、解析された前記構造に基づいて、原センテンスの中の文末を、原センテンスの主語に格助詞「が」が用いられる第一の場合に「ます」に変換し、主語に副助詞「は」が用いられる第二の場合および主語が原センテンスに示されない第三の場合に「てください」に変換することによって、平易なセンテンスを生成する。
【先行技術文献】
【特許文献】
【0009】
【文献】特開公開2021-121977号公報
【非特許文献】
【0010】
【文献】在留支援のためのやさしい日本語ガイドラインほか,文化庁ウェブサイト,2023年7月7日検索,https://www.bunka.go.jp/seisaku/kokugo_nihongo/kyoiku/92484001.html
【発明の概要】
【発明が解決しようとする課題】
【0011】
文末に使用される「ましょう」は、丁寧の助動詞「ます」の未然形「ましょ」および助動詞「う」からなる語句である。助動詞「う」が意志、勧誘、および推量のうちのいずれかを表わすので、「ましょう」も同様にいずれかを表わす。このように複数の意味があるので、日本語を母国語としない人にとって「ましょう」の正確なニュアンスを捉えることは、難しい。そこで、述語に「ましょう」を含むセンテンスをより的確に平易化することが望まれる。
【0012】
本発明は、このような課題に鑑み、述語に「ましょう」を含むセンテンスを従来よりも的確に平易化することを目的とする。
【課題を解決するための手段】
【0013】
本発明の一形態に係るセンテンス平易化システムは、「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する第一の記憶手段と、特定の助詞または符号である複数の付加語ごとに、当該付加語が「ましょう」の直後に用いられた際の換言方法を記憶する、第二の記憶手段と、前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記第一の記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語の中の「ましょう」の直後に前記複数の付加語のうちのいずれかが用いられる場合に、前記第二の記憶手段に記憶される、当該用いられる付加語の前記換言方法で当該述語を換言することによって、当該換言センテンスを生成する、生成手段と、を有する。
【0014】
好ましくは、前記生成手段は、前記用いられる付加語が「とも」である場合は、前記述語の中の「ましょう」および当該「とも」を「ます」に置換し、「が、」である場合は、当該「ましょう」および当該「が、」を「ても、」に置換し、「し」または「から」である場合は、当該「ましょう」の直前の動詞または助動詞を終止形に変換しかつ当該「ましょう」および当該「し」または「から」を「でしょうし」または「でしょうから」に置換し、「ね」または「よ」である場合は、当該「ましょう」および当該「ね」または「よ」を、前記述語の主語が一人称であれば「ます」に置換しそうでなければ「てください」または「でください」に置換し、「か?」または「?」である場合は、当該「ましょう」および当該「か?」または「?」を「ますか?」に置換することによって、前記換言センテンスを生成する。
【0015】
本発明の他の一形態に係るセンテンス平易化システムは、「ましょう」が用いられる述語を有する原センテンスを平易化するセンテンス平易化システムであって、「ましょう」が用いられる複数の第一の語句ごとに、当該第一の語句を平易に表現した第二の語句を記憶する記憶手段と、前記複数の第一の語句のうちのいずれかが前記原センテンスに含まれる場合に、前記原センテンスの中の当該含まれる第一の語句を、前記記憶手段に記憶される、当該含まれる第一の語句の前記第二の語句に置換することによって換言センテンスを生成し、当該複数の第一の語句のいずれも当該原センテンスに含まれないが前記述語に用いられる動詞が複数の所定の無アスペクト動詞のうちのいずれかである場合に、当該述語の中の「ましょう」を「ます」または「います」に置換することによって、当該換言センテンスを生成する、生成手段と、を有する。
【0016】
好ましくは、前記複数の所定の無アスペクト動詞は、サ行変格活用の動詞およびその進行形ならびに「ある」である。
【0017】
または、前記生成手段は、前記複数の第一の語句のいずれも前記原センテンスに含まれず、かつ、前記述語に用いられる動詞が前記複数の所定の無アスペクト動詞のいずれでもない無アスペクト動詞である場合に、当該述語の中の「ましょう」を「でしょう」に置換することによって前記換言センテンスを生成する。
【発明の効果】
【0018】
本発明によると、「ましょう」を含むセンテンスを従来よりも的確に平易化することができる。
【図面の簡単な説明】
【0019】
図1】文書平易化システムの全体的な構成の例を示す図である。
図2】変換サーバのハードウェア構成の例を示す図である。
図3】変換サーバの機能的構成の例を示す図である。
図4】第一の辞書データの例を示す図である。
図5】「ましょう」の文末換言処理の流れ例を示すフローチャートである。
図6】第二の辞書データの例を示す図である。
図7】換言方法データの例を示す図である。
図8】無アスペクト動詞処理の流れの例を示すフローチャートである。
図9】アスペクト動詞処理の流れの例を示すフローチャートである。
図10】文書平易化プログラムによる処理の全体的な流れの例を説明するフローチャートである。
【発明を実施するための形態】
【0020】
図1は、文書平易化システム4の全体的な構成の例を示す図である。図2は、変換サーバ1のハードウェア構成の例を示す図である。図3は、変換サーバ1の機能的構成の例を示す図である。
【0021】
文書平易化システム4は、図1に示すように、変換サーバ1、1台または複数台の端末装置2、および通信回線3などによって構成される。
【0022】
変換サーバ1および各端末装置2は、通信回線3を介して通信することができる。通信回線3として、インターネット、公衆回線、またはLAN(Local Area Network)などが用いられる。
【0023】
文書平易化システム4によると、ある文書をより平易な文書に変換して出力するサービスをユーザへ提供することができる。
【0024】
変換サーバ1は、ある文書をより平易な文書に変換する。変換サーバ1は、図2に示すように、演算ユニット10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10c、補助記憶装置10d、およびネットワークアダプタ10eなどによって構成される。変換サーバ1として、いわゆるサーバ機が用いられる。または、複数台のコンピュータを組み合わせたシステムを用いてもよいし、いわゆるクラウドサーバを用いてもよい。
【0025】
ROM10cまたは補助記憶装置10dには、オペレーティングシステム、ウェブサーバソフトウェア、および後述する文書平易化プログラム100(図3参照)などが記憶されている。さらに、補助記憶装置10dには、文書平易化プログラム100で使用されるデータを格納するためのディレクトリ120が設けられている。補助記憶装置10dとして、ハードディスクまたはSSD(Solid State Drive)などが用いられる。
【0026】
RAM10bは、変換サーバ1のメインメモリであって、ROM10cまたは補助記憶装置10dに記憶されているプログラムが適宜、ロードされる。
【0027】
演算ユニット10aは、CPU(Central Processing Unit)またはMPU(Micro Processing Unit)などのプロセッサであって、RAM10bにロードされたプログラムを実行する。
【0028】
ネットワークアダプタ10eは、TCP/IP(Transmission Control Protocol/Internet Protocol)などのプロトコルで端末装置2などと通信するための装置である。ネットワークアダプタ10eとして、NIC(Network Interface Card)が用いられる。
【0029】
端末装置2は、変換サーバ1によって得られた平易な文書をユーザへ提示するために出力する。端末装置2として、ウェブブラウザを有するパーソナルコンピュータ、タブレットコンピュータ、またはスマートフォンなどが用いられる。
【0030】
文書平易化プログラム100は、上述のサービスを提供するプログラムであって、ウェブサーバソフトウェア上で動作する。したがって、ウェブサーバソフトウェアに対応した言語で記述される。
【0031】
文書平易化プログラム100は、図3に示す原文書データ取得部101、センテンス解析部102、センテンス分割部103、文末表現統一部104、換言補完部105、ルビ分書部106、および平易文書送信部107などのソフトウェアモジュールによって構成される。
【0032】
また、文書平易化プログラム100は、公知文献1(特開2021-121976号公報)に記載される文書平易化プログラムを拡張したものであって、特に、文書中の、動詞または補助動詞の連用形に付く「ましょう」を含むセンテンスを、公知文献1に記載される文書平易化プログラムよりも的確に平易化することができる。以下、図3に示す各部の機能を、「ましょう」を含むセンテンスの平易化の機能を中心に説明する。
【0033】
図4は、第一の辞書データ801の例を示す図である。図5は、「ましょう」の文末換言処理の流れ例を示すフローチャートである。図6は、第二の辞書データ802の例を示す図である。図7は、換言方法データ803の例を示す図である。図8は、無アスペクト動詞処理の流れの例を示すフローチャートである。図9は、アスペクト動詞処理の流れの例を示すフローチャートである。
【0034】
原文書データ取得部101は、公知文献1に記載されるような公知の方法によって、1つまたは複数のセンテンスが含まれるオリジナルの文書(原文)である原文書50のテキストデータを端末装置2から取得する。
【0035】
センテンス解析部102は、原文書50のテキストデータが原文書データ取得部101によって取得されると、原文書50の形態素解析および係受け解析をMeCab、ChaSen、またはCaboChaなどの公知のアルゴリズムに基づいて行うことによって、原文書50のセンテンスごとに、含まれる単語および文節を検出しセンテンスの構造(係り受け、単語同士の関係、文節同士の関係など)を判別する。
【0036】
センテンス分割部103は、原文書50を、原文書50に含まれる各センテンスに適宜分割することによって、短化文書51を生成する。これらの処理は、公知文献1に記載されるような公知の方法で行えばよい。
【0037】
文末表現統一部104は、短化文書51に含まれる各センテンスの文末の表現形式を敬体(いわゆる「です・ます調」)に統一することによって、敬体文書52を生成する。これらの処理は、公知文献1に記載されるような公知の方法で行えばよい。
【0038】
換言補完部105は、敬体文書52に含まれる語句を他の語句に置換したり敬体文書52に語句を補完したりすることによって、換言補完文書53を生成する。具体的には、換言補完部105は、文末換言処理、数換言処理、難語換言処理、および補完処理を実行する。
【0039】
文末換言処理は、センテンスの誤解を防止しまたは理解を助けるために、文末の述語を換言する処理である。文末換言処理は、図4に示す第一の辞書データ801に基づいて次のように実行される。
【0040】
換言補完部105は、敬体文書52に含まれるセンテンスのうちの、第一の辞書データ801に示されるいずれかの対象語句が文末の述語に含まれるものを検出する。そして、検出したセンテンスの文末の対象語句を、その対象語句に対応する代替語句に置き換える。ただし、対象語句に対応する代替語句として所定のフォーマット(例えば、「A」から始まる4桁の英数字)のシリアルコードが第一の辞書データ801に示されることがある。この場合は、このシリアルコードに対応するルーチンの処理が文末換言処理として実行される。
【0041】
文末換言処理によると、例えば、「今週はずっと雨が続く見込みです。」というセンテンスは、「今週はずっと雨が続くでしょう。」と変換される。また、対象語句「ましょう」が述語の一部に含まれるセンテンスは、シリアルコード「A001」に対応するルーチンの処理が施される。この処理は、図5に示す手順で実行される。
【0042】
ところで、「ましょう」は、意志、勧誘、および推量のうちのいずれかを意味する。すなわち、例えば、「私が東京へ行きましょう。」というセンテンスの「ましょう」は意志を表わしており、このセンテンスは「私が東京へ行きます。」と換言することができる。また、「私と一緒に踊りましょう。」というセンテンスの「ましょう」は勧誘を表わしており、このセンテンスは「私と一緒に踊ってください。」と換言することができる。また、「今年の夏は、猛暑になりましょう。」というセンテンスの「ましょう」は推量を表わしており、このセンテンスは「今年の夏は、猛暑になるでしょう。」と換言することができる。
【0043】
このように「ましょう」は3つの意味を有するので、日本語を母国語としない者にとって、「ましょう」を含むセンテンスを理解するのが難しいことがある。したがって、「ましょう」を含むセンテンスの換言は、平易化において重要である。そこで、変換サーバ1は、図5に示す処理を「ましょう」の文末換言処理として採用している。この処理によると、従来よりも確実に、「ましょう」を含むセンテンスの平易化を図ることができる。
【0044】
「ましょう」の文末換言処理の概要は、次の通りである。換言補完部105は、図6の第二の辞書データ802に示されるいずれかの対象語句がセンテンスの中に含まれている場合は(図5の#721でYes)、例外処理を文末換言処理として実行する(#722)。
【0045】
しかし、第二の辞書データ802に示される対象語句が1つもセンテンスの中に含まれていない場合は(#721でNo)、図7の換言方法データ803に示されるいずれかの付加語(終助詞、形式名詞、または符号など)がそのセンテンスに含まれる「ましょう」の直後に付いていれば(#723でYes)、換言補完部105は、付加語含動詞処理を文末換言処理として実行する(#724)。
【0046】
しかし、センテンスに含まれる「ましょう」の直後に、換言方法データ803に示される付加語が付いていない場合は(#723でNo)、「ましょう」の直前の動詞が無アスペクト動詞であれば(#725でYes)、換言補完部105は、無アスペクト動詞処理を文末換言処理として実行する(#726)。一方、無アスペクト動詞でなければ、つまり、アスペクト動詞であれば(#725でNo)、アスペクト動詞処理を文末換言処理として実行する(#727)。
【0047】
ここで、例外処理、付加語含動詞処理、無アスペクト動詞処理、およびアスペクト動詞処理を順次、説明する。
【0048】
換言補完部105は、次のように例外処理を実行する。換言補完部105は、第二の辞書データ802(図6参照)に基づいて、センテンスの中に含まれる対象語句を、その対象語句に対応する代替語句に置き換える。ただし、対応する代替語句が複数ある場合は、いずれか1つをランダムに選出して置き換える。または、予め決められたほうに置き換えてもよい。
【0049】
これにより、例えば、「明日は、行楽日和になりましょう」というセンテンスは、「明日は、行楽日和になるでしょう」に変換される。
【0050】
また、「37度5分以上の熱があるときは、医者にかかりましょう。」というセンテンスは、「37度5分以上の熱があるときは、医者にかかってください。」と変換される。または、「37度5分以上の熱があるときは、医者の診察を受けてください。」と変換される。
【0051】
後者の変換によると、「ましょう」が「ください」に置換されるだけでなく、「医者にかかる」が「医者の診断を受ける」に置換される。つまり、「ましょう」が、意志、勧誘、および推量のいずれかを表わす他の語句に置換されるとともに、難解な語句が平易な語句に置換される。難解な語句の平易化は難語換言処理でも可能であるが、本例のように例外処理において文末の換言処理とともに一括して行うことによって、センテンス全体の平易化の的確性を高めることができる。
【0052】
また、換言補完部105は、次のように付加語含動詞処理を実行する。換言補完部105は、換言方法データ803(図7参照)に基づいて、「ましょう」および付加語を、その付加語に対応する換言方法に基づいて他の語句に置き換える。換言方法として、代替語句のみが示されていることがある。この場合は、「ましょう」および付加語を代替語句に置き換える。
【0053】
これにより、例えば、「明日は勝ちましょうとも。」というセンテンスは、「ましょう」および「とも」が「ます」に置換されることによって、「明日は勝ちます。」と変換される。また、「明日はどんな作戦で臨みましょう?」というセンテンスは、「明日はどんな作戦で臨みますか?」と変換される。また、「良いコンディションを保っていましょうことをお約束します。」というセンテンスは、「良いコンディションを保っていますことをお約束します。」と変換される。
【0054】
または、複数のケースそれぞれに応じた代替語句が換言方法として示されることがある。この場合は、換言補完部105は、「ましょう」および付加語を、複数のケースのうちセンテンスが当て嵌まるケースに応じた代替語句に置き換える。
【0055】
例えば、「ね」および「よ」のいずれかが付加語として含まれるセンテンスは、「ましょう」を含む述語の係り元(「ましょう」と係り受けの関係にある文節)すなわち主語が一人称でありかつその格助詞が「が」である場合は、意思を表わすように換言され、それ以外の場合は、勧誘を表わすように換言される。
【0056】
これにより、例えば、「俺たちが勝ちましょうね。」というセンテンスは、「俺たちが勝ちます。」と変換される。しかし、「山田さんが勉強しましょうね。」というセンテンスは、「山田さんが勉強してください。」と変換される。
【0057】
または、換言方法として、活用形および代替語句の組が示されることがある。この場合は、換言補完部105は、「ましょう」の直前の動詞等をこの活用形に変更し、かつ、「ましょう」および付加語を代替語句に置き換える。
【0058】
これにより、例えば、「明日は天気が好転しましょうし、お出かけ日和になるでしょう。」というセンテンスは、「明日は天気が好転するでしょうし、お出かけ日和になるでしょう。」と変換される。また、「大雨が続きましょうから、川に近づかないでください。」というセンテンスは、「大雨が続くでしょうから、川に近づかないでください。」と変換される。また、「帽子を被ってください、日差しが強くなりましょうし。」というセンテンスは、「帽子を被ってください、日差しが強くなるでしょうし。」と変換される。
【0059】
なお、付加語含動詞処理のほか置換に関する処理の際に、適宜、「ましょう」の直前の動詞の活用語尾に音便が用いられる。また、適宜、「てください」の「て」が「で」に変化させる。
【0060】
すなわち、例えば、「次の試合に勝ちましょうが、負けましょうが、決勝リーグには進めません。」というセンテンスは、促音便が用いられることによって、「次の試合に勝っても、負けても、決勝トーナメントには進めません。」と変換される。また、「慌てずに進みましょう。」というセンテンスは、「慌てずに進んでください。」のように変換される。
【0061】
また、換言補完部105は、図8に示す手順で無アスペクト動詞処理を実行する。換言補完部105は、「ましょう」の直前の動詞が特定の動詞であるか否かに応じて次のようにセンテンスを変換する。
【0062】
直前の動詞がサ変動詞(サ行変格活用の動詞)、サ変動詞の進行形(「○○している」または「○○しておる」)、または「ある」のいずれかの連用形である場合は(図8の#731でYes)、換言補完部105は、直前の動詞および「ましょう」を「○○します」、「○○しています」、または「あります」のような、意志を表わす表現に変換する(#732)。
【0063】
これにより、例えば、「明日の試合は普通の試合の3試合分に値しましょう。」というセンテンスは、「明日の試合は普通の試合の3試合分に値します。」と変換される。また、「そのことは、この試合がただの一戦ではないことを意味しておりましょう。」というセンテンスは、「そのことは、この試合がただの一戦ではないことを意味しています。」と変換される。また、「それくらいの価値はありましょう。」というセンテンスは、「それくらいの価値はあります。」と変換される。
【0064】
一方、これら3つのうちのいずれの連用形でもない場合は(#731でNo)、換言補完部105は、所定の規則に基づいて、推量を表わすようにセンテンスを変換する(#733)。
【0065】
これにより、例えば、「この製品は、あの製品よりも劣りましょう。」というセンテンスは、「この製品は、あの製品よりも劣るでしょう。」と変換される。また、「2人の考え方は、まったく異なりましょう。」というセンテンスは、「2人の考え方は、まったく異なるでしょう。」と変換される。
【0066】
また、換言補完部105は、図9に示す手順で無アスペクト動詞処理を実行する。換言補完部105は、「ましょう」を含む述語の係り元の格助詞「が」についてのルールまたは係助詞「も」のルールに主に基づいて、次のようにセンテンスを変換する。
【0067】
述語の係り元に格助詞「が」が使用されている場合は(図9の#741でYes)、換言補完部105は、格助詞「が」とともに文節をなす名詞(つまり、この述語の主語)のタイプに応じて次のようにセンテンスを変換する。その名詞が二人称以外の固有名詞(「山田君」、「鈴木様」、「加藤先生」などのように敬称が付属している場合を含む)、一人称の名詞、または動物の名前もしくは人を表す名詞であれば(#742でYes)、意思を表わすようにセンテンスを変換する(#743)。それ以外であれば(#742でNo)、勧誘を表わすように変換する(#744)。
【0068】
これにより、例えば、「佐藤会長が大会の開始を宣言しましょう。」というセンテンスは、「佐藤会長が大会の開始を宣言します。」と変換される。同様に、「私が東京へ行きましょう。」というセンテンスは、「私が東京へ行きます。」と変換される。また、「ポチが公園を歩いていましょう。」というセンテンスは、「ポチが公園を歩いています。」と変換される。
【0069】
しかし、「あなたが東京へ出張しましょう。」というセンテンスは、「あなたが東京へ出張してください。」と変換される。また、「木村さんが東京へ出張しましょう。」というセンテンスは、「木村さん」がこのセンテンスの聞き手すなわち「あなた」などの二人称に相当する場合は、「木村さんが東京へ出張してください。」と変換される。固有名詞が二人称であるか否かは、ユーザが指定してもよいし、自然言語処理によって判別してもよいし、前後の文脈に基づいて判別してもよい。
【0070】
格助詞「が」の代わりに係助詞「も」が用いられている場合は(#741でNo、#745でYes)、換言補完部105は、原則として格助詞「が」の場合と同様にセンテンスを変換するが、例外もある。
【0071】
係助詞「も」とともに文節をなす名詞(つまり、この述語の主語)が複数ある場合は(#746でYes)、換言補完部105は、それらの名詞の中に二人称の名詞が含まれており(#747でYes)、かつ、一人称の名詞が含まれていれば(#748でYes)、{一人称の名詞}+「も」+{二人称の名詞}+「も」、という形式の部分または{二人称の名詞}+「も」+{一人称の名詞}+「も」、という形式の部分を、{一人称の名詞}+「と一緒に」+{二人称の名詞}+「も」、という形式に変換し、かつ、「ましょう」を、勧誘を意味するように変換する(#749)。
【0072】
これにより、例えば、「私もあなたも東京へ行きましょう。」または「あなたも私も東京へ行きましょう。」というセンテンスは、「私と一緒にあなたも東京へ行ってください。」と変換される。または、「あなたも私と一緒に東京へ行ってください。」と変換してもよい。
【0073】
また、二人称の名詞が含まれるが(#747でYes)、一人称の名詞が含まれなければ(#748でNo)、換言補完部105は、「ましょう」を、勧誘を意味するように変換する(#744)。
【0074】
これにより、例えば、「彼もあなたも東京へ行きましょう。」というセンテンスは、「彼もあなたも東京へ行ってください。」と変換される。なお、ステップ#749と同様に、「彼と一緒にあなたも東京へ行ってください。」と変換してもよい。
【0075】
係助詞「も」とともに文節をなす複数の名詞に二人称の名詞が含まれない場合は(#747でNo)、換言補完部105は、「ましょう」を、意志を意味するように変換する(#743)。
【0076】
これにより、例えば、「私も彼も東京へ行きましょう。」というセンテンスは、「私も彼も東京へ行きます。」と変換される。
【0077】
係助詞「も」とともに文節をなす名詞が1つである場合は(#746でNo)、その名詞に敬称が付いていれば(#750でYes)、換言補完部105は、「ましょう」を、勧誘を意味するように変換する(#744)。付いていなければ(#750でNo)、格助詞「が」の場合と同様にセンテンスを変換する(#742~#744)。
【0078】
これにより、例えば、「山田さんも東京へ行きましょう。」というセンテンスは、「山田さんも東京へ行ってください。」と変換される。また、「私も一緒に行きましょう。」というセンテンスは、「私も一緒に行きます。」と変換される。
【0079】
格助詞「が」および係助詞「も」のいずれも使用されていない場合は(#741でNo、#745でNo)、換言補完部105は、勧誘を表わすようにセンテンスを変換する(#744)。
【0080】
これにより、例えば、「ただちに避難しましょう。」というセンテンスは、「ただちに避難してください。」と変換される。
【0081】
上述の通り、換言補完部105は、さらに、数換言処理、難語換言処理、および補完処理を実行する。数換言処理は、数に関する難解な語句を平易にする処理である。難語換言処理は、数以外の難易な語句を平易にする処理である。補完処理は、難解な語句を平易に説明する語句を補完する処理である。それぞれの処理の方法として、公知文献1に記載される方法が用いられる。これらの処理によって、敬体文書52から換言補完文書53が生成される。
【0082】
ルビ分書部106は、換言補完部105によって換言補完文書53が生成されると、換言補完文書53に含まれる各センテンスを文節単位で分かち書きにするとともに換言補完文書53に含まれる各漢字にルビを振ることによって、平易文書54を生成する。本実施形態では、ルビとして漢字の読みを表わす平仮名または片仮名を振る。文節および漢字の読みは、前に例示した、公知の形態素解析のアルゴリズムおよび辞書などによって特定することができる。分かち書きの後、句点を削除してもよい。
【0083】
平易文書送信部107は、ルビ分書部106によって平易文書54が生成されると、平易文書54のHTMLデータを端末装置2へ送信する。
【0084】
端末装置2は、HTMLデータを受信するとウェブブラウザによって平易文書54を表示する。さらに、公知の音声合成機能によって平易文書54を読み上げてもよい。
【0085】
図10は、文書平易化プログラム100による処理の全体的な流れの例を説明するフローチャートである。
【0086】
次に、変換サーバ1の全体的な処理の流れを説明する。変換サーバ1は、文書平易化プログラム100に基づいて、図10に示す手順で処理を実行する。
【0087】
変換サーバ1は、端末装置2から原文書50のテキストデータを受信すると(図10の#11)、原文書50を形態素解析および係受け解析を行うことによって、原文書50の各センテンスに含まれる単語および文節を検出し、各センテンスの構造を判別する(#12)。さらに、原文書50の各センテンスを必要に応じて分割する(#13)。これにより、1つまたは複数の短化文書51が得られる。
【0088】
変換サーバ1は、短化文書51に含まれる各センテンスの文末を敬体に統一する(#14)。これにより、敬体文書52が得られる。
【0089】
さらに、変換サーバ1は、敬体文書52に対して文末換言処理、数換言処理、難語換言処理、および補完処理を実行する(#15)。これにより、換言補完文書53が得られる。特に、「ましょう」が含まれるセンテンスに対しては、図5に示した手順で文末換言処理が実行される。
【0090】
さらに、変換サーバ1は、換言補完文書53に含まれる漢字にルビを振るとともに換言補完文書53を分かち書きにする(#16)。これにより、平易文書54が得られる。
【0091】
そして、変換サーバ1は、平易文書54のHTMLデータを端末装置2へ送信する(#17)。端末装置2は、HTMLデータを受信すると平易文書54を表示する。
【0092】
本実施形態によると、述語に「ましょう」を含むセンテンスを従来よりも的確に平易化することができる。
【0093】
特に、例外処理、付加語含動詞処理、無アスペクト動詞処理、およびアスペクト動詞処理の4つの処理のうち、例外処理を最初に実行することによって、クラス分けが難しい述語または動詞句において用いられている「ましょう」の言換えを従来よりも的確に行うことができる。
【0094】
本実施形態では、例外処理の後、付加語含動詞処理、無アスペクト動詞処理、およびアスペクト動詞処理の順に3つの処理を実行したが、3つの処理は、この順でなくてもよい。例えば、無アスペクト動詞処理およびアスペクト動詞処理の2つの処理を任意の順に実行した後、付加語含動詞処理を実行してもよい。
【0095】
ところで、「深海の海にはマッコウクジラが潜んでいましょう。」というセンテンスは、意志を表わしているとも、推量を表わしているとも、解釈し得る。しかし、勧誘を表わしているとは解釈できない。格助詞「が」の代わりに係助詞「も」が用いられる場合も、同様である。このように、三人称の名詞のみが主語である場合は、変換サーバ1は、意志および推量のいずれかを表わすように(つまり、勧誘を表わさないように)センテンスを変換すればよい。
【0096】
この際に、意志および推量のいずれを採用するかは、文書平易化システム4が使用される環境またはセンテンスの特性に基づいて決めておけばよい。例えば、内容を断定すると責任問題が生じる環境またはニュアンスを重視する環境において文書平易化システム4が使用される場合は、推量を表わすようにセンテンスが変換されるように設定しておけばよい。または、ニュアンスが失われてもよいが分かりやすさを重視したい環境で使用される場合は、意志を表わすようにセンテンスが変換されるように設定しておけばよい。
【0097】
または、動詞または動詞句ごとに予め決めておいてもよい。この場合は、第二の辞書データ802に登録しておけばよい。
【0098】
その他、文書平易化システム4、変換サーバ1の全体または各部の構成、処理の内容、処理の順序、データの内容などは、本発明の趣旨に沿って適宜変更することができる。
【符号の説明】
【0099】
1 変換サーバ(コンピュータ)
4 文書平易化システム
50 原文書(原センテンス)
52 敬体文書(原センテンス)
53 換言補完文書(換言センテンス)
54 平易文書(換言センテンス)
100 文書平易化プログラム(コンピュータプログラム)
105 換言補完部(生成部)
120 ディレクトリ(記憶手段)
802 第二の換言データ
803 換言方法データ
【要約】
【課題】述語に「ましょう」を含むセンテンスを従来よりも的確に平易化する。
【解決手段】「ましょう」が用いられる複数の第一の語句ごとに、第一の語句を平易に表現した第二の語句を記憶するディレクトリ120と、複数の第一の語句のうちのいずれかが敬体文書52に含まれる場合に、敬体文書52の中のこの第一の語句を、ディレクトリ120に記憶される、この第一の語句の第二の語句に置換することによって換言補完文書53を生成する、換言補完部105と、を変換サーバ1に設ける。
【選択図】図3
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10