(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-16
(45)【発行日】2024-07-24
(54)【発明の名称】文書評価装置、文書評価方法及び文書評価プログラム
(51)【国際特許分類】
G06F 40/253 20200101AFI20240717BHJP
G06F 40/279 20200101ALI20240717BHJP
【FI】
G06F40/253
G06F40/279
(21)【出願番号】P 2020128488
(22)【出願日】2020-07-29
【審査請求日】2023-05-11
(31)【優先権主張番号】P 2019141824
(32)【優先日】2019-07-31
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100089118
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】山家 優理子
(72)【発明者】
【氏名】金崎 克己
(72)【発明者】
【氏名】古田 俊之
(72)【発明者】
【氏名】勇 嘉偉
【審査官】長 由紀子
(56)【参考文献】
【文献】特開2006-227425(JP,A)
【文献】特開平10-091629(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
(57)【特許請求の範囲】
【請求項1】
テキストを構成する形態素の表示領域を、
前記形態素を評価する規則の数に応じた高さ方向の高さ領域に分割
し、前記規則と前記高さ領域とを対応付ける分割部と、
前記
形態素から
前記規則に該当する箇所を検出する検出部と、
前記
検出部が検出
した箇所の、
前記規則に対応する高さ領域に、
前記規則に対応する提示情報を付加する付加部と、
を有する文書評価装置。
【請求項2】
前記検出部は、前記
テキストを
前記形態素に分割したうえで、
前記規則に該当する箇所を検出すること
を特徴とする請求項1に記載の文書評価装置。
【請求項3】
分割された前記形態素と共に表示される、前記形態素と置換可能な置換候補情報を生成する置換候補生成部を、さらに備えること
を特徴とする
請求項2に記載の文書評価装置。
【請求項4】
入れ替え操作された際に、前記形態素と置換候補情報とを入れ替えた
テキストを作成する入れ替え制御部を、さらに備え
ること
を特徴とする
請求項3に記載の文書評価装置。
【請求項5】
前記付加部は、
前記規則に対応する色、形状、輝度、模様のうちいずれか一つ又は組み合わせた状態の提示情報を生成して、前記
検出部が検出
した箇所の、
前記規則に対応する高さ領域に付加すること
を特徴とする請求項1から
請求項4のうち、いずれか一項に記載の文書評価装置。
【請求項6】
文書評価装置で実行される文書評価方法であって、
テキストを構成する形態素の表示領域を、
前記形態素を評価する規則の数に応じた高さ方向の高さ領域に分割
し、前記規則と前記高さ領域とを対応付ける分割ステップと、
前記
形態素から
前記規則に該当する箇所を検出する検出ステップと、
前記
検出ステップが検出
した箇所の、
前記規則に対応する高さ領域に、
前記規則に対応する提示情報を付加する付加ステップと、
を有する文書評価方法。
【請求項7】
コンピュータを、
テキストを構成する形態素の表示領域を、
前記形態素を評価する規則の数に応じた高さ方向の高さ領域に分割
し、前記規則と前記高さ領域とを対応付ける分割部と、
前記
形態素から
前記規則に該当する箇所を検出する検出部と、
前記
検出部が検出
した箇所の、
前記規則に対応する高さ領域に、
前記規則に対応する提示情報を付加する付加部として機能させること、
を特徴とする文書評価プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書評価装置、文書評価方法及び文書評価プログラムに関する。
【背景技術】
【0002】
テキスト上の所定の規則に合致する箇所に対して強調表示を行う等、ユーザに対するフィードバックを行うシステムが知られている。このようなユーザに対するフィードバックは、例えばテキスト校正時の他、フレーズ、名前又はタイトルの作成時(編集時)等に行われる。複数の規則を用いてテキスト評価を行った場合、評価結果を示す多くの提示情報で表示画面が煩雑となり、提示情報過多によるユーザの混乱を招くおそれがある。このような提示情報の過多による煩雑さを回避するために、尺度をユーザの好みで選択する手法が知られている。
【0003】
また、特許文献1(特開2009-211716号公報)には、長い発音を要する難しい単語に強調して表示することを目的として、個々のフレーズ、単語及び音節等に対して色又は輝度を変化させる制御を時間的にずらして行うテキスト・プロセッサが開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、尺度をユーザの好みで選択する手法の場合、ユーザが誤った選択操作を行うことで、ユーザに対してテキストの内容を伝えるために重要なテキスト評価尺度が含まれなくなる問題がある。
【0005】
また、特許文献1のように、時間をずらして提示情報を提示する場合、時間をずらすことで提示情報の表示に時間を要する問題がある。
【0006】
本発明は、上述の課題に鑑みてなされたものであり、文書情報中の所定の規則に該当する箇所を示す提示情報を短時間かつ簡潔に提示可能とした文書評価装置、文書評価方法及び文書評価プログラムの提供を目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明は、テキストを構成する形態素の表示領域を、形態素を評価する規則の数に応じた高さ方向の高さ領域に分割し、規則と高さ領域とを対応付ける分割部と、形態素から規則に該当する箇所を検出する検出部と、検出部が検出した箇所の、規則に対応する高さ領域に、規則に対応する提示情報を付加する付加部と、を有する。
【発明の効果】
【0008】
本発明によれば、文書情報中の所定の規則に該当する箇所を示す提示情報を短時間かつ簡潔に提示可能とすることができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、比較例となる文書評価システムの提示情報の表示形態を示す図である。
【
図2】
図2は、実施の形態の文書評価システムの提示情報の表示形態を示す図である。
【
図3】
図3は、実施の形態の文書評価システムのハードウェア構成例を示す図である。
【
図4】
図4は、実施の形態の文書評価システムの機能ブロック構成例を示す図である。
【
図5】
図5は、実施の形態の文書評価システムの他の機能ブロック構成例を示す図である。
【
図6】
図6は、実施の形態の文書評価システムにおける、ユーザの操作フローを説明するためのフローチャートである。
【
図7】
図7は、実施の形態の文書評価システムにおける、ユーザの他の操作フローを説明するためのフローチャートである。
【
図8】
図8は、実施の形態の文書評価システムにおける、提示情報の表示例を示す図である。
【
図9】
図9は、実施の形態の文書評価システムにおける、提示情報の他の表示例を示す図である。
【
図10】
図10は、実施の形態の文書評価システムにおける、所望の形態素と置換候補情報との入れ替え操作を説明するための図である。
【
図11】
図11は、比較例となる文書評価システムにおける中国語の提示情報の表示形態を示す図である。
【
図12】
図12は、実施の形態の文書評価システムの中国語に対する提示情報の表示形態を示す図である。
【
図13】
図13は、実施の形態の文書評価システムにおける「い」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図14】
図14は、「ろ」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図15】
図15は、「い」、「ろ」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図16】
図16は、「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図17】
図17は、「い」、「は」、「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図18】
図18は、「い」、「は」、「第2」、「B」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図19】
図19は、「い」、「ろ」、「は」、「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図20】
図20は、「い」、「ろ」、「は」、「第1」及び「A」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図21】
図21は、「い」、「ろ」、「は」、「第1」、「A」及び「M」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図22】
図22は、「い」、「ろ」、「は」、「第2」、「B」及び「Y」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【
図23】
図23は、「い」、「ろ」、「は」、「第2」、「B」、「Y」及び「ス」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、文書評価装置、文書評価方法及び文書評価プログラムの実施の形態となる文書評価システムの説明をする。
【0011】
(概要)
まず、実施の形態の文書評価システムの概要を説明する。
図1は、比較例であり、所定の規則に該当する箇所の端点同士を線で繋いで示す例である。この場合,ユーザが規則に該当する箇所を認識する際に、「該当規則数×該当箇所数」の該当箇所数を確認する必要がある。また、この場合、規則該当箇所の端点同士を繋ぐ線同士が複雑に重なり合って煩雑な表示形態となり、規則該当箇所の視認が困難となる。
【0012】
これに対して、
図2は、実施の形態の文書評価システムの概要を示す図である。実施の形態の文書評価システムの場合、この
図2に示すように、テキストを構成する形態素又は形態素の関連語(例えば類義語等)に対して、N種類(Nは自然数)の規則の提示情報を表示する場合、形態素の高さをM/Nの各高さ領域に分割し、各高さ領域に対して、規則に対応する提示情報を表示する。
【0013】
すなわち、実施の形態の文書評価システムの場合、
図2に示すように、テキストの高さMを、表示する規則の数Nに基づいて均等にM/Nの高さの高さ領域に分割し、各高さ領域を、対応する規則の表示領域とする。そして、規則に該当する提示情報を、その規則に対して予め割り当てられている高さ領域に表示する。
【0014】
図2は、「まろやかな」との形態素に対して、第1の規則~第3の規則を表示する例である。この場合、3つの規則を表示するために、「まろやかな」との形態素の表示領域を、高さ方向に、均等に3分割する(N=3)。そして、第1の規則が該当する「まろ」に対して、第1の規則の表示領域となる最上段の高さ領域に、実線の四角で囲んで示すように第1の規則に対応する提示情報を表示する。
【0015】
同様に、第2の規則が該当する「やか」に対しては、第2の規則の表示領域となる中段の高さ領域に、点線の四角で囲んで示すように第2の規則に対応する提示情報を表示する。同様に、第3の規則が該当する「な」に対しては、第3の規則の表示領域となる下段の高さ領域に、一点鎖線の四角で囲んで示すように第3の規則に対応する提示情報を表示する。
【0016】
このように、規則別に異なる提示情報を、高さ位置を変えて表示することにより、提示情報同士の重なりを防止し、提示情報を視認し易くすることができる。
【0017】
(システム構成)
図3は、このような実施の形態の文書評価システムを実現するシステム構成例を示す図である。
図3(a)は、クライアント端末装置1で文書評価システムを構成する例である。この場合、クライアント端末装置1のCPU(Center Processing Unit)は、RAM(Read Only Memory)又はHDD(Hard Disc Drive)等の記憶部に記憶されている文書評価プログラムを実行することで、入出力機能10及び提示情報生成機能11の各機能を実現する。
【0018】
図3(b)は、インターネット又はLAN(Local Area Network)等の所定のネットワークを介して相互に接続されたクライアント端末装置1及びサーバ装置2で文書評価システムを構成する例である。一例ではあるが、この場合、クライアント端末装置1側で入出力機能10を実行し、サーバ装置2側で提示情報生成機能11を実行する。そして、サーバ装置2の提示情報生成機能11で生成された提示情報を、クライアント端末装置1側の表示機能に表示する。
【0019】
図3(c)は、クライアント端末装置1が、文書評価プログラムに基づいて、入出力機能10及び提示情報生成機能11と共に、提示情報を表示するテキスト情報を管理するテキスト管理機能12を実現する例である。
図3(d)は、このテキスト管理機能12及び入出力機能10をクライアント端末装置1側で実行し、提示情報生成機能11をサーバ装置2側で実行する例である。これに対して、
図3(e)は、クライアント端末装置1側は、入出力機能10を実行し、サーバ装置2側で提示情報生成機能11及びテキスト管理機能12を実行する例である。
【0020】
また、テキスト管理機能12は、クライアント端末装置1及びサーバ装置2とは物理的の異なる他の装置で実行してもよい。
図3(f)は、ネットワークを介してクライアント端末装置1及びサーバ装置2と相互に接続される第2のサーバ装置3でテキスト管理機能12を実行する例である。この場合、クライアント端末装置1は入出力機能10を実行し、第1のサーバ装置2は、提示情報生成機能11を実行する。
【0021】
さらに、テキスト管理機能12は、各機器で分担してもよい。
図3(g)は、第1のサーバ装置2及び第2のサーバ装置3でテキスト管理機能12を分担した例である。
図3(h)は、クライアント端末装置1、第1のサーバ装置2及び第2のサーバ装置3でテキスト管理機能12を分担した例である。
【0022】
なお、入出力機能10、提示情報生成機能11及びテキスト管理機能12は、それぞれ文書評価プログラムにより、ソフトウェアで実現されることとしたが、これらのうち、一部又は全部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。また、入出力機能10、提示情報生成機能11及びテキスト管理機能12は、文書評価プログラム単体で実現しても良いし、他のプログラムに処理の一部を実現させ、又は、他のプログラムを用いて間接的に実現させても良い。
【0023】
また、文書評価プログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)などのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、文書評価プログラムは、CD-R、DVD(Digital Versatile Disk)、ブルーレイディスク(登録商標)、半導体メモリなどのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、文書評価プログラムは、インターネット等のネットワーク経由でインストールするかたちで提供してもよいし、機器内のROM等に予め組み込んで提供してもよい。
【0024】
(機能の詳細)
図4は、入出力機能10、提示情報生成機能11及びテキスト管理機能12の各機能の詳細を説明するための図である。
図4(a)は、
図3(a)に示したように、クライアント端末装置1で入出力機能10及び提示情報生成機能11が実現される例に対応した機能ブロック図である。この
図4(a)に示すように、入出力機能10は、入出力部20を有する。また、提示情報生成機能11は、テキスト要素分析部31、テキスト要素分析ルール読み出し部32、テキスト評価部33、テキスト評価ルール読み出し部34、提示生成部35及び提示ルール読み出し部36を有する。
【0025】
入出力部20は、入力テキスト又は所望のテキスト又はテキストのうち置換対象のテキストと置換候補であるテキスト又は,テキストが記憶されているURL(Uniform Resource Locator)、フォルダ名等を示す指定情報を、テキスト要素分析部31に供給する。
【0026】
クライアント端末装置1のROM又はHDD等の記憶部には、テキスト要素分析ルール情報、テキスト評価ルール情報及び提示ルール情報が記憶されている。テキスト要素分析ルール読み出し部は、この記憶部に記憶されているテキスト要素分析ルール情報を読み出し、テキスト要素分析部31に供給する。
【0027】
テキスト要素分析ルール情報は、各形態素情報から、例えば品詞情報又は発音情報等の活用情報を取り出すためのルール情報となっている。テキスト要素分析部31は、このようなテキスト要素分析ルール情報に基づいて、入力テキストの各形態素情報のうち、品詞情報又は発音情報等の活用情報に相当する形態素情報を抽出する。または、テキスト要素分析部31は、テキスト要素分析ルール情報に基づいて、指定情報で指定されたテキストの各形態素情報から品詞情報又は発音情報等の活用情報に相当する形態素情報を抽出する。
【0028】
テキスト評価ルール読み出し部34は、記憶部からテキスト評価ルール情報を読み出し、テキスト評価部33に供給する。このテキスト評価ルール情報は、どのような評価尺度でテキストを評価するかのルール情報で、例えば「発音しづらい音素並びルール」等である。テキスト評価部33は、テキスト要素分析部31で抽出された形態素情報を、例えば発音しづらい音素並びのテキスト評価ルール情報に基づいて、各形態素情報の並びを評価し、この評価結果(例えば、スコア)を提示生成部35に供給する。また、テキスト評価部33は、テキストに対する提示情報の表示位置の特定を行う。
【0029】
提示ルール読み出し部36は、記憶部に記憶されている提示ルール情報を読み出して提示生成部35に供給する。提示生成部35は、テキスト評価部33により供給された評価結果を、提示ルール読み出し部36により供給された提示ルールに従って提示するための情報を入出力部20に供給する。入出力部20は、この情報に基づいて、テキストの各形態素上の所定の高さ位置に提示情報を表示する。これにより、提示情報同士の重なりを防止し、視認し易い状態で提示情報を表示することができる。このような提示情報の表示形態の詳細は、後述する。
【0030】
図4(b)は、
図4(a)に示した基本構成に、テキストの編集方法分析部37を追加した機能ブロック構成である。この場合、テキスト要素分析部31で抽出された活用情報は、テキスト編集方法分析部37に供給される。テキスト編集方法分析部37は、テキスト編集ルール読み出し部38により記憶部から読み出された、類義語又は削除可能な助詞等を示すテキスト編集ルール情報に基づいて、各形態素情報に対する置換候補情報を形成する。
【0031】
この置換候補情報は、各形態素情報の例えば下段に並べて表示される。各形態素情報及び各置換候補情報の所望の並びが適用され、編集操作されると、テキスト要素分析部31は、この所望の並びとされた文書から、再度、形態素情報を抽出して、テキスト評価部33に供給する。テキスト評価部33は、ユーザにより編集操作された形態素情報及び置換候補情報の並びの文書を、再度、評価し、この評価結果(例えば、スコア)を、提示生成部35を介して入出力部20に供給する。これにより、ユーザにより編集操作された形態素情報及び置換候補情報の並びの文書と共に、この文書に対応する評価結果(例えば、スコア)が表示部に表示される。ユーザは、この評価結果(例えば、スコア)に基づいて、編集操作の良し悪しを判断する。
【0032】
図5(a)は、テキストデータの保存機能及びテキストデータの編集機能を備えるテキスト管理部40からテキストデータの読み出し制御又は書き出し制御を可能とした構成を示している。また、
図5(b)は、
図3(g)又は
図3(h)に例示したように、テキスト管理部40が、クライアント端末装置1以外にも存在する場合に,テキスト書き出し時にテキスト保存先を指定する構成を示している。
【0033】
(ユーザの操作フロー)
図6(a)、
図6(b)及び
図7(a)、
図7(b)は、ユーザ操作の流れを示すフローチャートである。
図6(a)のフローチャートが、基本構成のユーザ操作フローを示している。この場合、ユーザがテキスト入力を行うと(ステップS1)、テキスト評価情報の表示を行う(ステップS2)。ステップS3で表示の終了が判別されると、この
図6(a)のフローチャートに示す処理が終了する。
【0034】
図6(b)は、このような基本構成のユーザ操作フローに、テキスト操作(ステップS4)を加えた構成である。また、
図7(a)は、基本構成のユーザ操作フローに、テキスト操作(ステップS4)及びテキスト保存操作(ステップS5、ステップS6)を加えた構成である。また、
図7(b)は、基本構成のユーザ操作フローに、テキスト操作(ステップS4)、テキスト保存操作(ステップS5、ステップS6)、及び、テキストの保存先設定操作(ステップS7)を加えた構成である。
【0035】
(提示ルール)
記憶部に記憶されており、提示ルール読み出し部36により読み出される提示ルールは、一例ではあるが、以下のようになっている。
【0036】
ルール「い」→語の境界の規則該当箇所のみにマークする(単体では語の並びの改良(削除/置換)余地がある箇所の特定に特化したルール。特定の語の置き換えが困難であり、周囲の置換を検討する際に、情報を絞って効率的に決定できる。
【0037】
ルール「ろ」→語の内部の規則該当箇所のみにマークするルール。単体では、語の内部に特化している。置換特定する際に絞り込んだ情報に基づいて効率的に決定できる。また、その語自体を置換可能な場合に有効である。
【0038】
ルール「は」→現状はルールに該当していないが、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則に該当する可能性がある部分をマークするルール。単体では語の並びの改良(削除/置換/並べ替え)の実施前に、好ましくない並びになり得る箇所を把握できる。
【0039】
このようなルール「い」~ルール「は」の組み合わせは、同時に俯瞰できる情報が増える点で、規則該当箇所を俯瞰したい場合に有効である。
【0040】
第1のルール→連続には向きを着けずに、e_iは許可するが、i_eは許可しない等のように、規則に並び順の要素を考慮する必要がある場合にのみ向きをつけるルール。並び順要素がある箇所の特定に効果的となる。
【0041】
第2のルール→単なる連続でも向きをつけるルール。表示のルールが多いと見づらいと感じるユーザに対して、提示情報及びテキストを見やすくすることができる。
【0042】
ルールA→ルールに該当する場合の提示情報の向きを、提示情報の形が形成される方向とするルール。ルールに該当する場合の提示情報の向きを提示情報の組み合わせにより図形が形成される方向とするルール(例えば二つの半円の弦の部分が向き合うと円が形成される。
【0043】
ルールB→ルールに該当する場合の提示情報の向きを、提示情報の形が形成されない方向とするルール。ルールに該当する場合の提示情報の向きを提示情報の組み合わせにより図形が形成されない方向とするルール(例えばふたつの半円の孤の部分が向き合うと円が形成されない。
【0044】
ルール「X」→提示情報の形状を半円形状にするルール。ルールに該当することを示す提示情報の形状として、丸みを帯びた形状を好むユーザにより選択される。
【0045】
ルール「Y」→提示情報の形状を三角形状にするルール。ルールに該当することを示す提示情報の形状として、角のある形状を好むユーザにより選択される。
【0046】
ルール「ス」→スコア表示の更新を指定するためのルール。テキスト操作を行うことで改善される評価結果(例えば、スコア)をリアルタイムに把握したいユーザにより選択される。
【0047】
ルール「ん」→文字列同士の距離が評価に影響する場合に、影響範囲を示す提示情報を表示するルール。ルールに該当する箇所が影響を及ぼす範囲を表示できる。
【0048】
ルール「M」→色以外の模様等の視覚情報で、提示情報の表示を指定するルール。模様等で提示情報を表示することで、色弱のユーザにも提示情報を視認可能とすることができる。
【0049】
(掲示情報の表示例)
次に、
図8~
図10に、掲示情報の表示例を示す。一例ではあるが、この
図8~
図10に示すように、提示生成部35は、4つの規則に対応する提示情報を表示するために、テキストを高さ方向に4等分割した例である。この4等分割した各高さ領域のうち、上段の高さ領域には、語尾に「あ」等の母音が存在する際に付される掲示情報が表示され、上から2番目の高さ領域には、語尾に「い」等の子音が存在する際に付される掲示情報が表示される。また、4等分割した各高さ領域のうち、下段の高さ領域には、語頭や語尾に「t」又は「r」の子音が存在する際に付される掲示情報が表示され、下から2番目の高さ領域には、発音が「ん」となる文字の前後3文字の範囲を示すバー状(長方形状)の掲示情報が表示される。
【0050】
なお、提示生成部35は、文書情報の表示領域を、表示する規則の数に応じた高さ方向の高さ領域に分割する分割部、及び、文書情報から検出した所定の規則に該当する箇所の、所定の規則に対応する高さ領域に、所定の規則に対応する提示情報を付加する付加部の一例である。
【0051】
まず、
図8(a)は、上述のルール「い」、第2のルール、ルール「A」 及びルール「X」が適用された場合における掲示情報の表示例を示している。
図8(a)は、「まろやかなバター味に仕上げました」との文書が入力テキストであり、テキスト要素分析部31により、「まろやか」、「な」、「バター」、「味」、「に」、「仕上げ」、「ました」との形態素情報が抽出された例を示している。また、この
図8(a)の例は、テキスト編集方法分析部37により、テキスト編集ルール情報に基づいて、「まろやか」との形態素情報から「芳醇」との置換候補情報が形成されて表示された例を示している。なお、テキスト評価部33は、文書情報から所定の規則に該当する箇所を検出する検出部の一例である。また、テキスト編集方法分析部37は、分割された形態素と共に表示される、形態素と置換可能な置換候補情報を生成する置換候補生成部の一例である。
【0052】
また、この
図8(a)の例は、テキスト編集方法分析部37により、「味」との形態素情報から「風味」及び「テイスト」との置換候補情報が形成されて表示された例を示している。さらに、この
図8(a)の例は、「に」の形態素情報に対して「で」の置換候補情報が形成されて表示され、「仕上げ」との形態素情報に対して「作り」との置換候補情報が形成されて表示された例を示している。
【0053】
なお、この
図8(a)の例は、「まろやか」、「な」、「バター」、「味」、「に」、「仕上げ」、「ました」との形態素情報の並びの場合に得られる評価結果(例えば、スコア)を示している。「スコア:61.5点」の表記は、その評価結果の一部であり、発音のし易さに関する評価値である。なお、テキスト評価部33は各形態素の並びに対応する特定の尺度に関する評価を行う評価部の一例である。
【0054】
このような
図8(a)の例の場合、「まろやか」、「な」、「バター」の各形態素の並びは、語尾の発音に「あ」が付く形態素の連続であるため、この「あ」が発音される上述の上段の高さ位置に、一対の半円形状の掲示情報が表示される。また、
図8(a)の例は、「味」及び「に」の各形態素の並びは、語尾の発音に「い」が付く形態素の連続であるため、この「い」が発音される上述の上から2番目の高さ位置に、一対の半円形状の掲示情報が表示される。なお、例えば上段の高さ位置に表示する掲示情報はレンジの色で表示し、上から2番目の高さ位置に表示する掲示情報は青色で表示する等のように、各段に対しては色、模様、輝度又は形状等を異ならせて掲示情報の表示を行うようになっている。
【0055】
次に、
図8(b)は、上述のルール「ろ」、第2のルール、ルール「A」及びルール「X」が適用された場合における掲示情報の表示例を示している。
図8(b)の例の場合、「まろやか」、「な」、「バター」の各形態素は、語尾の発音に「あ」が付く形態素の連続であるため、語尾に「あ」が発音される文字の上段の高さ位置に、一つの半円形状の掲示情報が表示される。すなわち、「や」、「か」、「バ」及び「タ」の各文字の上に半円形状の掲示情報が表示される。
【0056】
次に、
図8(c)は、上述のルール「い」、ルール「ろ」、第2のルール、ルール「A」及びルール「X」が適用された場合における掲示情報の表示例を示している。
図8(c)の例の場合、ルール「い」及びルール「ろ」が適用されているため、「まろやか」、「な」、「バター」の、語尾の発音に「あ」が付き、かつ、連続する形態素に対して、「あ」が発音される上述の上段の高さ位置に、一対の半円形状の掲示情報が表示されると共に、語尾に「あ」が発音される文字の上段の高さ位置に、一つの半円形状の掲示情報が表示される。
【0057】
次に、
図8(d)は、上述の第2のルール、ルール「A」及びルール「X」が適用された場合における掲示情報の表示例を示している。
図8(d)の例の場合、「ん」の発音を含む下から2番目の高さ位置の高さ領域に、所定の長さのバー状の提示情報が表示される。具体的には、「芳醇(ほうじゅん)」の形態素は、語尾が「ん」の発音となる。この「ん」の発音を含む形態素が連続すると、発音し難い文書となる。このため、提示生成部35は、「ん」の発音を含む「醇(じゅん)」の文字の前後3文字に渡って、下から2番目の高さ位置の高さ領域にバー状の提示情報を表示する。そして、このバー状の提示情報のうち、「ん」の発音を含む「醇(じゅん)」の文字に相当する位置に、所定の色、模様、輝度、マーク等を付す。
【0058】
なお、この場合、提示生成部35は、「醇(じゅん)」の文字が視認し難くなる不都合を防止するために、色、模様、マーク等は、色、模様、マーク等を介して「醇(じゅん)」の文字が視認可能な透明度として表示し、又は、テキストの奥に表示してもよい。
【0059】
次に、
図8(e)の例の場合、提示生成部35は、上述の上段の高さ位置において、「まろやか」、「な」、「バター」及び「ました」等のように、語尾の発音が「あ」となる形態素の先頭及び後尾に半円形状の提示情報を表示する。
【0060】
また、「ん」の発音を含む下から2番目の高さ位置の高さ領域に、所定の長さのバー状の提示情報が表示される。具体的には、「芳醇(ほうじゅん)」の形態素は、語尾が「ん」の発音となる。この「ん」の発音を含む形態素が連続すると、発音し難い文書となる。このため、提示生成部35は、「ん」の発音を含む「醇(じゅん)」の文字の前後3文字に渡って、下から2番目の高さ位置の高さ領域にバー状の提示情報を表示する。そして、このバー状の提示情報のうち、「ん」の発音を含む「醇(じゅん)」の文字に相当する位置に、所定の色、模様、輝度、マーク等を付す。
【0061】
なお、この場合、提示生成部35は、「醇(じゅん)」の文字が視認し難くなる不都合を防止するために、色、模様、マーク等は、色、模様、マーク等を介して「醇(じゅん)」の文字が視認可能な透明度として表示し、又は、テキストの奥に表示してもよい。
【0062】
次に、
図9(a)は、上述のルール「い」、ルール「は」、第2のルール、ルールB、ルール「X」及びルール「ん」が適用された場合における掲示情報の表示例を示している。
図9(a)の例の場合、提示生成部35は、上述の上段の高さ位置において、「まろやか」、「な」、「バター」及び「ました」等のように、語尾の発音が「あ」となる形態素の先頭及び後尾に半円形状の提示情報を表示する。
【0063】
提示生成部35は、提示情報の色を変更して表示してもよい。
図9(b)は、半円形状の提示情報の色を変更して表示した例である。この例は、「縄」の形態素の上段の高さ位置に、例えばオレンジ色の提示情報を表示し、「に」の形態素の上から2番目の高さ位置に、例えば青色の提示情報を表示し、「へ」の形態素の下段の高さ位置に、例えばピンク色の提示情報を表示した例である。提示情報の表示色をそれぞれ異ならせることで、ユーザが直感的に認識可能な提示情報の表示を行うことができる。
【0064】
また、提示生成部35は、提示情報の形状を変更して表示してもよい。
図9(c)は、半円形状の提示情報及び四角形状の提示情報を表示した例である。この例は、「縄」の形態素の上段の高さ位置に、例えばオレンジ色で四角形状の提示情報を表示し、「に」の形態素の上から2番目の高さ位置に、例えば青色で四角形状の提示情報を表示し、「へ」の形態素の下段の高さ位置に、例えばピンク色で半円形状の提示情報を表示した例である。提示情報の表示色及び形状をそれぞれ異ならせることで、ユーザが、さらに直感的に認識可能な提示情報の表示を行うことができる。
【0065】
また、提示生成部35は、提示情報の模様を変更して表示してもよい。
図9(d)は、半円形状及び四角形状の提示情報の模様を変更して表示した例である。この例は、「縄」の形態素の上段の高さ位置に表示する提示情報、「に」の形態素の上から2番目の高さ位置に表示する提示情報、及び、「へ」の形態素の下段の高さ位置に表示する提示情報の色、形状、模様を変更して表示した例である。提示情報の色、形状及び模様をそれぞれ異ならせることで、ユーザが、さらに直感的に認識可能な提示情報の表示を行うことができる。
【0066】
図9(e)は、上述のルール「い」、ルール「ろ」、ルール「は」、第2のルール、第4のルール、ルール「Y」及びルール「ん」が適用された場合における掲示情報の表示例を示している。
図9(e)は、上述のバーの提示情報で「ん」の発音が連続する箇所を示した例である。上述のように、バーの提示情報は、下から2番目の高さ位置の高さ領域に表示される。
図9(e)の例は、「カンタン」の形態素の最初の「ン」を中心として前後3文字分の領域にバーの提示情報が表示され、次の「ン」を中心として前後3文字分の領域にバーの提示情報が表示された例である。また、
図9(e)の例は、「ランタン」の形態素の最初の「ン」を中心として前後3文字分の領域にバーの提示情報が表示され、次の「ン」を中心として前後3文字分の領域にバーの提示情報が表示された例である。
【0067】
ユーザは、このバーの提示情報内に(「ン」の発音から前後3文字以内に)、なるべく「ン」の発音の形態素が入らないように、例えば「ランタン」の形態素を「ライト」の置換候補情報と入れ替え操作する。これにより、「ン」の発音の連続を少なくすることができ、発音し易い文書に校正できる。
【0068】
次に、
図10(a)及び
図10(b)は、特定の形態素を置換候補情報と入れ替え操作することで、評価結果(スコア)が向上する例を説明するための図である。
図10(a)は、上述のルール「い」、ルール「ろ」、ルール「は」、第2のルール、ルールB、ルール「Y」及び「ん」が適用された場合における掲示情報の表示例を示している。ルール「Y」は、提示情報の形状を三角形状にするルールである。
【0069】
この場合、提示生成部35は、「あ」の発音が続く「まろやか」、「な」、「バター」及び「ました」の各形態素の上段の高さ位置に対して三角形状の提示情報を表示する。
【0070】
ここで、このような「まろやかなバター味に仕上げました」との文書における発音のし易さに対応する評価結果(例えば、スコア)が61.5点であったとする。この場合、ユーザは、あまり良いスコアではないため、「あ」の発音の連続を、なるべく防止するように、各形態素を、置換候補情報と入れ替え操作する。
図10(b)の例は、「まろやか」及び「な」の形態素を、「芳醇」の置換候補情報と入れ替え操作すると共に、「味」、「に」及び「仕上げ」の各形態素を、「風味」、「で」、「作り」の置換候補情報と入れ替え操作した例である。
【0071】
すなわち、
図10(a)及び
図10(b)の例は、「まろやかなバター味に仕上げました」との文書では、「あ」の発音が連続する箇所が多く、発音し難いため、「芳醇なバター風味でつくりました」との文書に修正した例である。これにより、「あ」の発音が連続する箇所は、「バター」の形態素と、「ました」の形態素の2箇所となる。このため、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)は、
図10(b)に示すように、例えば80点に向上する。
【0072】
なお、提示された表示に対してユーザが評価を据え置き又は下げる操作をした場合に、提示生成部35は、編集方法として評価を向上又は据え置く方法を提示してもよい。例えば、ユーザが「まろやか」を「かろやか」に変化させようとした場合に(評価を据え置きする操作をした場合に)、提示生成部35は、「な」を排除する提案表示を行う。これにより、「な」を排除することで低評価要因を減らすことができる(評価を向上させることができる)。
【0073】
(他の言語に対する適用例)
次に、実施の形態の文書評価システムは、日本語以外の言語に対しても適用可能である。以下、実施の形態の文書評価システムの、中国語に対する適用例を説明する。
【0074】
(中国語に対するルール)
中国語においては、「l」と「n」は区別しにくい。このため、中国語の場合、提示生成部35は、「l」と「n」が連続して出現する箇所の「l」と「n」の両方に、所定の提示情報を表示する。なお、提示生成部35は、不連続の「l」と「n」には、提示情報は表示しない。
【0075】
また、中国語においては、「ao」及び「ou」は区別しにくい。このため、提示生成部35は、「ao」を含む音節の前後2音節の範囲に、上述のバー状(長方形状)の掲示情報を表示する。同様に、提示生成部35は、「ou」を含む音節の前後2音節の範囲に、上述のバー状(長方形状)の掲示情報を表示する。
【0076】
また、中国語においては、「劉老六(liu,lao,liu)」等のように、先頭が「l」の文字が連続すると発音しにくい。このため、提示生成部35は、「l」の文字が連続する箇所に所定の掲示情報を表示する。
【0077】
また、中国語においては、「l」の発音と「n」の発音は、区別して発音しにくい。このため、「l」と「n」が連続する箇所における「l」及び「n」の両方に、所定の提示情報を表示する。なお、提示生成部35は、連続していない単体の「l」及び「n」に対しては、提示情報は表示しない。
【0078】
次に、「老六▲りう▼牛 柳林鎮有个六号楼,劉老六住在六号楼」との、中国の早口言葉を例文として、提示情報の表示動作を説明する。この例文の▲ぴん▼音(PINYIN)は、「老六(lao liu)▲りう▼牛(liu niu) 柳林鎮(liu lin zhen) 有个(you ge) 六号楼(liu hao lou) 劉老六(liu lao liu) 住在(zhu zai) 六号楼(liu hao lou)」となる。なお、▲ぴん▼音(PINYIN)は、中国語で音節を音素文字に分け、ラテン文字化して表記する発音表記体系である。また、この例文を、日本語に翻訳すると、「老六さんが牛を牽き、柳林村に六号館があり、劉老六さんが六号館に住んでいる」となる。
【0079】
このような例文が読みづらい理由は、「l」及び「n」が区別しにくく、「iu」及び「ou」が区別しにくく、また、「ao」及び「ou」が区別しにくいためである。また、劉老六(liu lao liu)等のように、最初が「l(L)」の文字が3つ連続することで、発音し難い文が存在するためである。また、老六▲りう▼(lao liu liu niu)における「liu」と「niu」等のように、発音が似た単語(形態素)で構成された文が存在するためである。
【0080】
図11は、従来の文書評価システムにおける置換候補情報の選択形態を説明するための図である。この
図11に示すように、従来の文書評価システムでは、日本語で「六号館」を意味する六号楼(liu hao lou)の置換候補情報として、日本語で「六号室」を意味する六室(liu shi)、日本語で「部屋番号六」を意味する六号房間(liu hao fangjian)、又は、日本語で「六番の部屋」を意味する六号房(liu hao fang)が選択される。
【0081】
また、従来の文書評価システムでは、日本語で「第六ビル」を意味する第六大厦(di liu dasha)に対する置換候補情報として、日本語で「第六」を意味する第六名(di liu ming)が選択される。
【0082】
また、従来の文書評価システムでは、日本語で「六棟」を意味する嶺六(ling liu)に対する置換候補情報としては、日本語で「六号室」を意味する六室(liu shi)、日本語で「部屋番号六」を意味する六号房間(liu hao fangjian)、又は、日本語で「六番の部屋」を意味する六号房(liu hao fang)が選択される。
【0083】
このように、従来の文書評価システムでは、
図1に示した比較例と同様に、ユーザが規則に該当する箇所を認識する際に、「該当規則数×該当箇所数」の該当箇所数を確認する必要がある。また、この場合、規則該当箇所の端点同士を繋ぐ線同士が複雑に重なり合って煩雑な表示形態となり、規則該当箇所の視認が困難となる。
【0084】
(提示情報の表示形態)
図12は、実施の形態の文書評価システムにおける、中国語に対する提示情報の表示形態を示す図である。中国語の場合も上述の日本語の場合と同様であり、提示生成部35は、
図12に示すように、テキストの高さMを、表示する規則の数N(M、Nは自然数)に基づいて均等にM/Nの高さの高さ領域に分割し、各高さ領域を、対応する規則の表示領域とする。そして、規則に該当する提示情報を、その規則に対して予め割り当てられている高さ領域に表示する。これにより、提示情報同士の重なりを防止し、提示情報を視認し易くすることができる。
【0085】
具体的に説明すると、
図13は、上述の「い」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合、表示する規則が2つとなるため、提示生成部35は、
図13(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の存在を示す提示情報を表示し、第2段(下段)に「l」と「n」の連続を示す提示情報を表示する。
【0086】
図13(c)は、この例文の▲ぴん▼音(PINYIN)を示している。
図13(a)及び
図13(c)を見比べて分かるように、提示生成部35は、例文中、先頭に「l」が付く、例えば「老(lao)」、「六(liu)」、「柳(liu)」等の文字に対して、
図13(a)に示すように第1段目に半円の提示情報を表示する。また、提示生成部35は、例文中、「l」と「n」が連続する、例えば「▲りう▼牛(liu niu)」の文字に対して、
図13(a)に示すように第2段目に半円の提示情報を表示する。
【0087】
また、提示生成部35は、
図13(b)及び
図13(d)に示すように、発音し難い箇所である、「l」と「n」が連続する箇所、及び、先頭に「l」が付く形態素が3つ以上連続する箇所の下に、同様の意味を有する置換候補情報を表示する。なお、
図13(d)は、置換候補情報の▲ぴん▼音(PINYIN)である。
【0088】
図13(a)の例文の場合、「l」と「n」が連続する「▲りう▼牛(liu niu)」との形態素は発音し難いため、提示生成部35は、
図13(b)に示すように、「放牛(fang niu)」等の置換候補情報を表示する。また、先頭に「l」が付く形態素が3つ以上連続する「六号楼(liu hao lou)」との形態素は発音し難いため、提示生成部35は、
図13(b)に示すように、「六棟公寓(liu dong gong yu」等の置換候補情報を表示する。
【0089】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0090】
なお、
図13(c)に示す例文の▲ぴん▼音、及び、
図13(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0091】
図14は、上述の「ろ」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図14(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の存在を示す提示情報を表示し、第2段(下段)に「l」と「n」の連続を示す提示情報を表示する。
図14(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図14(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図14(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0092】
図14の例の場合、上述の「ろ」のルールが適用されている。このため、提示生成部35は、
図14(a)の例文の第1段(上段)及び第2段(下段)に示すように、語の内部の規則該当箇所のみに提示情報を表示する。また、提示生成部35は、
図14(b)及び
図14(d)に示すように、発音し難い箇所である、「l」と「n」が連続する箇所、及び、先頭に「l」が付く形態素が3つ以上連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0093】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0094】
なお、
図14(c)に示す例文の▲ぴん▼音、及び、
図14(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0095】
図15は、上述の「い」、「ろ」、「第2」、「A」、「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図15(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」と「n」が隣接していることを示す提示情報を表示する。
図15(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図15(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図15(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0096】
図15の例の場合、上述の「い」及び「ろ」のルールが適用されている。このため、提示生成部35は、
図15(a)の例文の第1段(上段)及び第2段(下段)に示すように、語の境界の規則該当箇所、及び、語の内部の規則該当箇所のみに提示情報を表示する。また、提示生成部35は、
図15(b)及び
図15(d)に示すように、発音し難い箇所である、「l」と「n」が連続する箇所、及び、先頭に「l」が付く形態素が3つ以上連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0097】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0098】
なお、
図15(c)に示す例文の▲ぴん▼音、及び、
図15(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0099】
図16は、上述の「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図16(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の存在を示す提示情報を表示し、第2段(下段)に「l」と「n」の連続を示す提示情報を表示する。
図16(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図16(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図16(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0100】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0101】
なお、
図16(c)に示す例文の▲ぴん▼音、及び、
図16(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0102】
図17は、上述の「い」、「は」、「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図17(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0103】
また、提示生成部35は、「い」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、また、現状はルールに該当していないが、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分、及び、文字列同士の距離が評価に影響する影響範囲を示すように、提示情報を表示する。また、提示生成部35は、提示情報を表示する場合、「X」のルールに従って、半円形状の提示情報を用いると共に、「A」のルールに従って、提示情報の向きを、提示情報の形が形成されるように表示する。すなわち、この場合、提示生成部35は、半円形状の各提示情報の直線の部分同士を相対向させることで、2つの提示情報で円形状が形成されるように、提示情報の表示を行う。
【0104】
図17(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図17(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図17(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0105】
また、提示生成部35は、
図17(b)及び
図17(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0106】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0107】
なお、
図17(c)に示す例文の▲ぴん▼音、及び、
図17(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0108】
図18は、上述の「い」、「は」、「第2」、「B」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図18(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0109】
また、提示生成部35は、「い」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、また、現状はルールに該当していないが、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分、及び、文字列同士の距離が評価に影響する影響範囲を示すように、提示情報を表示する。また、提示生成部35は、提示情報を表示する場合、「X」のルールに従って、半円形状の提示情報を用いると共に、「B」のルールに従って、提示情報の向きを、提示情報の形が形成されないように表示する。すなわち、この場合、提示生成部35は、半円形状の各提示情報の孤の部分同士を相対向させることで、2つの提示情報で円形状が形成されないように表示する。
【0110】
図18(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図18(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図18(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0111】
また、提示生成部35は、
図18(b)及び
図18(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0112】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0113】
なお、
図18(c)に示す例文の▲ぴん▼音、及び、
図18(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0114】
図19は、上述の「い」、「ろ」、「は」、「第2」、「A」及び「X」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図19(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0115】
また、提示生成部35は、「い」、「ろ」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、語の内部の規則該当箇所のみ、及び、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分に提示情報を表示する。また、提示生成部35は、「第2」、「A」及び「X」の各ルールに従って、2つの半円形状の提示情報を、相対向させることで円形状を形成するように表示する。
【0116】
図19(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図19(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図19(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0117】
また、提示生成部35は、
図19(b)及び
図19(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0118】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0119】
なお、
図19(c)に示す例文の▲ぴん▼音、及び、
図19(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0120】
図20は、上述の「い」、「ろ」、「は」、「第1」及び「A」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図20(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0121】
また、提示生成部35は、「い」、「ろ」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、語の内部の規則該当箇所のみ、及び、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分に提示情報を表示する。また、「い」、「ろ」、「は」、「第1」及び「A」の各ルールでは、提示情報の形状及び表示する向きが特定されない。このため、提示生成部35は、表示する向きに影響されない、例えば四角形状の提示情報を表示する。
【0122】
図20(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図20(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図20(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0123】
また、提示生成部35は、
図20(b)及び
図20(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0124】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0125】
なお、
図20(c)に示す例文の▲ぴん▼音、及び、
図20(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0126】
図21は、上述の「い」、「ろ」、「は」、「第1」、「A」及び「M」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図21(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0127】
また、提示生成部35は、「い」、「ろ」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、語の内部の規則該当箇所のみ、及び、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分に提示情報を表示する。また、「い」、「ろ」、「は」、「第1」及び「A」の各ルールでは、提示情報の形状及び表示する向きが特定されない。このため、提示生成部35は、表示する向きに影響されない、例えば四角形状の提示情報を表示する。
【0128】
ただ、この例の場合、色以外の模様等の視覚情報で、提示情報を表示する「M」のルールが適用されている。このため、提示生成部35は、
図21(a)に示すように、所定の模様の四角形状の提示情報を表示する。
【0129】
図21(c)は、この例文の▲ぴん▼音(PINYIN)を示している。また、
図21(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図21(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0130】
また、提示生成部35は、
図21(b)及び
図21(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0131】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0132】
なお、
図21(c)に示す例文の▲ぴん▼音、及び、
図21(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0133】
図22は、上述の「い」、「ろ」、「は」、「第2」、「B」及び「Y」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合、表示する規則が3つとなるため、提示生成部35は、
図22(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示する。また、提示生成部35は、第3段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0134】
また、中国語においては、「ao」及び「ou」は区別しにくい。このため、提示生成部35は、「ao」を含む音節の前後2音節の範囲に、上述のバー状(長方形状)の掲示情報を表示する。同様に、提示生成部35は、「ou」を含む音節の前後2音節の範囲に、上述のバー状(長方形状)の掲示情報を表示する。例えば、
図22(a)の例文の「有(you)」は、「ou」を含む。このため、提示生成部35は、「有」の形態素の左方向に隣接する「林鎮」の2つの形態素から、「有」の形態素の右方向に隣接する「个六」の2つの形態素までの長さのバー状の提示情報を表示する。
【0135】
また、提示生成部35は、「い」、「ろ」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、語の内部の規則該当箇所のみ、及び、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分に提示情報を表示する。また、提示生成部35は、「Y」のルールに基づいて、
図22(a)に示すように、三角形状の提示情報を表示する。
【0136】
図22(c)は、
図22(a)の例文の▲ぴん▼音(PINYIN)を示している。また、
図22(b)は、提示情報が表示された形態素に対応する置換候補情報である。また、
図22(d)は、各置換候補情報の▲ぴん▼音(PINYIN)を示している。
【0137】
提示生成部35は、
図22(b)及び
図22(d)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、同様の意味を有する置換候補情報を表示する。
【0138】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、上述のように、テキスト評価部33で算出される、発音のし易さに対応する評価結果(例えば、スコア)を向上させることができる。
【0139】
なお、
図22(c)に示す例文の▲ぴん▼音、及び、
図22(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0140】
図23は、上述の「い」、「ろ」、「は」、「第2」、「B」、「Y」及び「ス」の各ルールに対応する提示情報の、中国語の例文に対する表示例を示す図である。この場合も、表示する規則が2つとなるため、提示生成部35は、
図23(a)に示すように、例文を高さ方向に2等分に分割し、第1段(上段)に「l」の連続を示す提示情報を表示し、第2段(下段)に「l」に隣接する「n」の存在を示す提示情報を表示する。
【0141】
また、提示生成部35は、「い」、「ろ」及び「は」の各ルールに従って、語の境界の規則該当箇所のみ、語の内部の規則該当箇所のみ、及び、並べ替えを行った際に、語の境界で、ユーザによるテキスト操作によって規則該当する可能性がある部分に提示情報を表示する。また、提示生成部35は、「Y」のルールに基づいて、
図23(a)に示すように、三角形状の提示情報を表示する。
【0142】
さらに、提示生成部35は、「ス」のルールに従って、ユーザがテキスト操作を行うことで改善される評価結果であるスコアをリアルタイムに更新する。具体的には、提示生成部35は、
図23(a)に示すように、発音し難い箇所である、「l」が存在する箇所、及び、「l」と「n」が連続する箇所の下に、
図23(b)に示すように同様の意味を有する置換候補情報(代替単語)を表示する。
【0143】
ユーザは、提示情報が表示されている形態素と置換候補情報を入れ替え操作する。これにより、発音のし易さに対応する評価結果(スコア)が、テキスト評価部33により、リアルタイムで算出されて更新される。
図23(a)に示すスコアは、置換候補情報を入れ替え操作する前(改善前)のスコアであり、この例では、「61.5点」である。これに対して、
図23(c)に示すスコアは、置換候補情報の入れ替え操作後(改善後)のスコアであり、この例では、「80点」である。すなわち、置換候補情報の入れ替え操作を行うことで発音のし易さが向上したことを意味している。このようなスコアの更新は、リアルタイムで行われるため、ユーザは、置換候補情報の入れ替え操作を行った直後に、発音のし易さの評価結果(スコア)を確認することができる。
【0144】
なお、
図23(c)に示す例文の▲ぴん▼音、及び、
図23(d)に示す置換候補情報の▲ぴん▼音(PINYIN)は、提示情報として表示してもよいし、表示しなくてもよい。
【0145】
(実施の形態の効果)
以上の説明から明らかなように、実施の形態の文書評価システムは、テキストの高さMを、表示する規則の数Nに基づいて均等にM/Nの高さの高さ領域に分割し、各高さ領域を、対応する規則の表示領域に割り当てる。そして、規則に該当する提示情報を、その規則に対して予め割り当てられている高さ領域に表示する。
【0146】
これにより、テキスト中の所定の規則に該当する箇所を示す提示情報を、短時間かつ簡潔に表示可能とすることができる。
【0147】
また、テキストの各形態素情報に対する置換候補情報を形成して表示し、対応する形態素を入れ替え操作可能とすることで、特定尺度で評価した場合に,高い評価の文書を形成可能とすることができる。
【0148】
また、各形態素の並びにおける、例えば発音のし易さに関する評価結果(例えば、スコア)等の、特定尺度で評価した場合の評価結果(例えば、スコア)を算出して表示する。ユーザは、この評価結果と共に、図形等の提示情報で評価結果を視認できるため、短時間かつ簡潔に評価結果を認識可能とすることができる。
【0149】
また、各形態素が置換候補情報と入れ替え操作された際に、入れ替え操作された各形態素の並びにおける、特定尺度で評価した場合の評価結果(例えば、スコア)を、再度、算出して表示する。ユーザは、入れ替え操作前後のスコアを見ることで、入れ替え操作による改善度を認識することができる。
【0150】
最後に、上述の実施の形態は、一例として提示したものであり、本発明の範囲を限定することは意図していない。この新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことも可能である。
【0151】
例えば、表示する提示情報の種類が多くなると、その分、高さ領域の高さが低くなり、表示した提示情報が視認し難くなるおそれがある。このため、提示生成部35は、表示する提示情報の種類の数に応じて、表示するテキストの文字情報を、徐々に大きく表示する。これにより、提示情報の種類の数に応じて、高さ領域を高くすることができ、視認し易い状態で提示情報を表示できる。
【0152】
また、実施の形態及び実施の形態の変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0153】
1 クライアント端末装置
2 第1のサーバ装置
3 第2のサーバ装置
10 入出力機能
11 提示情報生成機能
12 テキスト管理機能
20 入出力部
31 テキスト要素分析部
32 テキスト要素分析読み出し部
33 テキスト評価部
34 テキスト評価ルール読み出し部
35 提示生成部
36 提示ルール読み出し部
37 テキスト編集方法分析部37
38 テキスト編集ルール読み出し部
40 テキスト管理部
【先行技術文献】
【特許文献】
【0154】