【課題を解決するための手段】
【0009】
上記の目的を実現すべく、1つの実施形態として、本発明が提供する英語の音節計算法
に基づいた可読性評価方法は、ターゲット文書取得端末と標準化処理サーバと可読性コン
ピューティングサーバと可読性フィードバック端末とを含む可読性フィードバックプラッ
トフォームにおいて実現され、
所定の取得方法によってターゲット文書を取得する。句読点に基づいてターゲット文書
を文章分割して総文章数を得る。分割された各文章に正規表現によって単語分割処理を施
して、総単語数を得る、ターゲット文書取得端末が行うステップS1と、
ステップS1で得られたターゲット文書における各単語を入力語として、それぞれプリ
セット標準化方法に従って標準化処理を行い、標準化処理された複数の単語を得る、標準
化処理サーバが行うステップ2と、
ステップS2で得られたすべての標準化処理された単語を新たな入力語として、それぞ
れプリセット変換条件に従って音節数を算出する。各入力語の音節数の和を総音節数とす
る、標準化処理サーバが行うステップ3と、
前記総文章数、総単語数及び総音節数を下記2つのプリセット可読性導出式
【数1】
に代入し、可読性係数(Flesch Readability)及びリーディング難易度係数(Flesch-Kin
caid Level)を計算する、可読性コンピューティングサーバが行うステップ4と、
可読性係数及びリーディング難易度係数の計算結果と、取得された目標文書とを同時に
表示して、ユーザにフィードバックする、可読性フィードバック端末が行うステップ5と
を含む。
【0010】
前記所定の取得方法は、
英語検索をサポートするすべてのウェブサイトを含む検索エンジンを使用してキーワー
ドに基づいて検索し、インデックスから要件を満たしているテキストスニペット又は文書
を検索する方法1、ユーザが文書を入力する方法2、及び、その他の方法のいずれかであ
る。
【0011】
ステップS1において方法1を用いた場合、検索エンジン及びキーワードによって検索
されたターゲット文書又はテキストスニペットを利用して、可読性係数及びリーディング
難易度係数の計算結果を、当該ターゲット文書若しくはテキストスニペットの下方又はタ
イトルの上方に同時に表示させる。
【0012】
ステップS1において方法2を用いた場合、可読性フィードバックプラットフォームの
ウィンドウの検出によってユーザが入力した目標文書を得て、且つ可読性ボタンの選択を
トリガすると、前記可読性フィードバックプラットフォームによって当該目標文書を分析
して、可読性係数及びリーディング難易度係数を計算し、これらの計算結果を、可読性フ
ィードバックプラットフォームにおけるウィンドウのタイトルの上方に自動的に表示させ
る。
【0013】
好ましくは、ステップS2における前記プリセット標準化方法は、サフィックス文字の
変換及び語頭のプレフィックスの付加を含む。
【0014】
前記サフィックス文字の変換において、入力語を一般的なサフィックス文字及び要変換
サフィックス文字に分ける。前記要変換サフィックス文字は、サフィックス2文字、サフ
ィックス3文字、サフィックス4文字、サフィックス5文字及びサフィックス7文字の5
つのカテゴリを含む。前記一般的なサフィックス文字については変換しない。サフィック
スn文字における最後のn個の文字を、対応するサフィックス変換キーに変換する。ここ
で、n=2、3、4、5、7である。
【0015】
前記語頭のプレフィックスの付加において、入力語を一般的なプレフィックス文字及び
要変換プレフィックス文字に分ける。前記要変換プレフィックス文字は、プレフィックス
2文字、プレフィックス3文字、プレフィックス4文字、プレフィックス5文字の4つの
カテゴリを含む。前記一般的なプレフィックス文字については変換しない。プレフィック
スm文字における最初のm個の文字を、対応するプレフィックス変換キーに変換する。こ
こで、m=2、3、4、5である。
【0016】
好ましくは、ステップS3におけるプリセット変換条件は、入力語のすべてが「y」を
含まない子音アルファベットの場合、音節の出力数を入力語の語長に等しくし、
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長が
3未満の場合、音節数を1として出力し、
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長
が3に等しい場合には、
(1)1番目及び3番目の文字が、いずれも任意の母音アルファベット又はアルファベ
ットの「y」であり、2番目が子音アルファベットである場合、音節数を2として出力し
、
(2)1番目、2番目及び3番目の文字が、いずれも任意の母音アルファベット又はア
ルファベットの「y」である場合、音節数を3として出力し、
(3)上記の(1)及び(2)以外の場合、音節数を1として出力する、といういずれ
か条件で処理を行うものであって
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長が
3より大きい場合、入力語を語頭から語尾へスキャンする。入力語に特徴語列が存在する
場合、特徴語列を対応する拡張語列に置き換えて置換語を得る。そして、置換語における
母音列の数を計算する。1つ又は結合された複数の「a、e、i、o、u若しくはy」を
、1つの母音列(即ち、置換語における複数の母音列は、yを除いた子音アルファベット
によって分離された複数の文字列であり、結合される「a、e、i、o、u若しくはy」
の数量に関わらず、yを除いたいずれかの子音アルファベットが真ん中に存在しない限り
、ただ1つの母音列である)とする。置換語の最後の1文字が「e」である場合、当該置
換語の最後の1文字を削除する。置換語の最初の2文字が「mc」である場合、音節数を
、母音列の数に1を加えたものとする。置換語の最初の2文字が「mc」でない場合、音
節数を母音列の数に等しくする。
【0017】
好ましくは、3文字から構成され、1番目の文字が、アルファベットaからアルファベ
ットzまでの任意のアルファベットであり、2番目の文字と3番目の文字との組合せは、
「ia」、「io」、「iu」、「ae」、「eo」及び「iy」のうちの1つである。
拡張語列は4文字で構成されている。拡張語列の1番目の文字、2番目の文字及び4番目
の文字は、対応する特徴語列の1番目の文字、2番目の文字及び3番目の文字とそれぞれ
同じであるものとして特徴語列が定義される。3番目の文字が特徴語列の1番目の文字と
同じであるものとして特徴語列が定義される。
【0018】
本発明は、英語の音節計算法に基づいた可読性評価アプリケーションプラットフォーム
としてのシステムをさらに提供する。前記アプリケーションプラットフォームは、ターゲ
ット文書取得端末と標準化処理サーバと可読性コンピューティングサーバと可読性フィー
ドバック端末とを含む。前記ターゲット文書取得端末は、所定の取得方法によりターゲッ
ト文書を取得して、当該ターゲット文書を前記標準化処理サーバに送信するものであって
、
ターゲット文書に対して句読点に基づいて文章分割処理を行い且つ分割された各文章に
正規表現によって単語分割処理を施す前処理を行い、ターゲット文書が前処理された後に
取得されたターゲット文書の総文章数及び総単語数を、前記可読性コンピューティングサ
ーバに送信する。
【0019】
前記標準化処理サーバは、ターゲット文書を読み取り、プリセット標準化方法に従って
ターゲット文書に対して標準化処理を行い、プリセット変換条件に従って総音節数を取得
して、当該総音節数を可読性コンピューティングサーバに送信するために用いられるもの
であって、標準化処理された単語を得る標準化処理モジュール、及び、標準化処理された
単語についてプリセット変換条件に従って音節数を算出するためのスキャン変換モジュー
ルを含む。各入力語の音節数の和を総音節数とする。
【0020】
前記可読性コンピューティングサーバは、可読性係数及びリーディング難易度係数を得
るために、前記総文章数、総単語数及び総音節数を、可読性係数(Flesch Readability)
の計算式及びリーディング難易度係数(Flesch-Kincaid Level)の計算式を含むプリセッ
ト可読性導出式
【数1】
に代入する。
【0021】
前記可読性フィードバック端末は、ディスプレイにおいてアクティブウィンドウとして
、可読性係数及びリーディング難易度係数の計算結果と取得されたターゲット文書とを同
時に表示してユーザにフィードバックするために用いられる。
【0022】
好ましくは、前記標準化処理モジュールには、サフィックス文字の変換及び語頭のプレ
フィックスの付加を含むプリセット標準化方法が設定されている。
【0023】
前記サフィックス文字の変換において、入力語を一般的なサフィックス文字及び要変換
サフィックス文字に分ける。前記要変換サフィックス文字は、サフィックス2文字、サフ
ィックス3文字、サフィックス4文字、サフィックス5文字及びサフィックス7文字の5
つのカテゴリを含む。前記一般的なサフィックス文字は変換されない。サフィックスn文
字における最後のn個の文字を、対応するサフィックス変換キーに変換する。ここで、n
=2、3、4、5、7である。
【0024】
前記語頭のプレフィックスの付加において、入力語を一般的なプレフィックス文字及び
要変換プレフィックス文字に分ける。要変換プレフィックス文字は、プレフィックス2文
字、プレフィックス3文字、プレフィックス4文字、プレフィックス5文字の4つのカテ
ゴリを含む。前記一般的なプレフィックス文字については変換しない。プレフィックスm
文字における最初のm個の文字は、対応するプレフィックス変換キーに変換される。ここ
で、m=2、3、4、5である。
【0025】
好ましくは、スキャン変換モジュールには、プリセット変換条件が設定されている。前
記プリセット変換条件は、
入力語のすべてが「y」を含まない子音アルファベットの場合、音節の出力数を入力語
の語長に等しくし、
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長が
3未満の場合、音節数を1として出力し、
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長が
3に等しい場合には、
(1)1番目及び3番目の文字が、いずれも任意の母音アルファベット又はアルファベ
ットの「y」であり、2番目が子音アルファベットである場合、音節数を2として出力し
、
(2)1番目、2番目及び3番目の文字が、いずれも任意の母音アルファベット又はア
ルファベットの「y」である場合、音節数を3として出力し、
(3)上記の(1)及び(2)以外の場合、音節数を1として出力する、といういずれ
か条件で処理を行うものである。
【0026】
入力語に任意の母音アルファベット又はアルファベットの「y」が含まれ、且つ語長が
3より大きい場合、入力語を語頭から語尾へスキャンする。入力語に特徴語列が存在する
場合、特徴語列を対応する拡張語列に置き換えて置換語を得る。置換語における母音列の
数を計算する。1つ又は結合された複数の「a、e、i、o、u若しくはy」を、1つの
母音列(即ち、置換語における複数の母音列は、yを除いた子音アルファベットによって
分離された複数の文字列であり、結合される「a、e、i、o、u若しくはy」の数量に
関わらず、yを除いたいずれかの子音アルファベットが真ん中に存在しない限り、ただ1
つの母音列である)とする。置換語の最後の1文字が「e」である場合、当該置換語の最
後の1文字を削除する。置換語の最初の2文字が「mc」である場合、音節数を、母音列
の数に1を加えたものとする。置換語の最初の2文字が「mc」でない場合、音節数を母
音列の数に等しくする。
【0027】
好ましくは、3文字から構成され、1番目の文字が、アルファベットaからアルファベ
ットzまでの任意のアルファベットであり、2番目の文字と3番目の文字との組合せは、
「ia」、「io」、「iu」、「ae」、「eo」及び「iy」のうちの1つであるも
のとして特徴語列が定義される。4文字で構成されており、1番目の文字、2番目の文字
及び4番目の文字が対応する特徴語列の1番目の文字、2番目の文字及び3番目の文字と
それぞれ同じであり、3番目の文字が特徴語列の1番目の文字と同じであるものとして拡
張語列が定義される。