特許第5836981号(P5836981)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許5836981文書評価パラメータ調整装置、方法、及びプログラム
<>
  • 特許5836981-文書評価パラメータ調整装置、方法、及びプログラム 図000003
  • 特許5836981-文書評価パラメータ調整装置、方法、及びプログラム 図000004
  • 特許5836981-文書評価パラメータ調整装置、方法、及びプログラム 図000005
  • 特許5836981-文書評価パラメータ調整装置、方法、及びプログラム 図000006
  • 特許5836981-文書評価パラメータ調整装置、方法、及びプログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5836981
(24)【登録日】2015年11月13日
(45)【発行日】2015年12月24日
(54)【発明の名称】文書評価パラメータ調整装置、方法、及びプログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20151203BHJP
   G06F 17/27 20060101ALI20151203BHJP
【FI】
   G06F17/30 220Z
   G06F17/30 170A
   G06F17/27 615
   G06F17/27 640
【請求項の数】3
【全頁数】11
(21)【出願番号】特願2013-9403(P2013-9403)
(22)【出願日】2013年1月22日
(65)【公開番号】特開2014-142702(P2014-142702A)
(43)【公開日】2014年8月7日
【審査請求日】2015年1月14日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】特許業務法人太陽国際特許事務所
(72)【発明者】
【氏名】西川 仁
(72)【発明者】
【氏名】牧野 俊朗
(72)【発明者】
【氏名】松尾 義博
【審査官】 山本 俊介
(56)【参考文献】
【文献】 特開平10−171850(JP,A)
【文献】 特開2009−32240(JP,A)
【文献】 米国特許出願公開第2009/0287695(US,A1)
【文献】 浅野陽子,日本文の可読性の測度と表示速度への応用,情報処理学会論文誌,日本,社団法人情報処理学会,1991年12月15日,第32巻,第12号,pp.1574−1582
【文献】 芝 温子,ユーザの嗜好を反映する図書検索システム,第52回(平成8年前期)全国大会講演論文集(6) ハードウェア 並列処理 システム,日本,社団法人情報処理学会,1996年 3月 6日
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06F 17/27
(57)【特許請求の範囲】
【請求項1】
特定の読み手によって文書の可読性に関する可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出する特徴量抽出手段と、
文書の前記可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段と、
前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するパラメータ調整手段と、
を含む文書評価パラメータ調整装置。
【請求項2】
特徴量抽出手段、パラメータ調整手段、及び文書の可読性に関する可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段を含む文書評価パラメータ調整装置における文書評価パラメータ調整方法であって、
前記特徴量抽出手段によって、特定の読み手によって前記可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出するステップと、
前記パラメータ調整手段によって、前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するステップと、
を含む文書評価パラメータ調整方法。
【請求項3】
文書の可読性に関する可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段を含むコンピュータを、
特定の読み手によって文書の可読性に関する可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出する特徴量抽出手段、及び
前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するパラメータ調整手段
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書評価パラメータ調整装置、方法、及びプログラムに関し、特に、可読性評価値を求めるためのパラメータを得るための文書評価パラメータ調整装置、方法、及びプログラムに関する。
【背景技術】
【0002】
近年、電子化されたテキスト(文書)が大量に流通するようになった。インターネットをはじめネットワーク上に存在する文書は様々な書き手によって書かれているが、全ての書き手が文書をわかりやすく記述するための十分な訓練を受けているとは限らない。そのため、文書の中には、理解しづらいものや、読み手のために加筆や修正を必要とするものも存在する。
【0003】
このような状況において読み手を支援する一つの方法は、文書の読みやすさ(可読性)を機械的に評価する仕組みを作り、読みやすい(可読性が高い)と判定された文書を優先的に読み手に提示することである。
【0004】
文書の可読性を機械によって評価することができれば、可読性の高い文書のみを読み手に提示するだけでなく、書き手に対して文書の可読性に関する評価を与えることによって、書き手に対して文書をより読みやすく(可読性が高く)なるように書き換えるよう指示することもできると期待できる。
【0005】
文書の可読性を把握する方法として、非特許文献1は重回帰モデルを利用し、文書と、人手で与えたその文書の可読性評価情報の組を予め用意し、それを学習事例として重回帰モデルのパラメータを学習することで文書の可読性を評価する方法を提案している。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】柴崎秀子, 玉岡賀津雄,「 国語科教科書を基にした小・中学校の文章難易学年判定式の構築」, 日本教育工学会論文誌, Vol.33, No.4, pp.449-458, 2010.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、非特許文献1の技術では、文書の可読性を把握する際に、ある特定の読み手に関する情報を全く考慮していないという問題がある。すなわち、非特許文献1の学習事例における読みやすい文書と、ある特定の読み手にとって読みやすい文書が乖離している場合、その特定の読み手にとってはその学習事例から学習されたパラメータは役に立たないものとなってしまう。
【0008】
この問題に対する一つの方法は、読み手一人一人が学習事例を用意して、読み手一人ひとりの学習事例から学習されたある特定の読み手のためのパラメータを用いてその読み手のために可読性評価を行うことであるが、実際には一人の読み手が大量の学習事例に対して可読性評価情報を付与することは現実的ではない。
【0009】
本発明は、上記の事情を鑑みてなされたもので、特定の読み手による文書の可読性評価を行うためのパラメータを簡易な処理で得ることができる文書評価パラメータ調整装置、方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記の目的を達成するために本発明に係る文書評価パラメータ調整装置は、特定の読み手によって文書の可読性に関する可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出する特徴量抽出手段と、文書の前記可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段と、前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するパラメータ調整手段と、を含んで構成されている。
【0011】
本発明に係る文書評価パラメータ調整方法は、特徴量抽出手段、パラメータ調整手段、及び文書の可読性に関する可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段を含む文書評価パラメータ調整装置における文書評価パラメータ調整方法であって、前記特徴量抽出手段によって、特定の読み手によって前記可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出するステップと、前記パラメータ調整手段によって、前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するステップと、を含む。
【0012】
本発明に係るプログラムは、文書の可読性に関する可読性評価値を求めるための予め学習された可読性予測モデルで用いられるパラメータを記憶する記憶手段を含むコンピュータを、特定の読み手によって文書の可読性に関する可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出する特徴量抽出手段、及び前記複数の文書の各々について前記特徴量抽出手段によって抽出された前記複数の特徴量に基づいて、前記複数の文書の各々についての、前記予め付与された前記可読性評価値と、前記複数の特徴量及び前記パラメータに基づく前記可読性評価値の予測値との差分絶対値が小さくなり、かつ前記記憶手段に記憶された前記パラメータとの差分絶対値が小さくなるように、前記記憶手段に記憶された前記パラメータを調整するパラメータ調整手段として機能させるためのプログラムである。
【0013】
本発明に係る文書評価パラメータ調整装置、方法、及びプログラムによれば、特徴量抽出手段によって、特定の読み手によって文書の可読性に関する可読性評価値が予め付与された複数の文書の各々について、文書の可読性に関する複数の特徴量を抽出する。
【0014】
そして、パラメータ調整手段によって、複数の文書の各々について特徴量抽出手段によって抽出された複数の特徴量に基づいて、複数の文書の各々についての、予め付与された可読性評価値と、複数の特徴量及びパラメータに基づく可読性評価値の予測値との差分絶対値が小さくなり、かつ記憶手段に記憶されたパラメータとの差分絶対値が小さくなるように、記憶手段に記憶されたパラメータを調整する。
【発明の効果】
【0015】
以上説明したように、本発明の文書評価パラメータ調整装置、方法、及びプログラムによれば、特定の読み手によって可読性評価値が予め付与された複数の文書の各々について、複数の特徴量を抽出し、予め付与された可読性評価値と、複数の特徴量及びパラメータに基づく可読性評価値の予測値との差分絶対値が小さくなり、かつ記憶されたパラメータとの差分絶対値が小さくなるように、パラメータを調整することにより、特定の読み手による文書の可読性評価を行うためのパラメータを簡易な処理で得ることができる、という効果が得られる。
【図面の簡単な説明】
【0016】
図1】本発明の実施の形態に係る文書評価パラメータ調整装置の一構成例を示すブロック図である。
図2】本発明の実施の形態に係る文書評価パラメータ調整装置に入力される文書データの一例を示す図である。
図3】文書と当該文書の可読性評価値(可読性評価情報)の一例を示す図である。
図4】パラメータデータベースに格納される重みベクトルw^の一例を示す図である。
図5】本発明の実施の形態に係る文書評価パラメータ調整装置におけるパラメータ調整処理ルーチンの内容を示すフローチャートである。
【発明を実施するための形態】
【0017】
<概要>
まず、本発明の実施の形態の概要について説明する。
【0018】
本発明の実施の形態は、予め用意されている学習事例から学習されたパラメータを、ある特定の読み手の可読性評価に適合するように調整する。具体的には、上記非特許文献1のような、事前に学習事例を利用して学習されたパラメータを、別途用意した、特定の読み手が可読性についての評価を与えた少量の文書を利用して、特定の読み手にとって読みやすい文書に高い可読性評価値を与えるように調整する。
【0019】
<システム構成>
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は、本発明の実施の形態に係る文書評価パラメータ調整装置100を示すブロック図である。文書評価パラメータ調整装置100は、CPUと、RAMと、後述するパラメータ調整処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
【0020】
本実施の形態に係る文書評価パラメータ調整装置100は、図1に示すように、入力部1と、演算部2と、出力部3とを備えている。
【0021】
入力部1は、入力された複数の文書(テキスト)からなる文書群(テキスト群)を受け付ける。例えば、文書として図2に示すようなデータを入力することができる。図2では、文書が文に分割され、更に形態素解析および係り受け解析が行われた結果を示すデータが入力として与えられた場合を示している。図2に示す表の各行がそれぞれ一形態素に対応しており、形態素の属する文節の番号、その文節の係り先、形態素の表記、読み、品詞、の情報がある。また、入力部1は、文書と共に、ある特定の読み手によって予め付与された可読性評価情報を教師情報として受け付ける。可読性評価情報には、ある特定の読み手によって当該文書毎に予め付与された可読性評価値が含まれている。
【0022】
可読性評価値は、1から5までの整数とし、1を読みづらい、2をどちらかというと読みづらい、3をどちらでもない、4をどちらかというと読みやすい、5を読みやすい、という形で与える。文書と当該文書の可読性評価値の組の一例を図3に示す。
【0023】
演算部2は、訓練事例データベース201と、特徴量抽出部202と、パラメータデータベース203と、パラメータ調整部204とを備えている。
【0024】
訓練事例データベース201には、入力部1により受け付けた複数の文書からなる文書群及び当該文書群の文書毎の可読性評価値が記憶されている。
【0025】
特徴量抽出部202は、訓練事例データベース201に記憶された文書群の文書の各々について、文書の可読性に関する複数の特徴量を抽出する。
【0026】
具体的には、特徴量抽出部202は、訓練事例データベース201に記憶された各文書xから複数の特徴量を抽出し、各文書xの特徴ベクトルf^(x)を算出する。なお、記号に付された「^」は、当該記号が行列または多次元配列またはベクトルであることを表わしている。特徴ベクトルf^(x)は実数を要素とするベクトルであり、言語尤度、エンティティ・グリッド、文間の類似度といった特徴量を要素として持つ。
【0027】
ここで、言語尤度とは、ある単語列の文としての尤もらしさを表す数値である。文書を構成する各文の言語尤度、あるいはそれらの和や平均値、あるいは最大値や最小値を特徴量として用いることで、文書の可読性を評価することができる。本実施の形態では、文の言語尤度の和と、文の言語尤度の平均値とを言語尤度に関する特徴量として抽出する。
【0028】
エンティティ・グリッドとは、文中に出現する名詞句の構文役割の変遷を利用して、文書の可読性を評価する方法である(参考文献(横野光, 奥村学, 「テキスト結束性を考慮したentity grid に基づく局所的一貫性モデル」, 自然言語処理, Vol.17, No.1, pp.161-182, 2010.)を参照)。エンティティ・グリッドに基づき、文書を構成する文の間における構文役割の変化を捉え、文書の可読性を評価することができる。本実施の形態では、エンティティ・グリッドを表わすベクトルの各要素についての和をエンティティ・グリッドに関する特徴量として各々抽出する。
【0029】
文間の類似度とは、文書を構成する複数の文同士の類似度である。例えば10文からなる文書の場合は、それらの文の間となる9つの文間の各々において文間の類似度を計算し、各文間の類似度、あるいはそれの和や平均値、最大値や最小値を特徴量として用いることで文書の可読性を評価することができる。本実施の形態では、文間の類似度の和、及び文間の類似度の平均値を、文間の類似度に関する特徴量として抽出する。
【0030】
上記の特徴量は一例であって、上に述べた言語尤度に関する特徴量、エンティティ・グリッドに関する特徴量、文間の類似度に関する特徴量以外の、他の任意の特徴量を抽出してもよい。
【0031】
パラメータデータベース203には、文書の可読性評価値を求めるための上記複数の特徴量の各々に対する重みが予め記憶されている。
具体的には、パラメータデータベース203には、複数の特徴量の各々に対する重みを表わす重みベクトルw^が記憶されている。重みベクトルw^が格納されるパラメータデータベース203の一例を図4に示す。図4に示す表の左側の列は、特徴量抽出部202によって抽出される特徴量の一部であり、それらに対応する右側の列はそれらの特徴量の重みである。図4に示す例は、特徴量抽出部202を説明する際に述べた、文間の類似度の和や、文間の類似度の平均値といった特徴量がそれぞれどの程度の重みを持っているかを示している。なお、図4に示す「SS」「SO」「SX」「S−」「OS」「OO」「OX」は、エンティティ・グリッドを表わすベクトルの各要素を示している。
【0032】
パラメータデータベース203に記憶されている重みベクトルw^は、複数の学習事例(学習用文書と任意の読み手により付与された可読性評価値との複数ペア)を用いた学習処理により予め求められた可読性予測モデルで用いられるパラメータである。なお、パラメータデータベース203は、記憶手段の一例である。
【0033】
パラメータ調整部204は、特徴量抽出部202によって複数の文書について抽出された複数の特徴量に基づいて、複数の文書の各々についての、予め付与された可読性評価値と、複数の特徴量及び重みベクトルに基づく可読性評価値の予測値との差分絶対値が小さくなり、かつパラメータデータベース203に記憶された複数の特徴量の各々に対する重みとの差分絶対値が小さくなるように、パラメータデータベース203に記憶された複数の特徴量の各々に対する重みを調整する。
【0034】
具体的には、パラメータ調整部204は、まず、入力部1により入力されたn個の文書x,x,…,xについて、特徴量抽出部202で抽出された特徴量としての特徴ベクトルf^(x)とその可読性評価値yとのn個の組を、訓練データT={(f^(x),y),(f^(x),y),…,(f^(x), y)}としてメモリ(図示省略)に記憶する。そして、パラメータデータベース203に格納されたパラメータとしての重みベクトルをw^、ある特定の読み手に対して調整された重みベクトルをw^とすると、w^とTを用いて、一例として、以下の(1)式を解くことによって、重みベクトルw^を重みベクトルw1^に調整する。
【0035】
【数1】
【0036】
ここで、w^・f^(x)は重みベクトルの変数w^と文書xの特徴ベクトルf(x)との内積であり、可読性評価値の予測値に相当する。λは重みの変化の大きさを制御するハイパーパラメータである。すなわち、上記(1)式を解くことで、予め別途用意されているパラメータw^との差が少なく、かつ、ある特定の読み手によって与えられた可読性評価値をできるだけうまく予測するような新しいw^を得ることができる。上記(1)式は、一例として、確率的勾配降下法などのアルゴリズムを用いて解くことができる。
【0037】
出力部3は、パラメータ調整部204で調整したパラメータとして、重みベクトルw^を結果として出力する。
【0038】
特定の読み手の可読性評価値を算出する場合には、算出対象の文書から複数の特徴量を抽出し、重みベクトルw^を用いた可読性予測モデル(例えば、重回帰モデル)に基づいて、可読性評価値を算出する。
【0039】
<文書評価パラメータ調整装置の作用>
次に、本実施の形態に係る文書評価パラメータ調整装置100の作用について説明する。まず、文書評価パラメータ調整装置100は、複数の学習事例を用いた学習処理により、可読性予測モデルを学習し、学習された可読性予測モデルで用いられる、各特徴量に対する重みを表わす重みベクトルw^を、パラメータデータベース203に格納しておく。そして、複数の文書である文書群と、当該複数の文書の各々について予め付与された可読性評価値(教師情報)とが文書評価パラメータ調整装置100に入力されると、文書評価パラメータ調整装置100によって、入力された文書群及び可読性評価値が、訓練事例データベース201へ格納される。そして、文書評価パラメータ調整装置100によって、図5に示すパラメータ調整処理ルーチンが実行される。
【0040】
まず、ステップS100において、訓練事例データベース201から1つの文書を取り出す。そして、ステップS102において、特徴量抽出部202によって、上記ステップS100において取り出された文書から、文書の可読性に関する複数の特徴量を抽出する。
【0041】
次のステップS104では、パラメータ調整部204によって、上記ステップS102において抽出された文書の各特徴量を、訓練事例データベース201に記憶されている当該文書の可読性評価値と対応付けて、訓練データとしてメモリ(図示省略)に記憶する。
【0042】
次に、ステップS106では、訓練事例データベース201に記憶されている全ての文書について、上記ステップS100〜S104の処理を実行したか否かを判定する。そして、上記ステップS100〜S104の処理を実行していない文書が存在する場合には、上記ステップS100へ戻り、当該文書を取り出す。一方、全ての文書について、上記ステップS100〜S104の処理を実行した場合には、ステップS108へ進む。
【0043】
ステップS108において、パラメータデータベース203から、複数の特徴量の各々に対する予め学習された重みを表わす重みベクトルw^を読み込む。
【0044】
ステップS110において、パラメータ調整部204によって、上記ステップS104でメモリに記憶された複数の訓練データを用いて、上記(1)式を解くことにより、複数の文書の各々についての、予め付与された可読性評価値と、複数の特徴量の重み付き加算値との差分絶対値が小さくなり、かつパラメータデータベース203に記憶された複数の特徴量の各々に対する重みとの差分絶対値が小さくなるように、パラメータデータベース203に記憶された複数の特徴量の各々に対する重みを調整する。
【0045】
そして、ステップS112において、出力部3によって、上記ステップS110で調整された複数の特徴量の各々に対する重みからなる重みベクトルw^を出力し、パラメータ調整処理ルーチンを終了する。
【0046】
以上説明したように、本実施の形態に係る文書評価パラメータ調整装置によれば、特定の読み手によって可読性評価値が予め付与された複数の文書の各々について、複数の特徴量を抽出し、予め付与された可読性評価値と、複数の特徴量に対する重みに基づく可読性評価値の予測値との差分絶対値が小さくなり、かつ記憶された複数の特徴量の各々に対する重みとの差分絶対値が小さくなるように、複数の特徴量の各々に対する重みを調整することにより、特定の読み手による文書の可読性評価を行うためのパラメータを簡易な処理で得ることができる。
【0047】
また、文書の可読性を評価するためのパラメータを、ある特定の読み手に合わせて調整することにより、ある特定の読み手が大量の訓練事例を作成することなく、その読み手にとって読みやすい文書を提示することができる。
【0048】
また、ある特定の読み手によって付与された少量の訓練事例に対する可読性評価情報を利用して、大規模な学習事例から求められた可読性評価のためのパラメータを調整することができる。
【0049】
また、予め学習された文書の可読性を評価するためのパラメータをあまり変化させずに、特定の読み手の評価に適合するように調整することができる。
【0050】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0051】
また、訓練事例データベース201及びパラメータデータベース203は、外部に設けられ、文書評価パラメータ調整装置とネットワークで接続されていてもよい。
【0052】
また、入力部1に入力される文書は図2に示すような形態素解析済みの文書でなくてもよく、通常の文書の形態であってもよい。この場合には、入力された文書に対して、形態素解析を行ってから特徴量を抽出すればよい。
【0053】
また、パラメータ調整部204は、上記(1)式に基づいて、確率的勾配降下法などのアルゴリズムを用いて重みベクトルw^の調整を行う場合を例に説明したが、これに限定されるものではなく、他の方法によって重みベクトルw^の調整を行っても良い。
【0054】
また、読み手によって文書毎に予め付与される可読性評価値は、1から5までの整数とする場合を例に説明したが、これに限定されるものではなく、0あるいは1の整数の2値として、0を読みづらい、1を読みやすいという形にしてもよい。
【0055】
また、重みベクトルw^の調整を行うための少量の訓練事例の文書は、事前に重みベクトルw^を学習する際に用いた学習事例の文書とは異なる場合を例に説明したが、これに限定されるものではなく、訓練事例の文書は学習事例の文書から取り出したものであっても良い。
【0056】
また、重みベクトルw^の予め行われる学習は、文書評価パラメータ調整装置とは別の装置によって行われてもよい。
【0057】
また、可読性予測モデルが、上記非特許文献1に記載されている重回帰モデルである場合を例に説明したが、これに限定されるものではなく、パラメトリックな表現を持った他の可読性予測モデルであってもよい。
【0058】
上述の文書評価パラメータ調整装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
【0059】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
【符号の説明】
【0060】
2 演算部
100 文書評価パラメータ調整装置
201 訓練事例データベース
202 特徴量抽出部
203 パラメータデータベース
204 パラメータ調整部
図1
図2
図3
図4
図5