特開2022-13346 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧 ▶ 国立大学法人名古屋大学の特許一覧

特開2022-13346学習装置、推定装置、学習方法、推定方法、プログラム、及び学習済み推定モデルのプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022013346

(43)【公開日】2022-01-18

(54)【発明の名称】学習装置、推定装置、学習方法、推定方法、プログラム、及び学習済み推定モデルのプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20220111BHJP

【ＦＩ】

G06N20/00 130

【審査請求】有

【請求項の数】16

【出願形態】ＯＬ

(21)【出願番号】P 2020115847

(22)【出願日】2020-07-03

(71)【出願人】

【識別番号】399037405

【氏名又は名称】楽天グループ株式会社

(71)【出願人】

【識別番号】504139662

【氏名又は名称】国立大学法人東海国立大学機構

(74)【代理人】

【識別番号】110000154

【氏名又は名称】特許業務法人はるか国際特許事務所

(72)【発明者】

【氏名】中澤満

(72)【発明者】

【氏名】シュテンガービヨン

(72)【発明者】

【氏名】川西康友

(72)【発明者】

【氏名】井手一郎

(72)【発明者】

【氏名】村瀬洋

(57)【要約】

【課題】推定モデルの精度を向上させる。
【解決手段】学習装置（１０）の訓練データ取得手段（１０２）は、入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する。共起性データ取得手段（１０３）は、項目間の共起性に関する共起性データを取得する。学習手段（１０４）は、訓練データと、共起性データと、に基づいて、推定モデルの学習を行う。
【選択図】図４

【特許請求の範囲】

【請求項1】

入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得手段と、
前記項目間の共起性に関する共起性データを取得する共起性データ取得手段と、
前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習手段と、
を含むことを特徴とする学習装置。

【請求項2】

前記共起性データ取得手段は、前記入力データに対応する前記推定モデルの出力に基づく前記項目間の共起性に関する推定共起性データと、前記正解データに基づく前記項目間の共起性に関する正解共起性データと、を取得し、
前記学習手段は、前記訓練データ、前記推定共起性データ、及び前記正解共起性データに基づいて、前記推定モデルの学習を行う、
ことを特徴とする請求項１に記載の学習装置。

【請求項3】

前記学習手段は、
前記入力データに対応する前記推定モデルの出力と、前記正解データと、に基づいて、第１の損失を計算し、
前記推定共起性データと、前記正解共起性データと、に基づいて、第２の損失を計算し、
前記第１の損失と、前記第２の損失と、に基づいて、前記推定モデルの学習を行う、
ことを特徴とする請求項２に記載の学習装置。

【請求項4】

前記学習手段は、
前記第１の損失と、前記第２の損失と、に基づいて、合計損失を計算し、
前記合計損失に基づいて、前記推定モデルの学習を行う、
ことを特徴とする請求項３に記載の学習装置。

【請求項5】

前記共起性データは、前記正解データにおける前記項目間の出現確率を示す、
ことを特徴とする請求項１～４の何れかに記載の学習装置。

【請求項6】

前記共起性データは、前記項目の組み合わせごとの共起性を示す、
ことを特徴とする請求項１～５の何れかに記載の学習装置。

【請求項7】

前記共起性データ取得手段は、前記正解データに基づいて、前記共起性データを取得する、
ことを特徴とする請求項１～６の何れかに記載の学習装置。

【請求項8】

前記正解データは、前記入力データを評価する評価者の評価結果を示し、
前記入力データは、前記推定モデルの推定対象となる推定対象データと、前記評価者の属性に関する属性データと、を含み、
前記推定モデルには、前記推定対象データと前記属性データが入力され、前記属性データに応じた推定結果が前記推定モデルから出力される、
ことを特徴とする請求項１～７の何れかに記載の学習装置。

【請求項9】

前記共起性データ取得手段は、前記属性又は前記属性に応じた区分ごとに、前記共起性データを取得し、
前記学習手段は、前記属性又は前記区分ごとに取得された前記共起性データに基づいて、前記推定モデルの学習を行う、
ことを特徴とする請求項８に記載の学習装置。

【請求項10】

前記共起性データ取得手段は、前記属性又は前記区分の組み合わせごとに、前記共起性データを取得し、
前記学習手段は、前記組み合わせごとに取得された前記共起性データに基づいて、前記推定モデルの学習を行う、
ことを特徴とする請求項９に記載の学習装置。

【請求項11】

前記入力データは、評価者により印象が評価されるコンテンツであり、
前記複数の項目の各々は、前記印象の評価項目であり、
前記共起性データは、前記評価項目間の共起性に関するデータである、
ことを特徴とする請求項１～１０の何れかに記載の学習装置。

【請求項12】

入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた推定モデルを記憶する記憶手段と、
前記推定モデルに、推定対象の入力データを入力する入力手段と、
前記推定対象の入力データに対応する前記推定モデルの出力を取得する取得手段と、
を含むことを特徴とする推定装置。

【請求項13】

入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得ステップと、
前記項目間の共起性に関する共起性データを取得する共起性データ取得ステップと、
前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習ステップと、
を含むことを特徴とする学習方法。

【請求項14】

入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた推定モデルに、推定対象の入力データを入力する入力ステップと、
前記推定対象の入力データに対応する前記推定モデルの出力を取得する取得ステップと、
を含むことを特徴とする推定方法。

【請求項15】

入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得手段、
前記項目間の共起性に関する共起性データを取得する共起性データ取得手段、
前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習手段、
としてコンピュータを機能させるためのプログラム。

【請求項16】

入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた学習済みのパラメータに基づいて、推定対象の入力データに対応する推定結果を出力する、
学習済み推定モデル。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、学習装置、推定装置、学習方法、推定方法、プログラム、及び学習済み推定モデルに関する。

【背景技術】

【0002】

従来、入力データと正解データが対応付けられた訓練データに基づいて、推定モデルの学習を行う技術が知られている。推定モデルは、マーケティング等の種々の分野で利用される。例えば、特許文献１には、予め用意されたコンテンツに対する評価者の印象評価に基づいて、他のコンテンツの印象を推定する印象推定モデルが記載されている。特許文献１の技術では、同じコンテンツであっても評価者によって受ける印象は異なる可能性があるので、平均的な印象値を安定的に推定するために、評価者による印象値のブレを傾向ごとに分析し、ブレの傾向に応じた重みを与えるようにしている。

【0003】

例えば、特許文献２には、印象評価をする評価者を属性に基づいて制限し、特定の評価者の評価データのみを利用することで、目的に応じた印象分析結果を得る印象分析装置が記載されている。また例えば、特許文献３及び４には、評価者の属性に基づいて、評価者のグループ分けを行い、グループごとに、印象推定のためのニューラルネットワーク（推定モデルの一例）を生成することが記載されている。特許文献３及び４の技術では、印象推定時には、コンテンツが提示されるユーザの属性に応じたグループのモデルを利用して、ユーザがコンテンツに対して抱く印象が推定される。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１９－０９５９６８号公報

【特許文献2】国際公開第２０１５／１２２１９５号

【特許文献3】特開２００５－１０７７１８号公報

【特許文献4】特開２００６－０８５５２３号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１－４の技術では、印象評価で用いられる複数の項目が正解データに含まれており、これらの項目間には、共起性が存在することがある。例えば、印象評価において、「かっこいい」、「都会的」、及び「伝統的」といった３つの項目が存在したとする。評価者が「かっこいい」と「都会的」の印象を同時に抱くことが多かったとすると、これらの項目間には、強い共起性が存在する。一方、評価者が「都会的」と「伝統的」の印象を同時に抱くことが少なかったとすると、これらの項目の共起性は弱い。

【0006】

上記の例において、推定モデルの出力が正解データと違っていたとしても、「かっこいい」又は「都会的」の何れかの数値だけが正解データと異なるのであれば、互いに似た項目のうちの片方は適切に評価できているので、推定モデルの精度は、さほど低くない可能性がある。一方、例えば、推定モデルから出力された「都会的」と「伝統的」の何れかの数値だけが正解データと異なっていたとしても、共起性が弱いこれらの数値が同じになっていたとすると、同じ数値になりにくいはずの項目が同じ数値になっているので、推定モデルの精度が非常に低い可能性がある。

【0007】

このように、推定モデルの出力が誤っていたとしても、項目間の共起性によっては、その誤りが大きいこともあれば小さいこともある。しかしながら、従来の技術では、項目間の共起性を何ら考慮しておらず、これらの誤りを同等とみなしている。このため、推定モデルの精度を適切に評価できず、推定モデルの精度を十分に向上させることができなかった。

【0008】

本開示の目的は、推定モデルの精度を向上させることである。

【課題を解決するための手段】

【0009】

本開示に係る学習装置は、入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得手段と、前記項目間の共起性に関する共起性データを取得する共起性データ取得手段と、前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習手段と、を含むことを特徴とする。

【0010】

本開示に係る推定装置は、入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた推定モデルを記憶する記憶手段と、前記推定モデルに、推定対象の入力データを入力する入力手段と、前記推定対象の入力データに対応する前記推定モデルの出力を取得する取得手段と、を含むことを特徴とする。

【0011】

本開示に係る学習方法は、入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得ステップと、前記項目間の共起性に関する共起性データを取得する共起性データ取得ステップと、前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習ステップと、を含むことを特徴とする。

【0012】

本開示に係る推定方法は、入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた推定モデルに、推定対象の入力データを入力する入力ステップと、前記推定対象の入力データに対応する前記推定モデルの出力を取得する取得ステップと、を含むことを特徴とする。

【0013】

本開示に係るプログラムは、入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得手段、前記項目間の共起性に関する共起性データを取得する共起性データ取得手段、前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習手段、としてコンピュータを機能させる。

【0014】

本開示に係る学習済み推定モデルは、入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた学習済みのパラメータに基づいて、推定対象の入力データに対応する推定結果を出力する。

【0015】

本開示の一態様では、前記共起性データ取得手段は、前記入力データに対応する前記推定モデルの出力に基づく前記項目間の共起性に関する推定共起性データと、前記正解データに基づく前記項目間の共起性に関する正解共起性データと、を取得し、前記学習手段は、前記訓練データ、前記推定共起性データ、及び前記正解共起性データに基づいて、前記推定モデルの学習を行う、ことを特徴とする。

【0016】

本開示の一態様では、前記学習手段は、前記入力データに対応する前記推定モデルの出力と、前記正解データと、に基づいて、第１の損失を計算し、前記推定共起性データと、前記正解共起性データと、に基づいて、第２の損失を計算し、前記第１の損失と、前記第２の損失と、に基づいて、前記推定モデルの学習を行う、ことを特徴とする。

【0017】

本開示の一態様では、前記学習手段は、前記第１の損失と、前記第２の損失と、に基づいて、合計損失を計算し、前記合計損失に基づいて、前記推定モデルの学習を行う、ことを特徴とする。

【0018】

本開示の一態様では、前記共起性データは、前記正解データにおける前記項目間の出現確率を示す、ことを特徴とする。

【0019】

本開示の一態様では、前記共起性データは、前記項目の組み合わせごとの共起性を示す、ことを特徴とする。

【0020】

本開示の一態様では、前記共起性データ取得手段は、前記正解データに基づいて、前記共起性データを取得する、ことを特徴とする。

【0021】

本開示の一態様では、前記正解データは、前記入力データを評価する評価者の評価結果を示し、前記入力データは、前記推定モデルの推定対象となる推定対象データと、前記評価者の属性に関する属性データと、を含み、前記推定モデルには、前記推定対象データと前記属性データが入力され、前記属性データに応じた推定結果が前記推定モデルから出力される、ことを特徴とする。

【0022】

本開示の一態様では、前記共起性データ取得手段は、前記属性又は前記属性に応じた区分ごとに、前記共起性データを取得し、前記学習手段は、前記属性又は前記区分ごとに取得された前記共起性データに基づいて、前記推定モデルの学習を行う、ことを特徴とする。

【0023】

本開示の一態様では、前記共起性データ取得手段は、前記属性又は前記区分の組み合わせごとに、前記共起性データを取得し、前記学習手段は、前記組み合わせごとに取得された前記共起性データに基づいて、前記推定モデルの学習を行う、ことを特徴とする。

【0024】

本開示の一態様では、前記入力データは、評価者により印象が評価されるコンテンツであり、前記複数の項目の各々は、前記印象の評価項目であり、前記共起性データは、前記評価項目間の共起性に関するデータである、ことを特徴とする。

【発明の効果】

【0025】

本開示によれば、推定モデルの精度を向上させることができる。

【図面の簡単な説明】

【0026】

【図1】推定システムの全体構成を示す図である。

【図2】評価者により評価結果が入力される様子を示す図である。

【図3】推定システムにおいて実行される処理の概要を示す図である。

【図4】推定システムで実現される機能の一例を示す機能ブロック図である。

【図5】訓練データセットのデータ格納例を示す図である。

【図6】共起性データと共起損失の取得方法の具体例を示す図である。

【図7】学習装置が実行する処理の一例を示すフロー図である。

【図8】推定装置が実行する処理の一例を示すフロー図である。

【発明を実施するための形態】

【0027】

［１．推定システムの全体構成］
以下、本開示に係る学習装置と推定装置を含む推定システムの実施形態の例を説明する。図１は、推定システムの全体構成を示す図である。図１に示すように、推定システムＳは、学習装置１０、推定装置２０、及び評価者装置３０を含み、これらは、インターネット又はＬＡＮなどのネットワークＮに接続される。なお、図１では、学習装置１０、推定装置２０、及び評価者装置３０を１台ずつ示しているが、これらは複数台あってもよい。

【0028】

学習装置１０は、ユーザが操作するコンピュータである。例えば、学習装置１０は、パーソナルコンピュータ、サーバコンピュータ、携帯情報端末（タブレット型コンピュータ及びウェアラブル端末を含む）、又は携帯電話機（スマートフォンを含む）等である。例えば、学習装置１０は、制御部１１、記憶部１２、通信部１３、操作部１４、及び表示部１５を含む。

【0029】

制御部１１は、少なくとも１つのプロセッサを含む。制御部１１は、記憶部１２に記憶されたプログラムやデータに従って処理を実行する。記憶部１２は、主記憶部及び補助記憶部を含む。例えば、主記憶部はＲＡＭなどの揮発性メモリであり、補助記憶部は、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ、又はハードディスクなどの不揮発性メモリである。

【0030】

通信部１３は、有線通信又は無線通信用の通信インタフェースであり、ネットワークＮを介してデータ通信を行う。操作部１４は、操作を行うための入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイス、キーボード、又はボタン等である。表示部１５は、例えば、液晶表示部又は有機ＥＬ表示部等である。表示部１５は、制御部１１の指示に従って画像を表示する。

【0031】

推定装置２０は、ユーザが操作するコンピュータである。学習装置１０のユーザと推定装置２０のユーザは、同じであってもよいし異なっていてもよい。例えば、推定装置２０は、パーソナルコンピュータ、サーバコンピュータ、携帯情報端末（タブレット型コンピュータ及びウェアラブル端末を含む）、又は携帯電話機（スマートフォンを含む）等である。

【0032】

例えば、推定装置２０は、制御部２１、記憶部２２、通信部２３、操作部２４、及び表示部２５を含む。制御部２１、記憶部２２、通信部２３、操作部２４、及び表示部２５の各々の物理的構成は、それぞれ制御部１１、記憶部１２、通信部１３、操作部１４、及び表示部１５と同様であってよい。

【0033】

評価者装置３０は、評価者が操作するコンピュータである。評価者は、後述するコンテンツを評価する人間である。評価者は、コンテンツにアノテーションを付けるため、アノテータということもできる。例えば、評価者装置３０は、パーソナルコンピュータ、サーバコンピュータ、携帯情報端末（タブレット型コンピュータ及びウェアラブル端末を含む）、又は携帯電話機（スマートフォンを含む）等である。

【0034】

例えば、評価者装置３０は、制御部３１、記憶部３２、通信部３３、操作部３４、及び表示部３５を含む。制御部３１、記憶部３２、通信部３３、操作部３４、及び表示部３５の各々の物理的構成は、それぞれ制御部１１、記憶部１２、通信部１３、操作部１４、及び表示部１５と同様であってよい。

【0035】

なお、記憶部１２，２２，３２に記憶されるものとして説明するプログラム及びデータは、ネットワークＮを介して供給されるようにしてもよい。また、学習装置１０、推定装置２０、及び評価者装置３０の各々のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部（例えば、光ディスクドライブやメモリカードスロット）や外部機器とデータの入出力をするための入出力部（例えば、ＵＳＢポート）が含まれていてもよい。例えば、情報記憶媒体に記憶されたプログラムやデータが読取部や入出力部を介して、各コンピュータに供給されるようにしてもよい。

【0036】

［２．推定システムの概要］
推定システムＳでは、学習装置１０により推定モデルの学習が行われ、推定装置２０により学習済みの推定モデルが利用される。推定モデルは、機械学習を利用したモデルである。機械学習自体は、種々の手法を利用可能であり、例えば、畳み込みニューラルネットワークであってもよいし、再帰型ニューラルネットワークであってもよい。本実施形態で推定モデルと記載した箇所は、機械学習のコンセプトを意味するのではなく、そのコンセプトにより生み出された電子的なデータを意味する。即ち、推定モデルは、プログラムとパラメータを含む。なお、推定モデルは、プログラム又はパラメータの何れかだけを意味してもよい。

【0037】

推定モデルに含まれるプログラムには、コンピュータが実行すべき処理内容（命令又は計算式）が定義されており、例えば、畳み込みやプーリングなどの処理を行うためのコードを含む。パラメータは、学習によって調整される数値を含み、例えば、重み付け係数やバイアスなどの数値を含む。学習前の推定モデルであれば、初期値のパラメータを含み、学習済みの推定モデルであれば、学習によって調整されたパラメータを含む。

【0038】

推定モデルは、入力データの推定を行う。推定とは、入力データに対して何らかの推定を行うことである。ここでの推定は、入力データの認識、分析、解析、理解、分類、又は識別を含む意味である。入力データは、推定モデルに入力されるデータである。別の言い方をすれば、入力データは、推定の対象になるデータである。推定モデルに入力される個々の入力データは、互いに同じ形式である。推定モデルから出力される個々の推定結果も、互いに同じ形式である。

【0039】

推定モデルは、任意の目的で利用可能であり、例えば、コンテンツに対する印象、人間の行動パターン、又は自然界の現象の推定を行うことができる。コンテンツは、人間に提供されるデータであり、例えば、画像、動画、音声、楽曲、ウェブサイト、広告、クーポン、又はアプリケーションである。推定モデルは、入力データの分類で用いられる場合、分類学習器と呼ばれることもある。入力データは、推定モデルの目的に応じた形式であればよく、例えば、コンテンツ、人間の行動履歴を示すデータ、又は自然界で検出された物理量を示すデータである。

【0040】

本実施形態では、推定モデルがコンテンツに対する印象を推定する場合を例に挙げる。印象の推定は、印象評価又は印象理解と呼ばれることもある。推定モデルには、評価者による、コンテンツに対する印象の評価結果が学習されている。例えば、推定システムＳは、不特定多数の評価者に対し、少なくとも１つのコンテンツを提示する。評価者は、コンテンツに対して抱いた印象を評価し、その評価結果を入力する。推定モデルには、評価者により入力された評価結果が学習される。

【0041】

図２は、評価者により評価結果が入力される様子を示す図である。図２に示すように、評価者装置３０の表示部３５には、コンテンツに対する印象の評価結果を入力するための評価画面Ｇが表示される。評価者は、複数の評価項目の各々について印象の評価結果を指定する。図２の例では、評価対象のコンテンツが車の画像であり、車の印象を示す「かっこいい」、「都会的」、「伝統的」、「高級」、「かわいい」、「上品」などの評価項目（印象語句）が用意されている。図２の例では、２３個の評価項目のうちの６個目の評価項目である「上品」の評価結果が入力される場合を示している。

【0042】

なお、本実施形態では、「ＹＥＳ」と「ＮＯ」の２択で評価結果が入力される場合を例に挙げるが、評価結果は、２択ではなく、３択以上で入力されてもよい。即ち、評価結果は、２値で表現されるのではなく、中間値が存在して３段階以上で表現されてもよい。例えば、「かっこいい」の評価項目に関し、「強くそう思う」、「そう思う」、「どちらでもない」、「あまり思わない」、「強く思わない」といった５択で評価結果が入力されてもよい。

【0043】

また、全ての評価項目の選択肢の数が同じでなくてもよく、評価項目に応じた数の選択肢が存在してもよい。例えば、「かっこいい」の評価項目は５択で選択させ、「都会的」の評価項目は２択で選択させてもよい。また例えば、評価結果は、選択肢ではなく、数値又は文字で入力されてもよい。例えば、「かっこいい」の評価項目に対し、かっこいい度合いを示す数値又は文字を評価者に入力させてもよい。

【0044】

評価者は、評価画面Ｇに表示されたコンテンツと評価項目を見て、ボタンＢ１又はＢ２の何れかを選択する。図２の例であれば、評価者は、コンテンツである車の画像を上品だと思えばボタンＢ２を選択し、そう思わなければボタンＢ１を選択する。評価者がボタンＢ３を選択すると、次の評価項目の評価が行われる。評価者が最後の評価項目（図２の例では、２３個目の評価項目）まで評価を行うと、評価者が入力した評価結果が、学習装置１０又は他のコンピュータに送信される。

【0045】

学習装置１０は、不特定多数の評価者による評価結果を収集し、推定モデルの訓練データを生成する。訓練データの詳細は後述するが、本実施形態では、評価者の年齢や性別などの属性に関する属性データも訓練データに含まれおり、コンテンツを提示する予定の人間の属性に応じた推定結果を得られるようになっている。学習装置１０は、訓練データに基づいて、推定モデルの学習を行う。

【0046】

学習後の推定モデルは、コンテンツと属性データを入力すると、そのコンテンツに対し、その属性データが示す属性の人間が抱く印象の推定結果を出力する。本実施形態では、推定結果は、２３個の評価項目の各々について「ＹＥＳ」を示す「１」又は「ＮＯ」を示す「０」の数値を含む２３次元のベクトルで表現される場合を例に挙げる。

【0047】

上記のような評価項目には、共起性が存在することがある。共起性は、評価結果の一致のしやすさ又は類似のしやすさである。ここでの一致とは、評価結果の数値が同じになることである。例えば、「かっこいい」という評価項目の数値と、「都会的」という評価項目の数値と、が同じことは、これらの評価項目の評価結果が一致することを意味する。また、ここでの類似とは、評価結果の数値の差が閾値未満になることである。例えば、評価項目の数値が０～１の数値で示される場合に、「かっこいい」という評価項目の数値と、「都会的」という評価項目の数値と、の差が閾値（例えば、０．３）未満であることは、これらの評価項目の評価結果が類似することを意味する。共起性は、評価項目の関連性又は類似性ということもできる。共起性は、強さで示されてもよいし、ある／なしの２値で示されてもよい。

【0048】

なお、共起性は、自然言語処理分野において、ある文字列と他の文字列とが任意の文書内に同時に出現するといった意味で用いられることがある。本実施形態では、推定モデルを自然言語処理で用いるのではなく、コンテンツの印象推定で用いるので、自然言語処理分野の共起性の定義における文書と文字列は、それぞれ評価者が抱いた印象全体と各評価項目が示す印象語句に相当する。このため、本実施形態の共起性は、コンテンツを見た人間（例えば、評価者）がそのコンテンツに抱いた印象全体の中に、ある評価項目の印象と、他の評価項目の印象と、が同時に出現することを意味する。

【0049】

例えば、一の評価項目の評価結果と、他の評価項目の評価結果と、が同じ又は類似するコンテンツ又は評価者の数が閾値（例えば、７割又は７０％）以上の場合には、これらの評価項目には、共起性が存在する。この数が閾値未満の場合には、これらの評価項目には共起性が存在しない。別の言い方をすれば、この数が大きいほど、これらの評価項目の共起性が強くなり、この数の数値が小さいほど、これらの評価項目の共起性が弱くなる。なお、ここでは、コンテンツ又は評価者の数を例に挙げたが、上記説明における数は、割合又は確率と読み替えてもよい。

【0050】

図２の例であれば、評価者が車のコンテンツを見たときに、「かっこいい」と「都会的」の２つの印象を抱きやすいのであれば、「かっこいい」と「都会的」の２つの評価項目は、共起性が強い。一方、評価者が車のコンテンツを見たときに、「都会的」と「伝統的」の２つの印象を抱きにくいのであれば、「都会的」と「伝統的」の２つの評価項目は、共起性が弱い。

【0051】

例えば、推定モデルの出力が、訓練データに含まれる正解データと違っていたとしても、共起性が強い「かっこいい」又は「都会的」の何れかの数値だけが正解データと異なるのであれば、互いに似た評価項目のうちの片方は適切に評価できているので、推定モデルの精度は、さほど低くない可能性がある。一方、共起性が弱い「都会的」と「伝統的」の数値が同じであれば、同じにならないはずの評価項目が同じ数値になっているので、推定モデルの精度が低い可能性がある。

【0052】

以上のように、推定モデルの出力が正解データと違っていたとしても、その評価項目間の共起性によっては、その違いが大きいこともあれば小さいこともある。この点、機械学習では、損失を計算することで推定モデルの精度が評価される。機械学習では、損失が小さくなるように推定モデルを学習（パラメータを調整）することで、推定モデルの精度を向上させる。このため、共起性を考慮して損失を計算することで、推定モデルの精度をより適切に評価可能である。その結果として、学習済みの推定モデルの精度をより高めることができる。

【0053】

例えば、推定モデルの出力が正解データと違う評価項目の個数だけを考慮して損失を計算しても、推定モデルの精度を適切に評価できない可能性がある。そこで、本実施形態の推定システムＳは、評価項目間の共起性を考慮して推定データの学習を行うことによって、推定システムＳの精度を適切に評価し、推定データの精度を向上させるようにしている。

【0054】

図３は、推定システムＳにおいて実行される処理の概要を示す図である。ここでは各処理の概要のみを説明し、個々の処理の詳細は後述する。また、図３の長方形は処理を示し、平行四辺形はデータを示す。図３に示すように、学習装置１０は、入力データＤ１に含まれるコンテンツＣと属性データＡを推定モデルＭに入力する。入力データＤ１に対応する正解データＤ２は、推定モデルＭの出力である推定データＤ３を比較される。

【0055】

推定モデルＭは、コンテンツＣと属性データＡの特徴量を計算し、特徴量に応じた推定結果を示す推定データＤ３を出力する。先述したように、本実施形態では、推定データＤ３は、２３個の評価項目の各々の推定結果を示す「１」又は「０」の数値からなる２３次元のベクトルとなる。学習装置１０は、推定データＤ３と、訓練データに含まれる正解データＤ２と、に基づいて、これらの違いの大きさを示す予測損失Ｅ１を計算する。

【0056】

学習装置１０は、推定データＤ３に示された評価項目間の共起性を示す推定共起性データＤ４と、正解データＤ２に示された評価項目間の共起性を示す正解共起性データＤ５と、を取得する。学習装置１０は、推定共起性データＤ４と、正解共起性データＤ５と、に基づいて、これらの違いの大きさを示す共起損失Ｅ２を計算する。

【0057】

学習装置１０は、予測損失Ｅ１と共起損失Ｅ２を合計して合計損失Ｅ３を計算する。なお、予測損失Ｅ１、共起損失Ｅ２、及び合計損失Ｅ３は、コンテンツＣと属性データＡのペアである入力データＤ１が入力されて推定データＤ３が出力されるたびに計算されてもよいし、ある程度の数のペアに対応する推定データＤ３が蓄積されてから計算されてもよい。学習装置１０は、合計損失Ｅ３が小さくなるように、推定モデルＭの学習を行う。なお、予測損失Ｅ１、共起損失Ｅ２、及び合計損失Ｅ３は、訓練データの処理単位であるバッチ（所定数の訓練データの集まり）ごとに計算されてもよい。

【0058】

以上のように、本実施形態の推定システムＳは、推定データＤ３と正解データＤ２の違いを示す予測損失Ｅ１だけでなく、推定共起性データＤ４と正解共起性データＤ５の違いを示す共起損失Ｅ２も考慮する。これにより、推定システムＳは、学習途中の推定モデルＭの精度を適切に評価し、学習の結果得られる推定モデルＭの精度が向上する。以降、推定システムＳの詳細について説明する。

【0059】

［３．推定システムで実現される機能］
図４は、推定システムＳで実現される機能の一例を示す機能ブロック図である。ここでは、学習装置１０で実現される機能と、推定装置２０で実現される機能と、について説明する。

【0060】

［３－１．学習装置で実現される機能］
学習装置１０では、データ記憶部１００、生成部１０１、訓練データ取得部１０２、共起性データ取得部１０３、及び学習部１０４が実現される。データ記憶部１００は、記憶部１２を主として実現され、生成部１０１、訓練データ取得部１０２、共起性データ取得部１０３、及び学習部１０４の各々は、制御部１１を主として実現される。

【0061】

［データ記憶部］
データ記憶部１００は、推定モデルＭの学習に必要なデータを記憶する。本実施形態では、このデータの一例として、訓練データセットＤＳを説明する。訓練データセットＤＳは、複数の訓練データの集まりである。訓練データセットＤＳは、複数の訓練データを格納したデータベースということもできる。例えば、訓練データセットＤＳは、学習装置１０のユーザによって用意される。

【0062】

訓練データは、推定モデルＭに学習させる個々のデータ単位である。訓練データは、教師データ又は学習データと呼ばれることもある。例えば、訓練データには、入力データＤ１と正解データＤ２とが対応付けられている。即ち、訓練データは、入力データＤ１と正解データＤ２のペアである。１つ１つのペアが訓練データであり、その集まりが訓練データセットＤＳである。訓練データに含まれる入力データＤ１は、学習済みの推定モデルＭに入力される入力データＤ１と同じ形式（本実施形態では、コンテンツＣと属性データＡのペア）である。

【0063】

正解データＤ２は、正解となる出力を示すデータである。正解となる出力とは、入力データＤ１が入力された場合に推定モデルＭが出力すべき内容（推定モデルＭに出力してほしい内容）である。例えば、正解データＤ２は、真値又は真値ベクトルを示すデータということもできる。正解データＤ２は、正解情報と呼ばれることもある。本実施形態では、訓練データに含まれる正解データＤ２は、学習済みの推定モデルＭから出力される推定結果と同じ形式（本実施形態では、２３次元のベクトル）であるが、その一部だけが正解データＤ２に示されていてもよい。

【0064】

正解データＤ２は、複数の項目を含む。項目は、推定結果に関する項目である。正解データＤ２は、複数の項目の各々の推定結果を含む。本実施形態では、個々の推定結果が「１」又は「０」の２値で表現される場合を説明するが、個々の推定結果は、３段階以上の数値で表現されてもよい。個々の推定結果は、文字などの数値以外の情報で表現されてもよい。本実施形態では、正解データＤ２がベクトル形式で表現される場合を説明するが、正解データＤ２は、任意の形式で表現可能である。例えば、正解データＤ２は、配列形式又は単一の数値で表現されてもよい。

【0065】

本実施形態では、入力データＤ１は、評価者により印象が評価されるコンテンツＣを含むので、複数の項目の各々は、印象の評価項目である。このため、本実施形態で評価項目と記載した箇所は、単に項目と読み替えることができる。正解データＤ２に含まれる項目は、評価項目に限られず、推定モデルＭの目的に応じた項目であればよい。例えば、推定モデルＭが入力データＤ１の分類で利用される場合には、個々の分類を示すラベルが項目に相当してもよい。本実施形態のようにコンテンツＣの印象を推定する場合には、コンテンツＣが各評価項目の印象に属するか否かが推定結果として出力されるので、評価項目もラベルの一種ということもできる。

【0066】

図５は、訓練データセットＤＳのデータ格納例を示す図である。図５に示すように、訓練データセットＤＳには、訓練データが多数格納されている。本実施形態では、推定モデルＭにコンテンツＣと属性データＡが入力されるので、入力データＤ１は、コンテンツＣと属性データＡのペアを含む。なお、推定モデルＭは、属性に応じた推定をしなくてもよく、この場合には、属性データＡは省略してもよい。

【0067】

入力データＤ１に含まれるコンテンツＣは、評価者による評価済みのコンテンツＣである。コンテンツＣは、評価対象データの一例である。このため、本実施形態でコンテンツＣと記載した箇所は、評価対象データと読み替えることができる。入力データＤ１に含まれる属性データＡは、ペアとなるコンテンツＣを評価した評価者の属性である。属性は、人間の性質、特徴、分類、又はカテゴリということもできる。属性は、任意の内容を示してよく、例えば、年齢、性別、誕生日、居住地、家族構成、趣味、居住地、国籍、学歴、収入、又は職種である。

【0068】

正解データＤ２は、評価者により入力された、複数の評価項目の各々の評価結果を示す。本実施形態では、２３個の評価項目が用意されているので、正解データＤ２には、２３個の評価項目の各々の評価結果が示されている。本実施形態では、「ＹＥＳ」と「ＮＯ」の２択で評価結果が入力されるので、「ＹＥＳ」を示す数値の一例である「１」、又は、「ＮＯ」を示す数値である「０」の何れかの数値で評価結果が示される。評価結果が３択以上で入力される場合には、評価結果は、「１」と「０」の２値ではなく、中間値も取りうる。なお、評価結果は、文字のように、数値以外の情報で示されてもよい。

【0069】

図５では、図面上の見やすさのためにテーブル形式で示しているが、正解データＤ２は、推定モデルＭの出力と同様の形式で表現されるので、実際には、ベクトル形式で表現される。正解データＤ２は、評価項目の数に応じた次元数であればよく、本実施形態では２３個の評価項目が存在するので、正解データＤ２が２３次元のベクトルで表現される。なお、正解データＤ２は、任意の形式で表現可能であり、ベクトル形式に限られない。例えば、正解データＤ２は、配列形式で表現されてもよいし、単一の数値で表現されてもよい。

【0070】

また例えば、データ記憶部１００は、学習前の推定モデルＭを記憶する。本実施形態では、学習済みの推定モデルＭは、推定装置２０のデータ記憶部２００に記憶される場合を説明するが、学習装置１０のデータ記憶部１００は、学習済みの推定モデルＭを記憶してもよい。他にも例えば、データ記憶部１００は、学習の処理に必要なプログラムや後述する数式を記憶してもよい。この数式は、プログラムの一部として記述されていてもよい。

【0071】

［生成部］
生成部１０１は、複数の訓練データを生成し、訓練データセットＤＳをデータ記憶部１００に記録する。例えば、訓練データに含まれる入力データＤ１と正解データＤ２のペアは、評価者の操作に基づいて生成される。生成部１０１は、評価者に提示されたコンテンツＣ及び評価者の属性データＡと、評価者により入力された評価結果を示す正解データＤ２と、のペアを、訓練データとして生成する。生成部１０１は、不特定多数の評価者に対応する複数の訓練データを取得し、訓練データセットＤＳとして生成する。

【0072】

なお、評価者の評価対象となるコンテンツＣは、データ記憶部１００に予め記憶されていてもよいし、学習装置１０以外の他のコンピュータ又は情報記憶媒体に記憶されていてもよい。また、属性データＡは、コンテンツＣの評価時に評価者に入力させてもよいし、属性データＡが格納されたデータベースから取得されてもよい。このデータベースは、評価者の氏名などの基本情報が登録されたデータベースである。このデータベースは、データ記憶部１００に記憶されていてもよいし、学習装置１０以外の他のコンピュータ又は情報記憶媒体に記憶されていてもよい。

【0073】

また、全ての入力データＤ１に対応する正解データＤ２が評価者によって手動で入力されてもよいが、一部の入力データＤ１に対応する正解データＤ２だけが評価者によって入力されてもよい。この場合、生成部１０１は、複数の入力データＤ１の各々の特徴量をもとにクラスタリングを行い、評価者が正解データＤ２を入力した入力データＤ１と同じクラスタに属する他の入力データＤ１については、この正解データＤ２を付与してもよい。このように、評価者に一部の正解データＤ２だけを入力させ、生成部１０１は、半自動的に複数の訓練データを生成してもよい。

【0074】

また、ユーザに正解データＤ２を手動で入力させずに、生成部１０１は、予め定められた付与方法に基づいて、各入力データＤ１に対して正解データＤ２を付与してもよい。この場合、付与方法には、入力データＤ１の特徴量と、対応する正解データＤ２と、の関係が定義されているものとする。生成部１０１は、所定の計算式に基づいて入力データＤ１の特徴量を計算し、対応する正解データＤ２を付与することによって、訓練データを生成する。このように、評価者に正解データＤ２を入力させることなく、生成部１０１は、全自動的に複数の訓練データを生成してもよい。

【0075】

［訓練データ取得部］
訓練データ取得部１０２は、入力データＤ１と、複数の評価項目を含む正解データＤ２と、が対応付けられた訓練データを取得する。本実施形態では、複数の訓練データを含む訓練データセットＤＳがデータ記憶部１００に記憶されているので、訓練データ取得部１０２は、データ記憶部１００から訓練データセットＤＳを取得する。訓練データ取得部１０２は、複数の訓練データを同時に取得する必要はなく、これらを別々に取得してもよい。なお、訓練データセットＤＳは、学習装置１０以外の他のコンピュータ又は外部の情報記憶媒体に記憶されており、訓練データ取得部１０２は、他のコンピュータ又は外部の情報記憶媒体から訓練データセットＤＳを取得してもよい。また、訓練データ取得部１０２は、訓練データを１つだけ取得してもよい。

【0076】

［共起性データ取得部］
共起性データ取得部１０３は、評価項目間の共起性に関する共起性データを取得する。評価項目間の共起性とは、複数の評価項目の各々の共起性である。本実施形態では、２つの評価項目のペアごとに共起性が示される場合を説明するが、３つ以上の評価項目の共起性ごとに共起性が示されてもよい。即ち、本実施形態のように２つの評価項目に対して１つの共起性が示されるのではなく、３つ以上の評価項目の集まりに対して１つの共起性が示されてもよい。

【0077】

共起性データは、評価項目間の共起性の強さを示す情報を含む。本実施形態では、この情報が数値で表現される場合を説明するが、文字などの他の情報で表現されてもよい。なお、共起性の強さでなく、共起性のある／なしが２値で表現されてもよい。共起性データは、共起損失Ｅ２を取得するために利用される。

【0078】

図６は、共起性データと共起損失Ｅ２の取得方法の具体例を示す図である。本実施形態では、共起性データが、正解データＤ２における評価項目間の出現確率を示す場合を例に挙げて説明する。図６に示すｐ（ｘ，ｙ）は、推定データＤ３から計算される確率分布であり、ｑ（ｘ，ｙ）は、正解データＤ２から計算される確率分布である。別の言い方をすれば、ｐ（ｘ，ｙ）は、学習時に算出される確率分布（現状の推定モデルＭの出力から算出される確率分布）であり、ｑ（ｘ，ｙ）は、事前に分かっている確率分布（正解となる確率分布）である。

【0079】

ｘは、一の評価項目であり、ｙは、他の評価項目である。図６の例では、ｘが「かっこいい」であり、ｙが「都会的」であるものとするが、他の任意の評価項目であってよい。共起性データ取得部１０３は、複数の入力データＤ１にそれぞれ対応する複数の推定データＤ３に基づいて、確率分布ｐ（ｘ，ｙ）の投票を行う。この投票は、複数の推定データＤ３の各々の「かっこいい」の数値と「都会的」の数値とに基づいて行われる。本実施形態では、評価項目ｘと評価項目ｙの各々が「１」又は「０」の２値で示されるので、ｐ（１，１）、ｐ（１，０）、ｐ（０，１）、ｐ（０、０）の各々に対する投票が行われる。

【0080】

例えば、共起性データ取得部１０３は、ある推定データＤ３の「かっこいい」が「１」であり、かつ、「都会的」が「１」だった場合には、ｐ（１，１）に１票投票する。また例えば、共起性データ取得部１０３は、ある推定データＤ３の「かっこいい」が「１」であり、かつ、「都会的」が「０」だった場合には、ｐ（１，０）に１票投票する。また例えば、共起性データ取得部１０３は、ある推定データＤ３の「かっこいい」が「０」であり、かつ、「都会的」が「１」だった場合には、ｐ（０，１）に１票投票する。また例えば、共起性データ取得部１０３は、ある推定データＤ３の「かっこいい」が「０」であり、かつ、「都会的」が「０」だった場合には、ｐ（０，０）に１票投票する。

【0081】

共起性データ取得部１０３は、２３個の評価項目の全ての組み合わせに対し、「かっこいい」と「都会的」と同様の投票を行う。即ち、評価項目をｎ個（ｎは自然数であり、本実施形態では２３）とすると、共起性データ取得部１０３は、_ｎＣ_２個の組み合わせについて、推定データＤ３に基づく投票を行う。評価項目ｘ，ｙの組み合わせのｐ（０，０）とｐ（１，１）の投票数が多いことは、評価項目ｘ，ｙの共起性が強いことを意味する。評価項目ｘ，ｙの組み合わせのｐ（１，０）とｐ（０，１）の投票数が多いことは、評価項目ｘ，ｙの共起性が弱いことを意味する。なお、共起性データ取得部１０３は、「かっこいい」の数値と「都会的」の数値が一致又は類似していた場合にのみ、確率分布ｐ（ｘ，ｙ）に投票してもよい。

【0082】

共起性データ取得部１０３は、確率分布ｐ（ｘ，ｙ）と同様にして、正解データＤ２に基づいて、確率分布ｑ（ｘ，ｙ）の投票を行う。確率分布ｐ（ｘ，ｙ），ｑ（ｘ，ｙ）は、共起損失Ｅ２の計算で用いられる。共起損失Ｅ２の計算方法は、学習部１０４の処理で説明する。

【0083】

上記のように、共起性データ取得部１０３は、入力データＤ１に対応する推定モデルＭの出力に基づく評価項目間の共起性に関する推定共起性データＤ４と、正解データＤ２に基づく評価項目間の共起性に関する正解共起性データＤ５と、を取得する。推定共起性データＤ４は、現状の推定モデルＭに対応する共起性を示し、正解共起性データＤ５は、正解データＤ２に対応する共起性を示す。本実施形態では、_ｎＣ_２個のｐ（ｘ，ｙ）は、推定共起性データＤ４の一例であり、_ｎＣ_２個のｑ（ｘ，ｙ）は、正解共起性データＤ５の一例である。

【0084】

なお、推定共起性データＤ４と正解共起性データＤ５は、確率分布に限られず、任意の形式で表現可能である。例えば、推定共起性データＤ４と正解共起性データＤ５は、_ｎＣ_２次元のベクトル形式で表現されてもよい。この場合、推定共起性データＤ４と正解共起性データＤ５は、１個目の要素が「かっこいい」と「都会的」の共起性を示す数値（例えば、ｐ（１，１）の投票数）になり、２個目の要素が「かっこいい」と「伝統的」の共起性を示す数値になるといったように、_ｎＣ_２個の組み合わせの共起性を各要素で表現すればよい。他にも例えば、推定共起性データＤ４と正解共起性データＤ５は、配列形式又は単一の数値といった他の形式で表現されてもよい。

【0085】

本実施形態では、共起性データは、評価項目の組み合わせごとの共起性を示す。即ち、共起性データは、複数の組み合わせの各々の共起性を示す。本実施形態では、_ｎＣ_２個の全ての組み合わせについて共起性が計算されるので、共起性データは、これら全ての組み合わせの共起性を示す。

【0086】

また、本実施形態では、共起性データ取得部１０３は、正解データＤ２に基づいて、正解共起性データＤ５を取得する。例えば、共起性データ取得部１０３は、複数の正解データＤ２の各々に示された評価項目の数値を集計し、正解共起性データＤ５を取得する。共起性データ取得部１０３は、学習で用いられる全ての正解データＤ２に基づいて正解共起性データＤ５を取得してもよいし、その一部だけに基づいて正解共起性データＤ５を取得してもよい。

【0087】

なお、正解共起性データＤ５は、正解となる共起性を示せばよく、訓練データに含まれる正解データＤ２から取得されなくてもよい。例えば、学習装置１０のユーザが共起性を入力し、共起性データ取得部１０３は、その入力結果に基づいて、正解共起性データＤ５を取得してもよい。この場合、ユーザが手動で正解共起性データＤ５を作成することになる。他にも例えば、正解共起性データＤ５は、訓練データとは異なるデータに含まれる評価項目の数値が集計されることによって取得されてもよい。また、共起性データ取得部１０３は、訓練データの処理単位であるバッチ（所定数の訓練データの集まり）ごとに、推定共起性データＤ４と、正解共起性データＤ５と、を取得してもよいし、複数のバッチの結果から推定共起性データＤ４と、正解共起性データＤ５と、を取得してもよい。

【0088】

［学習部］
学習部１０４は、訓練データと、共起性データと、に基づいて、推定モデルＭの学習を行う。学習部１０４は、訓練データに含まれる入力データＤ１を推定モデルＭに入力した場合に、訓練データに含まれる正解データＤ２又はそれに近い数値が推定モデルＭの出力として得られ、かつ、共起性データが示す共起性又はそれに近い共起性が推定モデルＭの出力から示されるように、推定モデルＭの学習を行う。

【0089】

本実施形態では、推定共起性データＤ４と正解共起性データＤ５の２つの共起性データが取得されるので、学習部１０４は、訓練データ、推定共起性データＤ４、及び正解共起性データＤ５に基づいて、推定モデルＭの学習を行う。学習部１０４は、訓練データに含まれる入力データＤ１を推定モデルＭに入力した場合に、訓練データに含まれる正解データＤ２又はそれに近い数値が推定モデルＭの出力として得られ、かつ、正解共起性データＤ５が示す共起性又はそれに近い共起性を推定共起性データＤ４が示すように、推定モデルＭの学習を行う。

【0090】

例えば、学習部１０４は、入力データＤ１に対応する推定モデルＭの出力と、正解データＤ２と、に基づいて、予測損失Ｅ１を計算する。予測損失Ｅ１は、第１の損失の一例であり、他の名称で呼ばれてもよい。損失は、損失の数値を計算する関数それ自体を指して損失関数と呼ばれることもある。損失の計算方法自体は、損失の計算方法自体は、２乗和誤差又はクロスエントロピーといった公知の計算方法を利用可能である。これらの点は、予測損失Ｅ１以外の損失（例えば、共起損失Ｅ２と合計損失Ｅ３）についても同様である。ただし、損失の計算に共起性が考慮されるという点は、公知の技術とは大きく異なる点である。

【0091】

予測損失Ｅ１は、推定モデルＭの出力である推定データＤ３と、正解データＤ２と、の違い（差異）を示す数値である。例えば、推定データＤ３と正解データＤ２の違いが大きいほど予測損失Ｅ１が大きくなり、これらの違いが小さいほど予測損失Ｅ１は小さくなる。予測損失Ｅ１は、所定の計算式で計算されるようにすればよく、例えば、学習部１０４は、推定データＤ３が示す２３次元のベクトルと、正解データＤ２が示す２３次元のベクトルと、の距離を予測損失Ｅ１として計算してもよいし、評価項目ごとに重み付け係数を設けておき、重み付け係数を考慮して予測損失Ｅ１を計算してもよい。

【0092】

学習部１０４は、推定共起性データＤ４と、正解共起性データＤ５と、に基づいて、共起損失Ｅ２を計算する。共起損失Ｅ２は、第２の損失の一例であり、他の名称で呼ばれてもよい。共起損失Ｅ２は、推定データＤ３から得られる推定共起性データＤ４と、その正解となりうる正解共起性データＤ５と、の違い（差異）を示す数値である。例えば、推定共起性データＤ４と正解共起性データＤ５の違いが大きいほど共起損失Ｅ２が大きくなり、これらの違いが小さいほど共起損失Ｅ２は小さくなる。共起損失Ｅ２は、所定の計算式で計算されるようにすればよく、例えば、学習部１０４は、推定共起性データＤ４が示す_ｎＣ_２個の確率分布と、正解共起性データＤ５が示す_ｎＣ_２個の確率分布と、を所定の計算式に代入し、共起損失Ｅ２を計算する。

【0093】

本実施形態では、学習部１０４は、図６に示す計算式から得られる数値ＫＬ（ｐ｜｜ｑ）を、ｎ個全ての評価項目の組み合わせである_ｎＣ_２個の組み合わせで計算する。数値ＫＬは、２つの確率分布がどの程度似ているかを示す指標であり、ＫＬダイバージェンスと呼ばれる。なお、クロスエントロピーなどを利用して他の指標が計算されてもよい。学習部１０４は、その平均値を共起損失Ｅ２として計算する。例えば、学習部１０４は、評価項目の組み合わせごとに重み付け係数を設けておき、重み付け係数を考慮して共起損失Ｅ２を計算してもよい。共起損失Ｅ２は、確率分布の平均値ではなく、任意の形式であってよい。学習部１０４は、数値ＫＬ（ｐ｜｜ｑ）の平均値ではなく、_ｎＣ_２個の確率分布そのものを共起損失Ｅ２として取得してもよい。

【0094】

学習部１０４は、予測損失Ｅ１と、共起損失Ｅ２と、に基づいて、推定モデルＭの学習を行う。学習部１０４は、予測損失Ｅ１と共起損失Ｅ２の各々が小さくなるように、推定モデルＭの学習を行う。例えば、学習部１０４は、予測損失Ｅ１と、共起損失Ｅ２と、に基づいて、合計損失Ｅ３を計算する。合計損失Ｅ３は、予測損失Ｅ１と共起損失Ｅ２の単純な合計値であってもよいし、所定の重み付け係数が考慮されて計算されてもよい。学習部１０４は、合計損失Ｅ３に基づいて、推定モデルＭの学習を行う。学習部１０４は、合計損失Ｅ３が小さくなるように、推定モデルＭの学習を行う。

【0095】

学習部１０４は、合計損失Ｅ３が十分小さくなるまで（例えば、合計損失Ｅ３が閾値未満になる）まで、推定モデルＭの学習を繰り返す。学習部１０４は、合計損失Ｅ３が十分小さくなるまで同じ訓練データセットＤＳで学習を繰り返してもよいし、新たな訓練データセットＤＳを取得して学習をしてもよい。学習途中で合計損失Ｅ３が十分小さくなった場合には、その時点で学習が終了してもよい。学習部１０４は、合計損失Ｅ３が十分小さくならなくても、所定回数の学習を繰り返した場合には学習が終了してもよい。なお、学習方法（パラメータの調整方法）自体は、公知の手法を利用可能であり、例えば、Ａｄａｍ又はＲＭＳＰｒｏｐと呼ばれる手法などが利用されてもよい。

【0096】

［３－２．推定装置で実現される機能］
推定装置２０では、データ記憶部２００、入力部２０１、取得部２０２、及び処理実行部２０３が実現される。データ記憶部２００は、記憶部２２を主として実現され、入力部２０１、取得部２０２、及び処理実行部２０３の各々は、制御部２１を主として実現される。

【0097】

［データ記憶部］
データ記憶部２００は、入力データＤ１と複数の評価項目を含む正解データＤ２とが対応付けられた訓練データと、評価項目間の共起性に関する共起性データと、に基づく学習が行われた学習済みの推定モデルＭを記憶する。学習済みの推定モデルＭは、入力データＤ１と複数の評価項目を含む正解データＤ２とが対応付けられた訓練データと、評価項目間の共起性に関する共起性データと、に基づく学習が行われた学習済みのパラメータに基づいて、推定対象の入力データＤ１に対応する推定結果を出力する。

【0098】

本実施形態では、正解データＤ２は、入力データＤ１を評価する評価者の評価結果を示し、入力データＤ１は、推定モデルＭの推定対象となるコンテンツＣと、評価者の属性に関する属性データＡと、を含むので、学習済みの推定モデルＭには、コンテンツＣと属性データＡが入力され、属性データＡに応じた推定結果が推定モデルＭから出力される。推定装置２０は、学習装置１０から学習済みの推定モデルＭを取得し、データ記憶部２００に記録する。例えば、データ記憶部２００は、学習済みの推定モデルＭによる推定対象になる入力データＤ１を記憶する。

【0099】

［入力部］
入力部２０１は、推定モデルＭに、推定対象の入力データＤ１を入力する。この入力データＤ１は、推定モデルＭの学習で利用される入力データＤ１ではなく、学習済みの推定モデルＭの推定対象となるデータである。推定対象となる入力データＤ１は、訓練データに含まれる入力データＤ１と同じ形式である。本実施形態では、コンテンツＣと属性データＡのペアが入力データＤ１に含まれているので、入力部２０１は、推定対象のコンテンツＣと、そのコンテンツＣを評価すると仮定した評価者の属性に関する属性データＡと、を入力データＤ１として取得する。

【0100】

本実施形態では、入力データＤ１がデータ記憶部２００に記憶されている場合を説明するが、入力データＤ１は、操作部２４から入力されてもよいし、推定装置２０以外の他のコンピュータ又は外部の情報記憶媒体から取得されてもよい。例えば、コンテンツＣはデータ記憶部２００に記憶されたものが取得され、属性データＡは操作部２４からの入力によって取得されてもよい。この場合、推定装置２０のユーザは、表示部２５にコンテンツＣを表示させ、推定モデルＭに入力する属性データＡの属性（コンテンツを提供する予定の属性）を操作部２４から指定する。入力部２０１は、表示されたコンテンツＣと、指定された属性データＡと、のペアを入力データＤ１として取得すればよい。

【0101】

［取得部］
取得部２０２は、推定対象の入力データＤ１に対応する推定モデルＭの出力を取得する。推定モデルＭは、入力データＤ１の特徴量を計算し、当該特徴量に応じた推定結果を出力する。これらの計算は、学習済みのパラメータが用いられる。即ち、入力データＤ１の特徴量から推定結果を導き出す計算には、学習済みのパラメータが用いられる。特徴量は、任意の次元数で表現される。推定モデルＭによる特徴量の計算方法自体は、公知の方法を利用可能であり、例えば、重み付け係数が設定されたフィルタによる畳み込みやプーリングなどが行われる。

【0102】

［処理実行部］
処理実行部２０３は、取得部２０２により取得された推定モデルＭの出力に基づいて、所定の処理を実行する。所定の処理は、推定モデルＭの目的に応じた処理であればよく、本実施形態では、推定モデルＭがマーケティングで利用される場合を例に挙げているので、マーケティング業務を支援する処理が所定の処理に相当する。

【0103】

例えば、処理実行部２０３は、推定モデルＭに入力されたコンテンツＣに対し、推定モデルＭに入力された属性データＡが示す属性の人間が抱く印象の推定結果を表示部２５に表示させる。推定装置２０のユーザは、表示部２５に表示された印象の推定結果を見て、コンテンツＣを編集したり、他のコンテンツＣの利用を検討したりする。他にも例えば、処理実行部２０３は、印象的な評価項目を表示部２５に表示させたり、印象的な評価項目のランキングを表示部２５に表示させたりしてもよい。推定モデルＭが他の目的で利用される場合には、処理実行部２０３は、その目的に応じた処理を実行すればよい。

【0104】

［４．システムで実行される処理］
本実施形態では、推定システムＳで実行される処理として、学習装置１０が実行する処理と、推定装置２０が実行する処理と、について説明する。

【0105】

［４－１．学習装置が実行する処理］
図７は、学習装置１０が実行する処理の一例を示すフロー図である。図７に示す処理は、制御部１１が記憶部１２に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図４に示す機能ブロックにより実行される処理の一例である。なお、訓練データセットＤＳと学習前の推定モデルＭは、予め記憶部１２に記憶されているものとする。

【0106】

図７に示すように、学習装置１０は、訓練データセットＤＳに格納された複数の訓練データの各々を取得する（Ｓ１００）。学習装置１０は、Ｓ１００で取得した複数の訓練データの各々に含まれる入力データＤ１（コンテンツＣと属性データＡのペア）を推定モデルＭに入力し、各入力データＤ１に対応する推定モデルＭの出力である推定データＤ３を取得する（Ｓ１０１）。Ｓ１０１においては、学習装置１０は、推定モデルＭに入力した入力データＤ１ごとに、推定モデルＭにより出力された推定データＤ３を取得する。

【0107】

学習装置１０は、複数の入力データＤ１の各々に対応する推定モデルＭの出力と、Ｓ１００で取得した複数の訓練データの各々に対応する正解データＤ２と、に基づいて、予測損失Ｅ１を計算する（Ｓ１０２）。Ｓ１０２においては、学習装置１０は、訓練データごとに、当該訓練データに含まれる入力データＤ１に対応する推定モデルＭの出力と、当該訓練データに含まれる正解データＤ２と、を所定の計算式に代入し、予測損失Ｅ１を計算する。

【0108】

学習装置１０は、複数の入力データＤ１の各々に対応する推定モデルＭの出力に基づいて、推定共起性データＤ４を取得する（Ｓ１０３）。Ｓ１０３においては、学習装置１０は、評価項目のペアごとに、推定モデルＭの出力に含まれる当該ペアの数値に基づく投票を行って予測確率分布を作成する。学習装置１０は、複数のペアの各々の予測確率分布を含む推定共起性データＤ４を取得する。

【0109】

学習装置１０は、複数の正解データＤ２の各々に基づいて、正解共起性データＤ５を取得する（Ｓ１０４）。Ｓ１０４においては、学習装置１０は、評価項目のペアごとに、正解データＤ２に含まれる当該ペアの数値に基づく投票を行って予測確率分布を作成する。学習装置１０は、複数のペアの各々の予測確率分布を含む正解共起性データＤ５を取得する。

【0110】

学習装置１０は、推定共起性データＤ４と、正解共起性データＤ５と、に基づいて、共起損失Ｅ２を計算する（Ｓ１０５）。Ｓ１０５においては、学習装置１０は、推定共起性データＤ４に含まれる各ペアの予測確率分布と、正解共起性データＤ５に含まれる各ペアの予測確率分布と、を所定の計算式に代入し、共起損失Ｅ２を計算する。

【0111】

学習装置１０は、Ｓ１０２で計算した予測損失Ｅ１と、Ｓ１０５で計算した共起損失Ｅ２と、に基づいて、合計損失Ｅ３を計算する（Ｓ１０６）。Ｓ１０６においては、学習装置１０は、予測損失Ｅ１と共起損失Ｅ２を所定の計算式に代入し、合計損失Ｅ３を計算する。学習装置１０は、合計損失Ｅ３に基づいて、推定モデルＭの学習を行う（Ｓ１０７）。Ｓ１０７においては、学習装置１０は、合計損失Ｅ３が小さくなるように、推定モデルＭのパラメータを調整する。

【0112】

学習装置１０は、推定モデルＭの学習を終了するか否かを判定する（Ｓ１０８）。推定モデルＭの学習は、任意のタイミングで終了可能であり、先述したように、合計損失Ｅ３が十分に小さくなった場合に終了してもよいし、他のタイミングで終了してもよい。学習を終了すると判定されない場合（Ｓ１０８；Ｎ）、Ｓ１００の処理に戻る。この場合、推定モデルＭの学習が継続される。なお、同じ訓練データを使って学習を繰り返す場合には、正解共起性データＤ５の内容は変わらないので、Ｓ１０４の処理は省略可能である。

【0113】

Ｓ１０８において、学習を終了すると判定された場合（Ｓ１０８；Ｙ）、学習装置１０は、推定装置２０に対し、学習済みの推定モデルＭを送信し（Ｓ１０９）、本処理は終了する。Ｓ１０９で送信された学習済みの推定モデルＭは、推定装置２０に記録される。

【0114】

［４－２．推定装置が実行する処理］
図８は、推定装置２０が実行する処理の一例を示すフロー図である。図８に示す処理は、制御部２１が記憶部２２に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図４に示す機能ブロックにより実行される処理の一例である。学習済みの推定モデルＭは、記憶部２２に記憶されているものとする。

【0115】

図８に示すように、推定装置２０は、推定対象のコンテンツＣを取得する（Ｓ２００）。推定対象のコンテンツＣは、記憶部２２に記憶されているものとするが、他のコンピュータ又は外部の情報記憶媒体に記憶されていてもよい。推定装置２０は、コンテンツＣが提示される予定者の属性データＡを取得する（Ｓ２０１）。評価者の属性データＡは、操作部２４から入力されるものとするが、記憶部２２、他のコンピュータ、又は外部の情報記憶媒体に記憶されていてもよい。

【0116】

推定装置２０は、Ｓ２００で取得したコンテンツＣとＳ２０１で取得した属性データＡを含む入力データＤ１を推定モデルＭに入力し、推定モデルＭの出力を取得する（Ｓ２０２）。Ｓ２０２においては、推定モデルＭは、入力データＤ１の特徴量を計算し、特徴量に応じた推定結果を出力する。推定装置２０は、推定対象のコンテンツＣと、Ｓ２０２で取得された推定モデルＭの出力と、を表示部２５に表示させ（Ｓ２０３）、本処理は終了する。

【0117】

本実施形態の推定システムＳによれば、訓練データの内容だけでなく、評価項目間の共起性を考慮して推定モデルＭの学習を行うことによって、学習途中の推定モデルＭの精度を適切に評価し、学習結果として得られる推定モデルＭの精度を向上させることができる。評価項目間の共起性を考慮して得られた推定モデルＭは、共起性が弱い評価項目については、同じ又は類似する評価結果を出力しないようになるので、推定モデルＭから出力される評価結果の共起性は、評価者による評価結果の共起性に近づき、より自然な出力を得ることができる。また、推定モデルＭの精度を適切に評価することにより、推定モデルＭの学習を繰り返す回数を低減させ、学習済みの推定モデルＭを得る処理を高速化できる。不要な学習を繰り返す必要がなくなるので、学習装置１０の処理負荷を軽減することもできる。また、少ない訓練データであっても高精度の推定モデルＭを得ることができ、学習装置１０のメモリ消費量を低減し、訓練データを準備するコストを低減することもできる。

【0118】

また、推定システムＳは、入力データＤ１に対応する推定モデルＭの出力に基づく評価項目間の共起性に関する推定共起性データＤ４と、正解データＤ２に基づく評価項目間の共起性に関する正解共起性データＤ５と、に基づいて、推定モデルＭの学習を行うことによって、推定モデルＭの出力に対応する共起性が正解となる共起性に近づくようになり、推定モデルＭの精度をより高めることができる。

【0119】

また、推定システムＳは、入力データＤ１に対応する推定モデルＭの出力と正解データＤ２とに基づく予測損失Ｅ１と、推定共起性データＤ４と正解共起性データＤ５とに基づく共起損失Ｅ２と、に基づいて、推定モデルＭの学習を行うことによって、予測損失Ｅ１とは別の評価軸である共起損失を考慮して学習を行い、より正確な共起性が推定モデルＭの出力から得られるようになり、推定モデルＭの精度をより高めることができる。

【0120】

また、推定システムＳは、予測損失Ｅ１と共起損失Ｅ２とに基づいて、合計損失Ｅ３を計算することによって、合計損失Ｅ３といった１つの指標に基づいて推定モデルＭの学習を行うことができ、学習時の処理を簡易化できる。その結果、学習済みの推定モデルＭを得る処理を高速化し、学習装置１０の処理負荷を軽減することもできる。

【0121】

また、推定システムＳは、正解データＤ２における評価項目間の出現確率を示す共起性データを取得することで、評価項目間の共起性を適切に考慮して、推定モデルＭの精度をより高めることができる。

【0122】

また、推定システムＳは、評価項目の組み合わせごとに、当該組み合わせの共起性に関する値を示す共起性データを取得することで、種々の評価項目の共起性を考慮して、推定モデルＭの精度をより高めることができる。

【0123】

また、推定システムＳは、正解データＤ２に基づいて、共起性データを取得することによって、正解データＤ２に含まれる各評価項目の数値を集計し、より正確な共起性を考慮することができるので、推定モデルＭの精度をより高めることができる。

【0124】

また、推定システムＳは、コンテンツＣと属性データＡが入力される推定モデルＭとすることによって、属性に応じた評価結果を得ることができ、推定モデルＭの精度をより高めることができる。また、属性ごとに別々の推定モデルＭを用意することもできるが、その場合には、属性の数だけ推定モデルＭが必要になる。本実施形態の推定モデルＭは１つあれば複数の属性に対応可能になるので、属性ごとに別々の推定モデルＭを用意する場合に比べて、訓練データを用意するコストや推定モデルＭを評価するコストを低減できる。その結果、学習装置１０の処理負荷やメモリ消費量を低減することもできる。

【0125】

また、推定システムＳは、コンテンツＣの印象を評価する推定モデルＭの学習を行うことにより、例えば、マーケティング業務の支援等を行う推定モデルＭを作成できる。推定モデルＭがコンテンツＣの印象を推定することにより、商品デザインや広告画像のプランニングを効果的に支援できる。

【0126】

［５．変形例］
なお、本開示は、以上に説明した実施の形態に限定されるものではない。本開示の趣旨を逸脱しない範囲で、適宜変更可能である。

【0127】

（１）例えば、評価者の属性又は属性に応じた区分によって、共起しやすい印象が異なることがあるので、共起性データ取得部１０３は、属性又は属性に応じた区分ごとに、共起性データを取得してもよい。区分とは、属性の上位概念であり、属性データＡが示す属性よりも広い属性ということもできる。１つの区分には、少なくとも１つの属性値が含まれる。属性値がそのまま区分として用いられてもよいし、属性値を閾値で大まかに区切った単位が区分として用いられてもよい。

【0128】

例えば、「年齢」の属性として、２０代、３０代、４０代、５０代、及び６０代といった５つの属性値が存在した場合に、「２０代以下」、「３０代」、及び「４０代以上」といった３区分が存在してもよい。また例えば、「住所」の属性として、日本全国の都道府県を示す４７個の属性値が存在したとすると、「東北地方」や「関東地方」といった区分が存在してもよい。他の属性についても同様であり、属性よりも大まかな単位を示すものが区分であればよい。

【0129】

ｋ個（ｋは自然数）の属性又は区分が存在したとすると、共起性データ取得部１０３は、ｋ個の共起性データを取得する。個々の共起性データの取得方法は、実施形態で説明した通りである。本変形例でも共起性データとして、推定共起性データＤ４と正解共起性データＤ５が取得される場合を説明する。

【0130】

例えば、共起性データ取得部１０３は、ある属性又はある区分に属する入力データＤ１に対応する推定データＤ３に基づいて、その属性又はその区分の推定共起性データＤ４を取得する。その属性又はその区分の推定共起性データＤ４の内容は、他の属性又は他の区分に属する入力データＤ１に対応する推定データＤ３に依存しない。また例えば、共起性データ取得部１０３は、ある属性又はある区分に属する入力データＤ１に対応する正解データＤ２に基づいて、その属性又はその区分の正解共起性データＤ５を取得する。その属性又はその区分の正解共起性データＤ５の内容は、他の属性又は他の区分に対応する正解データＤ２に依存しない。

【0131】

学習部１０４は、属性又は区分ごとに取得された共起性データに基づいて、推定モデルＭの学習を行う。例えば、学習部１０４は、推定共起性データＤ４と正解共起性データＤ５のペアごとに、これらを所定の計算式に代入して共起損失Ｅ２を計算する。ｋ個のペアが存在したとすると、ｋ個の共起損失Ｅ２が計算される。本変形例では、この計算式が図３と同様である場合を説明するが、図３とは異なる計算式であってもよい。例えば、学習部１０４は、予測損失Ｅ１と、ｋ個の共起損失Ｅ２と、に基づいて、合計損失Ｅ３を計算する。合計損失Ｅ３は、これらの単純な平均であってもよいし、属性又は区分に応じた重み付け係数が考慮されてもよい。合計損失Ｅ３に応じて学習を行う方法自体は、実施形態で説明した通りである。

【0132】

変形例（１）によれば、属性又は属性に応じた区分ごとに共起性データを取得することにより、評価項目間の共起性を適切に考慮して、推定モデルＭの精度をより高めることができる。例えば、「２０代以下」、「３０代」、及び「４０代以上」の各々で共起性が異なったとしても、これらの年齢層ごとに共起性データを取得することで、年齢層に応じた共起性の違いを吸収した推定モデルＭとすることができる。

【0133】

（２）また例えば、変形例（１）では、属性又は区分ごとに共起性データが取得される場合を説明したが、共起性データ取得部１０３は、属性又は区分の組み合わせごとに、共起性データを取得してもよい。この組み合わせは、複数の属性又は複数の区分のセットである。組み合わせは、２つに限られず、３つ以上であってもよい。例えば、性別（男性と女性）という区分と、年齢層（２０代以下、３０代、４０代以上）という区分と、を組み合わせて２×３の６区分が存在してもよい。なお、これらを組み合わせずに、属性の種別ごとに区分されて別々に扱われてもよい。この場合、２＋３で５区分となる。

【0134】

組み合わせがｍ個（ｍは自然数）であったとすると、学習部１０４は、ｍ個の共起性データを取得する。個々の共起性データの取得方法は、実施形態又は変形例（１）で説明した通りである。例えば、共起性データ取得部１０３は、ある属性又はある区分の組み合わせに属する入力データＤ１に対応する推定データＤ３に基づいて、その組み合わせの推定共起性データＤ４を取得する。その属性又はその区分の推定共起性データＤ４の内容は、他の属性又は他の区分に属する入力データＤ１に対応する推定データＤ３に依存しない。また例えば、共起性データ取得部１０３は、ある属性又はある区分の組み合わせに属する入力データＤ１に対応する正解データＤ２に基づいて、その組み合わせの正解共起性データＤ５を取得する。その属性又はその区分の正解共起性データＤ５の内容は、他の属性又は他の区分に対応する正解データＤ２に依存しない。

【0135】

学習部１０４は、属性又は区分の組み合わせごとに取得された共起性データに基づいて、推定モデルＭの学習を行う。例えば、学習部１０４は、推定共起性データＤ４と正解共起性データＤ５のペアごとに、これらを所定の計算式に代入して共起損失Ｅ２を計算する。ｍ個のペアが存在したとすると、ｍ個の共起損失Ｅ２が計算される。本変形例では、この計算式が図３と同様である場合を説明するが、図３とは異なる計算式であってもよい。例えば、学習部１０４は、予測損失Ｅ１と、ｍ個の共起損失Ｅ２と、に基づいて、合計損失Ｅ３を計算する。合計損失Ｅ３は、これらの単純な平均であってもよいし、属性又は区分に応じた重み付け係数が考慮されてもよい。合計損失Ｅ３に応じて学習を行う方法自体は、実施形態で説明した通りである。

【0136】

変形例（２）によれば、属性又は区分の組み合わせごとに共起性データを取得することにより、評価項目間の共起性を適切に考慮して、推定モデルＭの精度をより高めることができる。例えば、「男性」と「女性」の性別と、「２０代以下」、「３０代」、及び「４０代以上」といった年齢層と、の組み合わせによって共起性が異なったとしても、性別と年齢層の組み合わせごとに共起性データを取得することで、性別と年齢層の組み合わせに応じた共起性の違いを吸収した推定モデルＭとすることができる。

【0137】

（３）また例えば、上記変形例（１）－（２）を組み合わせてもよい。

【0138】

また例えば、実施形態及び変形例（１）－（２）では、訓練データと共起性データとに基づく学習方法の一例として、予測損失Ｅ１と共起損失Ｅ２に基づく合計損失Ｅ３を利用する処理を説明したが、学習方法は、実施形態及び変形例（１）－（２）で説明した例に限られない。

【0139】

例えば、学習部１０４は、共起損失Ｅ２を計算せず、正解共起性データＤ５に基づいて、予測損失Ｅ１に基づく学習のさせ方を変えてもよい。この場合、学習部１０４は、正解共起性データＤ５が示す共起性が強い評価項目間の数値が同じ正解データＤ２は信頼性が高いので、学習係数を大きくして予測損失Ｅ１に基づく学習を強く行うようにしてもよい。学習部１０４は、正解共起性データＤ５が示す共起性が弱い評価項目間の数値が同じ正解データＤ２は信頼性が低いので、学習係数を小さくして予測損失Ｅ１に基づく学習を弱く行うようにしてもよい。一部の評価者については、正しく評価を行わずに適当に評価をする可能性があるので、上記のように、学習部１０４は、評価項目間の共起性に基づいて正解データＤ２の信頼性を推定し、学習に強弱をつけてもよい。

【0140】

また例えば、学習部１０４は、正解データＤ２の信頼性に応じて学習に強弱をつけるのではなく、その正解データＤ２をそもそも学習させるか否かを決定してもよい。この場合、学習部１０４は、正解共起性データＤ５が示す共起性が強い評価項目間の数値が同じ正解データＤ２は信頼性が高いので、予測損失Ｅ１を計算して推定モデルＭに学習させる。学習部１０４は、正解共起性データＤ５が示す共起性が弱い評価項目間の数値が同じ正解データＤ２は信頼性が低いので、予測損失Ｅ１を計算せずに推定モデルＭに学習させないようにしてもよい。

【0141】

また例えば、学習部１０４は、共起損失Ｅ２を計算せず、正解共起性データＤ５に基づいて、予測損失Ｅ１の計算式の重み付け係数を決定してもよい。この場合、学習部１０４は、共起性が弱い評価項目間の数値が同じ又は類似していた場合に、予測損失Ｅ１が大きくなるように、重み付け係数を決定してもよい。また例えば、学習部１０４は、正解共起性データＤ５に基づいて、共起性が強い複数の評価項目を１つの評価項目に統合し、統合された評価項目に基づいて推定モデルＭを学習させてもよい。

【0142】

また例えば、推定モデルＭの目的としてマーケティング業務の支援を説明したが、推定モデルＭは、任意の目的で利用可能である。例えば、推定モデルＭは、画像であるコンテンツＣ内の物体を認識してもよい。認識対象の物体は、任意の物体であってよく、例えば、カメラで撮影された撮影画像内の被写体であってもよいし、ＣＧに描かれたオブジェクトであってもよい。他にも例えば、推定モデルＭは、生体認証で利用されてもよい。この場合、推定モデルＭは、人の顔、指紋パターン、静脈パターン、筆跡パターン、又はまばたきパターンなどの生体情報の正当性を推定する。これらの生体情報は、画像を利用して取得されるようにすればよい。

【0143】

また例えば、推定モデルＭは、画像認識以外の認識を行ってもよい。例えば、推定モデルＭが音声認識を行う場合には、入力データＤ１は音声データになり、正解データＤ２は音声に対応する認識結果となる。推定結果は、音声を示すテキストであってもよいし、音声の発話者を識別する情報であってもよい。画像認識及び音声認識以外にも、推定モデルＭは、任意の推定を行うことができ、例えば、自然言語処理、行動パターンの推定、又は自然界の現象の推定にも利用可能である。入力データＤ１は、それに応じたデータであればよい。推定モデルＭの評価対象データは、コンテンツＣに限られず、他のデータであってもよい。

【0144】

また例えば、推定システムＳは、共起性データに基づかずに、推定モデルＭの学習を行ってもよい。即ち、評価項目間の共起性は、推定モデルＭの学習で考慮されなくてもよい。この場合、推定モデルＭには、コンテンツＣと属性データＡを含む入力データが入力され、その出力である推定データＤ３と、正解データＤ２と、に基づいて推定モデルＭの学習が行われる。学習では、予測損失Ｅ１が計算され、共起損失Ｅ２は計算されない。このようにすることで、属性ごとに別々の推定モデルＭを用意する場合に比べて、１つの推定モデルＭを用意すれば済み、訓練データを準備するコストや推定モデルＭを評価するコストを低減できる。更に、１つの推定モデルＭにより評価者の属性を考慮した推定結果を出力できるので、学習装置１０及び推定装置２０の処理負荷及びメモリ消費量を低減できる。

【0145】

また例えば、推定システムＳに学習装置１０と推定装置２０が含まれる場合を説明したが、学習装置１０と推定装置２０は、別々のシステムに存在してもよい。また例えば、データ記憶部１００，２００に記憶されるものとして説明したデータは、学習装置１０又は推定装置２０とは異なる他のコンピュータ又は情報記憶媒体に記憶されていてもよい。

【符号の説明】

【0146】

Ｓ推定システム、Ｎネットワーク、１０学習装置、２０推定装置、３０評価者装置、１１，２１，３１制御部、１２，２２，３２記憶部、１３，２３，３３通信部、１４，２４，３４操作部、１５，２５，３５表示部、Ｇ評価画面、Ｍ推定モデル、Ｂ１，Ｂ２，Ｂ３ボタン、Ｄ１入力データ、Ｄ２正解データ、Ｄ３推定データ、Ｄ４推定共起性データ、Ｄ５正解共起性データ、ＤＳ訓練データセット、Ｅ１予測損失、Ｅ２共起損失、Ｅ３合計損失、１００データ記憶部、１０１生成部、１０２訓練データ取得部、１０３共起性データ取得部、１０４学習部、２００データ記憶部、２０１入力部、２０２取得部、２０３処理実行部。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【手続補正書】

【提出日】2021-12-01

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

前記共起性データは、前記正解データにおける前記項目間の出現確率を示す、
ことを特徴とする請求項１～４の何れかに記載の学習装置。

【請求項6】

前記共起性データは、前記項目の組み合わせごとの共起性を示す、
ことを特徴とする請求項１～５の何れかに記載の学習装置。

【請求項7】

【請求項8】

【請求項9】

【請求項10】

【請求項11】

【請求項12】

【請求項13】

コンピュータが、
入力データと、複数の項目を含む正解データと、が対応付けられた訓練データを取得する訓練データ取得ステップと、
前記項目間の共起性に関する共起性データを取得する共起性データ取得ステップと、
前記訓練データと、前記共起性データと、に基づいて、推定モデルの学習を行う学習ステップと、
を実行することを特徴とする学習方法。

【請求項14】

コンピュータが、
入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた推定モデルに、推定対象の入力データを入力する入力ステップと、
前記推定対象の入力データに対応する前記推定モデルの出力を取得する取得ステップと、
を実行することを特徴とする推定方法。

【請求項15】

【請求項16】

入力データと複数の項目を含む正解データとが対応付けられた訓練データと、前記項目間の共起性に関する共起性データと、に基づく学習が行われた学習済みのパラメータに基づいて、推定対象の入力データに対応する推定結果を出力する、
学習済み推定モデルのプログラム。

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版