(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-13
(45)【発行日】2024-05-21
(54)【発明の名称】操作予測装置及びそのモデル学習方法、操作予測方法
(51)【国際特許分類】
G06N 3/09 20230101AFI20240514BHJP
G06F 16/9035 20190101ALI20240514BHJP
G06F 18/2431 20230101ALI20240514BHJP
【FI】
G06N3/09
G06F16/9035
G06F18/2431
(21)【出願番号】P 2020115035
(22)【出願日】2020-07-02
【審査請求日】2023-05-12
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】井尻 善久
(72)【発明者】
【氏名】米谷 竜
(72)【発明者】
【氏名】谷合 竜典
【審査官】多賀 実
(56)【参考文献】
【文献】特開2018-063484(JP,A)
【文献】KAMISHIMA, Toshihiro et al.,"Nantonac Collaborative Filtering - A Model-Based Approach",Proceedings of the Fourth ACM Conference on Recommender Systems (RecSys '10) [online],米国,Association for Computing Machinery,2010年,pp. 273-276,[検索日 2021.08.12],インターネット:<https://dl.acm.org/doi/pdf/10.1145/1864708.1864765>, <DOI: 10.1145/1864708.1864765>
【文献】SHARMA, Abhishek,"Listwise Learning to Rank with Deep Q-Networks",arXiv.org [online],arXiv: 2002.07651v1,米国,Cornell University,2020年02月,pp. 1-8,[検索日 2021.08.12], インターネット:<URL: https://arxiv.org/pdf/2002.07651v1.pdf>
【文献】PEI, Changhua et al.,"Personalized Re-Ranking for Recommendation",Proceedings of the 13th ACM Conference on Recommender Systems (RecSys '19) [online],米国,Association for Computing Machinery,2019年,pp. 3-11,[検索日 2021.08.12],インターネット:<https://dl.acm.org/doi/pdf/10.1145/3298689.3347000>,<DOI: 10.1145/3298689.3347000>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 16/00-16/958
G06F 18/00-18/40
G06Q 10/04-10/047
G06Q 30/00-30/08
(57)【特許請求の範囲】
【請求項1】
複数のオブジェクトからなるデータセットを取得するデータセット取得部と、
ユーザの属性情報を取得する属性情報取得部と、
機械学習されたモデルを用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測する予測部と、を有し、
前記モデルは、
前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュールと、
前記第1モジュールにより得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の処理を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュールと、
を含む構造を有しており、
前記モデルは、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されている
ことを特徴とする操作予測装置。
【請求項2】
前記ニューラルネットワークは、少なくとも1つのオブジェクトと前記属性情報が入力として与えられ、指標値の確率分布を出力する構造を有しており、
前記第1モジュールは、前記ニューラルネットワークから出力された確率分布から指標値をサンプリングし、当該指標値を前記第2モジュールへ出力する
ことを特徴とする請求項1に記載の操作予測装置。
【請求項3】
前記第1モジュールは、微分可能な関数を用いて、前記確率分布から前記指標値をサンプリングする
ことを特徴とする請求項2に記載の操作予測装置。
【請求項4】
前記ニューラルネットワークは、前記第1モジュール及び前記第2モジュールのいずれかで得られる値が再帰的に入力される構造を有する
ことを特徴とする請求項1~3のうちいずれか1項に記載の操作予測装置。
【請求項5】
前記第1モジュールは、複数のオブジェクトが入力として与えられ、前記複数のオブジェクトが同時に又は連続的に発生したという条件における指標値を出力する構造を有することを特徴とする請求項1~4のうちいずれか1項に記載の操作予測装置。
【請求項6】
前記オブジェクト又は前記属性情報は複数の情報を含んでおり、
前記第1モジュールは、前記複数の情報のそれぞれに対応した複数のサブモジュールから構成されており、各オブジェクトについて、前記複数のサブモジュールで得られた複数の指標値を出力する
ことを特徴とする請求項1~5のうちいずれか1項に記載の操作予測装置。
【請求項7】
前記所定の処理は、
前記指標値に対する四則演算、
前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトの並び替え、
前記指標値もしくは前記指標値から演算された値に対する閾値処理、
前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトからの一部のオブジェクトの選択、及び、
前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトのグループ分け、
のうち少なくともいずれかを含む
ことを特徴とする請求項1~6のうちいずれか1項に記載の操作予測装置。
【請求項8】
前記所定の処理は、微分可能な関数を用いた処理、又は、微分可能な関数を用いた処理の組み合わせにより近似されて構成される
ことを特徴とする請求項1~7のうちいずれか1項に記載の操作予測装置。
【請求項9】
請求項1~8のうちいずれか1項に記載の操作予測装置において用いられるモデルを機械学習するためのモデル学習方法であって、
複数のサンプルからなるサンプルデータセットを取得するステップと、
前記複数のサンプルに対する操作者の操作結果である正解データを取得するステップと、
前記操作者の属性情報を取得するステップと、
前記複数のサンプルからなるサンプルデータセット、前記正解データ、及び、前記操作者の属性情報を用いて、前記モデルの機械学習を行うステップと、
を有することを特徴とするモデル学習方法。
【請求項10】
前記機械学習を行うステップでは、誤差逆伝播法により、前記複数のサンプルと前記操作者の属性情報とを入力として与えたときの前記モデルの出力と、前記正解データとのあいだの誤差に基づき、前記第1モジュール及び前記第2モジュールの学習が行われる
ことを特徴とする請求項9に記載のモデル学習方法。
【請求項11】
複数のオブジェクトからなるデータセットを取得するステップと、
ユーザの属性情報を取得するステップと、
機械学習されたモデルを用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測するステップと、を有し、
前記モデルは、
前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュールと、
前記第1モジュールにより得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の操作を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュールと、
を含む構造を有しており、
前記モデルは、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されている
ことを特徴とする操作予測方法。
【請求項12】
請求項9又は10に記載のモデル学習方法の各ステップをプロセッサに実行させるためのプログラム。
【請求項13】
請求項11に記載の操作予測方法の各ステップをプロセッサに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、属人的な操作を機械学習により予測するための技術に関する。
【背景技術】
【0002】
提示された複数のオブジェクト(候補)に対して人が主観や経験則などの個人的(属人的)な評価に基づいて特定の操作を行う、という場面は数多く存在する。例えば、通常の社会生活の中で、レストランのメニューの中から美味しそうな料理を選択することや、複数の候補者の写真をみて魅力的な順にランキングすること、ショップ内の商品群の中から可愛いアイテムを選んでコーディネートすることなども、その一例である。
【0003】
従来より、このような人間の主観や経験に依存する属人的評価を機械学習によって予測する研究がなされている。下記の非特許文献1では、料理写真の美味しそうに見える度合を評価する方法が提案され、非特許文献2では、画像の審美性を評価する方法が提案されている。
【先行技術文献】
【非特許文献】
【0004】
【文献】高橋和馬,道満恵介,川西康友,平山高嗣,井手一郎,出口大輔,村瀬洋,”料理写真の魅力度推定に用いる特徴量の検討による精度向上”,電子情報通信学会技術研究報告,2016年10月6日,第116巻,第245号,p.41-46
【文献】X. Lu, Z. Lin, H. Jin, J. Yang and J. Z. Wang, "Rating Image Aesthetics Using Deep Learning," in IEEE Transactions on Multimedia, vol. 17, no. 11, pp. 2021-2034, Nov. 2015.
【文献】Grover, Aditya, et al. "Stochastic optimization of sorting networks via continuous relaxations." arXiv preprint arXiv:1903.08850 (2019).
【文献】Cuturi, Marco, Olivier Teboul, and Jean-Philippe Vert. "Differentiable Ranks and Sorting using Optimal Transport: The Sinkhorn CDF and Quantile Operator." arXiv preprint arXiv:1905.11885 (2019).
【文献】Jang, Eric, Shixiang Gu, and Ben Poole. "Categorical reparameterization with gumbel-softmax." arXiv preprint arXiv:1611.01144 (2016).
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の研究はいずれも、「美味しそうに見える度合」や「美しいと感じる度合」のような主観的指標をユーザが定義し、属人的評価を定量化・数値化しようとするアプローチである。それゆえ、機械学習を実施するためには、学習データとして用意する画像の夫々に対して、主観的指標の真値(正解データ)を与える必要があった。
【0006】
しかしながら、人によって嗜好や感じ方はさまざまであるため、主観的指標の真値を定めることは困難である。また、そもそも人の主観や経験に基づく評価や価値を数値で表現すること自体が難しいため、適切な主観的指標を設計することができないこともある。このような問題点から、従来のアプローチには限界があった。
【0007】
本発明は、上記課題に鑑みなされたものであって、複数のオブジェクトに対する属人的な操作を機械学習により予測するための新規な技術を提供することを目的とする。また、本発明の目的の一つは、主観的指標の定義及び真値を与えなくても、人間の主観や経験などに依存する属人的な操作を機械学習することが可能な新規な技術を提供することである
。
【課題を解決するための手段】
【0008】
本開示は、複数のオブジェクトからなるデータセットを取得するデータセット取得部と、ユーザの属性情報を取得する属性情報取得部と、機械学習されたモデルを用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測する予測部と、を有し、前記モデルは、前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュールと、前記第1モジュールにより得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の処理を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュールと、を含む構造を有しており、前記モデルは、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されていることを特徴とする操作予測装置を含む。
【0009】
このような構成の操作予測装置によれば、データセットと属性情報を与えると、当該属性情報に該当する者が当該データセットに対して行うであろう操作を予測することができる。予測の対象となる操作は、属人的な評価に基づく操作であるとよく、例えば、趣味・嗜好又は経験則に基づくオブジェクトの選択、並べ替え、グループ分けなどである。
【0010】
従来、この種の属人的な操作を機械学習するには、主観的指標の定義及び真値を与える必要があった。これに対し、上記操作予測装置では、主観的指標に相当する「指標値」がモデルの内部パラメータとなっており、指標値の定義や真値を陽に与える必要がない。すなわち、学習時には、ある操作者(テスター)がサンプルデータセットに対して行った操作結果(例えば、選択結果、並べ替えの結果、グループ分けの結果など)を正解データとして与えるだけで、当該操作に相関のある指標値が自動的に獲得される。したがって、主観的指標の定義及び真値を与えなくても、人間による主観的な操作を機械学習により予測することが可能となる。
【0011】
オブジェクトの選択、並べ替え、グループ分けなどのユーザ操作を第2モジュールで行うことを想定した場合、通常、これらの操作を模擬するための「所定の処理」は微分不可能(non-differentiable)な処理である。第2モジュールが微分不可能な処理を含む場合には、モデルの学習時に、誤差逆伝播法を用いて、第2モジュールの出力である予測結果の誤差を、第2モジュールの入力(これが第1モジュールの出力でもある)である指標値の誤差へと伝播させることができない、という制約が生じる。その場合は、例えば、第2モジュールの誤差を推定する専用モデルなどを用いて、予測結果の誤差を指標値の誤差へと変換してもよい。
【0012】
上記のようなモデル学習時の制約を解決するために、前記所定の処理は、微分可能な関数を用いた処理、又は、微分可能な関数を用いた処理の組み合わせにより近似されて構成されてもよい。微分可能な処理で第2モジュールの内部計算を構成することで、予測結果の誤差を第2モジュールを介して第1モジュールへと逆伝播させることが可能になる。これにより、誤差逆伝播法を用いてモデル全体(つまり、第1モジュールと第2モジュールを一緒に)の機械学習を実施可能となり、モデルの学習が容易となる。
【0013】
前記ニューラルネットワークは、少なくとも1つのオブジェクトと前記属性情報が入力として与えられ、指標値の確率分布を出力する構造を有してもよい。前記第1モジュールは、前記ニューラルネットワークから出力された確率分布から指標値をサンプリングし、当該指標値を前記第2モジュールへ出力してもよい。このような確率モデルを用いること
により、予測結果の妥当性の向上が期待できる。
【0014】
前記第1モジュールは、微分可能な関数を用いて、前記確率分布から前記指標値をサンプリングしてもよい。これにより、誤差逆伝播法を用いて第1モジュールの機械学習を実施可能となる。
【0015】
第1モジュール及びニューラルネットワークは、さまざまな構造を採り得る。例えば、前記ニューラルネットワークは、前記第1モジュール及び前記第2モジュールのいずれかで得られる値が再帰的に入力される構造を有してもよい。また、前記第1モジュールは、複数のオブジェクトが入力として与えられ、前記複数のオブジェクトが同時に又は連続的に発生したという条件における指標値を出力する構造を有してもよい。また、前記オブジェクト又は前記属性情報は複数の情報を含んでもよい。この場合に、前記第1モジュールは、前記複数の情報のそれぞれに対応した複数のサブモジュールから構成されており、各オブジェクトについて、前記複数のサブモジュールで得られた複数の指標値を出力してもよい。
【0016】
前記所定の処理は、前記指標値に対する四則演算、前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトの並び替え、前記指標値もしくは前記指標値から演算された値に対する閾値処理、前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトからの一部のオブジェクトの選択、及び、前記指標値もしくは前記指標値から演算された値に基づく前記複数のオブジェクトのグループ分け、
のうち少なくともいずれかを含んでもよい。
【0017】
本開示は、操作予測装置において用いられるモデルを機械学習するためのモデル学習方法であって、複数のサンプルからなるサンプルデータセットを取得するステップと、前記複数のサンプルに対する操作者の操作結果である正解データを取得するステップと、前記操作者の属性情報を取得するステップと、前記複数のサンプルからなるサンプルデータセット、前記正解データ、及び、前記操作者の属性情報を用いて、前記モデルの機械学習を行うステップと、を有することを特徴とするモデル学習方法を含む。このとき、前記機械学習を行うステップでは、誤差逆伝播法により、前記複数のサンプルと前記操作者の属性情報とを入力として与えたときの前記モデルの出力と、前記正解データとのあいだの誤差に基づき、前記第1モジュール及び前記第2モジュールの学習が行われてもよい。
【0018】
本開示は、複数のオブジェクトからなるデータセットを取得するステップと、ユーザの属性情報を取得するステップと、機械学習されたモデルを用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測するステップと、を有し、前記モデルは、前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュールと、前記第1モジュールにより得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の操作を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュールと、を含む構造を有しており、前記モデルは、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されていることを特徴とする操作予測方法を含む。
【0019】
本発明は、上記手段ないし構成の少なくとも一部を有する操作予測装置として捉えてもよいし、その予測結果を用いて操作/評価/行動選択/制御/模擬/提案/推薦/検索などを行うシステムとして捉えてもよい。また、本発明は、操作予測装置で用いるモデルのモデル学習方法やモデル学習装置として捉えてもよい。また、本発明は、上記処理の少な
くとも一部を含む操作予測方法や操作予測装置の制御方法として捉えてもよいし、その予測結果を用いて操作/評価/行動選択/制御/模擬/提案/推薦/検索などを行う方法として捉えてもよい。また、本発明は、上記方法の各ステップをプロセッサに実行させるためのプログラムやそのプログラムを記録した記録媒体として捉えることもできる。なお、上記手段及び処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【発明の効果】
【0020】
本発明によれば、主観的指標の定義及び真値を与えなくても、人間の主観や経験などに依存する属人的な操作を機械学習したモデルを生成でき、そのモデルを用いることによって、複数のオブジェクトに対する属人的な操作を予測することが可能となる。
【図面の簡単な説明】
【0021】
【
図1】
図1は、予測モデルの構造を示す模式図である。
【
図3】
図3A及び
図3Bは、第1モジュールの構成のバリエーションを示す図である。
【
図4】
図4は、第1モジュールの構成のバリエーションを示す図である。
【
図5】
図5は、操作予測装置の構成例を示すブロック図である。
【
図6】
図6は、モデル学習処理の一例を示すフローチャートである。
【
図7】
図7は、予測処理の一例を示すフローチャートである。
【
図8】
図8は、実施例1の予測モデルの構成を模式的に示す図である。
【
図9】
図9は、実施例2の予測モデルの構成を模式的に示す図である。
【
図10】
図10は、予測モデルを装置のメンテナンス支援に応用した例を説明する図である。
【発明を実施するための形態】
【0022】
以下に図面を参照して、本発明に係る操作予測装置及びそのモデル学習方法、並びに操作予測方法の一実施形態について説明する。
【0023】
<予測モデル>
図1を参照して、人間の主観や経験などに依存する属人的な操作の予測に用いるモデル(以下「予測モデル」と呼ぶ。)を説明する。
図1は予測モデルの構造を示す模式図である。
【0024】
予測モデル1は、複数のオブジェクトからなるデータセットx={x1,…,xN}とユーザの属性情報aが入力として与えられると、当該ユーザがデータセットxに対して行うであろう操作を予測結果y={y1,…,yN}として出力するものである。
【0025】
オブジェクトxi(i=1,…,N)にはどのような種類のデータを用いてもよく、予測モデル1を適用するアプリケーションにあわせて適宜設計することができる。例えば、画像データ(動画像含む)、テキストデータ、音声データなどをオブジェクトとして用いてもよく、複数のデータの組み合わせを1つのオブジェクトとしてもよい。複数のデータの組み合わせの例として、画像とその画像に写る被写体の説明文(例えば、料理のレシピ、観光スポットの解説など)、画像とその画像に写る場所に関する地理情報(例えば、緯度・経度などの位置情報、最寄りの駅・空港、最寄の駅・空港からの所要時間など)などが挙げられる。また、複数枚の画像の組み合わせのように、同じ種類のデータの組み合わせでもよい。なお、オブジェクトの個数Nは任意に設定してよい。
【0026】
属性情報aは、ユーザを層別するための情報である。予測モデル1を適用するアプリケーションに依って層別の観点は異なり得るため、属性情報としてはどのような情報を用いてもよい。一例を挙げれば、年齢、年齢層、性別、血液型、職業、収入、資産、身長、体重、健康状態、既往症、出身地、居住地、国籍、家族構成、趣味、嗜好などを属性情報として用いることができる。また、パーソナライゼーションされた結果を出力するアプリケーションの場合であれば、ユーザ個人を識別する情報(氏名、個人ID、マイナンバーなど)を属性情報として用いてもよい。属性情報aとして入力するのは単一の情報でもよいし、複数の情報の組み合わせ(例えば、年齢と性別など)でもよい。
【0027】
予測結果yは、ユーザがデータセットxに対して操作を行った結果を表している。操作の例として、k個のオブジェクトの選択(1≦k<N)、オブジェクトの並べ替え(ランキング)、オブジェクトのグループ分け、及び、これらの操作の組み合わせなどが挙げられる。操作の具体的内容についても、予測モデル1を適用するアプリケーションにあわせて適宜設計してよい。
【0028】
ここで、「データセットxに対して行う操作」とは、データセットxに含まれる全てのオブジェクトx1,…,xNを考慮に入れた条件下でデータセットxのうちの一部又は全部のオブジェクトxiに対して行う操作、を意味する。すなわち、予測モデル1は、1つの入力オブジェクトに対して個別の予測結果を出力するという構成ではなく、N個の入力オブジェクト群に対して総合的な予測結果を出力するという構成を採用している。
【0029】
図1に模式的に示すように、予測モデル1は、第1モジュールM1と第2モジュールM2を連結した多段構造を有する。前段の第1モジュールM1は、入力されたオブジェクトx
iと属性情報aの組み合わせに対応する指標値v
iを、ニューラルネットワークを用いて計算するユニットである。第1モジュールM1は、オブジェクトx
iと属性情報aが与えられた際の指標値v
iに関する確率モデル P(v
i|x
i,a) で表現される。第1モジュールM1は、データセットxに含まれる複数のオブジェクトx
1,…,x
Nのそれぞれについて指標値v
1,…,v
Nを計算するように構成され、計算された指標値のセットV={v
1,…,v
N}を第2モジュールM2へと出力する。後段の第2モジュールM2は、複数のオブジェクトx
1,…,x
Nにそれぞれ対応する複数の指標値v
1,…,v
Nに対し所定の処理を行うことによって、予測結果yを計算するユニットである。第2モジュールM2は、指標値のセットV={v
1,…,v
N}から予測結果yを出力する関数 y=F(V) で表現される。
【0030】
<第1モジュール>
第1モジュールM1で用いられるニューラルネットワークはどのような構造のものでもよく、予測モデル1を適用するアプリケーションにあわせて適宜設計することができる。例えば、畳み込みニューラルネットワークやその改良型を用いてもよい。また、リカレントニューラルネットワークのように、第1モジュールM1及び第2モジュールM2のいずれかで得られる値が再帰的に入力される構造を有するニューラルネットワークを用いてもよい。
【0031】
【0032】
図2Aは、1つのオブジェクトx
iと属性情報aが入力され、1つの指標値v
iが出力される構成である。
【0033】
図2B~
図2Dは、1つのオブジェクトx
iと属性情報aが入力され、複数の指標値v1
i,v2
iが出力される構成である。この種の第1モジュールM1は、それぞれが異な
る指標値v1
i,v2
i,…を出力するように構成された複数のサブモジュールM11,M12,…を組み合わせることにより実現できる。
図2B~
図2Dでは2つのサブモジュールを組み合わせた例を示しているが、3つ以上のサブモジュールを組み合わせれば、1つの入力オブジェクトx
iに対して、3つ以上の指標値を出力することも可能である。
【0034】
図2Bの例では、各サブモジュールM11,M12には同じデータ(x
i,a)が入力される。ただし、サブモジュールM11,M12は構造が異なるか、又は、構造が同じであっても学習により獲得した内部パラメータが相違しているため、異なる指標値v1
i,v2
iが出力され得る。
【0035】
図2Cは、1つのオブジェクトx
iが複数の情報x1
i,x2
iを含んだデータ(例えば、画像x1
iとテキストx2
iなど)である場合の例である。サブモジュールM11は、情報x1
iと属性情報aに基づき第1の指標値v1
iを出力し、サブモジュールM12は、情報x2
iと属性情報aに基づき第2の指標値v2
iを出力するように構成されている。
【0036】
図2Dは、属性情報aが複数の情報a1,a2を含んだデータ(例えば、年齢a1と性別a2など)である場合の例である。サブモジュールM11は、オブジェクトx
iと属性情報a1に基づき第1の指標値v1
iを出力し、サブモジュールM12は、オブジェクトx
iと属性情報a2に基づき第2の指標値v2
iを出力するように構成されている。
【0037】
図2Eは、第1モジュールM1に複数のオブジェクトが入力される例である。複数のオブジェクトのうちの1つが、指標値v
iを求める対象のオブジェクトx
iであり、残りは参照オブジェクトx
jである。参照オブジェクトx
jは1つでもよいし複数でもよい。この構成の場合に、第1モジュールM1は、複数のオブジェクトx
i,x
jが同時に又は連続的に発生したという条件における条件付き確率を指標値v
iとして出力するとよい。
【0038】
図2Fも、第1モジュールM1に複数のオブジェクトが入力される例である。
図2Eの構成との違いは、入力されたオブジェクトx
i,x
j,…のそれぞれに対応する指標値v
i,v
j,…が出力される点である。この構成の場合、指標値v
iは、複数のオブジェクトx
i,x
j,…が同時に又は連続的に発生したという条件における、オブジェクトx
iの条件付き確率であり、指標値v
jは、同じ条件におけるオブジェクトx
jの条件付き確率である。
【0039】
図3Aは、第2モジュールM2の出力である予測結果yを第1モジュールM1に再帰させる構成の例を示し、
図3Bは、第1モジュールM1の出力である指標値v
iを第1モジュールM1に再帰させる構成の例である。ここで、予測結果yや指標値v
iは第1モジュールM1のニューラルネットワークの中間層に与えられてもよいし、入力層に与えられてもよい。
【0040】
なお、第1モジュールM1の構成は
図2A~
図2F、
図3A~
図3Bに示したものに限られない。例えば、
図2B~
図2Dは2つの指標値を出力する例であるが、これに限らず、3つ以上の指標値を出力する構成としてもよい。また、オブジェクトx
iと属性情報aがともに複数の情報を含んでいる場合には、その全ての組み合わせに対応した数の指標値を出力してもよい。また、
図2A~
図2Fの構成を適宜組み合わせることにより、複数のオブジェクトと属性情報が入力され、複数の指標値を出力する構成の第1モジュールM1を作成してもよい。また、再帰の具体的構造は
図3A~
図3Bに示したものに限定されない。例えば、第1モジュールM1の中間状態(ニューラルネットワークの中間層の値又は出力層の値など)を再帰させてもよいし、第2モジュールM2の中間状態(予測結果yの計算過程の値など)を再帰させてもよい。
【0041】
図4は、第1モジュールM1の一具体例を示している。
図4の構成は、変分オートエンコーダで用いられる確率的エンコーダの構造を第1モジュールM1に応用したものである。この第1モジュールM1は、ニューラルネットワーク40とサンプリング部41から構成される。ニューラルネットワーク40は、少なくともオブジェクトx
iとユーザの属性情報aとが入力として与えられ、指標値v
iの確率分布を出力する構造を有している。ここでは、指標値v
iにガウス分布を仮定し、ニューラルネットワーク40からパラメータμ
i,σ
i
2を出力する(μ
i:平均、σ
i
2:分散)。サンプリング部41は、ニューラルネットワーク40から出力された確率分布N(μ
i,σ
i
2)から指標値v
iのサンプリングを行う。このとき、サンプリング部41は、微分可能な関数を用いて、確率分布N(μ
i,σ
i
2)から指標値v
iを決定するとよい。下記式は指標値v
iを計算するための関数の一例である。
v
i=μ
i+σ
iv
*
v
*~N(0,1)
この関数は、平均値μ
iに確率的なノイズσ
iv
*を加えた値を指標値v
iとして出力するよう設計されている。
【0042】
このように、微分可能な関数によってサンプリングを行う構成を採用したことで、指標値viの誤差をサンプリング部41を介してニューラルネットワーク40へと逆伝播させることが可能になる。これにより、誤差逆伝播法を用いて第1モジュールM1の機械学習を実施可能となる。
【0043】
<第2モジュール>
第2モジュールM2は、指標値のセットV={v1,…,vN}に対し所定の処理を施し、予測結果y={y1,…,yN}を出力するものである。第2モジュールM2は、単一の要素(1つの指標値vi)に対して処理を行うものではなく、複数の要素からなる集合(指標値のセットV)に対して処理を行うところに特徴の一つを有する。これにより、第2モジュールM2では、他の要素との関係を考慮した操作(例えば、並べ替え、選択、グループ分けなど)が実現できる。所定の処理は、予測モデル1を適用するアプリケーションにあわせて適宜設計することができる。例えば、下記の1)~5)のうちの1つ以上の処理を組み合わせて構成されるとよい。
【0044】
1)指標値v1,…,vNに対する四則演算(足し算、引き算、内積など)
2)指標値v1,…,vNもしくは指標値v1,…,vNから演算された値w1,…,wNに基づく複数のオブジェクトx1,…,xNの並び替え
3)指標値viもしくは指標値viから演算された値wiに対する閾値処理
4)指標値v1,…,vNもしくは指標値v1,…,vNから演算された値w1,…,wNに基づく複数のオブジェクトx1,…,xNからの一部のオブジェクトの選択
5)指標値v1,…,vNもしくは指標値v1,…,vNから演算された値w1,…,wNに基づく複数のオブジェクトx1,…,xNのグループ分け
ここで、「値wi」は指標値viに対する四則演算によって得られた値である。
【0045】
例えば、予測モデル1によって予測するユーザ操作が「オブジェクトの選択」の場合であれば、第2モジュールM2の処理は1)と4)の組み合わせで構成することができる。また、予測するユーザ操作が「全オブジェクトの並べ替え(ランキング)」の場合であれば、第2モジュールM2の処理は1)と2)の組み合わせで構成することができ、「一部のオブジェクトの並べ替え(ランキング)」であれば、1)と2)と4)の組み合わせで構成可能である。
【0046】
予測結果yは、入力として与えられた複数のオブジェクトx1,…,xNのそれぞれに
対する予測値y1,…,yNを要素にもつ。予測値yiは、バイナリ値(0又は1)、連続値、確率分布(を表すパラメータ)、ベクトルなど、どのような型の値でもよい。予測値yiの型及びその値の意味(定義)は、予測モデル1を適用するアプリケーションにあわせて適宜設計することができる。
【0047】
例えば、予測するユーザ操作が「オブジェクトの選択」の場合であれば、予測値y
iをバイナリ値で表現し、(1:選択,0:非選択)と定義してもよい。このとき、予測結果yはy={0,0,1,0,1}のようなバイナリベクトルで出力される(この例は、5個のオブジェクトの中から3番目と5番目の2個のオブジェクトが選択されるという予測結果を示している)。また、予測するユーザ操作が「オブジェクトの並べ替え(ソーティングないしランキング)」の場合であれば、予測結果yとして、いわゆる並べ替え行列を出力してもよい。並べ替え行列は、N×Nの行列であり(Nはオブジェクトx
iの数)、第i行にあたるN次元ベクトルy
iの中で値「1」をもつ要素がオブジェクトx
iの順番(ランク)を表している。例えば、下に示す並べ替え行列yは、5個のオブジェクトx
1~x
5の順番(ランク)を「4番目,2番目,5番目,3番目,1番目」と定義する行列の例である。この行列yに従ってオブジェクトを並べ替えると、「x
5→x
2→x
4→x
1→x
3」となる。
【数1】
また、予測するユーザ操作が「オブジェクトのグループ分け」の場合であれば、予測値y
iとして、オブジェクトx
iが属するクラスタを特定する情報を出力してもよい。例えば、クラスタの数がK個、オブジェクトx
iが属するクラスタの番号をk(k=1,…,K)とした場合、k番目の要素のみ「1」、他の要素は「0」となるような、K次元のone-hotベクトルを予測値y
iとして出力してもよい。
【0048】
第2モジュールM2で実行される所定の処理は、微分可能な関数を用いた処理、又は、微分可能な関数を用いた処理の組み合わせ、により近似されて構成されるとよい。微分可能な処理で第2モジュールの内部計算を構成することで、予測結果yの誤差を第2モジュールM2を介して第1モジュールM1へと逆伝播させることが可能になる。
【0049】
処理1)の四則演算が微分可能であることは自明である。処理2)の並べ替えについては、例えば、非特許文献3、4で提案されている処理を用いてもよい。処理3)の閾値処理については、例えば、sigmoid関数やhard-sigmoid関数をstraight-through estimator
(STE)と組み合わせ、フォワードパスのときはsigmoid関数やhard-sigmoid関数で2
値化し、バックワードパスのときは保存しておいた2値化前の値を用いて勾配を計算すればよい。処理4)の選択については、例えば、Gumbel-softmax(非特許文献5参照)やsoftmax関数をstraight-through estimatorと組み合わせてもよい。
【0050】
<装置構成>
図5は、予測モデル1を適用した操作予測装置5の構成例を示すブロック図である。
【0051】
操作予測装置5は、主な構成として、データセット取得部50と、属性情報取得部51と、予測部52と、情報出力部53と、記憶部54と、学習部55と、を有している。データセット取得部50はデータセットxを取得する機能を有し、属性情報取得部51は、
ユーザの属性情報aを取得する機能を有する。予測部52は、予測モデル1を用いて、データセットx及び属性情報aからユーザの操作を予測する機能を有する。情報出力部53は、予測結果や処理結果などの各種の情報をユーザに提供する機能を有する。記憶部54は、データセットx、属性情報a、予測結果、処理結果などの各種データを記憶するための内部ストレージである。学習部55は、予測モデル1の機械学習を実施する機能を有する。なお、操作予測装置5自身が予測モデル1の学習(追加学習含む)を行う場合には学習部55は必要であるが、操作予測装置5が他の学習器で生成された学習済モデルを利用するだけであれば学習部55は実装しなくてもよい。
【0052】
操作予測装置5は、例えば、CPU(プロセッサ)、メモリ、ストレージ、通信装置、入力装置、表示装置などを備える一般的なコンピュータにより構成することができる。この場合、
図5に示す構成及び後述する情報処理は、CPUが、ストレージに記憶されているプログラムをメモリ上に展開し、当該プログラムを実行することによって、ソフトウエア的に実現されるものである。利用するコンピュータは、パーソナルコンピュータ(PC)、スマートフォン、タブレット端末、ウェアラブルコンピュータ、ゲーム装置、オンボードコンピュータなど、どのような形態のものでもよい。なお、操作予測装置5の少なくとも一部の機能をFPGAやASICなどで構成したり、クラウドサーバなどの他の装置で実行したりする構成でもよい。
【0053】
<モデル学習>
図6は、操作予測装置5によって実行されるモデル学習処理の一例を示すフローチャートである。
【0054】
ステップS100において、学習部55が学習用データを取得する。学習用データは、内部ストレージである記憶部54から取得されてもよいし、外部ストレージから取得されてもよい。学習用データは、N個のサンプルからなるサンプルデータセットxs={xs1,…,xsN}と、ある操作者Oがサンプルデータセットxsに対して行った操作結果である正解データyt={yt1,…,ytN}と、操作者Oの属性情報aOとを含んでいる。十分な予測精度を得るために、多数の学習用データを準備することが好ましく、また、サンプルのバリエーション及び属性情報のバリエーションが多いほど好ましい。
【0055】
ステップS101において、学習部55が、第1モジュールM1の全てのパラメータ(ニューラルネットワークの各層の重みなど)に初期値を設定すると共に、学習率などの機械学習に用いるパラメータの値も設定する。
【0056】
ステップS102において、学習部55が、学習用データのサンプルデータセットxsと属性情報aOを第1モジュールM1に入力する。
【0057】
ステップS103において、フォワードパスの演算が行われる。すなわち、第1モジュールM1が各サンプルxsiと属性情報aOから指標値vsiを計算し、指標値のセットVs={vs1,…,vsN}を第2モジュールM2へ入力する。そして第2モジュールM2は、指標値のセットVsに対し所定の処理を施し、予測結果ys={ys1,…,ysN}を出力する。
【0058】
ステップS104において、学習部55が、予測結果ysと正解データytのあいだの誤差を計算する。
【0059】
ステップS105において、学習部55が、誤差逆伝播法を用いてバックワードパスの演算を行い、第1モジュールM1のパラメータを更新する。
【0060】
ステップS106において、学習部55が、終了判定を行い、所定の終了条件が満たされた場合に学習処理を終了する。
【0061】
以上の処理によって獲得された学習済みの予測モデル1は、予測部52に格納され、次に述べる予測処理に利用される。
【0062】
<予測処理>
図7は、操作予測装置5によって実行される予測処理の一例を示すフローチャートである。
【0063】
ステップS200において、データセット取得部50が、N個のオブジェクトからなるデータセットx={x1,…,xN}を取得する。データセットxは、内部ストレージである記憶部54から取得されてもよいし、外部ストレージから取得されてもよい。
【0064】
ステップS201において、属性情報取得部51が、ユーザの属性情報aを取得する。例えば、属性情報取得部51は、属性情報入力画面(GUI)を表示し、ユーザに属性情報の入力ないし選択を要求してもよい。あるいは、属性情報取得部51は、データセットxを解析することによってユーザの属性情報を推定したり、他のアプリケーションやネットワークサービスなどからユーザの属性情報を取得してもよい(例えば、SNSアプリとのID連携によって個人情報を取得するなど)。
【0065】
ステップS202において、予測部52が、データセットxと属性情報aを予測モデル1の第1モジュールM1に入力する。
【0066】
ステップS203において、フォワードパスの演算が行われる。すなわち、第1モジュールM1が各サンプルxiと属性情報aから指標値viを計算し、指標値のセットV={v1,…,vN}を第2モジュールM2へ入力する。そして第2モジュールM2は、指標値のセットVに対し所定の処理を施し、予測結果y={y1,…,yN}を算出する。
【0067】
ステップS204において、情報出力部53が、予測結果yを示す情報を出力する。予測結果yの出力方法は問わない。例えば、選択された画像の一覧を画面に表示してもよいし、選択された画像を用いてアルバムを生成したり、ユーザに対するレコメンデーションなどを行ってもよい。
【0068】
<実施例1>
予測モデル1を連続ナップサック問題に適用した場合の実施例について説明する。本実施例では、複数の観光スポットの中から、予め決められた時間内に巡ることができるスポットを選択する、というアプリケーションを想定する。
【0069】
入力は、観光スポットの画像群x={x
1,…,x
N}及び各観光スポットの所要時間c={c
1,…,c
N}、観光者の属性情報としての年齢層aである。また、制約条件と
して、トータルの観光時間C
totalを与える。出力は、i番目のオブジェクトx
iが選択されたかどうかを示すインジケータy
i∈{0,1}である。
図8は実施例1の予測モデル1の構成を模式的に示している。第1モジュールM1としては、1つのオブジェクト(画像x
i)と属性情報(年齢層a)から指標値v
iを求める構造のモジュール(
図2A参照)を用いることができる。また、第2モジュールM2では、第1モジュールM1から出力される各観光スポットの指標値V、与えられた各観光スポットの所要時間cとトータルの観光時間C
totalから、ナップサック問題の解が出力される。なお、
図8では、
図2Aに示す構造の第1モジュールM1を例示したが、
図2Eや
図2Fに示す構造の第1モジュールM1を用いることによって、同時に巡る観光スポットの組合せを考慮に入れ
た指標値を計算するようにしてもよい。
【0070】
ステップ1)第1モジュールM1が、画像x1,…,xNと年齢層aから指標値v1,…,vNを算出する。
【0071】
ステップ2)第2モジュールM2が、wi=log(vi)-log(ci)を計算する。
【0072】
ステップ3)第2モジュールM2が、w1,…,wNに基づいてN個のオブジェクトx1,…,xNを降順にソートする。並び替え後のi番目のオブジェクトxiが持つ元々のインデックスをp(i)とする。
【0073】
ステップ4)第2モジュールM2が、下記式によりi番目の観光スポットまで巡った場合の合計所要時間C
iを計算する。
【数2】
【0074】
ステップ5)第2モジュールM2が、sigmoid(Ci-Ctotal)を計算し、その
値が0.5以上となるp(i)について、yp(i)=1とし、それ以外のyの要素を0とする。
【0075】
以上の処理によって、「所定の時間Ctotal内で巡ることができる、年齢層aの人に人気の観光スポット」を抽出することができる。このような予測結果は、例えば、旅行者の年齢に応じて観光コースをアレンジし推薦するようなアプリケーションに利用することが可能である。
【0076】
<実施例2>
実施例1では、各オブジェクトxiのコストciが予め与えられるナップサック問題への予測モデル1の適用例を示したが、実施例2では、コストci自体も未知のパラメータとし、第1モジュールM1によりコストciを内部的に推定する構成を採る。
【0077】
図9は実施例2の予測モデル1の構成を模式的に示している。入力は、複数のオブジェクトx={x
1,…,x
N}と属性情報aである。また、制約条件として、トータルコストC
totalを与える。出力は、i番目のオブジェクトx
iが選択されたかどうかを示すインジケータy
i∈{0,1}である。実施例1との違いは、第1モジュールM1が、1つのオブジェクトx
iと属性情報aから、オブジェクトx
iの価値に相当する第1の指標値v
iとコストに相当する第2の指標値c
iを求めるところにある。これは、例えば、
図2Bに示す構造の第1モジュールM1を用いることによって実現可能である。また、第2モジュールM2としては、第1モジュールM1から出力される各オブジェクトの価値v
i及びコストc
iと、予め与えられたトータルコストC
totalから、ナップサック問題を解くknapsack solverが用いられる。第2モジュールM2の構成は実施例1と同じでよい。
【0078】
<その他の適用例>
予測モデル1は、例えば以下のようなアプリケーションにも好ましく適用できる。
【0079】
1.エキスパートによる推薦の模倣
大量の料理画像のなかから、エキスパート(例:管理栄養士)に「洋風」「和風」などのコンセプトに基づいて一週間の献立を組み立ててもらう。これを学習した予測モデルを用いることにより、新たな料理画像のデータセットについて、あたかもそのエキスパートが選んだかのような献立を提供することができる。
【0080】
2.ユーザに適応した推薦
様々なユーザの献立画像がサンプルデータセットとして与えられたとする。また、各ユーザの属性(和食が好き、など)が献立の傾向や履歴から推定できるとする。この学習データにより生成された予測モデルを用いることにより、新たな料理画像のデータセットと属性を与えると、その属性をもつ人(和食が好きな人、など)の好みの献立を生成することができる。
【0081】
3.要約の自動生成
実施例1で述べた予測モデル1は、コンテンツの要約の自動生成に応用することができる。例えば、与えられた動画コンテンツから60秒のプロモーションビデオを生成する場面を想定する。まず、オリジナルの動画コンテンツを、数秒から十数秒程度の短いクリップに分割する。動画の分割は、例えば、シーンの切り替わりを検知して分割する手法や、動画に埋め込まれているメタデータに基づいて分割する手法など、公知の手法を用いればよい。そして、各クリップをオブジェクトxi、各クリップの再生時間をコストciとして、予測モデル1に入力し、コストの合計が60秒に収まるという制約条件の下で、価値viを最大化するオブジェクトxiの最適な組み合わせを求めればよい。このとき、例えば、属性情報として、「20代、ファッション」のように年齢層と興味カテゴリを与えることで、その層別の人たちに訴求効果の高いプロモーションビデオを作成することができる。なお、動画コンテンツ以外にも、テキスト文書の要約、録音データの要約など、あらゆるデジタルコンテンツの要約生成に応用が可能である。
【0082】
4.装置の要点検箇所の絞り込み
実施例2で述べた予測モデル1を、装置のメンテナンス支援に応用する例を説明する。例えば、対象とする装置が100か所以上の点検項目を有しており、その全てをくまなく点検すると1時間以上かかると仮定する。装置の稼働中に何らかの不具合が発生し、その原因究明を10分以内に行わねばならないとき、100か所以上の点検項目を順に調べていては到底間に合わない。そこで、予測モデル1を用いて、不具合の原因である可能性が高く、且つ、制限時間内に点検が可能な項目を、要点検箇所として絞り込むとよい。例えば、
図10に示すように、装置を撮影した画像から点検候補箇所の画像を切り出す。そして、それらの画像群xと点検作業者の属性a(例えば点検作業のスキルなど)と制限時間C
totalを予測モデル1に与えて、要点検箇所yを絞り込む。予め、熟練作業者、中堅作業者、若手作業者それぞれの点検項目や作業時間を学習しておくことで、それぞれの作業スキルに応じた点検手順の設計及びレコメンドが可能となるため、効率的な点検作業の実施が実現できる。また、用途や機能が同じ装置の場合は、不具合が発生しやすい箇所(すなわち点検項目)が共通することが多い。したがって、この予測モデル1は、新規導入した装置を初めて点検する際の、効率的な点検手順の設計にも応用することができる。
【0083】
5.物品の検査
実施例2で述べた予測モデル1を、物品の抜き取り検査の支援に応用する例を説明する。例えば、製造ラインにおいて全数検査が困難な場合は、一定数の製造物を抜き取り検査することが行われる。このとき、製造物の状態によって検査内容や検査時間に違いが出るとともに、検査作業者のスキルによって抜き取る対象や検査に要する時間に差が出る。そこで、予測モデル1を用いて、制限時間(例えば1日の業務時間)内に出来る限り多くの不良を検出できるように、検査対象とすべき物品の選定を支援するとよい。
【0084】
<付記>
1.複数のオブジェクトからなるデータセットを取得するデータセット取得部(50)と、
ユーザの属性情報を取得する属性情報取得部(51)と、
機械学習されたモデル(1)を用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測する予測部(52)と、を有し、
前記モデル(1)は、
前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュール(M1)と、
前記第1モジュール(M1)により得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の処理を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュール(M2)と、
を含む構造を有しており、
前記モデル(1)は、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されている
ことを特徴とする操作予測装置(5)。
【0085】
2.操作予測装置(5)において用いられるモデル(1)を機械学習するためのモデル学習方法であって、
複数のサンプルからなるサンプルデータセットを取得するステップ(S100)と、
前記複数のサンプルに対する操作者の操作結果である正解データを取得するステップ(S100)と、
前記操作者の属性情報を取得するステップ(S100)と、
前記複数のサンプルからなるサンプルデータセット、前記正解データ、及び、前記操作者の属性情報を用いて、前記モデルの機械学習を行うステップ(S102~S106)と、
を有することを特徴とするモデル学習方法。
【0086】
3.複数のオブジェクトからなるデータセットを取得するステップ(S200)と、
ユーザの属性情報を取得するステップ(S201)と、
機械学習されたモデルを用い、前記データセット及び前記属性情報から、前記ユーザが前記データセットに対して行うであろう操作を予測するステップ(S202~S203)と、を有し、
前記モデル(1)は、
前記データセットに含まれる各オブジェクトについて、ニューラルネットワークを用いて、当該オブジェクトと前記属性情報の組み合わせに対応する指標値を計算する、第1モジュール(M1)と、
前記第1モジュール(M1)により得られた、前記複数のオブジェクトにそれぞれ対応する複数の指標値に対し所定の操作を行うことによって、前記ユーザによる操作の予測結果を計算する、第2モジュール(M2)と、
を含む構造を有しており、
前記モデル(1)は、複数のサンプルからなるサンプルデータセット、ある操作者が前記サンプルデータセットに対して行った操作結果である正解データ、及び、前記操作者の属性情報、を含む学習用データを用いて機械学習されている
ことを特徴とする操作予測方法。
【符号の説明】
【0087】
1:予測モデル
5:操作予測装置