特許第6869588号(P6869588)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社エイシングの特許一覧

<>
  • 特許6869588-情報処理装置、方法及びプログラム 図000003
  • 特許6869588-情報処理装置、方法及びプログラム 図000004
  • 特許6869588-情報処理装置、方法及びプログラム 図000005
  • 特許6869588-情報処理装置、方法及びプログラム 図000006
  • 特許6869588-情報処理装置、方法及びプログラム 図000007
  • 特許6869588-情報処理装置、方法及びプログラム 図000008
  • 特許6869588-情報処理装置、方法及びプログラム 図000009
  • 特許6869588-情報処理装置、方法及びプログラム 図000010
  • 特許6869588-情報処理装置、方法及びプログラム 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6869588
(24)【登録日】2021年4月16日
(45)【発行日】2021年5月12日
(54)【発明の名称】情報処理装置、方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20210426BHJP
【FI】
   G06N20/00
【請求項の数】8
【全頁数】12
(21)【出願番号】特願2020-566857(P2020-566857)
(86)(22)【出願日】2020年7月30日
(86)【国際出願番号】JP2020029357
【審査請求日】2020年11月27日
(31)【優先権主張番号】特願2019-151518(P2019-151518)
(32)【優先日】2019年8月21日
(33)【優先権主張国】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】517045705
【氏名又は名称】株式会社エイシング
(74)【代理人】
【識別番号】100098899
【弁理士】
【氏名又は名称】飯塚 信市
(74)【代理人】
【識別番号】100163865
【弁理士】
【氏名又は名称】飯塚 健
(72)【発明者】
【氏名】出澤 純一
(72)【発明者】
【氏名】菅原 志門
【審査官】 稲葉 崇
(56)【参考文献】
【文献】 特開2016−173686(JP,A)
【文献】 国際公開第2019/026702(WO,A1)
【文献】 特開平6−259399(JP,A)
【文献】 特開平5−322711(JP,A)
【文献】 金 天海 ほか,力学系学習木における誤差ベース予測アルゴリズム,情報処理学会 研究報告 数理モデル化と問題解決(MPS),日本,情報処理学会,2017年 2月20日,2017-MPS-112巻, 5号,pp.1-4
(58)【調査した分野】(Int.Cl.,DB名)
G06N3/00−3/12
G06N7/08−99/00
G06N5/00−7/06
(57)【特許請求の範囲】
【請求項1】
階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理装置において、
複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出部と、
前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出部と、
各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成部と、
前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習部と、を備える情報処理装置。
【請求項2】
前記順序生成部は、さらに、
前記重要度が高い入力列が前記木構造モデルにおける上位ノードに対応するように順序を生成する、詳細順序生成部を備える、請求項1に記載の情報処理装置。
【請求項3】
各前記重要度は、各前記入力列と対応する各前記出力列との間の関連性に基づいて生成される、請求項1に記載の情報処理装置。
【請求項4】
前記関連性は、各前記入力列と対応する各前記出力列との間の相関係数の絶対値である、請求項3に記載の情報処理装置。
【請求項5】
前記順序生成部は、
各前記入力列のうち相関係数が最大となる入力列を特定して前記順序に組み込む、最大相関係数入力列特定部と、
相関係数が最大として特定された前記入力列の相関係数を所定数値で除算する、除算部と、
前記最大相関係数入力列特定部と前記除算部とを所定回数だけ繰り返し動作させて、各前記入力列の順序を生成する、繰返処理部と、を備える、請求項4に記載の情報処理装置。
【請求項6】
前記順序生成部は、
各前記入力列の重要度順に各前記入力列の順序を生成する、重要度順順序生成部、を備える、請求項1に記載の情報処理装置。
【請求項7】
階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理方法において、
複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出ステップと、
前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出ステップと、
各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成ステップと、
前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習ステップと、を備える情報処理方法。
【請求項8】
コンピュータを、階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理装置として機能させるコンピュータプログラムにおいて、
複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出ステップと、
前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出ステップと、
各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成ステップと、
前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習ステップと、を備えるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、機械学習技術に関し、特に、木構造を利用した機械学習技術に関する。
【背景技術】
【0002】
近年、機械学習の分野が高い注目を集めている。このような背景の中、本願の発明者らは、木構造を有する新たな機械学習の枠組み(学習木)を提唱している(特許文献1)。
【0003】
図8は、上述の新たな機械学習の枠組みについて示す説明図、すなわち、学習木の構造について示す説明図である。図8(a)には、当該学習手法における学習木の構造が示されており、図8(b)には、当該構造に対応する状態空間のイメージが示されている。同図から明らかな通り、学習木構造は、階層的に分割された各状態空間に対応する各ノードを、最上位ノード(始端ノード又は根ノード)から最下端ノード(末端ノード又は葉ノード)まで、樹形状乃至格子状に分岐して配置することにより構成されている。なお、同図は、N階層d次元n分割の学習木においてdが2、nが2の場合の例を示しており、図8(a)に記載の学習木の1階層目の4つの末端ノードに付された1〜4の番号は、それぞれ、図8(b)に記載の4つの状態空間に対応している。
【0004】
上記学習木を用いて学習処理を行う際には、入力されるデータが、逐次、分割された各状態空間に対応付けられ、それらが各状態空間に蓄積されていくこととなる。このとき、それまでデータが存在しなかった状態空間に新たにデータが入力された場合には、新たなノードが順次生成されていく。予測出力は、学習後に各状態空間に内包される各データに対応する出力値又は出力ベクトルの相加平均をとることで算出されることとなる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2016−173686号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、従前のこの種の機械学習の枠組みにおいては、入力が複数次元である場合、提供された入力列の順に木構造の上位から分岐判定が行われていた。
【0007】
図9は、従前の、分岐判定に用いられる入力列の順序、すなわち、分岐列についての説明図である。同図の場合において、入力は3次元であり、その入力列の順序は左から順に「入力列1」、「入力列2」及び「入力列3」である。従前、分岐判定に用いられる入力列の順序については特段の配慮はなされておらず、単に提供された各入力列の順序に沿って上位から決定されていた。すなわち、同図の例にあっては、最上位ノード(根ノード)は「入力列1」に基づいて、その一つ下の段のノードは「入力列2」に基づいて、さらにその一つ下のノードは「入力列3」に基づいて、分岐判定を行っていた。
【0008】
しかしながら、このような構成とすると種々の不都合が生じる。例えば、図9の場合において、仮に、「入力列1」が出力に対して影響を殆ど及ぼさないような入力列であったような場合、意義の小さい「入力列1」の値に基づいて最上位の状態空間において空間分割が行われると、その後の探索は分割された空間に基づいて行われることから、不適当に探索空間を狭めてしまう虞があった。
【0009】
本発明は、上述の技術的背景の下になされたものであり、その目的とすることころは、学習対象となる入力列の順序によって探索空間が不当に限定されることを防止して、それにより機械学習の精度を向上させることにある。
【0010】
本発明のさらに他の目的並びに作用効果については、明細書の以下の記述を参照することにより、当業者であれば容易に理解されるであろう。
【課題を解決するための手段】
【0011】
上述の技術的課題は、以下の構成を有する装置、方法、プログラム等により解決することができる。
【0012】
すなわち、本発明に係る情報処理装置は、階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理装置において、複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出部と、前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出部と、各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成部と、前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習部と、を備えている。
【0013】
このような構成によれば、重要度の高い入力列から優先的に状態空間を探索するので探索空間が不当に限定されることがない。そのため、本来探索すべき状態空間を十分に探索することができるので、機械学習の精度を向上させることができる。また、それに伴い、精度の良好な学習済モデル(予測モデル)を提供することができる。なお、予想の語は、入力データと学習済モデルに基づいて出力データを生成することを意味する。
【0014】
前記順序生成部は、さらに、前記重要度が高い入力列が前記木構造モデルにおける上位ノードに対応するように順序を生成する、詳細順序生成部を備える、ものであってもよい。
【0015】
各前記重要度は、各前記入力列と対応する各前記出力列との間の関連性に基づいて生成される、ものであってもよい。
【0016】
前記関連性は、各前記入力列と対応する各前記出力列との間の相関係数の絶対値である、ものであってもよい。
【0017】
前記順序生成部は、各前記入力列のうち相関係数が最大となる入力列を特定して前記順序に組み込む、最大相関係数入力列特定部と、相関係数が最大として特定された前記入力列の相関係数を所定数値で除算する、除算部と、前記最大相関係数提供部と前記除算部とを所定回数だけ繰り返し動作させて、各前記入力列の順序を生成する、繰返処理部と、を備えるものであってもよい。
【0018】
前記順序生成部は、各前記入力列の重要度順に各前記入力列の順序を生成する、重要度順順序生成部、を備える、ものであってもよい。
【0019】
また、本発明は情報処理方法として観念することもできる。すなわち、本発明に係る情報処理方法は、階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理方法において、複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出ステップと、前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出ステップと、各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成ステップと、前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習ステップと、を備えている。
【0020】
さらに、本発明に係るコンピュータプログラムとして観念することもできる。すなわち、本発明に係るコンピュータプログラムは、コンピュータを、階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理装置として機能させるコンピュータプログラムにおいて、複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出ステップと、前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出ステップと、各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成ステップと、前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習ステップと、を備えている。
【発明の効果】
【0021】
本発明によれば、探索空間が不当に限定されることを防止して、それにより機械学習の精度を向上させることができる。
【図面の簡単な説明】
【0022】
図1図1は、情報処理装置のハードウェア構成図である。
図2図2は、学習処理に関するゼネラルフローチャートである。
図3図3は、分岐列生成処理に関するゼネラルフローチャートである。
図4図4は、重要度解析処理に関する詳細フローチャートである。
図5図5は、相関係数に関する説明図である。
図6図6は、分岐列の生成処理に関する詳細フローチャートである。
図7図7は、分岐列の生成に関する説明図である。
図8図8は、学習の基本的構成に関する説明図である。
図9図9は、分岐列に関する説明図である。
【発明を実施するための形態】
【0023】
以下、本発明の実施の一形態を、添付の図面を参照しつつ、詳細に説明する。
【0024】
<1.第1の実施形態>
<1.1 構成>
図1を参照しつつ、本実施形態に係る機械学習処理、予測処理等が実行される情報処理装置100のハードウェアの構成について説明する。同図から明らかな通り、本実施形態に係る情報処理装置100は、表示部1、音声出力部2、入力部3、制御部4、記憶部5、通信部6とがバスを介して接続されて構成されている。情報処理装置100は、例えば、パーソナルコンピュータ(PC)、スマートフォンやタブレット端末である。
【0025】
表示部1は、ディスプレイ等と接続されて表示制御を行い、ディスプレイ等を介してユーザにGUIを提供する。音声出力部2は、音声情報に関する処理を行い、スピーカー等を通じて音声を出力する。入力部3は、キーボード、タッチパネル、マウス等を介して入力された信号を処理するものである。
【0026】
制御部4は、CPU及びGPU等の情報処理部であり、情報処理装置100の全体制御、学習処理又は予測処理などのプログラムの実行処理を行う。記憶部5は、ROM、RAM、ハードディスク、フラッシュメモリ等の揮発性又は不揮発性の記憶装置であり、学習対象データ、機械学習プログラム、予測処理プログラム等の各種データやプログラムを格納している。通信部6は、有線又は無線にて外部機器と通信を行う通信ユニットである。
【0027】
なお、ハードウェア構成は、本実施形態に係る構成に限定されるものではなく、構成や機能を分散又は統合してもよい。例えば、複数台の情報処理装置を用いて分散的に処理を行っても良いし、大容量記憶装置をさらに外部に設けて情報処理装置1と接続する等してもよいことは勿論である。また、インターネット等を介してコンピュータネットワークを形成して処理を行ってもよい。
【0028】
また、本実施形態に係る処理は、ソフトウェアとしてだけでなく、FPGA等の半導体回路(IC等)、すなわちハードウェアとして実装してもよい。
【0029】
<1.2 動作>
図2は、情報処理装置100において行われる学習処理に関するゼネラルフローチャートである。
【0030】
同図から明らかな通り、学習処理が開始すると、木構造を構成するノードにおける分岐判定に用いられる入力列の順序、すなわち、分岐列の生成処理が行われる(S1)。
【0031】
図3図7を参照しつつ、分岐列の生成処理(S1)の詳細について説明する。
【0032】
図3は、分岐列生成処理(S1)に関するゼネラルフローチャートである。同図から明らかな通り、学習対象データセット、すなわち、複数の入力列と1又は複数の出力列のセットを記憶部5から読み出す処理が行われる(S11)。その後、読み出された学習対象データセットに基づいて、各入力列の重要度を解析する処理が行われる(S13)。なお、本実施形態においては、例として、入力列はimax次元、出力列の個数は1次元である。
【0033】
図4は、重要度解析処理に関する詳細フローチャートである。処理が開始すると、学習対象データセットのうちの各入力列に便宜上与えられる固有値i(整数)を初期化する処理が行われる(S131)。初期化処理が完了すると、i番目の入力列Iiと出力列Oとの間の相関係数ρを、下記の数式に基づき算出し、当該ρの絶対値を算出する処理が行われる(S133)。なお、σは対象となる入力列の標準偏差、σは対象となる出力列の標準偏差、及び、σXYは、共分散を表している。
【数1】
【0034】
その後、相関係数ρの絶対値を記憶部5へと記憶する処理が行われる(S135)。なお、後述するように、この相関係数ρの絶対値は重要度に相当する数値となる。
【0035】
図5は、相関係数に関する説明図(概念図)である。同図(a)は、2つの確率変数間に強い負の相関がある場合、同図(b)は、2つの確率変数間に同図(a)よりは弱い負の相関がある場合、同図(c)は、相関がない場合、同図(d)は、2つの確率変数間に同図(e)よりは弱い正の相関がある場合、同図(e)は、2つの確率変数間に強い正の相関がある場合を表している。相関係数の絶対値をとることで、例えば、同図(a)、同図(b)、同図(d)及び同図(e)に相当するような2つの確率変数間に何らかの相関がある場合を抽出することができる。
【0036】
その後、iの値をimaxと比較する処理が行われ、未だiの値がimaxに満たないと判断される場合、iを1だけインクリメントする処理が行われる(S139)。このような処理(S133〜S137NO、S139)は、iの値がimaxと一致するまで行われる。
【0037】
iの値がimaxと一致する場合(S137YES)、重要度解析処理(S13)は終了する。
【0038】
図3に戻り、重要度解析処理が終了すると、分岐列の生成処理が行われる(S15)。
【0039】
図6は、分岐列の生成処理に関する詳細フローチャートである。処理が開始すると、記憶部5から各入力列に関する相関係数ρの絶対値を分岐列生成列として読み出す(S151)。その後、便宜的に分岐列の長さを表す整数値nを初期化する処理が行われる(S153)。
【0040】
所定の初期化処理の後、現在の分岐列生成列のうち、相関係数ρの絶対値が最大となる入力列を分岐列の第n番目の値として記憶部5へと記憶する。その後、nが所定の最大設定値nmaxと一致するか否かが判定される(S157)。nの値がnmaxと一致しないと判定される場合(S157NO)、現在の分岐列生成列のうち、相関係数ρの絶対値が最大の入力列の相関係数の絶対値に対して所定の値、特に0より大きく1より小さい値、本実施形態においては例示的に2/3を掛けて値を更新し記憶する(S159)。その後、nを1だけインクリメントし、再度、上述の処理(S155、S157NO、S159、S161)が繰り返される。
【0041】
その後、nの値がnmaxと一致すると判定された場合(S157YES)、分岐列の生成処理は終了する。
【0042】
図7を参照しつつ、図6のフローチャートに係る動作を具体的に説明する。図7は、分岐列の生成に関する説明図である。同図の例にあっては、当初の入力列は3次元であって、各入力列には便宜上1〜3の番号が振られている。また、同入力列に対して、重要度解析処理(S13)が行われたことにより、3番目の入力列に対して重要度が0.9、入力列1に対しては重要度が0.65、入力列2に対しては重要度が0.32として算出されたものとする。すなわち、当初入力列が「3→1→2」の順で重要度が大きいものとして算出され記憶部5へと記憶されている。
【0043】
このとき、分岐列生成処理(S15)が開始すると、各入力列の相関係数ρの絶対値を読み出す処理が行われ(S151)、また、nを1として初期化される(S153)。その後、相関係数の絶対値が0.9で最大となる3番目の入力列を第1番目の分岐列として記憶する。その後、nの値がnの最大値nmax(同図の例にあっては4)であるか否かが判定される(S157)。
【0044】
ここでは、nの値は1で最大値4と一致しないので(S157NO)、現在の分岐生成列のうち、相関係数ρの絶対値が最大となる3番目の入力列に2/3を掛けて分岐列生成列を更新、記憶する処理が行われる(S159)。すなわち、3番目の入力列の値0.9に2/3を掛けて0.6とする処理が行われ、各入力列「3、1、2」の重要度は、それぞれ「0.6、0.65、0.32」へと更新される。
【0045】
その後、nの値を1だけインクリメントさせて2として、再び同様の処理が繰り返される。すなわち、次に相関係数ρの絶対値が最大(0.65)となる入力列である1番目の入力列を分岐列として記憶した後、当該数値に2/3を掛けるという処理を行う。上述の処理が、nの値が4と一致するまで繰り返し行われる。その結果、同図の例においては、分岐列は最終的に「3→1→3→1」となる。
【0046】
図3に戻り、分岐列の生成処理(S15)が終了すると、生成された分岐列を記憶部5へと記憶する処理が行われて(S17)、分岐列生成処理(S1)は終了する。
【0047】
図2に戻り、分岐列生成処理(S1)が終了すると、分岐列に基づく、機械学習処理が行われる(S3)。すなわち、生成された分岐列に基づいて、木構造の上位から各ノードの分岐判定を行い、各ノードに各データを蓄積させていく処理を行う。
【0048】
例えば、図7の分岐列を使用する場合にあっては、根ノードから末端ノードに向かって、入力列「3→1→3→1」の順に条件判定を行って各入力データをノードへと蓄積していくこととなる。なお、機械学習処理の例については、種々の公知の文献、例えば、特開2016−173686号公報なども参照されたい。
【0049】
分岐列に基づく機械学習処理が終了すると、生成された学習済モデルを記憶部5へと記憶する処理が行われる(S5)。
【0050】
このような構成によれば、重要度の高い入力列から優先的に状態空間を探索するので探索空間が不当に限定されることがない。そのため、本来探索すべき状態空間を十分に探索することができるので、機械学習の精度を向上させることができる。
【0051】
なお、適切な学習処理がなされることにより、学習済モデルを利用した予測処理の精度も向上する。
【0052】
<2.変形例>
上述の実施形態においては、重要度解析処理(S13)における重要度として相関係数の絶対値を利用したが、本発明はそのような構成に限定されない。従って、例えば、相関係数以外の種々の指標を利用することができる。
【0053】
上述の実施形態においては、重要度解析処理(S13)を行った後、動的に分岐列を生成する処理(S15)を行ったが、本発明はそのような構成に限定されない。従って、例えば、単に重要度の順に分岐列を生成してもよい。
【産業上の利用可能性】
【0054】
本発明は、機械学習技術を利用する種々の産業等にて利用可能である。
【符号の説明】
【0055】
1 表示部
2 音声出力部
3 入力部
4 制御部
5 記憶部
6 通信部
100 情報処理装置
【要約】
【課題】 学習対象となる入力列の順序によって探索空間が不当に限定されることを防止して、それにより機械学習の精度を向上させること。
【解決手段】 階層的に分割された状態空間へとそれぞれ対応付けられる複数のノードを分岐させて階層的に配置することにより構成される木構造モデルを利用して機械学習を行う情報処理装置において、複数の入力列と1又は複数の出力列とから成る学習対象データセットを読み出す、学習対象データセット読出部と、前記学習対象データセットに基づいて、各前記入力列の重要度を算出する、重要度算出部と、各前記重要度に基づいて、各前記ノードの分岐判定の基礎となる各前記入力列の順序を生成する、順序生成部と、前記学習対象データセットと前記順序に基づいて機械学習を行う、機械学習部と、を備える情報処理装置が提供される。
【選択図】図7
図1
図2
図3
図4
図5
図6
図7
図8
図9