(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-23
(45)【発行日】2022-07-01
(54)【発明の名称】モデル選択装置、及びモデル選択方法
(51)【国際特許分類】
G06N 7/08 20060101AFI20220624BHJP
【FI】
G06N7/08
(21)【出願番号】P 2018118755
(22)【出願日】2018-06-22
【審査請求日】2021-06-22
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業に係る委託研究、産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】301022471
【氏名又は名称】国立研究開発法人情報通信研究機構
(73)【特許権者】
【識別番号】504190548
【氏名又は名称】国立大学法人埼玉大学
(74)【代理人】
【識別番号】100120868
【氏名又は名称】安彦 元
(72)【発明者】
【氏名】成瀬 誠
(72)【発明者】
【氏名】菅野 円隆
(72)【発明者】
【氏名】内田 淳史
【審査官】川▲崎▼ 博章
(56)【参考文献】
【文献】特開平09-146915(JP,A)
【文献】特開2005-196752(JP,A)
【文献】特開2003-208560(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06N 7/08
(57)【特許請求の範囲】
【請求項1】
少なくとも2種類の特徴的な信号強度が不規則に変化する不規則信号を取得する取得部と、
第1タイミングにおける前記不規則信号の第1信号強度に基づき、前記第1タイミングよりも後の第2タイミングにおける前記不規則信号の信号強度を推定した予測系列を生成する複数の推定部と、
前記第2タイミングにおける前記不規則信号の第2信号強度を取得し、前記第2信号強度に対する複数の前記予測系列のそれぞれの予測誤差を算出する評価部と、
複数の前記予測誤差に基づき、複数の前記推定部のうち前記第2信号強度の推定に適した優位推定部を探索する探索部と
を備え、
複数の前記推定部のそれぞれは、前記不規則信号のうち1種類の前記特徴的な信号強度を推定するために最適化されたものであること
を特徴とするモデル選択装置。
【請求項2】
前記探索部は、
複数の前記予測誤差に基づき、前記優位推定部を選択するための閾値を調整する閾値調整部と、
不規則に信号強度が変化する選択用不規則信号を発信する信号発信部と、
前記選択用不規則信号の信号強度と、前記閾値とを比較する比較部と、
前記比較部による比較結果に基づき、前記優位推定部を選択する選択部と
を有すること
を特徴とする請求項1記載のモデル選択装置。
【請求項3】
前記第1信号強度を光信号に変換する変換部をさらに備え、
複数の前記推定部は、前記変換部から出力された光信号に基づき、前記予測系列を生成すること
を特徴とする請求項1又は2記載のモデル選択装置。
【請求項4】
複数の前記推定部は、それぞれ異なる重み情報を予め取得し、前記光信号の出力から取得された仮想ノード状態に前記重み情報を演算して前記予測系列を生成し、
前記重み情報は、前記不規則信号のうち1種類の前記特徴的な信号強度を推定するために構築されたこと
を特徴とする請求項3記載のモデル選択装置。
【請求項5】
複数の前記推定部の数は、前記特徴的な信号強度の種類の数以上であること
を特徴とする請求項1~4の何れか1項記載のモデル選択装置。
【請求項6】
少なくとも2種類の特徴的な信号強度が不規則に変化する不規則信号を取得する取得ステップと、
第1タイミングにおける前記不規則信号の第1信号強度に基づき、前記第1タイミングよりも後の第2タイミングにおける前記不規則信号の信号強度を推定した予測系列を複数生成する推定ステップと、
前記第2タイミングにおける前記不規則信号の第2信号強度を取得し、前記第2信号強度に対する複数の前記予測系列のそれぞれの予測誤差を算出する評価ステップと、
複数の前記予測誤差に基づき、前記予測系列を生成した複数の推定部のうち前記第2信号強度の推定に適した優位推定部を探索する探索ステップと
を備え、
複数の前記予測系列のそれぞれは、前記不規則信号のうち1種類の前記特徴的な信号強度の推定に適したものに基づき生成されたものであること
を特徴とするモデル選択方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、モデル選択装置、及びモデル選択方法に関するものである。
【背景技術】
【0002】
現代の人工知能(AI:Artificial Intelligence)を支える機械学習では、画像認識等に優れた能力を発揮する「深層学習」と呼ばれる技術に並び、「強化学習」と呼ばれる技術が注目を集めている。強化学習の中心となる課題に、例えば多数のスロットマシンが並んだカジノで、儲けを最大にするためにはどのようにするべきかという問題がある。儲けを最大化するには、「当たり台」を見つけるための試行錯誤(試し打ち)をする必要がある。しかしながら、過剰な試し打ちは、損失につながることがあり、その上、当たり台が時々刻々と変化する場合もある。これに対し、早々に試し打ちを打ち切ると、肝心の当たり台を見逃してしまう可能性がある。このように、「探索」と「決断」に難しいジレンマが存在する。
【0003】
上記問題は、「多本腕バンディット問題」として知られており、例えばワイヤレス通信における周波数の割当てのほか、データセンターにおける計算資源の割当て、ロボット制御、ウェブ広告などの様々な問題を解決するための応用展開が期待されることから、各種研究が行われている。
【0004】
多本腕バンディット問題の解決手法に関する研究では、多数のスロットマシンから当たり確率の高いマシンを選択する状況が想定され、原理検証や評価性能が行われており、例えば非特許文献1には、光カオスを用いた超高速な手法が提案されている。
【先行技術文献】
【非特許文献】
【0005】
【文献】M. Naruse, Y. Terashima, A. Uchida, and S. -J. Kim: Ultrafast photonic reinforcement learning based on laser chaos, SCIENTIFIC REPORTS, Vol. 7, Article No. 8772, August 2017.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、これまでの開示技術では、仮想的なスロットマシンを対象とした検討に留まっており、特定の事象を対象とすることに限られている。このため、様々な現実的な事象における問題の解決に展開することが、課題として挙げられている。
【0007】
そこで本発明は、上述した問題点に鑑みて案出されたものであり、その目的とするところは、様々な現実的な事象における問題の解決に用いることができるモデル選択装置、及びモデル選択方法を提供することにある。
【課題を解決するための手段】
【0008】
第1発明に係るモデル選択装置は、少なくとも2種類の特徴的な信号強度が不規則に変化する不規則信号を取得する取得部と、第1タイミングにおける前記不規則信号の第1信号強度に基づき、前記第1タイミングよりも後の第2タイミングにおける前記不規則信号の信号強度を推定した予測系列を生成する複数の推定部と、前記第2タイミングにおける前記不規則信号の第2信号強度を取得し、前記第2信号強度に対する複数の前記予測系列のそれぞれの予測誤差を算出する評価部と、複数の前記予測誤差に基づき、複数の前記推定部のうち前記第2信号強度の推定に適した優位推定部を探索する探索部とを備え、複数の前記推定部のそれぞれは、前記不規則信号のうち1種類の前記特徴的な信号強度を推定するために最適化されたものであることを特徴とする。
【0009】
第2発明に係るモデル選択装置は、第1発明において、前記探索部は、複数の前記予測誤差に基づき、前記優位推定部を選択するための閾値を調整する閾値調整部と、不規則に信号強度が変化する選択用不規則信号を発信する信号発信部と、前記選択用不規則信号の信号強度と、前記閾値とを比較する比較部と、前記比較部による比較結果に基づき、前記優位推定部を選択する選択部とを有することを特徴とする。
【0010】
第3発明に係るモデル選択装置は、第1発明又は第2発明において、前記第1信号強度を光信号に変換する変換部をさらに備え、複数の前記推定部は、前記変換部から出力された光信号に基づき、前記予測系列を生成することを特徴とする。
【0011】
第4発明に係るモデル選択装置は、第3発明において、複数の前記推定部は、それぞれ異なる重み情報を予め取得し、前記光信号の出力から取得された仮想ノード状態に前記重み情報を演算して前記予測系列を生成し、前記重み情報は、前記不規則信号のうち1種類の前記特徴的な信号強度を推定するために構築されたことを特徴とする。
【0012】
第5発明に係るモデル選択装置は、第1発明~第4発明の何れかにおいて、複数の前記推定部の数は、前記特徴的な信号強度の種類の数以上であることを特徴とする。
【0013】
第6発明に係るモデル選択方法は、少なくとも2種類の特徴的な信号強度が不規則に変化する不規則信号を取得する取得ステップと、第1タイミングにおける前記不規則信号の第1信号強度に基づき、前記第1タイミングよりも後の第2タイミングにおける前記不規則信号の信号強度を推定した予測系列を複数生成する推定ステップと、前記第2タイミングにおける前記不規則信号の第2信号強度を取得し、前記第2信号強度に対する複数の前記予測系列のそれぞれの予測誤差を算出する評価ステップと、複数の前記予測誤差に基づき、前記予測系列を生成した複数の推定部のうち前記第2信号強度の推定に適した優位推定部を探索する探索ステップとを備え、複数の前記予測系列のそれぞれは、前記不規則信号のうち1種類の前記特徴的な信号強度の推定に適したものに基づき生成されたものであることを特徴とする。
【発明の効果】
【0014】
上述した構成からなる本発明によれば、探索部は、複数の予測誤差に基づき、第2信号強度の推定に適した優位推定部を探索する。また、複数の推定部のそれぞれは、不規則信号のうち1種類の特徴的な信号強度を推定するために最適化されたものである。このため、不規則信号の種類やタイミングに関わらず、最も予測性能に適した推定部(優位推定部)を探索することができる。これにより、様々な現実的な事象における問題の解決に用いることが可能となる。
【0015】
また、上述した構成からなる本発明では、特定の局面に対する性能を最大化するように形成された複数の推定部を用い、現実の局面に最も適した推定部(モデル)を選択するアプローチを実現することができる。これにより、膨大な学習や汎化能力の獲得を必要としないほか、短いレイテンシと高いスループットの両立を実現することが可能となる。
【0016】
また、上述した構成からなる本発明によれば、探索部は、閾値調整部と、信号発信部と、比較部と、選択部とを有してもよい。このため、優位推定部を探索する際、光カオスを利用した強化学習を用いることができる。これにより、優位推定部の探索時間を短縮させることが可能となる。
【0017】
特に、閾値調整部は、複数の予測誤差に基づき、優位推定部を選択するための閾値を調整してもよい。このため、予測誤差のバラつきが多い場合においても、直前までの選択傾向を踏襲した選択を実施することができ、予測誤差のバラつきに伴う選択ミスを減らすことができる。これにより、不規則に変化する不規則信号に対し、優位推定部を選択する精度の低下を抑制することが可能となる。
【0018】
また、上述した構成からなる本発明によれば、変換部は、第1信号強度を光信号に変換してもよい。このため、第1信号強度を光信号以外の対象に変換した場合に比べて、予測系列を生成する時間を大幅に短縮することができる。これにより、短時間で最も予測性能に適した優位推定部を探索することが可能となる。
【0019】
また、上述した構成からなる本発明によれば、複数の推定部は、光信号に基づき予測系列を生成する。このため、短時間で予測系列を生成することができる変換部と、強化学習を用いた探索部との組み合わせを容易に実現することができる。これにより、優位推定部の探索時間を大幅に短縮させることが可能となる。
【0020】
また、上述した構成からなる本発明によれば、重み情報は、不規則信号のうち1種類の特徴的な信号強度を推定するために構築されてもよい。このため、複数の特徴的な信号強度を推定する1つの重み情報を構築する場合に比べ、容易に構築することができる。これにより、事前準備の簡略化を実現することが可能となる。
【0021】
また、上述した構成からなる本発明によれば、推定部の数は、特徴的な信号強度の種類の数以上でもよい。このため、不規則信号に含まれる全ての特徴的な信号強度に対し、最も予測性能に適した推定部が必ず含まれた条件での探索ができる。これにより、探索精度を向上させることが可能となる。
【0022】
上述した構成からなる本発明によれば、探索ステップは、複数の予測誤差に基づき、第2信号強度の推定に適した優位推定部を探索する。また、複数の予測系列のそれぞれは、不規則信号のうち1種類の特徴的な信号強度を推定に適したものに基づき生成されたものである。このため、不規則信号の種類やタイミングに関わらず、最も予測性能に適した推定部(優位推定部)を探索することができる。これにより、様々な現実的な事象における問題の解決に用いることが可能となる。
【図面の簡単な説明】
【0023】
【
図1】本発明を適用したモデル選択装置の全体構成の一例を示す模式図である。
【
図4】戻り半導体レーザ光を生成する場合における信号発信部のブロック構成図である。
【
図5】意思決定部における信号強度を検知するプロセスを示す図である。
【
図6】本発明を適用したモデル選択装置の全体構成の他の例を示す模式図である。
【
図7】本発明を適用したモデル選択方法の一例を示すフローチャートである。
【
図8】(a)は、実施例において使用した不規則信号を示すグラフであり、(b)及び(c)は、実施例において生成した予測系列を示すグラフである。
【
図9】(a)及び(b)は、実施例において算出した予測誤差を示すグラフである。
【
図10】(a)は、実施例における閾値の推移を示すグラフであり、(b)は、優位推定部として推定に適した選択部を正しく選択した割合を示すグラフである。
【発明を実施するための形態】
【0024】
以下、本発明を適用したモデル選択装置について図面を参照しながら詳細に説明をする。
【0025】
(モデル選択装置1の構成)
図1は、本発明を適用したモデル選択装置1の全体構成の一例を示す模式図である。モデル選択装置1は、不規則信号TSに対して最も予測性能に適した推定部12(優位推定部)を探索することができ、様々な現実的な事象における問題の解決に用いることが可能となる。
【0026】
モデル選択装置1は、取得部11と、推定部12と、評価部13と、探索部14とを備え、例えば
図6に示すように、変換部15を備えてもよい。
【0027】
<取得部11>
取得部11は、不規則信号TSを取得する。取得部11は、例えば不規則信号TSに任意のマスク処理を施してもよい。取得部11は、例えば任意のタイミングにおける不規則信号TSの信号強度を出力する。取得部11は、例えば第1タイミングにおいて第1信号強度TS1を出力し、第1タイミングよりも後の第2タイミングにおいて第2信号強度TS2を出力する。なお、第1タイミングと第2タイミングとの間隔は、任意である。
【0028】
不規則信号TSは、少なくとも2種類の特徴的な信号強度が不規則に変化するものである。不規則信号TSに含まれる特徴的な信号強度として、例えばローレンツ型の時系列や、レスラー型の時系列等に基づいて形成された信号強度が用いられてもよい。
【0029】
<推定部12>
推定部12は、不規則信号TSの信号強度を推定した予測系列PWを生成し、複数設けられる。推定部12は、例えば第1信号強度TS1に基づき、第2タイミングにおける不規則信号TSの信号強度(第2信号強度TS2)を推定した予測系列PWを生成する。複数の推定部12のそれぞれは、不規則信号TSのうち1種類の特徴的な信号強度を推定するために最適化されたものである。このため、各推定部12(例えば第1推定部12a、第2推定部12b)は、同一の第1信号強度TS1に基づき、それぞれ異なる予測系列PW(例えば第1予測系列PW1、第2予測系列PW2)を生成する。なお、推定部12の数は、例えば特徴的な信号強度の種類の数以上である。
【0030】
<評価部13>
評価部13は、第2タイミングにおける不規則信号TSの第2信号強度TS2を取得する。評価部13は、第2信号強度TS2に対する複数の予測系列PWのそれぞれの予測誤差PEを算出する。予測誤差PEは、例えば第2信号強度TS2と予測系列PWとの差分にて算出される。すなわち、予測誤差PEは、各推定部12の予測精度を示す指標として算出される。
【0031】
<探索部14>
探索部14は、複数の予測誤差PEに基づき、複数の推定部12のうち第2信号強度TS2の推定に適した推定部12(優位推定部)を探索する。探索部14は、例えば予測誤差PEの絶対値が最も小さくなる予測系列PWを生成した推定部12を、優位推定部として探索してもよい。
【0032】
探索部14は、例えば
図2に示すように、閾値調整部14aと、信号発信部14bと、比較部14cと、選択部14dとを有する。探索部14は、閾値調整部14a、信号発信部14b、及び比較部14cを介して、推定部12を探索してもよい。
【0033】
<閾値調整部14a>
閾値調整部14aは、複数の予測誤差PEに基づき、推定に適した推定部12(優位推定部)を選択するための閾値THを調整する。閾値調整部14aは、調整前の閾値THに対して調整するため、直前までの選択傾向を踏襲した上で、新たに生成された予測誤差PEの内容を加えた状態の閾値THを形成することができる。閾値調整部14aは、例えば絶対値が最も小さい予測誤差PEを生成した推定部12が、優先して選択されるように閾値THを調整する。
【0034】
<信号発信部14b>
信号発信部14bは、不規則に信号強度が変化する選択用不規則信号を発信する。信号発信部14bから発信された選択用不規則信号は、比較部14c及び選択部14dを含む意思決定部4へ供給される。
【0035】
この信号発信部14bにより発信される選択用不規則信号は、信号強度が単にランダムに変化する場合に限定されるものではなく、またカオス的に変化する場合に限定されるものではない。つまりこの選択用不規則信号とは、その信号発信時点の直前の信号発信時点における信号強度に対して一切の相関を持たない完全な不規則性をもつ信号で構成されていてもよいし、その信号発信時点の直前の信号発信時点における信号強度に対して若干の相関を持たせた一部の不規則性をもつ信号で構成されていてもよい。
【0036】
この信号発信部14bは、電気的、物理的信号を発信することは必須ではなく、以前において取得した選択用不規則信号のデータ列を意思決定部4へ供給するものであってもよい。例えば、この信号発信部14bから発信される選択用不規則信号は、半導体レーザから出射された光を反射部を介してそのレーザ共振器内に戻すことにより発現される戻り半導体レーザ光に基づいて生成されるものであってもよい。
【0037】
図4は、この戻り半導体レーザ光を生成する場合における信号発信部14bのブロック構成を示している。この信号発信部14bは、半導体レーザ91と、カプラ92と、減衰器93と、反射部94と、光アイソレータ95と、減衰器96と、受光部97と、オシロスコープ98とを備えている。
【0038】
半導体レーザ91は、供給される電気信号に基づいてレーザ光を発振する。カプラ92は、半導体レーザ91からのレーザ光や、減衰器93および反射部94からの戻り光を分岐させる役割を担う。減衰器93は、反射部94からの戻り光を減衰させる。反射部94は、半導体レーザ91からのレーザ光を反射するミラー等で構成される。光アイソレータ95は、カプラ92から出射されるレーザ光につき、順方向に進む光の成分のみを透過し逆方向の光の成分を遮断する役割を担う。減衰器96は、光アイソレータ95からのレーザ光を減衰させる。受光部97は、フォトダイオード等で構成され光アイソレータ95からのレーザ光を光電変換して電気信号化する。オシロスコープ98は、受光部97において光電変換された電気信号を時間軸をベースにし、その信号強度を波形化する。
【0039】
このような構成からなる信号発信部14bによれば、先ず半導体レーザ91により発振されたレーザ光は、カプラ92と減衰器93を介して反射部94に到達する。このレーザ光は反射部94を反射した後、減衰器93で戻り光量を調整された後、戻り光として再びカプラ92を介して半導体レーザ91に戻される。この半導体レーザ91における共振器内に戻された戻り光により光の雑音レベルが著しく増加し、不安定化する結果、そこから改めて戻り半導体レーザ光が出射される。この戻り半導体レーザ光は、コヒーレンスが崩壊した、いわばレーザーカオス状態となっているため、上述した不規則信号となっている。このような戻り半導体レーザ光は、カプラ92、光アイソレータ95を介して減衰器96において減衰され、受光部97において光電変換され、更にオシロスコープ98において波形化されることになる。このオシロスコープ98において波形化された信号は不規則信号となっている。信号発信部14bは、このような不規則信号を選択用不規則信号として、意思決定部4へ供給する。
【0040】
<意思決定部4、比較部14c、選択部14d>
意思決定部4は、信号発信部14bから発信された選択用不規則信号の信号強度を検知する。意思決定部4には、比較部14c及び選択部14dが含まれる。比較部14cは、選択用不規則信号の信号強度と、閾値THとを比較する。選択部14dは、比較部14cによる比較結果に基づき、推定部12(優位推定部)を選択する。例えば推定部12が2つの場合(
図2)、比較部14cの用いる閾値THは1つ(TH
1)であり、選択部14dは2つの推定部12a、12bから1つ選択する。例えば推定部12が4つの場合(
図3)、比較部14cの用いる閾値THは3つ(TH
1、TH
2、0、TH
2,1)であり、選択部14dは4つの推定部12a、12b、12c、12dから1つ選択する。
【0041】
図5は、意思決定部4における信号強度を検知するプロセスを示す。なお、
図5では、4つの推定部12a、12b、12c、12dから優位推定部を選択する一例を示す。
【0042】
図5に示すように、選択用不規則信号を横軸に時間、縦軸を信号強度とした場合、比較部14cは、選択用不規則信号の信号強度を2以上の各観測時点においてそれぞれ検知する。例えば、この観測時点をt
1、t
2の2つの時点に設定した場合には、この観測時点t
1における選択用不規則信号の信号強度P
1を検知し、観測時点t
2における選択用不規則信号の信号強度P
2を検知する。
【0043】
次に比較部14cは、各観測時点において検知した信号強度と、観測時点毎に設定された閾値THとを比較する。ここで、観測時点t1には閾値TH1が予め設定されているものと仮定し、観測時点t2には閾値TH2,0、TH2,1が予め設定されているものと仮定する。観測時点t1における選択用不規則信号の信号強度P1と、閾値TH1とを先ず比較する。その結果、信号強度P1が閾値TH1より小さい場合には、閾値TH2,0の矢印方向に進み、信号強度P1が閾値TH1以上の場合には、閾値TH2,1の矢印方向に進む。閾値TH2,0の矢印方向に進んだ場合には、観測時点t2における選択用不規則信号の信号強度P2と閾値TH2,0とを比較する。選択部14dは、信号強度P2と閾値TH2,0の大小関係に応じて推定部12を選択する。同様に閾値TH2,1の矢印方向に進んだ場合には、観測時点t2における選択用不規則信号の信号強度P2と閾値TH2,1とを比較する。選択部14dは、信号強度P2と閾値TH2,1の大小関係に応じて推定部12を選択する。
【0044】
ここで上述した推定部12a、12b、12c、12dは、それぞれ閾値TH1、TH2,0、TH2,1を隔てて予め割り当てられている。例えば推定部12aは、閾値TH2,0未満において割り当てられ、推定部12bは、閾値TH2,0以上において割り当てられ、推定部12cは、閾値TH2,1未満において割り当てられ、推定部12dは、閾値TH2,0以上において割り当てられているものとする。選択用不規則信号の信号強度P2と閾値THとの比較の結果、選択する推定部12は、各閾値THを隔てて予め割り当てられている推定部12に対応させる。
【0045】
上述した例の場合、選択部14dは、信号強度P2が閾値TH2,0より小さい場合には、推定部12aを選択する。選択部14dは、信号強度P2が閾値TH2,0以上の場合には、推定部12bを選択する。選択部14dは、信号強度P2が閾値TH2,1より小さい場合には、推定部12cを選択する。選択部14dは、信号強度P2が閾値TH2,1以上の場合には、推定部12dを選択する。
【0046】
つまり、推定部12aが優位選択部として選択されるケースは、信号強度P1が閾値TH1未満であり、かつ信号強度P2が閾値TH2,0未満である場合である。推定部12bが優位推定部として選択されるケースは、信号強度P1が閾値TH1未満であり、かつ信号強度P2が閾値TH2,0以上である場合である。推定部12cが優位推定部として選択されるケースは、信号強度P1が閾値TH1以上であり、かつ信号強度P2が閾値TH2,1未満である場合である。推定部12dが優位推定部として選択されるケースは、信号強度P1が閾値TH1以上であり、かつ信号強度P2が閾値TH2,1以上である場合である。実際にこの推定部12a、12bが選択される場合に閾値TH1、閾値TH2,0が使用され、閾値TH2,1は特段使用されないこととなる。同じく推定部12c、12dが選択される場合に閾値TH1、閾値TH2,1が使用され、閾値TH2,0は特段使用されないこととなる。
【0047】
ちなみに、推定部12a、12b、12c、12dをそれぞれ10進数における数値0~3を割り当てた場合、これを2進数に変換した場合には、推定部12aが(00)、推定部12bが(01)、推定部12cが(10)、推定部12dが(11)となる。
【0048】
この2進数における桁を上位から第1桁、第2桁と定義する場合、第1桁が0の場合は、閾値TH2,0に進む場合であり、第1桁が1の場合には、閾値TH2,1に進む場合である。即ち、閾値TH2,kにおけるkは、第1桁の数値に対応している。第2桁の数値は、閾値TH2,0、TH2,1を介して隔てられる推定部12a(00)又は推定部12b(01)と、推定部12c(10)又は推定部12d(11)に相当する。
【0049】
なお、上述した探索部14は、例えば任意の強化学習技術に基づき実現されてもよい。この場合においても、学習に用いられるパラメータとして予測誤差PEが用いられ、優位推定部が探索される。
【0050】
<変換部15>
変換部15は、例えば
図6に示すように、第1信号強度TS1を光信号Lに変換する。この場合、複数の推定部12は、変換部15から出力された光信号Lに基づき、予測系列PWを生成する。
【0051】
変換部15は、例えば半導体レーザを用いて、信号強度(例えば第1信号強度TS1)を光信号Lに変換する。変換部15は、半導体レーザから出力された光信号Lのフィードバックループ内における出力を一定間隔で区切り、その応答出力を仮想ノード状態VNとして取得する。この場合、複数の推定部12は、それぞれ異なる重み情報を予め取得し、仮想ノード状態VNに重み情報を演算して予測系列PWを生成する。なお、重み情報は、不規則信号TSのうち1種類の特徴的な信号強度を推定するために構築される。
【0052】
なお、変換部15は、例えば任意の光リザーバコンピューティング技術を用いて実現されてもよい。この場合においても、入力パラメータとして信号強度(例えば第1信号強度TS1)が用いられ、各推定部12は、それぞれ異なる予測系列PWを生成する。
【0053】
(モデル選択方法)
次に、
図7を参照して、本発明を適用したモデル選択方法について説明する。
図7は、本発明を適用したモデル選択方法の一例を示すフローチャートである。
【0054】
<取得ステップS110>
先ず、不規則信号TSを取得する(取得ステップS110)。例えば取得部11は、不規則信号TSを取得する。取得部11は、第1タイミングにおける不規則信号TSの第1信号強度TS1を出力し、第2タイミングにおける不規則信号TSの第2信号強度TS2を出力する。なお、取得部11が不規則信号TSを取得する頻度やタイミング、並びに、第1信号強度TS1及び第2信号強度TS2を出力する頻度やタイミングは、任意である。
【0055】
<変換ステップS150>
次に、例えば第1信号強度TS1を光信号Lに変換してもよい(変換ステップS150)。例えば変換部15は、第1信号強度TS1を取得し、半導体レーザを用いて光信号Lを出力する。変換部15は、光信号Lの出力から仮想ノード状態VNを取得する。
【0056】
<推定ステップS120>
次に、予測系列PWを複数生成する(推定ステップS120)。例えば複数の推定部12は、第1信号強度TS1に基づき、第2タイミングにおける不規則信号TSの信号強度を推定した予測系列PWを生成する。各推定部12は、取得部11から第1信号強度TS1を取得して予測系列PWを生成するほか、例えば変換部15から仮想ノード状態VNに重み情報を演算して予測系列PWを生成してもよい。何れの場合においても、各予測系列PWのそれぞれは、不規則信号TSのうち1種類の特徴的な信号強度の推定に適したものであり、それぞれ異なる予測系列PWが生成される。
【0057】
<評価ステップS130>
次に、予測誤差PEを算出する(評価ステップS130)。例えば評価部13は、第2タイミングにおける不規則信号TSの第2信号強度TS2を、取得部11から取得する。評価部13は、第2信号強度TS2に対する複数の予測系列PWのそれぞれの予測誤差PEを算出する。
【0058】
<探索ステップS140>
次に、優位推定部を探索する(探索ステップS140)。例えば探索部14は、複数の予測誤差PEを評価部13から取得する。探索部14は、複数の予測誤差PEに基づき、予測系列PWを生成した複数の推定部12のうち、第2信号強度TS2の推定に適した優位推定部を探索する。
【0059】
探索ステップS140において、例えば閾値調整部14a、信号発信部14b、比較部14c、及び選択部14dを用いて優位推定部を探索してもよい。この場合、閾値調整部14aは、複数の予測誤差PEに基づき、優位推定部を選択するための閾値THを調整する。信号発信部14bは、選択用不規則信号を発信する。比較部14cは、選択用不規則信号の信号強度と、閾値THとを比較する。選択部14dは、比較部14cによる比較結果に基づき、優位推定部を選択する。
【0060】
これにより、本発明を適用したモデル選択方法が終了する。なお、探索ステップS140を実施したあと、状況に応じて取得ステップS110等を再び実施してもよい。
【0061】
本発明を適用したモデル選択装置1によれば、探索部14は、複数の予測誤差PEに基づき、第2信号強度TS2の推定に適した推定部12(優位推定部)を探索する。また、複数の推定部12のそれぞれは、不規則信号TSのうち1種類の特徴的な信号強度を推定するために最適化されたものである。このため、不規則信号TSの種類やタイミングに関わらず、最も予測性能に適した推定部12(優位推定部)を探索することができる。これにより、様々な現実的な事象における問題の解決に用いることが可能となる。
【0062】
また、本発明を適用したモデル選択装置1によれば、特定の局面に対する性能を最大化するように形成された複数の推定部12を用い、現実の局面に最も適した推定部12(モデル)を選択するアプローチを実現することができる。これにより、膨大な学習や汎化能力の獲得を必要としないほか、短いレイテンシと高いスループットの両立を実現することが可能となる。
【0063】
また、本発明を適用したモデル選択装置1によれば、探索部14は、閾値調整部14aと、信号発信部14bと、比較部14cと、選択部14dとを有してもよい。このため、優位推定部を探索する際、光カオスを利用した強化学習を用いることができる。これにより、優位推定部の探索時間を短縮させることが可能となる。
【0064】
特に、閾値調整部14aは、複数の予測誤差PEに基づき、優位推定部を選択するための閾値THを調整してもよい。このため、予測誤差PEのバラつきが多い場合においても、直前までの選択傾向を踏襲した選択を実施することができ、予測誤差PEのバラつきに伴う選択ミスを減らすことができる。これにより、不規則に変化する不規則信号TSに対し、優位推定部を選択する精度の低下を抑制することが可能となる。
【0065】
また、本発明を適用したモデル選択装置1によれば、変換部15は、第1信号強度TS1を光信号Lに変換してもよい。このため、第1信号強度TS1を光信号L以外の対象に変換した場合に比べて、予測系列PWを生成する時間を大幅に短縮することができる。これにより、短時間で最も予測性能に適した優位推定部を探索することが可能となる。
【0066】
また、本発明を適用したモデル選択装置1によれば、複数の推定部12は、光信号Lに基づき予測系列PWを生成する。このため、短時間で予測系列PWを生成することができる変換部15と、強化学習を用いた探索部14との組み合わせを容易に実現することができる。これにより、優位推定部の探索時間を大幅に短縮させることが可能となる。
【0067】
また、本発明を適用したモデル選択装置1によれば、重み情報は、不規則信号TSのうち1種類の特徴的な信号強度を推定するために構築されてもよい。このため、複数の特徴的な信号強度を推定する1つの重み情報を構築する場合に比べ、容易に構築することができる。これにより、事前準備の簡略化を実現することが可能となる。
【0068】
また、本発明を適用したモデル選択装置1によれば、推定部12の数は、特徴的な信号強度の種類の数以上でもよい。このため、不規則信号TSに含まれる全ての特徴的な信号強度に対し、最も予測性能に適した推定部12が必ず含まれた条件での探索ができる。これにより、探索精度を向上させることが可能となる。
【0069】
本発明を適用したモデル選択方法によれば、探索ステップS140は、複数の予測誤差PEに基づき、第2信号強度TS2の推定に適した推定部12(優位推定部)を探索する。また、複数の予測系列PWのそれぞれは、不規則信号TSのうち1種類の特徴的な信号強度を推定に適したものに基づき生成されたものである。このため、不規則信号TSの種類やタイミングに関わらず、最も予測性能に適した推定部12(優位推定部)を探索することができる。これにより、様々な現実的な事象における問題の解決に用いることが可能となる。
【実施例】
【0070】
次に、本発明の効果を確認する上で行ったシミュレーションの結果について説明する。このシミュレーションでは、各タイミング(以下、ステップとする)における不規則信号TSの信号強度を推定した予測系列PWに基づき、探索部14に設定された閾値THの調整推移、及び優位推定部として推定に適した推定部12を正しく選択した割合を検証した。
【0071】
本実施例では、
図6に示す取得部11と、変換部15と、2つの推定部12a、12bと、評価部13と、探索部14とを用い、探索部14には、
図2に示す閾値調整部14aと、信号発信部14bと、比較部14cと、選択部14dとを用いた。
【0072】
本実施例では、各推定部12a、12bから生成された予測系列PW1、PW2のそれぞれの予測誤差PEを算出し、予測誤差PEの絶対値が小さいほうを優先して選択されるように、閾値THを調整するように設定した。なお、閾値THは、直前の値に基づき調整するように設定した。これは、予測誤差PEのバラつきに追従して、閾値THの大幅な変化に伴う選択ミスを防ぐために設定した。
【0073】
図8(a)は、準備した不規則信号TSを示すグラフである。図の横軸はステップを示し、縦軸は各ステップにおける信号強度を示す。不規則信号TSに含まれる特徴的な信号強度として、ローレンツ型の時系列(
図8(a)の範囲L)、及びレスラー型の時系列(
図8(a)の範囲R)に基づいて形成された信号強度を用いた。各信号強度は、不規則に変化するものとした。
図8(a)では、450ステップ前後において、ローレンツ型の時系列からレスラー型の時系列に変化している。なお、
図8(a)には0ステップから1000ステップまでの信号強度が記載されているが、本実施例では、4000ステップまで実施した。
【0074】
本実施例では、予め構築(学習)済みの重み情報を有する2つの推定部12a、12bを用いて、予測系列PW1、PW2を生成した。推定部12aの重み情報として、レスラー型の時系列に基づいて形成された信号強度を推定するために最適化されたものを使用した。推定部12bの重み情報として、ローレンツ型の時系列に基づいて形成された信号強度を推定するために最適化されたものを使用した。
【0075】
上記条件に基づき、各推定部12a、12bにより生成された予測系列PW1、PW2を、
図8(b)、
図8(c)のグラフに示す。
図8(b)は、
図8(a)に示した不規則信号TSの信号強度に対し、推定部12aを用いて推定した予測系列PW1を示す。
図8(c)は、
図8(a)に示した不規則信号TSの信号強度に対し、推定部12bを用いて推定した予測系列PW2を示す。
【0076】
図9は、各ステップにおける不規則信号TSの信号強度に対する各予測系列PW1、PW2のそれぞれの予測誤差PE1、PE2を示すグラフである。
図9の横軸はステップを示し、縦軸は各ステップにおける予測誤差PEの絶対値を示す。予測誤差PEの値が小さい程、推定精度が高い結果を意味する。
【0077】
図9(a)では、450~500ステップ以降の予測誤差PEの値が、それ以前のステップの予測誤差PEの値に比べて小さいことを確認した。これは、推定部12aの重み情報が、レスラー型の時系列に基づいて形成された信号強度を推定するために最適化されたものを使用したことに起因する。また、
図9(b)では、450~500ステップ以前の予測誤差PEの値が、それ以降のステップの予測誤差PEの値に比べて小さいことを確認した。これは、推定部12bの重み情報が、ローレンツ型の時系列に基づいて形成された信号強度を推定するために最適化されたものを使用したことに起因する。
【0078】
図10(a)は、探索部14に設定された閾値THの推移を示すグラフである。
図10(a)の横軸はステップを示し、縦軸は閾値THを示す。
図10(a)では、閾値THが0から増加するにつれて、推定部12bを選択する可能性が高くなることを示し、閾値THが0から減少するにつれて、推定部12aを選択する可能性が高くなることを示す。
【0079】
図10(a)では、0ステップから400ステップ程度まで閾値THが増加する傾向を示している。これは、推定部12bに対応する予測誤差PE2の値が、推定部12aに対応する予測誤差PE1の値よりも小さく、推定部12bを優位推定部として優先的に選択するように閾値THが変化したことを示している。
【0080】
また、400ステップから2000ステップ弱程度まで閾値THが減少する傾向を示している。これは、推定部12aに対応する予測誤差PE1の値が、推定部12bに対応する予測誤差PE2の値よりも小さく、推定部12aを優位推定部として優先的に選択するように閾値THが変化したことを示している。
【0081】
また、2000弱ステップから3000ステップ弱程度まで閾値THが増加する傾向を示している。これは、推定部12bに対応する予測誤差PE2の値が、推定部12aに対応する予測誤差PE1の値よりも小さく、推定部12bを優位推定部として優先的に選択するように閾値THが変化したことを示している。
【0082】
また、3000ステップ弱から4000ステップ程度まで閾値THが減少する傾向を示している。これは、推定部12aに対応する予測誤差PE1の値が、推定部12bに対応する予測誤差PE2の値よりも小さく、推定部12aを優位推定部として優先的に選択するように閾値THが変化したことを示している。
【0083】
図10(b)は、優位推定部として推定に適した推定部12を正しく選択した割合を示すグラフである。
図10(b)の横軸はステップを示し、縦軸は正しく選択された割合(最小0.0、最大1.0)を示す。
【0084】
図10(b)では、0ステップから400ステップ程度までにおいて、正しく選択された割合が1.0を維持している。すなわち、推定部12bを優位推定部として選択することが、正しく実行されていたことを確認した。
【0085】
これに対し、400ステップ以降において、正しく選択された割合が1.0から0.0付近へと急激に変化している。これは、ローレンツ型の時系列からレスラー型の時系列に基づいて形成された信号強度に変化したことに起因する。すなわち、推定部12bを優先するための閾値THが、急激な信号強度の変化に追従していないことを意味する。
【0086】
しかしながら、正しく選択された割合は、1000ステップ程度において0.9程度まで上昇し、1400ステップ以降では1.0を維持している。すなわち、ステップを重ねる度に閾値THを調整し、推定部12aを優位推定部として選択する方向に実行されていたことを確認した。
【0087】
また、2000ステップ弱以降において、正しく選択された割合が1.0から0.0付近へと急激に変化している。これは、レスラー型の時系列からローレンツ型の時系列に基づいて形成された信号強度に変化したことに起因する。すなわち、推定部12aを優先するための閾値THが、急激な信号強度の変化に追従していないことを意味する。
【0088】
しかしながら、正しく選択された割合は、2200ステップ程度において1.0程度まで上昇し、2200ステップ以降では1.0を維持している。すなわち、ステップを重ねる度に閾値THを調整し、推定部12bを優位推定部として選択する方向に実行されていたことを確認した。
【0089】
また、3000ステップ弱以降において、正しく選択された割合が1.0から0.0付近へと急激に変化している。これは、ローレンツ型の時系列からレスラー型の時系列に基づいて形成された信号強度に変化したことに起因する。すなわち、推定部12bを優先するための閾値THが、急激な信号強度の変化に追従していないことを意味する。
【0090】
しかしながら、正しく選択された割合は、3200ステップ程度において1.0程度まで上昇し、3200ステップ以降では1.0を維持している。すなわち、ステップを重ねる度に閾値THを調整し、推定部12aを優位推定部として選択する方向に実行されていたことを確認した。
【0091】
上記より、特徴的な信号強度が不規則に変化する不規則信号TSに対して、最も予測性能に適した推定部12(優位推定部)を探索することができることを確認した。これにより、様々な現実的な事象における問題の解決に用いることが可能となる。
【0092】
なお、上述した取得部11、推定部12、評価部13、探索部14、及び変換部15は、例えば半導体集積回路(LSI)を用いて実現できるほか、例えば公知のマイクロプロセッサやメモリを有するコンピュータがプログラムを実行することによって実現してもよい。
【0093】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0094】
1 :モデル選択装置
11 :取得部
12 :推定部
13 :評価部
14 :探索部
14a :閾値調整部
14b :信号発信部
14c :比較部
14d :選択部
15 :変換部
4 :意思決定部
91 :半導体レーザ
92 :カプラ
93 :減衰器
94 :反射部
95 :光アイソレータ
96 :減衰器
97 :受光部
98 :オシロスコープ
L :光信号
PE :予測誤差
PW :予測系列
S110 :取得ステップ
S120 :推定ステップ
S130 :評価ステップ
S140 :探索ステップ
S150 :変換ステップ
TH :閾値
TS :不規則信号
TS1 :第1信号強度
TS2 :第2信号強度