(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-15
(45)【発行日】2023-09-26
(54)【発明の名称】決定装置、決定方法および決定プログラム
(51)【国際特許分類】
G06N 3/08 20230101AFI20230919BHJP
【FI】
G06N3/08
(21)【出願番号】P 2019133764
(22)【出願日】2019-07-19
【審査請求日】2022-06-17
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】宮崎 祐
(72)【発明者】
【氏名】小林 隼人
(72)【発明者】
【氏名】菅原 晃平
(72)【発明者】
【氏名】野口 正樹
(72)【発明者】
【氏名】山崎 朋哉
【審査官】渡辺 一帆
(56)【参考文献】
【文献】特開2016-6617(JP,A)
【文献】小林 正典,"圏と関手 物理的対象の記述言語になるか?",数理科学,株式会社サイエンス社,2008年,第46巻, 第3号,pp. 7-12,ISSN 0385-2240
【文献】西郷 甲矢人,"自然知能と圏論",人工知能,一般社団法人人工知能学会,2018年,第33巻, 第5号,pp. 553-560,ISSN 2188-2266
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/02- 3/10
G06N 20/00-20/20
(57)【特許請求の範囲】
【請求項1】
複数のレイヤを有し、各レイヤがノード接続されたモデルの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する第1生成部と、
前記第1生成部によって生成された前記写像空間に基づいて、圏論における圏を生成する第2生成部と、
前記第2生成部によって生成された前記圏論における圏の同値関係に基づいて、前記レイヤ間の接続パラメータを決定する決定部と
を備えることを特徴とする決定装置。
【請求項2】
前記決定部は、
前記圏論における圏の同値関係に導来圏における同値関係を用いて、前記レイヤ間の接続パラメータを決定すること
を特徴とする請求項1に記載の決定装置。
【請求項3】
前記第1生成部は、
前記レイヤ内の接続関係を示す複体を圏論の構造における対象と見做し、当該対象間の同値類をホモトピーによってまとめた前記写像空間を生成すること
を特徴とする請求項1または2に記載の決定装置。
【請求項4】
前記第1生成部は、
グレブナー基底に基づいて、前記写像空間を生成すること
を特徴とする請求項1または2に記載の決定装置。
【請求項5】
コンピュータが実行する決定方法であって、
複数のレイヤを有し、各レイヤがノード接続されたモデルの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する第1生成工程と、
前記第1生成工程によって生成された前記写像空間に基づいて、圏論における圏を生成する第2生成工程と、
前記第2生成工程によって生成された前記圏論における圏の同値関係に基づいて、前記レイヤ間の接続パラメータを決定する決定工程と
を含むことを特徴とする決定方法。
【請求項6】
複数のレイヤを有し、各レイヤがノード接続されたモデルの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する第1生成手順と、
前記第1生成手順によって生成された前記写像空間に基づいて、圏論における圏を生成する第2生成手順と、
前記第2生成手順によって生成された前記圏論における圏の同値関係に基づいて、前記レイヤ間の接続パラメータを決定する決定手順と
をコンピュータに実行させることを特徴とする決定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、決定装置、決定方法および決定プログラムに関する。
【背景技術】
【0002】
従来、複数のノードを有するレイヤを多段に接続したモデルを用いて、入力情報の分類を実行させるDNN(Deep Neural Network)の技術が知られている。例えば、モデルに対して所定の入力情報を入力した際に、モデルの出力が入力情報と対応する出力情報に近づくようにモデルの学習を行うことで、所望の特徴に応じて入力情報を分類するようモデルの学習を行う技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術では、モデルに柔軟性を持たせることについては考慮されておらず、柔軟性のある推論や予測を行うことが困難であった。
【0005】
本願は、上記に鑑みてなされたものであって、柔軟性のあるモデルを構築することにより、状況に応じた最適化をすることができる決定装置、決定方法および決定プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る決定装置は、第1生成部と、第2生成部と、決定部とを備える。前記第1生成部は、複数のレイヤを有し、各レイヤがノード接続されたモデルの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する。前記第2生成部は、前記第1生成部によって生成された前記写像空間に基づいて、圏論における圏を生成する。前記決定部は、前記第2生成部によって生成された前記圏論における圏の同値関係に基づいて、前記レイヤ間の接続パラメータを決定する。
【発明の効果】
【0007】
実施形態の一態様によれば、柔軟性のあるモデルを構築することにより、状況に応じた最適化をすることができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る決定装置が実行する処理の一例を示す図である。
【
図2】
図2は、実施形態に係る決定装置のブロック図である。
【
図4】
図4は、実施形態に係る決定装置が実行する処理手順を示すフローチャートである。
【
図5】
図5は、提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る決定装置、決定方法および決定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る決定装置、決定方法および決定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.情報処理〕
まず、
図1を用いて、決定装置が実行する処理の一例について説明する。
図1は、実施形態に係る決定装置が実行する処理の一例を示す図である。
図1では、決定装置10は、以下に説明する決定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
【0011】
より具体的には、決定装置10は、インターネット等の所定のネットワークを介して、任意の装置と通信が可能である。
【0012】
近年、モデルとして、複数のノードを含むレイヤを多段に設定し、各レイヤ間のノードを接続経路を介して接続するとともに、接続経路に種々の接続係数を設定したDNNの技術が知られている。また、このようなDNN以外にも、RNN(Recurrent Neural Network)、LSTM(Long short-term memory)、CNN(Convolutional Neural Network)、DSSM(Deep Structured Semantic Models)といった、ノードを含むレイヤを多段に設定した各種のモデルが知られている。
【0013】
このような各種のモデルは、入力層、中間層(隠れ層)、および出力層と呼ばれるレイヤを有し、入力層から入力された情報(すなわち、入力情報)を各接続経路を伝播させながら出力層まで伝達する。この際、各接続経路に設定された接続係数に基づいた演算処理を実行することで、モデルは、入力情報に対応する出力情報を生成する。また、各レイヤは、複数のニューロから構成され、各ニューロは、行列などの関数である。
【0014】
ところで、従来技術においては、モデルに柔軟性を持たせることについては考慮されておらず、柔軟性のある推論や予測を行うことが困難であった。
【0015】
そこで、決定装置10は、モデルMに圏論の概念を用いて抽象化し、導来圏を用いた同値関係(導来同値)により、柔軟性のある当てはめにより、モデルMの構造に柔軟性を持たせることとした。つまり、決定装置10は、隣接するレイヤを滑らかにシフトさせたときの各レイヤの接続関係(すなわち、コホモロジー)を導来圏を用いることで計算し、そのコホモロジーの接続構造が同じものを同値とみなしてレイヤ間の接続パラメータを決定する。例えば、決定装置10は、接続パラメータとして、あるレイヤを基準としたときの隣接するレイヤとの接続関係を示すシフト量Dを決定し、そのシフト関係の構造が同じものを同値とみなす。
【0016】
つまり、決定装置10は、シフト量Dだけ、レイヤ間の構造をずらすことで、各レイヤ間の接続関係による同値構造を決定し、個々の接続パラメータが異なっていても、その接続構造が同一であれば、同じ値であるとみなして学習を行う。これにより、各レイヤ間の接続関係をより抽象的な概念でとらえることができ、柔軟性を持った最適化を行うことができる。
【0017】
具体的には、まず、決定装置10は、モデルMに基づいて、コホモロジーを満たす写像空間を生成する(ステップS1)。例えば、決定装置10は、モデルMを構成するレイヤ内におけるニューロ間の接続関係を示す複体X、Yを圏論の構造における「対象」と見做し、「対象」間の接続関係をホモトピー同値へ変換することで、コホモロジーを満たす写像空間を生成する。
【0018】
複体X、Yを「対象」と見做した場合、各対象を下記(式1)および(式2)のように定義する。なお、複体Xは、レイヤL1内の各ニューロの接続関係を示し、複体Yは、レイヤL2内の各ニューロの接続関係を示すものとする。
【数1】
ここで、(式1)および(式2)において、X
-1,X
0,X
1、X
2・・・およびY
-1,Y
0,Y
1、Y
2・・・は、それぞれニューロ間の接続関係を示す関数であり、d
-1、d
0、d
1・・・およびd´
-1、d´
0、d´
1・・・は、それぞれ対応する斜を示す。
【0019】
このとき、複体Xおよび複体Yがなす圏は、下記(式3)によって表すことができ、(式3)について、圏同値をホモトピーによってまとめたものが下記(式4)となる。
【数2】
(式4)は、コホモロジーを満たす写像空間を示す。
【0020】
そして、決定装置10は、上記(式4)に基づき、導来圏を生成する(ステップS2)。導来圏は、下記(式5)で表され、下記(式6)における全ての「n」について対応関係が成立する。
【数3】
【0021】
また、導来圏は、下記(式7)によっても表すことができる。
【数4】
【0022】
(式7)に示す「Qis」は、コホモロジーにおけるイメージに対応し、「Homk(R)(・)」は、コホモロジーにおけるカーネルに対応する。すなわち、(式7)は、複体Xと複体Yとのコホモロジーを示すことになる。
【0023】
ここで、導来圏は、非特許文献1(http://annals.math.princeton.edu/wp-content/uploads/annals-v166-n2-p01.pdf)に開示された三角圏の性質を有する。したがって、導来圏を用いることで、複体X、Yの接続関係、すなわち、シフト量Dを滑らかに変化させたときのコホモロジーを算出することが可能となる。
【0024】
このように、決定装置10は、導来圏を生成することで、各レイヤ間のコホモロジーを連続的に捉え、その構造に基づいた同値関係を得ることが可能となるので、柔軟性をもった接続パラメータを決定することが可能となる。
【0025】
そして、決定装置10は、かかる接続パラメータに基づいて、接続関係の最適化を行うことができるので、モデルMを理論的に最適化することが可能となる。さらには、モデルMに柔軟性を持たせることで、柔軟性のある推論や予測が可能となる。
【0026】
したがって、実施形態に係る決定装置10によれば、DNNを活用して新たなアイデアや新たな文章、画像などの創作を行う場合に、同じとみなすデータの範囲を広げることが可能となる。これにより、より人間のような柔らかい思考での創作に近い結果を得ることができる。
【0027】
〔2.決定装置の構成〕
次に、
図2を用いて、実施形態に係る決定装置10の構成例について説明する。
図2は、実施形態に係る決定装置10のブロック図である。
図2に示すように、決定装置10は、通信部20と、記憶部30と、制御部40とを備える。通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、所定のネットワークと有線または無線で接続され、図示しない外部装置との間で情報の送受信を行う。
【0028】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、モデルデータベース31を記憶する。
【0029】
モデルデータベース31は、モデルMを格納するデータベースである。なお、モデルデータベース31には、それぞれ互いに異なる複数のモデルMが格納されていてもよいし、あるいは、単一のモデルMが格納されていてもよい。なお、モデルMは、外部装置から取得したものであってもよいし、決定装置10によって学習されたものであってもよい。
【0030】
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、決定装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0031】
また、
図2に示すように、制御部40は、第1生成部41と、第2生成部42と、決定部43とを備える。第1生成部41は、複数のレイヤを有し、各レイヤがノード接続されたモデルの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する。
【0032】
図3は、コホモロジーの概念図である。
図3に示すように、コホモロジーは、ネットワークにおける前後の接続関係を示し、「カーネル(Ker g)÷イメージ(Im f)」で表現することができる。
【0033】
第1生成部41は、モデルMの各レイヤ内における接続関係を示す複体X、Yを圏論の構造における対象と見做し、上記(式4)までの計算を行うことで、圏同値がホモトピーによってまとめられた写像空間を生成する。
【0034】
ところで、上述したように、複体X、Yの各構成要素は、それぞれ各レイヤ内における各ニューロ間の接続関係を示す関数である。すなわち、別の見方をすると、複体X、Yは、それぞれ対応する複体内のニューロが示す関数同士の接点の集合と見做すことができ、ニューロの微分空間であると見做すことができる。
【0035】
このように、写像空間の対象を微分空間とすることで、ニューロを抽象化した概念で捉えることが可能となる。
【0036】
なお、第1生成部41は、例えば、非特許文献2(http://www2.math.kyushu-u.ac.jp/~m-kudo/kudo-combination-2015-2.pdf)に開示されたグレブナー基底の概念を用いて、コホモロジーを満たす写像空間を生成することにしてもよい。
【0037】
図2の説明に戻り、第2生成部42について説明する。第2生成部42は、第1生成部41によって生成された写像空間に基づいて、圏論における圏を生成する。具体的には、第2生成部42は、上記(式7)によって示した導来圏を生成する。
【0038】
決定部43は、第2生成部42によって生成された圏論における圏の同値関係に基づいて、レイヤ間の接続パラメータを決定する。つまり、決定部43は、導来圏による同値関係(導来同値)によって、個々の接続パラメータが異なっていても、その接続構造が同一であれば、同じ値であるとみなして学習を行う。
【0039】
これにより、モデルMについて柔軟性を持った最適化を行うことができる。
【0040】
ここで、別の観点から、接続パラメータを理論的に求める手法について説明する。複体X、Yと斜fとの関係を(式8)とする場合、2つの複体X、Yの畳み込みを示す式は、下記(式9)によって示すことができる。
【数5】
【0041】
(式9)に示すZは、Cone(f)に対応し、複体X,Yの「錐」とも称される。ここで、(式9)に示すように、複体X,Yの和集合間の斜δ
nは、(式10)として表すことができる。
【数6】
【0042】
なお、(式10)において、dnは、複体Xの斜、d´n+1は、複体Yの斜をそれぞれ示し、fn+1は、斜(dn、d´n+1)の斜を示す。つまり、fn+1は、斜同士(dn、d´n+1)の斜であり、複体X,Y間のズレを示すことになる。
【0043】
したがって、(式10)において、斜δnが最少となるように、「n」を決定することで、複体X,Y間の接続態様のズレを小さくすることができる。言い換えれば、斜δnが最少となるように「n」を決定することで、モデルMの最適化を理論的に実現することができる。
【0044】
ここで、斜δnは、離散的な表現となるが、斜δnの導来圏を導くことで、三角圏の性質を持つようになり、斜δnを連続的に捉えることが可能となる。すなわち、(式10)を導来圏で示したものが上記(式7)となる。
【0045】
このように、決定部43は、導来圏を用いて接続パラメータを設定することで、各レイヤを滑らかにシフトさせたときの斜δnに基づいて、最適な接続パラメータを決定することが可能となる。
【0046】
〔3.情報処理のフロー〕
次に、
図4を用いて、実施形態に係る決定装置10が実行する処理手順について説明する。
図4は、実施形態に係る決定装置10が実行する処理手順を示すフローチャートである。
【0047】
図4に示すように、実施形態に係るが決定装置10は、まず、モデルMの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成し(ステップS101)、写像空間に基づいて、導来圏を生成する(ステップS102)。
【0048】
続いて、決定装置10は、導来圏における同値関係に基づいて、レイヤ間の接続パラメータを決定し(ステップS103)、接続パラメータに基づいて、モデルMの構造を最適化し(ステップS104)、処理を終了する。
【0049】
〔4.ハードウェア構成〕
上述してきた実施形態に係る決定装置10は、例えば
図4に示すような構成のコンピュータ1000によって実現される。
図4は、決定装置10の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0050】
CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。
【0051】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網500を介して他の機器へ送信する。
【0052】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0053】
メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0054】
例えば、コンピュータ1000が実施形態に係る決定装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部40の機能を実現する。また、HDD1400には、記憶部30内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
【0055】
〔5.効果〕
上述したように、実施形態に係る決定装置10は、第1生成部41と、第2生成部42と、決定部43とを備える。第1生成部41は、複数のレイヤを有し、各レイヤがノード接続されたモデルMの接続関係を事象と見做し、コホモロジーを満たす写像空間を生成する。第2生成部42は、第1生成部41によって生成された写像空間に基づいて、圏論における圏を生成する。決定部43は、第2生成部42によって生成された圏論における圏の同値関係に基づいて、レイヤ間の接続パラメータを決定する。
【0056】
したがって、実施形態に係る決定装置10によれば、柔軟性のあるモデルを構築することにより、状況に応じた最適化をすることができる。
【0057】
また、実施形態に係る決定装置10において、第1生成部41は、圏論における圏の同値関係を、導来圏における同値関係としてレイヤ間の接続パラメータを決定する。
【0058】
したがって、実施形態に係る決定装置10によれば、各レイヤ間の接続パラメータに柔軟性を持たせて最適化を行うことができる。
【0059】
また、実施形態に係る決定装置10において、決定部43は、圏論における圏の同値関係を、導来圏における同値関係として、レイヤ間の接続パラメータを決定する。
【0060】
したがって、実施形態に係る決定装置10によれば、モデルMの構造に柔軟性を持たせることができる。
【0061】
また、実施形態に係る決定装置10において、第1生成部41は、グレブナー基底に基づいて、写像空間を生成する。
【0062】
したがって、実施形態に係る決定装置10によれば、コホモロジーを満たす写像空間を適切に生成することができる。
【0063】
〔6.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0064】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0065】
また、上述してきた実施形態に記載した各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0066】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、第1生成部41は、第1生成手段や第1生成回路に読み替えることができる。
【符号の説明】
【0067】
10 決定装置
20 通信部
30 記憶部
31 モデルデータベース
40 制御部
41 第1生成部
42 第2生成部
43 決定部