【文献】
羽室行信ほか,"ネットワーク構造を対象とした特徴量抽出とその応用",オペレーションズ・リサーチ,日本,公益社団法人日本オペレーションズ・リサーチ学会,2015年08月01日,第60巻,第8号,P.468〜474,ISSN:0030-3674
(58)【調査した分野】(Int.Cl.,DB名)
技術文献に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報に含まれるノードの数とリンクの数との変化の傾向に基づいて、前記技術文献の対象となる分野における変化の傾向を推定する推定部と、
前記推定部によって推定された変化の傾向を示す情報を提供する提供部と
を有することを特徴とする提供装置。
前記推定部は、冪分布に従って、既存のノードから、当該ノードとリンクにより接続される新たなノードが発生するものとして、前記ノードの数とリンクの数との変化の傾向を推定する
ことを特徴とする請求項1〜5のうちいずれか1つに記載の提供装置。
前記推定部は、バラバシ・アルバートモデルを用いて、前記グラフ情報の初期状態を生成し、生成したグラフ情報に含まれる既存ノードから、当該ノードとリンクにより接続される新たなノードが発生するものとして、前記ノードの数とリンクの数との変化の傾向を推定する
ことを特徴とする請求項1〜6のうちいずれか1つに記載の提供装置。
前記推定部は、複数種別の要素の集合からいずれかの要素が選択された際に、選択された要素とともに選択された要素とは異なる種別の要素を前記集合に加えた後において各種別の要素が選択される確率に基づいて、既存のノードから、当該ノードとリンクにより接続される新たなノードが発生するものとして、前記ノードの数とリンクの数との変化の傾向を推定する
ことを特徴とする請求項1〜7のうちいずれか1つに記載の提供装置。
前記推定部は、前記グラフ情報の畳み込み解析を行うことで、所定の分野における主要なノード間の関係性を示すグラフ情報を新たに生成し、新たに生成したグラフ情報に含まれる既存のノードから、当該ノードとリンクにより接続される新たなノードが発生するものとして、前記ノードの数とリンクの数との変化の傾向を推定する
ことを特徴とする請求項8に記載の提供装置。
技術文献に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報に含まれるノードの数とリンクの数との変化の傾向に基づいて、前記技術文献の対象となる分野における変化の傾向を推定する推定手順と、
前記推定手順によって推定された変化の傾向を示す情報を提供する提供手順と
をコンピュータに実行させるための提供プログラム。
【発明を実施するための形態】
【0011】
以下に、本願に係る提供装置、提供方法および提供プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る提供装置、提供方法および提供プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0012】
[実施形態]
〔1−1.提供装置の一例〕
まず、
図1を用いて、提供装置が実行する処理の一例について説明する。
図1は、実施形態に係る提供装置が実行する処理の一例を示す図である。
図1では、提供装置10は、以下に説明する提供処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
【0013】
より具体的には、提供装置10は、インターネット等の所定のネットワークNを介して、入出力装置100(例えば、
図2を参照)といった任意の装置と通信が可能である。ここで、入出力装置100は、マイクなどの音声を取得する音声取得装置を用いて、利用者の発言を取得する。そして、入力装置100は、任意の音声認識技術を用いて、発言をテキストデータに変換し、変換後のテキストデータを提供装置10へと送信する。また、入出力装置100は、スピーカ等の音声を出力する装置を用いて、提供装置10から受信したテキストデータの読み上げを行う。なお、入出力装置100は、提供装置10から受信したテキストデータを所定の表示装置に表示してもよい。
【0014】
なお、入出力装置100は、スマートフォンやタブレット等のスマートデバイス、デスクトップPC(Personal Computer)やノートPC等、サーバ装置等の情報処理装置により実現される。なお、入出力装置100は、例えば、同一の情報処理装置によって実現されてもよく、例えば、ロボット等の装置によって実現されてもよい。
【0015】
〔1−2.提供装置の処理について〕
ここで、技術文献に含まれる文章を分散表現に変換し、他の発言や情報の分散表現との比較結果に基づいて、利用者の発言に対する応答や、利用者間の対話を補助する発言を生成するといった処理が考えられる。しかしながら、このような技術では、利用者間の対話そのものを補助しているに過ぎない。すなわち、従来の技術では、利用者間の対話を局所的にとらえた情報を提供しているに過ぎず、例えば、利用者にどのような主題で対話を行えばよいかといった提案、すなわち、大局的な利用者間の対話の補助を実現することができない。例えば、従来の技術では、今後成長する技術や新たなアイデアにより発展する見込みのある(イノベーションが起こりやすい)分野を特定することができない。
【0016】
ここで、将来発展するであろう技術分野を予測し、予測した技術分野を利用者間の対話の主題として提案した場合には、ブレスト等といった利用者間の対話を効率化することができると予測される。しかしながら、単に話題となっている技術分野を提案しただけでは、必ずしも利用者の対話を効率化できているとは言えない。例えば、話題となっている技術分野であっても、新たな技術が生じ難い場合等、発展性が乏しい場合には、対話により新たな技術が生じる可能性が低く、対話の主題として適切であるとは言えない場合がある。すなわち、発展性が乏しい分野を提案した場合、利用者間の対話においてイノベーションとなる新たな技術を生み出すことができなくなる恐れがある。
【0017】
このようなイノベーションが発生しやすい分野、すなわち、発展性が豊かな分野においては、既存技術から新たな技術が生じやすい分野であると考えられる。このような技術の生じやすさを分野ごとに推定した場合、利用者に対してイノベーションを起こしやすい分野を対話の主題として提案することができると考えられる。このようなある分野における新たな技術の生じやすさは、その分野に属する既存技術から新たな技術がどのように生じるかを特定することで判断できると考えられるものの、このような技術の発展を精度良く連続的にとらえるには、多くの情報が必要になると考えられる。また、利用者の対話に要する場合以外にも、イノベーションを起こしやすい分野を特定することができるのであれば、技術開発等の用途に用いることも可能である。
【0018】
そこで、提供装置10は、以下の提供装置を実行する。まず、提供装置10は、技術文献に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報に含まれるノードの数とリンクの数との変化の傾向に基づいて、技術文献の対象となる分野における変化の傾向を推定する。そして、提供装置10は、推定された変化の傾向を示す情報を提供する。
【0019】
例えば、提供装置10は、所定の技術分野に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報(以下、「技術グラフ」と記載する。)を生成する。このようなグラフ情報は、ある分野に属する技術要素が、どのような技術要素から生じたものであるかを示す情報である。例えば、第1技術要素が、第2技術要素と第3技術要素との組合せである場合や、第2技術要素と第3技術要素とから発展した技術である場合、第1技術要素と対応するノードは、リンクを介して、第2技術要素と対応するノードおよび第3技術要素と対応するノードと接続される。
【0020】
ここで、提供装置10は、ある分野に属する技術を示す情報であれば、任意の情報を技術要素としてよい。例えば、提供装置10は、ある分野に属する特許発明や特許出願を技術要素とし、各技術要素同士の関係性を技術グラフに落とし込んでもよい。また、提供装置10は、1つの論文を1つの技術要素と見做し、引用関係がある論文同士をリンクにより接続することで、技術グラフを生成してもよい。また、提供装置10は、共通性を有する複数の論文を1つの技術要素と見做してもよい。
【0021】
このような技術グラフにおいて、ノードの数の増加傾向は、その分野に属する技術要素の増加傾向、すなわち、新たな技術要素の増加傾向を示す。このような新たな技術要素の増加傾向は、その分野におけるイノベーションの生じやすさの指標と見做すことができる。また、このような技術グラフにおいて、リンクの数の増加傾向は、その分野においてある技術から他の技術がどれくらい生じやすいかを示すと考えられる。すなわち、リンクの数の増加傾向は、その分野において新たな技術が生じた際に、その技術に基づいて新たな技術がどれくらい生じやすいか、潜在的な技術発展の可能性の指標となりえる情報である。
【0022】
そこで、提供装置10は、ある分野に対応する技術グラフを生成し、生成した技術グラフの発展態様を特定する。より具体的には、提供装置10は、ノードの数の増加傾向とリンクの数の増加傾向とを推定する。そして、提供装置10は、推定した増加傾向に基づいて、技術グラフと対応する分野が成長しやすい分野であるか否か、その分野が成長する分野であるか否か等、その分野における技術発展の傾向を推定する。
【0023】
例えば、提供装置10は、ノードの数の増加傾向に基づいて、対応する分野に属する新たな技術の発生傾向を推定してもよい。例えば、提供装置10は、処理対象となる分野と対応する技術グラフにおいて、所定の時間内に増加するノードの数が所定の閾値を超える場合は、処理対象となる分野(以下、「対象分野」と記載する。)が成長しやすい分野である旨を推定してもよい。
【0024】
また、例えば、提供装置10は、リンクの数の増加傾向に基づいて、対応する分野に属する新たな技術の発生傾向を推定してもよい。例えば、提供装置10は、処理対象となる分野と対応する技術グラフにおいて、所定の時間内に増加するリンクの数が所定の閾値を超える場合は、対象分野が成長しやすい分野である旨を推定してもよい。
【0025】
ここで、ノードの数の増加傾向とリンクの数の増加傾向とが類似する場合(例えば、ノードが1つ増加した際にリンクが1つ増加する場合)、その分野における技術は、既存技術から段階的に発展していくと推定される。また、ノードの数の増加傾向をリンクの数の増加傾向が所定の閾値だけ上回る場合(例えば、ノードが1つ増加した際にリンクが5つ以上増加する傾向にある場合)は、ある1つの技術から新たな複数の技術が生じやすい分野であると推定される。
【0026】
そこで、提供装置10は、ノードの数の増加傾向とリンクの数の増加傾向とに基づいて、対応する分野に属する新たな技術の発生傾向を推定してもよい。例えば、推定装置10は、ノードの数の増加傾向とリンクの数の増加傾向と差に基づいて、対応する分野に属する新たな技術の発生傾向を推定してもよい。例えば、推定装置10は、ノードの数の増加傾向と比較して、リンクの数の増加傾向が多い場合は、対象分野に属する技術が発展しやすい技術である旨を推定してもよい。
【0027】
このように、提供装置10は、技術グラフにおけるノードの数の増加傾向やリンクの数の増加傾向に基づいて、その分野における技術発展のしやすさを推定する。この結果、提供装置10は、イノベーションが生じやすい分野を利用者に対して提示することができる。
【0028】
〔1−3.技術グラフの発展について〕
ここで、提供装置10は、過去の技術要素の数の変化や、技術要素間の関係性の変化に基づいて、その分野における技術グラフの発展を示すパラメータを推定し、推定したパラメータに基づいて技術グラフに含まれるノードやリンクの数を変化させることで、対象分野における将来の技術発展のしやすさを予測してもよい。
【0029】
例えば、ある分野における技術の発展は、技術グラフにおけるノードやリンクの数の変化と見做すことができるが、このようなノードやリンクの数の変化は、冪分布で仮想的に再現されると予測される(例えば、非特許文献1参照)。そこで、提供装置10は、冪分布に従って、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定してもよい。
【0030】
例えば、ある分野に属するリンクの数をn、技術要素の数をN(n)とおく。このような場合、技術要素の数とリンクの数とがベキ則に従うと仮定すると、広いスケールに渡り、以下の式(1)に示す確率モデルを設定することができる。なお式(1)のρは、所定の定数であり、技術グラフの発展を示すパラメータと対応する。
【0032】
ここで、技術グラフの発展がYule過程に従うと仮定すると、定数ρは、以下の式(2)で示すことができる。ここで、式(2)のgとは、新たなノードの生成速度、すなわち、単位時間あたりにおける新たな技術要素の発生数と対応し、sは技術要素間の関係の数、すなわち、単位時間あたいにおける新たなリンクの数の発生数に対応する。
【0034】
一方、技術グラフの発展がSimon過程に従うと仮定すると、定数ρは、以下の式(3)で示すことができる。なお、式(3)に示すαは、式(4)で示されるパラメータである。
【0037】
また、技術グラフの発展が修正Yule過程に従うと仮定すると、定数ρは、以下の式(5)で示すことができる。
【0039】
提供装置10は、技術グラフと対応する対象分野ごとに、式(2)〜(5)で示されるいずれかのパラメータを設定する。より具体的には、提供装置10は、過去に測定された単位時間値の技術要素の増加数やリンクの増加数等に基づいて、定数ρの値を設定する。そして、提供装置10は、式(1)で示される関係性に従って、技術グラフに含まれるノードやリンクが増加していくものとして、技術グラフを発展させる。すなわち、提供装置10は、技術グラフに含まれるノードやリンクの数を増加させることで、対象分野における将来の技術発展を予測する。そして、提供装置10は、技術グラフのノードやリンクの数の増加傾向に基づいて、対象分野における将来の発展傾向を推定してもよい。
【0040】
〔1−4.技術グラフの初期モデルについて〕
ここで、提供装置10は、任意の構成を有するグラフを技術グラフの初期モデルとして採用してもよい。例えば、提供装置10は、バラバシ・アルバートモデルを用いて、技術グラフの初期状態を生成し、生成したグラフ情報に含まれるノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定してもよい。
【0041】
例えば、提供装置10は、技術グラフの初期モデルとして、m個のノードを有する完全グラフを生成する。続いて、提供装置10は、新しいノードを1つ追加し、追加したノードと他のノードとの間を所定の確率で接続するリンクを設定する。例えば、提供装置10は、式(1)における定数ρの値が「3」となるように、リンクの接続を行う。このような処理をノードの数が所定の数になるまで繰り返すことで、提供装置10は、初期モデルの生成を行ってもよい。
【0042】
なお、上述した技術以外にも、提供装置10は、例えば、ワッツ・ストロガッツモデル等、複雑グラフの初期モデルを生成するための各種の手法を採用して、技術グラフの初期モデルを生成してよい。
【0043】
〔1−5.ポリアの壺アルゴリズムについて〕
ここで、非特許文献1で示されるように、技術分野の発展をポリアの壺アルゴリズムにより数学的に表す手法が考えられる。そこで、提供装置10は、ポリアの壺アルゴリズムを用いて、技術グラフを発展させ、技術グラフのノードやリンクの数の増加傾向に基づいて、対象分野における将来の発展傾向を推定してもよい。
【0044】
以下、ポリアの壺アルゴリズムの一例について説明する。例えば、ポリアの壺アルゴリズムにおいては、それぞれ異なる色の玉が入れられた壺からランダムに1つの玉が取り出され、取り出された玉が、初めて取り出された玉の色であるか否かが判定される。そして、取り出された玉が、過去に取り出された玉と同じ色である場合は、取り出された玉が壺に戻されるとともに、その玉と同じ色の玉が所定の数だけ壺に追加される。一方、取り出された玉が初めて取り出された色である場合は、取り出された玉が壺に戻され、その玉と同じ色の玉が所定の数だけ壺に追加されるとともに、それぞれ色が異なる所定の数の玉であって、それぞれが新たな色を有する玉が壺に入れられる。
【0045】
このようなポリアの壺アルゴリズムは、ある分野における技術要素の発展の確率モデルと見做せる。例えば、壺の中に入れられた玉を技術要素とした場合、壺の中から取り出された玉の色が初めて取り出された玉の色である確率は、新たな技術要素が発生する確率と対応付けることができる。また、取り出された玉が初めて取り出された色である場合に、新たに壺の中に入れられる新たな色の玉の数は、新たな技術要素が発生した際にその技術から将来発生する新たな技術要素の数を示すパラメータと対応付けることができる。また、取り出された玉とともに壺に入れられる玉であって、壺の中から取り出された玉と同じ色の玉の数は、技術要素間の関係性、すなわち、リンクが生じるパラメータと対応付けることができる。
【0046】
そこで、提供装置10は、ポリアの壺アルゴリズムを用いて、技術グラフを発展させ、対象分野における将来の発展傾向を推定する。例えば、提供装置10は、複数種別の要素の集合からいずれかの要素が選択された際に、選択された要素とともに選択された要素とは異なる種別の要素を集合に加えた後において各種別の要素が選択される確率に基づいて、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。
【0047】
例えば、玉を取り出すシーケンスをt、壺の中の全ての玉の数をU(t)、時刻tまでに取り出されていない玉の数をU
D(t)、時刻t=0における壺の中の玉の数をN
0、新たな色の玉が取り出された際に追加される新たな色の玉の数をv+1、取り出した玉とともに壺に追加される玉であって、取り出した玉と同じ色の玉の数をρとおく。ここで、ある時刻において壺の中にある玉の色の数(異なる要素の数)をDとおくと、新たな技術要素が生じる速度は、単位時間あたりのDの変化、すなわちdD/dtで表すことができる。そして、dD/dtは、以下の式(6)で示すことができる。
【0049】
そこで、提供装置10は、式(6)を用いて、技術グラフの成長の速さを推定する。すなわち、提供装置10は、単位時間当たりの新たな技術要素が生じる確率を、技術グラフの成長の速さとして、対象分野における変化を推定する。例えば、以下の式(7)で示される条件が満たされるものとする。このような際にρがvよりも大きい場合は、Dは、以下の式(8)を満たし、ρがvよりも小さい場合は、以下の式(9)を満たし、ρとvとが等しい場合は、以下の式(10)を満たすこととなる。
【0054】
ここで、vは、新たな色の玉が取り出された際に追加される新たな色の玉の数と対応するため、新たな技術の発生に関するパラメータ、すなわち、技術グラフにおける新たに発生するノードの数と対応すると考えられる。また、ρは、取り出した玉とともに壺に追加される玉であって、取り出した玉と同じ色の玉の数と対応するため、新たな技術と既存技術との関係性に関するパラメータ、すなわち、技術グラフにおける新たなリンクの数と対応すると考えられる。そこで、提供装置10は、対象分野に属する過去の特許文献等から、ρやvの数を推定し、推定結果に基づいて、Dの値を算出することで、対象分野におけるイノベーションの起こりやすさ、すなわち、新たな技術の生じやすさを推定する。なお、提供装置10は、対象分野ごとにρやvといった各種のパラメータの値と、実際の技術要素の数や関係性の数との間の対応を学習し、学習結果とある分野に属する技術要素の数や関係性の数とに基づいて、その分野におけるρやvの値を設定してもよい。
【0055】
〔1−6.グラフの畳み込みについて〕
なお、提供装置10は、対象分野におけるイノベーションの起こりやすさを推定する際、グラフ畳み込みの技術を用いることで、対象分野における中核技術、すなわち、対象分野における主だった技術や重要な技術を抽出し、抽出した中核技術のイノベーションの起こりやすさを推定してもよい。
【0056】
例えば、グラフコンボリューション等といったグラフの畳み込みを行う技術を用いて、対象分野における技術グラフの畳み込み解析を行った場合、対象分野における主要なノード、すなわち、対象分野における中核技術と対応するノードのグラフ構造を得ることができる。そこで、提供装置10は、技術グラフの畳み込み解析を行うことで、対象分野における主要なノード間の関係性を示す技術グラフを新たに生成し、新たに生成した技術グラフに含まれる既存のノードから、リンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定してもよい。
【0057】
このように、提供装置10は、技術グラフの畳み込み解析を行うことで、対象分野に奥得る中核技術の発展のしやすさを推定することできるので、例えば、重要な技術のイノベーションが生じやすい対象分野を利用者に対して提案することができる。
【0058】
〔1−7.提供装置の一例について〕
次に、
図1を用いて、提供装置10が実行する提供装置の一例について説明する。まず提供装置10は、ある分野に属する技術要素をノードとし、技術要素間の関係性をリンクとする技術グラフを生成する(ステップS1)。例えば、提供装置10は、所定の第1カテゴリに属する特許発明や論文を技術要素とし、技術要素間の関係性を特定する。そして、提供装置10は、技術要素をノードにあてはめ、技術要素間の関係性を示すリンクを設定した技術グラフを生成する。なお、このような技術グラフの生成については、任意のグラフ生成技術が採用可能である。
【0059】
続いて、提供装置10は、ポリアの壺アルゴリズムに基づいて、将来の技術要素と関係性との増加態様を推定する(ステップS2)。例えば、提供装置10は、関連性が生じる確率のパラメータであるρに対し、新たなリンクが生じる速度に応じた値を設定し、新たな技術要素が生まれる確率のパラメータであるvに対し、新たな技術要素が生じる速度に応じた値を設定する。このようなパラメータに対して設定される値は、例えば、対象分野における過去の複数時点における技術グラフを生成し、生成した技術グラフ同士の比較結果に基づいて、設定されてもよい。そして、提供装置10は、式(6)に基づいて、詳細における技術グラフの成長速度を推定する。
【0060】
続いて、提供装置10は、各分野におけるノードとリンクとの数の変化に基づいて、対象分野の成長傾向を推定する(ステップS3)。例えば、提供装置10は、式(6)を用いて、第1カテゴリと対応する技術グラフの状態であって、将来のタイミングT
1における状態N
1(T
1)、将来のタイミングT
2における状態N
1(T
2)、および将来のタイミングT
3におけるN
1(T
3)を推定する。そして、提供装置10は、状態N
1(T
1)、N
1(T
2)、およびN
1(T
3)の変化に基づいて、第1カテゴリの成長速度#1を推定する。例えば、提供装置10は、状態N
1(T
1)におけるノードとリンクとの数、N
1(T
2)におけるノードとリンクとの数、およびN
1(T
3)におけるノードとリンクとの数の変化に基づいて、第1カテゴリの成長速度#1を推定する。例えば、提供装置10は、ノードの数の増加量の平均値やリンクの数の増加量の平均値に基づいて、成長速度#1を推定してもよい。
【0061】
同様に、提供装置10は、式(6)を用いて、第2カテゴリと対応する技術グラフの状態であって、将来のタイミングT
1における状態N
2(T
1)、将来のタイミングT
2における状態N
2(T
2)、および将来のタイミングT
3におけるN
2(T
3)を推定する。そして、提供装置10は、状態N
2(T
1)、N
2(T
2)、およびN
2(T
3)の変化に基づいて、第2カテゴリの成長速度#2を推定する。
【0062】
そして、提供装置10は、成長速度が速いカテゴリを利用者に対して提案する。例えば、
図1に示す例では、提供装置10は、成長速度が速いカテゴリを対話対象となるカテゴリとして提案する(ステップS4)。例えば、提供装置10は、第1カテゴリの成長速度#1が第2カテゴリの成長速度#2よりも速い場合は、第1カテゴリを対話の主題として利用者に提案する。この結果、提供装置10は、より成長速度が速いカテゴリを対話の主題として提案することができるので、技術戦略立案やブレスト時のテーマ選定において、イノベーションの導出に役立つテーマを特定し、利用者に提供することができる。すなわち、提供装置10は、利用者間の対話に対する大局的な提案を出力することができる。
【0063】
なお、
図1に示す例では、提供装置10は、成長速度が速いカテゴリを対話対象となるカテゴリとして提案したが、実施形態は、これに限定されるものではない。例えば、提供装置10は、成長速度が速いカテゴリ、すなわち、イノベーションが生じやすい技術分野を示す情報を利用者に対して提示することができるのであれば、任意の目的で用される情報を任意の態様で提示すればよい。
【0064】
〔2.提供装置の構成〕
以下、上記した提供処理を実現する提供装置10が有する機能構成の一例について説明する。
図2は、実施形態に係る提供装置の構成例を示す図である。
図2に示すように、提供装置10は、通信部20、記憶部30、および制御部40を有する。
【0065】
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、入出力装置100との間で情報の送受信を行う。
【0066】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、技術グラフデータベース31を記憶する。
【0067】
技術グラフデータベース31には、技術グラフが登録されている。例えば、
図3は、実施形態に係る技術グラフデータベースに登録される情報の一例を示す図である。
図3に示す例では、技術グラフデータベース31には、「カテゴリ」、「パラメータ」、「リンクID(Identifier)」、「第1ノードID」、および「第2ノードID」等といった項目を有する情報が、技術グラフごとに登録される。
【0068】
ここで、「カテゴリ」とは、技術グラフと対応する対応カテゴリを示す情報である。また、「パラメータ」とは、対応する技術グラフにおいてノードやリンクの数がどのように増加していくかを示すパラメータである。また、「リンクID」とは、技術グラフに含まれるリンクを識別するための情報である。また、「第1ノードID」および「第2ノードID」とは、対応付けられた「リンクID」が示すリンクによって接続されたノード、すなわち、関連性を有する2つの技術要素を示すノードを識別する情報である。
【0069】
例えば、
図3に示す例では、「技術グラフ#1」が示す技術グラフの情報として、カテゴリ「カテゴリ#1」、パラメータ「パラメータ#1」、リンクID「リンク#1」、第1ノードID「ノード#1」、および第2ノードID「ノード#2」が対応付けて登録されている。このような情報は、「技術グラフ#1」が示す技術グラフが、「カテゴリ#1」と対応する技術グラフであり、上述したρやvの値として、パラメータ「パラメータ#1」が設定され、リンクID「リンク#1」が示すリンクにより、第1ノードID「ノード#1」が示すノードと、第2ノードID「ノード#2」が示すノードとが接続されている旨を示す。
【0070】
なお、
図3に示す例では、「カテゴリ#1」、「リンク#1」、「ノード#1」等といった概念的な値について記載したが、実際には、カテゴリを示す文字列や数値、リンクやノードを示す文字列や数値等が登録されることとなる。また、
図3に示す情報は、あくまで一例であり、技術グラフデータベース31には、グラフ構造を有するデータであれば、任意の形式のデータが登録されていてよい。
【0071】
図2に戻り、説明を続ける。制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0072】
図2に示すように、制御部40は、生成部41、推定部42、および提供部43を有する。生成部41は、カテゴリごとに技術グラフの初期グラフを生成する。例えば、生成部41は、あるカテゴリに属する論文や特許発明等を技術要素とするとともに、技術要素間の関係性を特定する。例えば、生成部41は、形態素解析や文章解析の各種公知技術を用いて、論文や特許発明の明細書に含まれる単語群を抽出し、抽出した単語群が示す技術要素と、技術要素同義の関係性とを特定する。このような特定は、例えば、各種意図解析の技術を用いて、イノベーションの単位となる技術を特定することにより実現されてもよい。また、推定した技術同士の関係性を単語群の共起姓に基づいて、技術要素間の関係性を特定してもよい。すなわち、生成部41は、各種の意図解析技術を用いて、技術要素を特定し、単語群の類似性や共起性に基づいて単語群が示す意味同士の関係性を推定する推定技術を用いて、技術要素間の関係性を特定するのであれば、任意の意図解析技術や推定技術を採用してよい。
【0073】
そして、生成部41は、特定した技術要素をノードとし、技術要素間の関係性をリンクとした技術グラフを生成し、生成した技術グラフを技術グラフデータベース31に登録する。なお、生成部41は、バラバシ・アルバートモデルを用いて、グラフ情報の初期状態を生成し、生成したグラフ情報を技術グラフとして技術グラフデータベース31に登録してもよい。
【0074】
また、生成部41は、技術グラフごとに、ρやvといったパラメータの値を設定する。例えば、生成部41は、実際の論文数や特許発明数等といった技術要素の数の変化に基づいて、単位時間あたりのノードの増加量を特定してもよい。また、生成部41は、実際の技術要素間の関係性の変化に基づいて、単位時間あたりのリンクの増加量を特定してもよい。そして、生成部41は、これらノードの増加量やリンクの増加量に基づいて、ρやvの値を設定し、技術グラフデータベース31に登録する。
【0075】
推定部42は、技術文献に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報に含まれるノードの数とリンクの数との変化の傾向に基づいて、各技術分野における変化の傾向を推定する。例えば、推定部42は、技術グラフデータベース31に登録された各技術グラフごとに、対応するパラメータに基づいて、各技術グラフのノードやリンクの数を増加させる。すなわち、推定部42は、パラメータに基づいて、技術グラフを成長させる。そして、推定部42は、成長させた技術グラフを将来の技術グラフと見做すことで、ノードやリンクの数の増加量を特定し、特定した増加量に基づいて、対象分野の成長態様を推定する。
【0076】
例えば、推定部42は、対象分野における変化の傾向として、対象分野が成長するか否かを推定してもよい。また、推定部42は、ノードの数の増加傾向に基づいて、対象分野に属する新たな技術の発生傾向を推定してもよい。また、推定部42は、ノードの数の増加傾向と、リンクの数の増加傾向とに基づいて、対象分野に属する技術の発展のしやすさを推定してもよい。
【0077】
なお、推定部42は、ノードの数の増加傾向やリンクの数の増加傾向に基づいて、対象分野の成長速度がどの程度であるか、どのような態様で対象分野が成長するかを推定してもよい。例えば、推定部42は、ノードの数の増加傾向と比較して、リンクの数の増加傾向が多い場合は、対象分野に属する技術が発展しやすい技術である旨を推定してもよい。
【0078】
例えば、
図4は、実施形態に係る提供装置が推定する成長態様の一例を概念的に示す図である。例えば、
図4中左側に示す技術グラフにおいて、ノード#Aが新たに生じ、その後、ノード#Bが新たに生じたものとする。このような場合、
図4に示す技術グラフにおいて1つのノードが追加された際に増加するリンクの数がそれほど多くない場合、
図4に示す技術グラフは、将来にわたって線形的に変化していくとも考えられる。一方、
図4に示す技術グラフにおいて1つのノードが追加された際に増加するリンクの数が多い場合やノードの数の増加傾向が所定の閾値を超える場合は、
図4中右側に示すように、ノード#Bから新たに多くのノードが生成されやすいと推定される。
【0079】
このように、新たなノードが生成されやすい技術グラフは、イノベーションが生じやすい対象分野を示していると考えられ、ノードやリンクの増加傾向は、対象分野におけるイノベーションの起こりやすさや発展の態様を示唆すると推定される。そこで、提供装置10は、ノードやリンクの数の変化の傾向に基づいて、対象分野における発展の傾向を推定する。
【0080】
例えば、推定部42は、ノードやリンクの数の増加量が所定の閾値を超える場合は、対象分野が成長する分野である旨を推定してもよい。また、推定部42は、ノードの数の増加量が所定の閾値をこえ、かつ、ノードの数の増加量と比較して、リンクの数の増加量が多い場合、新たな技術要素が発生した際に、その新たな技術要素からさらに新たな技術要素が発生しやすい分野、すなわち、イノベーションが発生しやすい分野である旨を推定してもよい。
【0081】
ここで、推定部42は、冪分布に従って、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。例えば、推定部42は、技術グラフデータベース31に登録された技術グラフと、技術グラフと対応するパラメータとを読み出す。そして、推定部42は、複数種別の要素の集合からいずれかの要素が選択された際に、選択された要素とともに選択された要素とは異なる種別の要素を集合に加えた後において各種別の要素が選択される確率に基づいて、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。すなわち、推定部42は、ポリアの壺アルゴリズムに基づいて、ノードの数とリンクの数との変化の傾向を推定する。より具体的な例を挙げると、推定部42は、生成部41に設定されたρやvの値を用いて、上述した式(8)〜(10)から技術グラフの成長速度を算出する。
【0082】
なお、推定部42は、グラフ情報の畳み込み解析を行うことで、所定の分野における主要なノード間の関係性を示すグラフ情報を新たに生成し、新たに生成したグラフ情報に含まれる既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定してもよい。例えば、推定部42は、技術グラフデータベース31に登録されたグラフ情報の畳み込み解析を行うことで、対象分野における中核技術の技術グラフ(以下、「中核グラフ」と記載する。)を生成する。そして、推定部42は、中核グラフのノードやリンクの数の増加量に基づいて、対象分野の成長を推定してもよい。なお、生成部41や推定部42は、中核グラフのノードやリンクの数の増加量に関する各種のパラメータを設定してもよい。
【0083】
図2に戻り、提供部43は、推定された変化の傾向を示す情報を提供する。例えば、提供部43は、推定部42により将来成長すると推定された対象分野を示す音声を入出力装置100へと送信し、入出力装置100に再生させることで、利用者に将来成長する分野を示す情報を提供する。なお、提供部43は、推定部43により推定された対象分野の成長態様を示す情報を提供してもよい。
【0084】
〔3.提供装置が実行する処理の流れの一例〕
次に、
図5を用いて、提供装置10が実行する提供処理の流れの一例について説明する。
図5は、実施形態に係る提供処理の流れの一例を説明するフローチャートである。まず、提供装置10は、対象分野ごとに技術グラフを生成し(ステップS101)、技術グラフごとにポリアの壺アルゴリズムにおける各パラメータを設定する(ステップS102)。そして、提供装置10は、設定したパラメータに基づいて、各技術グラフのノードとリンクとの数の増加傾向を推定する(ステップS103)。そして、提供装置10は、推定結果に基づいて、各対象分野の成長の傾向を推定し(ステップS104)、推定結果に基づいた提案を出力して(ステップS105)、処理を終了する。
【0085】
〔4.変形例〕
上記では、提供装置10による提供処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、提供装置10が実行する提供処理のバリエーションについて説明する。
【0086】
〔4−1.装置構成〕
上述した例では、提供装置10は、提供装置10内で提供処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、提供装置10は、技術グラフの初期モデルやパラメータを設定する生成装置、対象分野の発展態様を推定する推定装置、および推定結果に基づいた情報を提供する提供装置が連携して動作することで、実現されてもよい。このような場合、生成装置は、
図2に示す生成部41を有し、推定装置は、
図2に示す推定部42を有し、提供装置は、
図2に示す提供部43を有することとなる。また、提供装置10は、技術グラフデータベース31を外部のストレージサーバに記憶させてもよい。
【0087】
〔4−2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0088】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0089】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0090】
〔5.プログラム〕
また、上述してきた実施形態に係る提供装置10は、例えば
図6に示すような構成のコンピュータ1000によって実現される。
図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0091】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
【0092】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0093】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0094】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0095】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0096】
例えば、コンピュータ1000が提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
【0097】
〔6.効果〕
上述したように、提供装置10は、技術文献に属する単語群で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報に含まれるノードの数とリンクの数との変化の傾向に基づいて、技術文献の対象となる分野における変化の傾向を推定する。そして、提供装置10は、推定された変化の傾向を示す情報を提供する。このような処理の結果、提供装置10は、技術戦略立案やブレスト時のテーマ選定において、イノベーションの導出に役立つテーマを抽出することができる。すなわち、提供装置10は、どの分野がどのように変化するかに基づいた大局的な提案を利用者に提供することができる。
【0098】
例えば、提供装置10は、分野における変化の傾向として、その分野が成長するか否かを推定する。また、例えば、提供装置10は、ノードの数の増加傾向に基づいて、分野に属する新たな技術の発生傾向を推定する。また、例えば、提供装置10は、ノードの数の増加傾向と、リンクの数の増加傾向とに基づいて、分野に属する技術の発展のしやすさを推定する。また、例えば、提供装置10は、ノードの数の増加傾向と比較して、リンクの数の増加傾向が多い場合は、その分野に属する技術が発展しやすい技術である旨を推定する。このため、提供装置10は、発展しやすい分野を利用者に対して提案することができる。
【0099】
また、提供装置10は、冪分布に従って、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。このため、提供装置10は、発展しやすい分野を精度良く利用者に対して提案することができる。
【0100】
例えば、提供装置10は、バラバシ・アルバートモデルを用いて、技術グラフの初期状態を生成し、生成した技術グラフに含まれる既存ノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。また、提供装置10は、複数種別の要素の集合からいずれかの要素が選択された際に、選択された要素とともに選択された要素とは異なる種別の要素を集合に加えた後において各種別の要素が選択される確率に基づいて、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。このため、提供装置10は、発展しやすい分野を精度良く利用者に対して提案することができる。
【0101】
また、提供装置10は、技術グラフの畳み込み解析を行うことで、所定の分野における主要なノード間の関係性を示す技術グラフを新たに生成し、新たに生成した技術グラフに含まれる既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、ノードの数とリンクの数との変化の傾向を推定する。このため、提供装置10は、例えば、中核技術のイノベーションが発生しやすい分野を利用者に対して提案することができる。
【0102】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0103】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。