特許第6798839号(P6798839)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許6798839-情報提供装置、および情報提供方法 図000002
  • 特許6798839-情報提供装置、および情報提供方法 図000003
  • 特許6798839-情報提供装置、および情報提供方法 図000004
  • 特許6798839-情報提供装置、および情報提供方法 図000005
  • 特許6798839-情報提供装置、および情報提供方法 図000006
  • 特許6798839-情報提供装置、および情報提供方法 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6798839
(24)【登録日】2020年11月24日
(45)【発行日】2020年12月9日
(54)【発明の名称】情報提供装置、および情報提供方法
(51)【国際特許分類】
   G06F 40/56 20200101AFI20201130BHJP
   G06Q 10/10 20120101ALI20201130BHJP
   G06F 40/279 20200101ALI20201130BHJP
【FI】
   G06F40/56
   G06Q10/10 340
   G06F40/279
【請求項の数】4
【全頁数】17
(21)【出願番号】特願2016-182364(P2016-182364)
(22)【出願日】2016年9月16日
(65)【公開番号】特開2018-45659(P2018-45659A)
(43)【公開日】2018年3月22日
【審査請求日】2019年3月25日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】宮崎 祐
(72)【発明者】
【氏名】小林 隼人
(72)【発明者】
【氏名】谷尾 香里
(72)【発明者】
【氏名】菅原 晃平
(72)【発明者】
【氏名】野口 正樹
【審査官】 木村 貴俊
(56)【参考文献】
【文献】 特開2015−114855(JP,A)
【文献】 特開2014−134859(JP,A)
【文献】 米国特許出願公開第2015/0189085(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F16/00−16/659、19/00、40/20−40/58
G06Q10/00−10/10、 30/00−30/08
50/00−50/20、 50/26−99/00
G10L15/00−17/26
(57)【特許請求の範囲】
【請求項1】
集会における参加者の組み合わせを、利用者属性データベースの利用者の専門分野属性の組み合わせの類似度に基づいて決定する推定部と、
前記集会における参加者の発言内容を取得する取得部と、
前記集会における参加者の発言主体をアームと見做し、前記集会において各発言主体が発言を行った場合に、当該発言内容の分散表現と、集会の目的の分散表現とが類似した場合により高い値の報酬が設定されるマルチアームドバンディッアルゴリズムによる強化学習の結果に基づいて、後続する発言内容を前記集会の目的に近づける可能性が高い発言主体を決定する決定部と、
前記決定した発言主体に発言させるための応答を出力する出力部と
を有することを特徴とする情報提供装置。
【請求項2】
前記決定部は、前記集会の状態が前記集会の目的に近づいた場合は、報酬が増大したと見做す
ことを特徴とする請求項1に記載の情報提供装置。
【請求項3】
前記出力部は、各アームを選択した際の報酬が得られなくなったとき、あるいは、累積報酬が増大しなくなった場合は、前記集会を終了させるための応答を出力する
ことを特徴とする請求項1または2に記載の情報提供装置。
【請求項4】
情報提供装置が実行する情報提供方法であって
集会における参加者の組み合わせを、利用者属性データベースの利用者の専門分野属性の組み合わせの類似度に基づいて決定する推定工程と、
前記集会における参加者の発言内容を取得する取得工程と、
前記集会における参加者の発言主体をアームと見做し、前記集会において各発言主体が発言を行った場合に、当該発言内容の分散表現と、集会の目的の分散表現とが類似した場合により高い値の報酬が設定されるマルチアームドバンディッアルゴリズムによる強化学習の結果に基づいて、後続する発言内容を前記集会の目的に近づける可能性が高い発言主体を決定する決定工程と、
前記決定した発言主体に発言させるための応答を出力する出力工程と
を含むことを特徴とする情報提供方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報提供装置、および情報提供方法に関する。
【背景技術】
【0002】
従来、入力された情報の解析結果に基づいて、入力された情報と関連する情報を検索もしくは生成し、検索もしくは生成した情報を応答として出力する技術が知られている。このような技術の一例として、入力されたテキストに含まれる単語、文章、文脈を多次元ベクトルに変換して解析し、解析結果に基づいて、入力されたテキストと類似するテキストや、入力されたテキストに続くテキストを類推し、類推結果を出力する自然言語処理の技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2015−28625号公報
【非特許文献】
【0004】
【非特許文献1】“Fractals, Chaos, Power Laws” Manfred Schroeder Dover Publications ISBN-10:0486472043
【非特許文献2】“強化学習におけるUCB行動選択手法の効果”、斉藤 晃貴、野津 亮、本多 克宏、30th Fuzzy System Symposium (Kochi, September 1-3, 2014)
【非特許文献3】“モンテカルロ囲碁における探索木の情報を利用したシミュレーション方策の動的更新” 板持 貴之、 三輪 誠、 鶴岡 慶雅、 近山 隆、The 18th Game Programming Workshop 2013
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術を集会の補助として適用した場合、集会を効率的に進めることができない場合がある。
【0006】
例えば、上述した従来技術を用いて、利用者の発言に基づき、次の発言を行わせる利用者を決定し、決定した発言者に発言を求めるといった司会を行わせる技術が考えられる。しかしながら、上記の従来技術では、入力されたテキストと類似するテキストや、入力されたテキストに続くテキスト等、利用者が予測しうる情報を出力しているに過ぎない。このため、例えば、上記の従来技術では、同じような発言を行う利用者に発言を求める結果、集会を効率的に進める利用者に発言を求めることができないおそれがある。
【0007】
本願は、上記に鑑みてなされたものであって、集会を効率的に進めることを目的とする。
【課題を解決するための手段】
【0008】
本願に係る情報提供装置は、集会における発言内容を取得する取得部と、前記集会における発言主体の発言、あるいは、目的に近づけるはために生成された発言を木構造のノードと見做して、後続する発言内容を前記集会の目的に近づける発言主体を、木構造探索手法により決定する決定部と、前記決定した発言主体に発言させるための応答を出力する出力部とを有する。
【発明の効果】
【0009】
実施形態の一態様によれば、集会を効率的に進めることができる。
【図面の簡単な説明】
【0010】
図1図1は、実施形態に係る情報提供装置が実行する推定処理および決定処理の一例を示す図である。
図2図2は、実施形態に係る情報提供装置の構成例を示す図である。
図3図3は、実施形態に係る利用者属性データベースに登録される情報の一例を示す図である。
図4図4は、実施形態に係る推定処理の流れの一例を説明するフローチャートである。
図5図5は、実施形態に係る決定処理の流れの一例を説明するフローチャートである。
図6図6は、ハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0011】
以下に、本願に係る情報提供装置および情報提供方法を実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報提供装置および情報提供方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0012】
[実施形態]
〔1.情報提供装置の一例〕
まず、図1を用いて、推定処理および決定処理を実行する情報提供装置の一例について説明する。図1は、実施形態に係る情報提供装置が実行する推定処理および決定処理の一例を示す図である。図1では、情報提供装置10は、以下に説明する推定処理および決定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
【0013】
より具体的には、情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照)を介して、入力装置100や出力装置200(例えば、図2を参照)、端末装置300(例えば、図2を参照)といった任意の装置と通信が可能である。
【0014】
ここで、入力装置100は、マイクなどの音声を取得する音声取得装置を用いて、利用者の発言を取得する。そして、入力装置100は、任意の音声認識技術を用いて、発言をテキストデータに変換し、変換後のテキストデータを情報提供装置10へと送信する。また、出力装置200は、スピーカ等の音声を出力する装置を用いて、情報提供装置10から受信したテキストデータの読み上げを行う。なお、出力装置200は、情報提供装置10から受信したテキストデータを所定の表示装置に表示してもよい。また、端末装置300は、各利用者が使用する端末装置であり、情報提供装置10から受信した任意の情報を表示可能な情報処理装置である。例えば、端末装置300は、会議等といった所定の集会に利用者を招待するメッセージを情報提供装置10から受信すると、受信したメッセージを表示することで、利用者が招待された旨を通知する。
【0015】
なお、入力装置100、出力装置200、および端末装置300は、スマートフォンやタブレット等のスマートデバイス、デスクトップPC(Personal Computer)やノートPC、サーバ装置等の情報処理装置により実現される。なお、入力装置100、出力装置200、および端末装置300は、例えば、同一の情報処理装置によって実現されてもよく、例えば、ロボット等の装置によって実現されてもよい。
【0016】
なお、以下の説明においては、情報提供装置10は、任意の音声認識技術を用いて、利用者の発言をテキストデータに変換可能であるものとする。また、情報提供装置10は、形態素解析やw2v(word2vec)、ディープラーニング等の技術を用いて、テキストデータに変換された発言の内容を解析し、発言内容の類似性や発言内容の概念の類似性を示す値を算出可能であるものとする。このような発言内容の類似性や、発言内容の概念の類似性を判定する言語解析技術については、後述する推定処理や決定処理の説明に関わらず、任意の技術が適用可能であるものとする。
【0017】
〔2.情報提供装置が実行する推定処理について〕
ここで、従来技術では、会議等の発言に対応する発言をロボット等から出力することで、会議等の集会を円滑に進めるといった技術が考えられる。例えば、会議に参加した利用者がそれぞれ異なる分野に興味を有していた場合、共感を得ることができずに会議が収束しなくなり、会議を効率的に進めることができない場合がある。一方で、会議に参加した利用者が全て同一の分野に興味を有していた場合、すなわち、集会に参加した利用者が類似する場合には、会議中に生じたトピックに対して理解や共感を得やすいものの、ブレインストーミング等、新たな発想が求められる集会においては、トピックの展開等が進まず、新たなアイデアを創出できない恐れがある。
【0018】
そこで、情報提供装置10は、以下の推定処理を実行する。まず、情報提供装置10は、複数の利用者の属性の類似度を特定する。そして、情報提供装置10は、類似度の値を有向浸透現象において状態が伝播する確率と見做して、利用者間における共感の伝播を推定する。
【0019】
すなわち、情報提供装置10は、利用者間において共感が伝播する確率を、有向浸透現象、すなわち、パーコレーションにおいて状態が伝播する確率と見做して、利用者間を共感が伝播する状態を推定する。より具体的には、情報提供装置10は、集会に招待する利用者の候補(以下、「候補者」と記載する場合がある。)の間で、所定のトピックについて共感が伝播する様子を、有向浸透現象を予測する技術を用いて推定する。そして、情報提供装置10は、推定結果に基づいて、集会に招待する利用者を決定し、決定した利用者の端末装置300に、集会に招待するメッセージ(以下、「招待メッセージ」と記載する場合がある。)を送信する。
【0020】
例えば、利用者間を共感が伝播する確率(以下、「伝播確率」と記載する。)は、利用者同士の類似度に応じて変化すると予測される。そこで、情報提供装置10は、候補者の属性の類似度に基づいて、伝播確率の値を特定する。例えば、情報提供装置10は、候補者の性別や年代といったデモグラフィック属性や、好み等といったサイコグラフィック属性に加え、各候補者が専門的に研究している学問分野、すなわち、各候補者の専門分野を属性として収集する。そして、情報提供装置10は、候補者間の属性の類似度を算出し、算出した類似度に基づく伝播確率を算出する。
【0021】
例えば、有向浸透現象においては、任意の次元空間上に複数のセルを配置した系を設定し、活性状態(乱流)であるセルから隣接するセルに活性状態が伝播する伝播確率をp、活性状態が消滅する消滅確率を1−pとして、各セルの状態を時間発展させることで、系における活性状態の伝播をシミュレートする。
【0022】
このような活性状態の伝播においては、伝播確率pの値を系に応じた浸透閾値pの値以上に設定すると、時間発展を続けても活性状態がいずれかのセルに残り続ける状態が生じる。一方で、伝播確率pの値を系に応じた浸透閾値pの値よりも小さい値に設定すると、時間発展の結果、活性状態が最終的に消滅する状態が生じる。また、伝播確率pの値が浸透閾値pよりも十分に大きい場合には、系全体に活性状態が迅速に行きわたることとなる。一方、伝播確率pの値が浸透閾値pよりも十分に小さい場合には、活性状態が系全体で迅速に消滅することとなる。また、伝播確率pの値が浸透閾値pの値以上であり、かつ、伝播確率pの値が浸透閾値pに十分に近い場合には、時間発展させても活性状態が系から消滅せず、自己相似的(フラクタル)的なパターンでセルの間を伝播し続けることとなる(例えば、非特許文献1参照)。
【0023】
ここで、系を集会と見做し、系に設定された各セルを集会に参加した利用者と見做すことで、活性状態の伝播を利用者間の共感の伝播と見做すことができると考えられる。すると、活性状態が系全体で消滅する状態は、集会においてあるトピックに対する共感が発散してしまい、最終的な合意が得られない状態と見做すことができ、活性状態が系全体に行きわたる状態は、集会においてあるトピックに対する共感が行きわたり、全員の合意が得られる状態と見做すことも可能である。
【0024】
しかしながら、ブレインストーミング等の新たなアイデアを創出する集会(以下、単に「集会」と記載する。)においては、あるトピックに対する共感が伝播せず、最終的な合意が得られない場合には、新たなアイデアを創出できるとは言い難い。また、このような集会において、あるトピックに対する共感が迅速に全員に行きわたるような状態でも、単純に合意が行われるに過ぎないため、新たなアイデアを創出できるとは言いがたい。このため、集会において新たなアイデアを創出するような場合には、あるアイデアの共感が利用者間で伝播しつづけることで、アイデアの変種が生じやすくなるといった状態が好ましいと考えられる。
【0025】
そこで、情報提供装置10は、利用者間の属性の類似度の値と、有向浸透現象において臨界現象が生じる浸透閾値との比較結果に基づいて、利用者間における共感の伝播を推定する。すなわち、情報提供装置10は、伝播確率pの値と浸透閾値pの値との比較結果に基づいて、集会における共感の収束を制御する。
【0026】
例えば、情報提供装置10は、様々な候補者の組み合わせについて、利用者の属性の類似度を算出し、算出した値を伝播確率pとする。例えば、情報提供装置10は、ある組み合わせに含まれる候補者の属性を収集し、収集した属性の類似度を示す1以下の値を算出する。なお、情報提供装置10は、例えば、各候補者の属性が共通する場合には類似度を上昇させ、各候補者の属性が共通しない場合には類似度を減少させるアルゴリズムであれば、任意のアルゴリズムに基づいて、各候補者の属性の類似度を算出してよい。
【0027】
そして、情報提供装置10は、算出した各伝播確率pの値と浸透閾値pの値とを比較し、伝播確率pの値が浸透閾値pの値よりも大きく、かつ、伝播確率pの値が浸透閾値pの値に最も近い候補者の組み合わせを特定する。例えば、情報提供装置10は、伝播確率pの値から浸透閾値pの値を減算し、さらにの伝播確率pの値で除算した値が1よりも十分に小さい正の値となる候補者の組み合わせを特定する。すなわち、情報提供装置10は、参加者の間でアイデアへの共感が伝播し続けるが、全員が同じアイデアに共感し、合意がえられるといった状態になりにくい参加者の組み合わせを特定する。
【0028】
そして、情報提供装置10は、特定した組み合わせに含まれる候補者に対して、招待メッセージを送信する。このような処理の結果、情報提供装置10は、あるトピックへの共感が、表面的な内容への共感ではなく、根本的な内容の理解にたどり着いた上で共感できる利用者を集会に招待する利用者として選択することができる。この結果、情報提供装置10は、集会において新たなアイデアの創出を補助することができる。
【0029】
〔3.情報提供装置が実行する決定処理について〕
ここで、会議等の発言に対応する発言をロボット等から出力することで、集会を円滑に進行させるといった技術が考えられる。しかしながら、上記の従来技術では、入力されたテキストと類似するテキストや、入力されたテキストに続くテキスト等、利用者が予測しうる情報を出力しているに過ぎない。このため、例えば、上記の従来技術では、集会を効率的に進めることができない恐れがある。
【0030】
そこで、情報提供装置10は、以下の決定処理を実行する。まず、情報提供装置10は、集会における発言内容を取得する。そして、情報提供装置10は、集会における発言主体の発言、あるいは、目的に近づけるはために生成された発言を木構造のノードと見做して、後続する発言内容を集会の目的に近づける発言主体を、木構造探索手法により決定する。
【0031】
例えば、情報提供装置10は、MAB(Multi Armed Bandit)アルゴリズムによる計算手法を用いて、後続する発言内容を集会の目的に近づける可能性が最も高い発言主体を決定する。より具体的には、情報提供装置10は、集会における発言主体をMABのアームと見做し、集会の目的と集会の状態とに基づく報酬に応じて、MABアルゴリズムに基づき、発言主体を決定する。
【0032】
すなわち、情報提供装置10は、集会の参加者にMABアルゴリズムによるスロットマシンを対応付ける。このような場合、参加者をアームとみなし、出力装置200等のロボットが選択した参加者の発言により、ロボットが報酬を貰える設定で、ロボットが累積報酬を最大化する問題をMABアルゴリズムにより解決する装置であると見なすことができ、スロットマシンが当たりを出す確率は、集会の参加者が発言を行うことで、集会の状態が集会の目的へと近づく確率と見做すことができると考えらえる。また、集会の参加者が発言を行うことで、集会の状態が集会の目的へと近づいた場合には、MABアルゴリズムにおける報酬の額が増大したと見做すことができる。
【0033】
そこで、情報提供装置10は、各利用者の属性(例えば、専門分野)と各利用者の発言により集会の状態が集会の目的に近づいたか否かとに基づいて、各利用者に対応付けたスロットマシンが当たりを出す確率を推定する。そして、情報提供装置10は、MAB(Multi Armed Bandit)アルゴリズムによる計算手法を用いて、後続する発言内容を集会の目的に近づける可能性が最も高い発言主体を決定する。より具体的には、情報提供装置10は、参加者の発言により、集会の状態が集会の目的に近づいた場合は、報酬が増大したと見做して、後続する発言を行う利用者を決定する。
【0034】
より具体的な例を挙げると、情報提供装置10は、参加者が新たな内容のアイデアを発言した場合には、報酬が増大したと見做してもよい。また、情報提供装置10は、アイデアの新たな適用対象やアイデアのバリエーション等、参加者がアイデアを広げる発言をした場合に、報酬が増大したと見做してもよい。例えば、情報提供装置10は、概念検索における重みづけから、参加者の発言に基づいて、アイデアがどれくらい広がったかを示す値を算出し、算出した値に基づいて、報酬の値を変更してもよい。
【0035】
また、情報提供装置10は、アイデアのポイントに関する発言等、参加者がアイデアを深める発言をした場合に、報酬が増大したと見做してもよい。例えば、情報提供装置10は、w2vの技術等を用いて、参加者の発言内容とアイデアのポイントとなる概念との間の意味空間上の距離を算出する。そして、情報提供装置10は、算出した距離が一定内に収まる発言を利用者が行った場合は、参加者がアイデアを深める発言をしたものとして、報酬を増大させてもよい。
【0036】
また、情報提供装置10は、両者が発言を行うごとに、良い発言であったか否かのアンケートを参加者に対して行い、アンケートの結果に基づいて、報酬の値を設定してもよい。また、情報提供装置10は、ウェアラブルデバイス等が参加者から取得した生体情報に基づいて、発言に対する各利用者の感情を推定し、推定した感情が好意的な感情である場合は、報酬の値を増大させてもよい。
【0037】
また、例えば、情報提供装置10は、前回取得した発言内容と、新たに取得した発言内容とのブレが少ない程、報酬の値を大きくしてもよい。ここで、報酬の値は、例えば、形態素解析等の文章解析技術に基づいて、前回の発言内容と、新たな発言内容との比較を行い、前回の発言内容と新たな発言内容との差分が大きい程、報酬の値を小さくするといった手段により実現されてもよい。
【0038】
また、報酬の値は、例えば、発言後において、集会に参加する利用者が入力した評価の値に基づいて決定されてもよい。例えば、情報提供装置10は、発言の出力後に、集会に参加する利用者から、集会の内容が目的に近づいているか否かの評価を受付ける。このような評価は、例えば、各利用者に与えられたスライダ等の入力装置や、BMI(Brain-machine Interface)等によって取得される。そして、情報提供装置10は、取得された評価に基づいて、報酬の値を設定し、設定した報酬の値に基づいて、次に発言する参加者を決定してもよい。
【0039】
なお、情報提供装置10は、MABアルゴリズムに関連するアルゴリズムであれば、任意のアルゴリズムを適用可能である。例えば、情報提供装置10は、ある状態sで行動aをとるときの価値Q(s,a)を学習し、価値Qの値に基づくUCB値に基づいた行動選択を行うUCBQアルゴリズム(例えば、非特許文献2参照)に基づいて、発言を行う利用者の選択を行ってもよい。また、情報提供装置10は、UCT(Upper Confidence bound applied to Tree)値と、価値Qの値とに基づいた行動選択を行うアルゴリズム(例えば、非特許文献3参照)に基づいて、発言を行う利用者の選択を行ってもよい。また、情報提供装置10は、上述したアルゴリズム以外にも、集会の各参加者をスロットマシンのアームと見做し、各参加者が行う発言により集会の状態が集会の目的に近づいたか否かに基づく報酬を設定することで、集会の状態を集会の目的に近づける参加者を次の発言者として戦略的に選択することができるのであれば、上述したアルゴリズム以外にも、任意のアルゴリズムが適用可能である。
【0040】
ここで、MABアルゴリズムにおいては、どのアームを選択したとしても、得られる報酬の期待値があまり変化しなくなる場合がある。このような状態は、それ以上集会の状態を集会の目的に近づけることができない状態と見做すことができる。そこで、情報提供装置10は、報酬が得られなくなったとき、あるは、累積報酬が増大しなくなったアームを選択した際の選択した際の報酬の期待値が同程度となった場合は、集会を終了させるための応答を出力してもよい。このような応答を出力することで、情報提供装置10は、無駄な集会の継続を回避することができる。
【0041】
なお、上述した説明においては、情報提供装置10は、集会の参加者が発言する度に報酬の値を算出し直したが、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、選択した利用者が発言を回避した場合や、発言を拒否した場合、発言ができなかった場合等には、発言が行われなかったという状態に基づいて、報酬の値や各アームが当たりを出力する確率を変更し、再度、発言者の選択を行ってもよい。
【0042】
〔4.情報提供装置が実行する処理の一例〕
次に、図1を用いて、情報提供装置10が実行する推定処理および決定処理の一例について説明する。まず、情報提供装置10が実行する推定処理の一例について説明する。まず情報提供装置10は、集会に招待する候補となる利用者の専門分野の類似度から、パーコレーションの伝播確率を取得する(ステップS1)。例えば、情報提供装置10は、利用者#1の専門分野が分野#1であり、利用者#2の専門分野が分野#2であり、利用者#3の専門分野が分野#3である場合は、分野#1〜分野#3の類似性を示す類似度を算出し、算出した類似度を利用者#1〜#3の伝播確率pとする。なお、情報提供装置10は、利用者#1〜利用者#3以外にも、全ての候補者の組み合わせについて、専門分野の類似度から伝播確率pの値を取得する。
【0043】
そして、情報提供装置10は、有向浸透現象のモデルを用いて、利用者間における共感の伝播を推定する(ステップS2)。例えば、情報提供装置10は、ステップS1にて算出した伝播確率pと、伝播確率pを1から減算した値である消滅確率1−pとを用いて、共感がどのように伝播するかを推定する。例えば、情報提供装置10は、伝播確率pと消滅確率1−pとから、浸透閾値pの値を求める。そして、情報提供装置10は、伝播確率pの値が浸透閾値pの値以上となる候補者の組み合わせのうち、伝播確率pの値が浸透閾値pの値に最も近い候補者の組み合わせを検索する。
【0044】
その後、情報提供装置10は、推定結果に基づいて、招待する利用者を選択する(ステップS3)。例えば、情報提供装置10は、伝播確率pの値が浸透閾値pの値以上となる候補者の組み合わせのうち、伝播確率pの値が浸透閾値pの値に最も近い候補者の組み合わせが、利用者#1、利用者#3、および利用者#6の組み合わせである場合は、かかる組み合わせを招待する利用者の組み合わせとして選択する。
【0045】
そして、情報提供装置10は、選択した組み合わせの利用者を集会に招待する(ステップS4)。例えば、情報提供装置10は、利用者#1、利用者#3、および利用者#6を集会に招待する。この結果、情報提供装置10は、新たなアイデアを創出しやすい利用者の集会を実現できる。
【0046】
次に、情報提供装置10が実行する決定処理の一例について説明する。まず、情報提供装置10は、各利用者の発言を受付ける(ステップS5)。このような場合、情報提供装置10は、各利用者をMABアルゴリズムのアームと見做し、集会の目的と現在の集会の状態とに応じた報酬を設定する(ステップS6)。
【0047】
例えば、情報提供装置10は、利用者#1をアーム#1と見做し、利用者#3をアーム#3と見做し、利用者#6をアーム#6と見做す。また、情報提供装置10は、集会における利用者#1の発言や利用者#1の専門分野に基づいて、アーム#1が当たりを出す確率を推定する。同様に、情報提供装置10は、集会における利用者#3の発言や利用者#3の専門分野に基づいて、アーム#3が当たりを出す確率を推定し、集会における利用者#6の発言や利用者#6の専門分野に基づいて、アーム#6が当たりを出す確率を推定する。また、情報提供装置10は、発言によるアイデアの広がりや深まり、利用者の満足度に基づいて報酬を設定する。
【0048】
そして、情報提供装置10は、後続する発言内容を集会の目的に近づけるように、発言主体を木構造探索手法により決定する(ステップS7)。例えば、情報提供装置10は、UCBQアルゴリズムや、UCTとQ値とを組み合わせたアルゴリズム等、MABアルゴリズムを用いて、報酬が最大化するようなアーム、すなわち、利用者を推定する。
【0049】
そして、情報提供装置10は、決定した利用者に対して発言を促す(ステップS8)。例えば、情報提供装置10は、ロボットなどの出力装置200に対し、決定した利用者に発言を促すような発言を行わせる。この結果、情報提供装置10は、報酬が最大化するように、すなわち、集会の目的に近づけるように、集会を効率的に進めることができる。
【0050】
〔5.情報提供装置の構成〕
以下、上記した推定処理および決定処理を実現する情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
【0051】
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、入力装置100、出力装置200、および端末装置300との間で情報の送受信を行う。
【0052】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者属性データベース31を記憶する。
【0053】
利用者属性データベース31には、候補者の属性が登録されている。例えば、図3は、実施形態に係る利用者属性データベースに登録される情報の一例を示す図である。図3に示すように、利用者属性データベース31には、「利用者ID(Identifier)」、および「専門分野」といった項目を有する情報が登録される。
【0054】
ここで、「利用者ID」とは、利用者を識別するための識別子である。また、「専門分野」とは、対応付けられた利用者IDが示す利用者の専門分野を示す情報である。なお、利用者属性データベース31には、図3に示す項目以外にも、利用者のデモグラフィック属性やサイコグラフィック属性等、各種属性情報が登録されていてもよい。
【0055】
例えば、図3に示す例では、利用者属性データベース31には、利用者ID「利用者#1」、専門分野「分野#1」とが対応付けて登録されている。このような情報は、利用者ID「利用者#1」が示す利用者の専門分野が専門分野「分野#1」である旨を示す。なお、図3に示す例では、「分野#1」等といった概念的な値を記載したが、実際には、分野を示すテキストデータや数値等が登録される。
【0056】
図2に戻り、説明を続ける。制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0057】
図2に示すように、制御部40は、特定部41、推定部42、選択部43、取得部44、決定部45、および出力部46を有し、上述した推定処理および決定処理を実行する。より具体的には、特定部41、推定部42、および選択部43は、上述した推定処理を実行し、取得部44、決定部45、および出力部46は、上述した決定処理を実行する。
【0058】
特定部41は、複数の利用者の属性の類似度を特定する。より具体的には、特定部41は、利用者の属性の類似度として、利用者が専門とする分野の類似度を特定する。例えば、特定部41は、利用者属性データベース31を参照し、候補者の組み合わせを生成する。具体的な例を挙げると、特定部41は、集会に招待する利用者の数が3人である場合は、利用者IDの中から3つの利用者IDを組み合わせた組を全て生成する。なお、特定部41は、専門分野やその他利用者の属性情報の条件を考慮して、候補者の組み合わせを生成してもよい。
【0059】
そして、特定部41は、生成した組み合わせごとに、属性の類似度を算出する。例えば、特定部41は、組み合わせに含まれる候補者の利用者IDと対応付けられた専門分野を特定し、特定した専門分野の類似性を示す類似度を算出する。例えば、特定部41は、専門分野の概念の分散表現空間をあらかじめ学習しておき、分散表現空間上における各候補者の専門分野の類似性(コサイン距離等)に基づいて、類似度を算出してもよい。
【0060】
推定部42は、類似度の値を有向浸透現象において状態が伝播する確率と見做して、利用者間における共感の伝播を推定する。例えば、推定部42は、類似度の値と、有向浸透現象において臨界現象が生じる浸透閾値との比較結果に基づいて、利用者間における共感の伝播を推定する。
【0061】
例えば、推定部42は、特定部41から候補者の組と類似度とを受付ける。このような場合、推定部42は、類似度に基づいて、候補者の組に対応する伝播確率pの値を算出する。そして、推定部42は、算出した伝播確率pの値に基づいて、利用者間における共感の伝播を推定する。例えば、推定部42は、伝播確率pの値から所定の浸透閾値pの値を減算した値を算出し、算出した値を伝播確率pの値で除算した値εを算出する。そして、推定部42は、値εの値が、1よりも十分小さい正の値であるか否かを判定する。すなわち、推定部42は、伝播確率pの値が浸透閾値pの値よりも大きく、かつ、浸透閾値pの値に近しいか否かを判定することで、共感が候補者間を随時伝播し続けるか否かを判定する。
【0062】
そして、推定部42は、εの値が、1よりも十分小さい正の値である場合(例えば、εの値が所定の閾値よりも小さい正の値である場合)は、対応する候補者の組を選択部43に通知する。すなわち、推定部42は、共感が候補者間を随時伝播し続ける候補者の組を通知する。
【0063】
選択部43は、推定結果に基づいて、所定の集会に招待する利用者を選択する。より具体的には、選択部43は、伝播確率pの値から浸透閾値pを減算し、さらに伝播確率pの値で除算した値εが1よりも十分に小さい正の値となるように、所定の集会に招待する利用者を選択する。例えば、選択部43は、εの値が1よりも十分小さい正の値を取る候補者の組み合わせを推定部42から受付ける。
【0064】
このような場合、選択部43は、各組み合わせに対応するεの値を比較し、εの値が最も小さい組み合わせを選択する。すなわち、選択部43は、合意までの間に、候補者の間を共感が長い間伝播し続ける候補者の組を選択する。そして、選択部43は、選択した組に含まれる候補者の端末装置300に対し、招待メッセージを送信する。
【0065】
取得部44は、集会における発言内容を取得する。例えば、取得部44は、入力装置100から、集会における各利用者の発言内容のテキストデータを取得する。なお、取得部44は、音声データを取得し、任意の音声解析技術等を用いて、各利用者の発言内容のテキストデータを取得してもよい。
【0066】
決定部45は、集会における発言主体の発言、あるいは、目的に近づけるはために生成された発言を木構造のノードと見做して、後続する発言内容を集会の目的に近づける発言主体を、木構造探索手法により決定する。より具体的には、決定部45は、集会における発言主体をアームと見做し、集会の目的と集会の状態とに基づく報酬に応じて、MABアルゴリズムに基づき、発言主体を決定する。例えば、決定部45は、集会の状態が集会の目的に近づいた場合は、報酬が増大したと見做して、次の発言主体を選択する。
【0067】
例えば、決定部45は、集会に参加した利用者である参加者から、あらかじめ集会の目的の設定を受付ける。そして、決定部45は、現在の集会の状態と、集会の目的との概念上の距離に基づく報酬の値を設定する。例えば、決定部45は、w2v等、言葉の概念を分散表現空間上に落とし込む任意の技術を利用して、現在の集会の状態と、集会の目的との概念上の距離に基づく報酬の値を設定する。
【0068】
また、決定部45は、参加者の専門分野に基づいて、各参加者を発言者として選択した際に報酬の値を増加させる確率を推定する。例えば、決定部45は、専門分野と、集会の目的との概念上の距離に基づいて、確率を推定する。そして、決定部45は、推定した確率を、各参加者に対応付けたアームが当たりを出力する確率とする。
【0069】
また、決定部45は、いずれかの参加者が発言を行った場合は、かかる発言によって変化した集会の状態と、集会の目的との概念上の距離に基づく報酬の値を再設定する。例えば、情報提供装置10は、発言によるアイデアの広がりや深まり、利用者の満足度に基づいて報酬を再設定する。さらに、決定部45は、参加者が発言を行ったことにより、集会の状態が集会の目的に近づいたか否かに基づいて、発言を行った参加者が報酬の値を増加させる確率を再設定する。そして、決定部45は、各参加者のうち、次に発言を行わせる参加者を、報酬の値が最終的に増大するように、UCBQアルゴリズムや、UCTとQ値とを組み合わせたアルゴリズム等、MABアルゴリズムを用いて選択する。
【0070】
なお、決定部45は、例えば、出力装置200に対し、所定の確率で当たりを出力するMABアルゴリズムのアームを割り当ててもよい。また、決定部45は、出力装置200に対しても、他の参加者と同様に、当たりの確率が変化するアームを設定し、MABアルゴリズムによって発言を行わせてもよい。このような場合、出力装置200は、w2vやディープラーニング等を用いて、集会の状態や前の参加者の発言等に基づく新たな発言を行うように構成されていてよい。
【0071】
出力部46は、決定した発言主体に発言させるための応答を出力する。例えば、出力部46は、決定部45が参加者のうち利用者#1を発言者として選択した場合は、「利用者#1さん、何か考えは有りますか?」等といった利用者#1に対して発言を促す発言を出力装置200に発声させる。この結果、情報提供装置10は、集会の状態を集会の目的に近づけるような発言を行わせることができる。
【0072】
なお、出力部46は、参加者に対応付けられた各アームを選択した際の報酬が得られなくなったとき、あるは、累積報酬が増大しなくなった期待値が同程度となった場合は、集会を終了させるための応答を出力する。例えば、出力部46は、各アームを選択した際の期待値の差が所定の範囲内に収まる場合は、「それでは、この辺で休憩としましょう。」等といった集会を一旦終了させるような発言を出力装置200に発声させる。
【0073】
〔6.情報提供装置が実行する処理の流れの一例〕
次に、図4図5を用いて、情報提供装置10が実行する推定処理および決定処理の流れの一例について説明する。まず、図4を用いて、情報提供装置10が実行する推定処理の流れの一例を説明する。図4は、実施形態に係る推定処理の流れの一例を説明するフローチャートである。
【0074】
まず、情報提供装置10は、候補者となる各利用者の属性情報を取得する(ステップS101)。続いて、情報提供装置10は、各利用者の属性の類似度をパーコレーションの伝播確率pと見做して、利用者間における共感の伝播を推定する(ステップS102)。そして、情報提供装置10は、推定結果に基づいて、集会に招待する利用者を選択する(ステップS103)。その後、情報提供装置10は、選択した利用者に対して、招待メッセージの通知を行い(ステップS104)、処理を終了する。
【0075】
次に、図5を用いて、情報提供装置10が実行する決定処理の流れの一例を説明する。図5は、実施形態に係る決定処理の流れの一例を説明するフローチャートである。例えば、情報提供装置10は、集会における利用者の発言を取得する(ステップS201)。このような場合、情報提供装置10は、各発言の主体をMABアルゴリズムのアームと見做し、集会の目的と現在の集会の状態とに基づく報酬に応じて、次の発言主体を決定する(ステップS202)。そして、情報提供装置10は、決定した発言主体に対して発言を求める応答を出力装置200に出力させ(ステップS203)、処理を終了する。
【0076】
〔7.変形例〕
上記では、情報提供装置10による推定処理および決定処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する推定処理および決定処理のバリエーションについて説明する。
【0077】
〔7−1.推定処理と決定処理との実行環境について〕
上述した説明では、情報提供装置10は、推定処理および決定処理を両方実行することで、効率的な集会を実現した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、推定処理のみを実行する推定装置と、決定処理のみを実行する決定装置とによって実現されてもよい。このような場合、推定装置は、図2に示す特定部41、推定部42、および選択部43を有し、決定装置は、取得部44、決定部45および出力部46を有することとなる。
【0078】
なお、推定装置および決定装置は、スタンドアローンで動作してもよく、連携した動作を行ってもよい。例えば、決定装置は、決定装置から集会において各利用者の発言と、かかる発言によって集会の状態が集会の目的に近づいたか否か、集会の目的にどれくらい近づいたかといった情報を属性情報として提供する。このような場合、推定装置は、決定装置から受付けた属性情報に基づいて、集会の状態を集会の目的に近づけるような利用者を優先的に選択してもよい。
【0079】
〔7−2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0080】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0081】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0082】
〔8.プログラム〕
また、上述してきた実施形態に係る情報提供装置10は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0083】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
【0084】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0085】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0086】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0087】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0088】
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
【0089】
〔9.効果〕
上述したように、情報提供装置10は、集会における発言内容を取得する。また、情報提供装置10は、集会における発言主体の発言、あるいは、目的に近づけるはために生成された発言を木構造のノードと見做して、後続する発言内容を集会の目的に近づける発言主体を、木構造探索手法により決定する。そして、情報提供装置10は、決定した発言主体に発言させるための応答を出力する。このため、情報提供装置10は、集会を効率的に進めることができる。
【0090】
また、情報提供装置10は、集会における発言主体をアームと見做し、集会の目的と集会の状態とに基づく報酬に応じて、MABアルゴリズムに基づき、発言主体を決定する。このため、情報提供装置10は、発言を様々な参加者に行わせつつも、集会が目的へと効率的に近づくように、集会を進めることができる。
【0091】
また、情報提供装置10は、集会の状態が集会の目的に近づいた場合は、報酬が増大したと見做す。このため、情報提供装置10は、集会の状態が集会の目的へと近づくように、発言を行わせる参加者を選択することができる。
【0092】
また、情報提供装置10は、各アームを選択した際の報酬が得られなくなったとき、あるは、累積報酬が増大しなくなった場合は、集会を終了させるための応答を出力する。このため、情報提供装置10は、無駄な集会の継続を防ぐことができる。
【0093】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0094】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、選択部は、選択手段や選択回路に読み替えることができる。
【符号の説明】
【0095】
10 情報提供装置
20 通信部
30 記憶部
31 利用者属性データベース
40 制御部
41 特定部
42 推定部
43 選択部
44 取得部
45 決定部
46 出力部
100 入力装置
200 出力装置
300 端末装置
図1
図2
図3
図4
図5
図6