IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許7586312情報処理装置、改善トラジェクトリ構築方法およびプログラム
<>
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図1
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図2
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図3
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図4
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図5
  • 特許-情報処理装置、改善トラジェクトリ構築方法およびプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-11
(45)【発行日】2024-11-19
(54)【発明の名称】情報処理装置、改善トラジェクトリ構築方法およびプログラム
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20241112BHJP
【FI】
G06Q10/04
【請求項の数】 4
(21)【出願番号】P 2023523839
(86)(22)【出願日】2021-05-26
(86)【国際出願番号】 JP2021020090
(87)【国際公開番号】W WO2022249368
(87)【国際公開日】2022-12-01
【審査請求日】2023-08-30
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110004381
【氏名又は名称】弁理士法人ITOH
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【弁理士】
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】赤木 康紀
(72)【発明者】
【氏名】倉島 健
(72)【発明者】
【氏名】戸田 浩之
【審査官】加内 慎也
(56)【参考文献】
【文献】特開2021-056572(JP,A)
【文献】特開2012-242183(JP,A)
【文献】特開2006-172318(JP,A)
【文献】特表2020-513119(JP,A)
【文献】特開2001-000420(JP,A)
【文献】特表2013-511095(JP,A)
【文献】特開2008-236904(JP,A)
【文献】特開2017-090886(JP,A)
【文献】国際公開第2014/155769(WO,A1)
【文献】特開2020-056737(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
初期の第一の数値指標と、目標となる第二の数値指標と、を含む入力情報を取得する入力部と、
前記入力情報に基づいて、前記第一の数値指標から前記第二の数値指標に至るまでの軌跡を時系列に示す改善トラジェクトリを構築する改善トラジェクトリ構築部と、を備え、
前記入力情報は、目標達成時の報酬と、時間割引関数と、単位時間に数値指標を変更するために必要な労力を表す関数と、報酬と労力のトレードオフを調整するパラメータと、をさらに含み、
前記改善トラジェクトリ構築部は、時間割引された報酬の負の現在価値と総距離の重み付き和を最小化する前記改善トラジェクトリを構築する、
情報処理装置。
【請求項2】
前記入力情報に基づいて、ダイクストラ法によって最短路を計算する最短路計算部をさらに備え、
前記改善トラジェクトリ構築部は、計算された最短路に基づいて、前記改善トラジェクトリを構築する、
請求項1に記載の情報処理装置。
【請求項3】
コンピュータが実行する改善トラジェクトリ構築方法であって、
初期の第一の数値指標と、目標となる第二の数値指標と、を含む入力情報を取得するステップと、
前記入力情報に基づいて、前記第一の数値指標から前記第二の数値指標に至るまでの軌跡を時系列に示す改善トラジェクトリを構築する改善トラジェクトリ構築ステップと、を備え、
前記入力情報は、目標達成時の報酬と、時間割引関数と、単位時間に数値指標を変更するために必要な労力を表す関数と、報酬と労力のトレードオフを調整するパラメータと、をさらに含み、
前記改善トラジェクトリ構築ステップにおいて、時間割引された報酬の負の現在価値と総距離の重み付き和を最小化する前記改善トラジェクトリを構築する、
改善トラジェクトリ構築方法。
【請求項4】
コンピュータを請求項1又は2に記載の情報処理装置における各部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、改善トラジェクトリ構築方法およびプログラムに関する。
【背景技術】
【0002】
ユーザの数値指標の改善計画の生成を支援する技術が知られている。また、多くの人間にとって、目標達成の際に得られる報酬の価値(金銭などの報酬や、目標達成に伴う喜びなど)は、得られる時刻が現在から遠ければ遠いほど減少することが知られており、この現象は時間割引と呼ばれ行動経済学などの分野において研究が行われている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
【文献】J. Benhabib, B. Alberto, and S. Andrew. Present-bias, Quasi-hyperbolic Discounting, and Fixed Costs, Games and Economic Behavior 69.2 (2010): 205-223.
【発明の概要】
【発明が解決しようとする課題】
【0004】
改善計画は、なるべく早く目標を達成することができる計画である方が、現在価値が高くなり、ユーザのやる気を上げる効果がある。しかし、あまりにも急激に指標を上げようとすると、ユーザにとっての負担が非常に大きくなるため、逆にユーザのやる気を下げてしまう。したがって、目標達成までの適切な改善計画の作成をこれらのトレードオフを考慮して行いたいという要望がある。
【0005】
開示の技術は、数値指標の適切な改善計画の作成を支援することを目的とする。
【課題を解決するための手段】
【0006】
開示の技術は、初期の第一の数値指標と、目標となる第二の数値指標と、を含む入力情報を取得する入力部と、前記入力情報に基づいて、前記第一の数値指標から前記第二の数値指標に至るまでの軌跡を時系列に示す改善トラジェクトリを構築する改善トラジェクトリ構築部と、を備え、前記入力情報は、目標達成時の報酬と、時間割引関数と、単位時間に数値指標を変更するために必要な労力を表す関数と、報酬と労力のトレードオフを調整するパラメータと、をさらに含み、前記改善トラジェクトリ構築部は、時間割引された報酬の負の現在価値と総距離の重み付き和を最小化する前記改善トラジェクトリを構築する、情報処理装置である。

【発明の効果】
【0007】
数値指標の適切な改善計画の作成を支援することができる。
【図面の簡単な説明】
【0008】
図1】情報処理装置の機能構成図である。
図2】入力情報の一例を示す図である。
図3】改善トラジェクトリ出力処理の流れの一例を示すフローチャートである。
図4】改善トラジェクトリ構築のアルゴリズムの一例を示す図である。
図5】改善トラジェクトリの一例を示す図である。
図6】コンピュータのハードウェア構成例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明の実施の形態(本実施の形態)について説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
【0010】
(本実施の形態の概要)
本実施の形態に係る情報処理装置は、ダイエットによる体重減少や、チェスやプログラミングコンテストにおけるレーティングシステムといった、数値指標の改善を目標とする状況において、初期の数値指標(第一の数値目標)と目標となる数値指標(第二の数値目標)を含む入力情報に基づいて、数値指標の改善トラジェクトリを出力する装置である。
【0011】
改善トラジェクトリは、初期の数値指標から、目標となる数値指標に至るまでの軌跡を時系列に示す情報である。
【0012】
次に、本実施の形態で扱う問題の定式化について説明する。情報処理装置10の入力は以下である。なお、数値指標及び時間については適当な離散化が行われているものとする。
【0013】
(1)初期の数値指標y
【0014】
(2)目標となる数値指標y。ダイエットの例であればy<y、レーティングの例であればy>yであることが想定される。以降、y>yのもとでの説明を行うが、y<yの場合でも同様の処理が可能である。
【0015】
(3)目標達成時の報酬R。
【0016】
(4)t単位時間先の報酬の割引率を表す時間割引関数f(t)。t時間先の報酬Rは、ユーザにとってR・f(t)の価値を感じさせる。通常f(t)は単調減少な関数が仮定されるが、本実施の形態においても同様な仮定をおく。
【0017】
(5)単位時間に指標をyからyに変更するために必要な労力(距離)を表す関数g(y,y)。任意のy,yにおいてg(y,y)>0であると仮定する。
【0018】
(6)報酬と労力のトレードオフを調整するパラメータλ。λが大きい場合報酬を大きくすることを重視し、小さい場合は労力を小さくすることを重視する。
【0019】
これらの値は、利用するユーザが予め決定しておくものとする。
【0020】
また、情報処理装置10の出力は、時間割引された報酬の負の現在価値と総距離の重み付き和を最小化する改善トラジェクトリである。具体的には、時刻0,1,・・・,Tにおける指標値の列y(y),y,・・・,y(=y)で、以下の式(1)を最小化するようなものである。
【0021】
【数1】
なお、Tの値も出力の一部であり、情報処理装置10が決定する値である。
【0022】
(情報処理装置の機能構成)
図1は、情報処理装置の機能構成図である。情報処理装置10は、操作部11と、入力部12と、入力情報蓄積部13と、最短路計算部14と、改善トラジェクトリ構築部15と、改善トラジェクトリ蓄積部16と、出力部17と、を備える。
【0023】
操作部11は、外部からの操作を行うためのインタフェースを提供する。操作部11は、入力部12を操作することによる入力データの格納および修正、最短路計算部14への命令による計算の開始、出力部17への命令による推定結果の出力などの操作を可能にする。
【0024】
入力部12は、入力情報蓄積部13へのデータの格納およびデータの修正を行う。具体的な入力は、初期の数値指標と、目標の数値指標と、目標達成時の報酬と、時間割引関数と、数値指標の間の距離を表す関数と、報酬と距離のトレードオフを調整するパラメータである。
【0025】
最短路計算部14は、改善トラジェクトリを構築するためにダイクストラ法(参考文献[1])による最短路計算を行う。計算の詳細については後述する。
【0026】
改善トラジェクトリ構築部15は、計算された最短路をもとに改善トラジェクトリを構築する。具体的には、得られた最短路(y=y,0),(y,1),・・・,(y=y,T)から,y,yT-1,・・・,yという改善トラジェクトリを構築する。構築された改善トラジェクトリが式(1)を最小化するものである。
【0027】
改善トラジェクトリ蓄積部16は、構築された改善トラジェクトリを蓄積する。
【0028】
出力部17は、改善トラジェクトリ蓄積部16に格納された改善トラジェクトリを読み込み、出力する。出力部17は、改善トラジェクトリを示す画面をディスプレイ等に表示しても良く、他の装置に改善トラジェクトリを示す情報を送信しても良い。
【0029】
(情報処理装置の扱う情報)
図2は、入力情報の一例を示す図である。入力情報901は、項目として、初期の数値指標yと、目標となる数値指標yと、目標達成時の報酬Rと、t単位時間先の報酬の割引率を表す時間割引関数f(t)と、単位時間に指標をyからyに変更するために必要な労力(距離)を表す関数g(y,y)と、報酬と労力のトレードオフを調整するパラメータλと、を含む。
【0030】
(情報処理装置の動作)
次に、情報処理装置10の動作について、図面を参照して説明する。情報処理装置10は、操作部11がユーザの操作等を受けて、改善トラジェクトリ出力処理を開始する。
【0031】
図3は、改善トラジェクトリ出力処理の流れの一例を示すフローチャートである。入力部12は、入力情報901を取得する(ステップS11)。取得した入力情報901は、入力情報蓄積部13に格納される。
【0032】
次に、最短路計算部14は、入力情報にダイクストラ法を適用して最短路を計算する(ステップS12)。
【0033】
続いて、改善トラジェクトリ構築部15は、計算された最短路に基づく改善トラジェクトリを構築する(ステップS13)。構築された改善トラジェクトリは、改善トラジェクトリ蓄積部16に格納される。
【0034】
出力部17は、構築された改善トラジェクトリを出力する(ステップS14)。
【0035】
(最短路計算の詳細)
次に、改善トラジェクトリ出力処理のステップS12における最短路計算部14の処理の詳細について説明する。
【0036】
図4は、改善トラジェクトリ構築のアルゴリズムの一例を示す図である。各頂点が(指標の値,時刻)の形で表されるグラフを考える。点(y,t)からは、各y′∈{y,y+1,・・・,y}について、点(y′,t+1)に向けてコストg(y,y′)+λ・R・(f(t)-f(t-1))の辺が引かれているものとする。このグラフ上で、最短路計算部14は、スタート地点を(y,0)としたダイクストラ法を実行し、探索が初めて(y,T)(Tは任意の非負整数)の形の頂点にたどり着いた時点で探索を終了する。最短路計算部14は、このアルゴリズムで返される情報prevを用いて(y,T)から遡っていくことで、最短路を計算する。
【0037】
fの単調減少性及びgが正の値のみをとることから、各辺のコストは必ず正になる。このことから、上記のアルゴリズムが(y,0)から(y,T)への最短路を出力すること、そして上記のアルゴリズムが必ず終了することを示すことができる。
【0038】
(構築された改善トラジェクトリの例)
図5は、改善トラジェクトリの一例を示す図である。画面902は、出力部17によってディスプレイに表示された画面の一例である。1つの入力情報に対しては、1つの改善トラジェクトリが構築される。画面902は、第一の改善トラジェクトリ903と、第二の改善トラジェクトリ904を含むため、2つの入力情報に対してそれぞれ構築された2回分の改善トラジェクトリを表示している。
【0039】
例えば、第一の改善トラジェクトリ903および第二の改善トラジェクトリ904は、それぞれ初期時刻tにおける第一の指標yと、第二の指標yという目標となる指標を入力として構築されたものである。それぞれ報酬R、時間割引関数f(t)、関数g(y,y)、パラメータλが互いに異なるため、異なる改善トラジェクトリが構築されている。
【0040】
(コンピュータのハードウェア構成例)
上述した情報処理装置10の各機能部は、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。なお、この「コンピュータ」は、物理マシンであってもよいし、クラウド上の仮想マシンであってもよい。仮想マシンを使用する場合、ここで説明する「ハードウェア」は仮想的なハードウェアである。
【0041】
上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
【0042】
図6は、上記コンピュータのハードウェア構成例を示す図である。図6のコンピュータは、それぞれバスBで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。
【0043】
当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0044】
メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、当該装置に係る機能を実現する。インタフェース装置1005は、ネットワークに接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。なお、上記コンピュータは、CPU1004の代わりにGPU(Graphics Processing Unit)またはTPU(Tensor processing unit)を備えていても良く、CPU1004に加えて、GPUまたはTPUを備えていても良い。その場合、例えば特殊な演算が必要な処理をGPUまたはTPUが実行し、その他の処理をCPU1004が実行する、というように処理を分担して実行しても良い。
【0045】
(本実施の形態の効果)
本実施の形態に係る情報処理装置10によれば、入力情報に基づいてダイクストラ法による最短路計算を行い、計算された最短路をもとに時間割引された負の報酬の初期価値と総距離の重み付き和を最小化する改善トラジェクトリを構築する。これによって、報酬と距離のトレードオフを調整された数値指標の適切な改善計画の作成を支援することができる。
【0046】
例えば、出力部17により出力される改善トラジェクトリをユーザが認識することによって、ユーザによる改善計画を支援することができる。また、改善トラジェクトリを目標管理システム等に出力することによって、目標管理システム等が管理する目標を詳細化し、途中経過も含めた目標を管理させることができる。
【0047】
(参考文献)
[1]R. K. Ahuja, T. L. Magnanti, J. B. Orlin, Network Flows: Theory, Algorithms, Applications, Prentice Hall, 1993.
【0048】
(実施の形態のまとめ)
本明細書には、少なくとも下記の各項に記載した情報処理装置、改善トラジェクトリ構築方法およびプログラムが記載されている。
(第1項)
初期の第一の数値指標と、目標となる第二の数値指標と、を含む入力情報を取得する入力部と、
前記入力情報に基づいて、前記第一の数値指標から前記第二の数値指標に至るまでの軌跡を時系列に示す改善トラジェクトリを構築する改善トラジェクトリ構築部と、を備える、
情報処理装置。
(第2項)
前記入力情報は、目標達成時の報酬と、時間割引関数と、単位時間に数値指標を変更するために必要な労力を表す関数と、報酬と労力のトレードオフを調整するパラメータと、をさらに含み、
前記改善トラジェクトリ構築部は、時間割引された報酬の負の現在価値と総距離の重み付き和を最小化する前記改善トラジェクトリを構築する、
第1項に記載の情報処理装置。
(第3項)
前記入力情報に基づいて、ダイクストラ法によって最短路を計算する最短路計算部をさらに備え、
前記改善トラジェクトリ構築部は、計算された最短路に基づいて、前記改善トラジェクトリを構築する、
第1項または第2項に記載の情報処理装置。
(第4項)
コンピュータが実行する改善トラジェクトリ構築方法であって、
初期の第一の数値指標と、目標となる第二の数値指標と、を含む入力情報を取得するステップと、
前記入力情報に基づいて、前記第一の数値指標から前記第二の数値指標に至るまでの軌跡を時系列に示す改善トラジェクトリを構築するステップと、を備える、
改善トラジェクトリ構築方法。
(第5項)
コンピュータを第1項から第3項のいずれか1項に記載の情報処理装置における各部として機能させるためのプログラム。
【0049】
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0050】
10 情報処理装置
11 操作部
12 入力部
13 入力情報蓄積部
14 最短路計算部
15 改善トラジェクトリ構築部
16 改善トラジェクトリ蓄積部
17 出力部
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
1008 出力装置
図1
図2
図3
図4
図5
図6