【文献】
杉本 千佳,ウェアラブルセンシングによる環境制御・ヘルスケア ウェアラブルセンサを用いたネットワーキングと個別状態推定,電子情報通信学会技術研究報告,日本,2015年 1月19日,Vol.114 No.419,73-76
【文献】
佐藤 敬幸、阿野 茂浩、山崎 克之,携帯電話のGPSデータによる生活習慣観測システムの開発と評価,電子情報通信学会技術研究報告 Vol.109 No.351,日本,社団法人電子情報通信学会,2009年12月11日,第39〜44頁
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下に、本願に係る推定装置、推定方法、推定プログラム、学習データ、及びモデルを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る推定装置、推定方法、推定プログラム、学習データ、及びモデルが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
(実施形態)
〔1.生成処理〕
まず、
図1を用いて、実施形態に係る生成処理の一例について説明する。
図1は、実施形態に係る生成処理の一例を示す図である。
図1では、推定装置100がユーザの位置情報を含むユーザ情報と、そのユーザの健康リスクを示す正解情報とを含む履歴(ログ)に基づいてモデルの生成を行う場合を示す。
図1の例では、推定装置100は、所定の検診を受診したユーザの位置情報を含むユーザ情報UDTと、そのユーザの検診結果PEDに基づく正解情報とを含む履歴(ログ)に基づいてモデルの生成を行う場合を示す。以下では、正解情報が対応付けられたユーザ情報を「学習データ」ともいう。ユーザ情報については後述する。
【0011】
図1及び
図2の例では、健康リスクとして、Aリスク、Bリスク、Cリスク等の種別を対象とする場合を示す。例えば、健康リスクは、ユーザの健康に関するリスクであれば、どのような種別の疾病や症候群等であってもよい。
図1及び
図2の例における健康リスクについて、種別「Aリスク」は「高血圧」であり、種別「Bリスク」は「メタボ(メタボリックシンドローム)」等であってもよい。また、
図1に示す正解情報は、ユーザの検診結果PEDにおいて「正常ではない」と診断された種別の健康リスクについて「リスク有」とし、「正常」と診断された種別の健康リスクについて「リスク無」とする情報であってもよい。なお、検診におけるどの判断区分(レベル)以上を「リスク有」とするかは適宜設定されてもよい。例えば、「要再検査」とされた種別を「リスク有」としてもよいし、「所見有り」とされた種別を「リスク有」としてもよい。
【0012】
また、推定装置100は、生成したモデルを用いて、あるユーザの位置情報を含むユーザ情報に基づいて、そのユーザの健康リスクを推定する。また、推定装置100は、推定したユーザの健康リスクを示す情報に基づいて、サービスを提供したりするが、この点については
図2で説明する。
【0013】
〔推定システムの構成〕
まず、
図1の説明に先立って、
図3に示す推定システム1について説明する。
図3に示すように、推定システム1は、端末装置10と、推定装置100とが含まれる。端末装置10と、推定装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。
図3は、実施形態に係る推定システムの構成例を示す図である。なお、
図3に示した推定システム1には、複数台の端末装置10や、複数台の推定装置100が含まれてもよい。
【0014】
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。
図1に示す例においては、端末装置10がユーザが利用するスマートフォンである場合を示す。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。例えば、
図2では、端末装置10がユーザU1が利用するスマートフォンである場合を示す。なお、上記のように、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により識別されるユーザであることを示す。例えば、「ユーザU1」と記載した場合、そのユーザはユーザID「U1」により識別されるユーザである。
【0015】
また、端末装置10は、GPS(Global Positioning System)センサ等の機能を有し、ユーザの位置情報(センサ情報)を検知し、取得するものとする。また、端末装置10は、通信を行っている基地局の位置情報や、WiFi(登録商標)(Wireless Fidelity)の電波を用いてユーザの位置情報を推定し、取得してもよい。なお、以下では位置情報を単に「位置」と記載する場合がある。また、端末装置10は、GPSセンサ等に限らず種々のセンサにより、各種センサ情報を検知してもよい。また、端末装置10は、加速度センサの機能を有し、ユーザの移動における加速度情報(センサ情報)を検知し、取得する。また、端末装置10は、温度センサや気圧センサ等の種々の機能を有し、温度や気圧等のユーザの置かれている環境情報を検知し、取得可能であってもよい。また、端末装置10は、心拍センサ等の種々の機能を有し、ユーザの生体情報を検知し、取得可能であってもよい。例えば、端末装置10を利用するユーザは、端末装置10と通信可能なウェアラブルデバイスを身に付けることにより、端末装置10によりユーザ自身のコンテキスト情報を取得可能としてもよい。例えば、端末装置10を利用するユーザは、端末装置10と通信可能なリストバンド型のウェアラブルデバイスを身に付けることにより、端末装置10によりユーザ自身の心拍(脈拍)に関する情報を端末装置10が取得可能としてもよい。
【0016】
推定装置100は、ユーザの位置情報を含むユーザ情報に基づいて、ユーザの健康リスクを推定する情報処理装置である。
図2の例では、推定装置100は、ユーザの健康リスクの推定に用いられるモデルであって、ユーザ情報が入力されたモデルの出力に基づいて、ユーザの健康リスクを推定する。
【0017】
また、推定装置100は、推定したユーザの健康リスクに関する情報に基づいてサービスを提供する。
図2の例では、推定装置100は、推定対象となったユーザにユーザの健康リスクを示す情報を提供する。なお、推定装置100は、ユーザの健康リスクを示す情報を、ユーザが属する事業体等に提供してもよい。
【0018】
まず、
図1の示す例において、推定装置100がモデルM1に生成に用いる学習データLD1について説明する。例えば、学習データLD1は、ユーザU101について収集された位置情報PDT101や検索情報SDT101等のユーザ情報と、ユーザU101に対応する診断結果PEDに基づく正解情報RDT101を含むデータDT101を含む。
図1の例では、ユーザU101は、診断結果PEDに示すように、AリスクやBリスクがあると診断されており、正解情報RDT101には、Aリスク「有」やBリスク「有」やCリスク「無」等の各健康リスクに対応するリスク有無を示す情報が含まれる。例えば、推定装置100は、位置情報PDT101や検索情報SDT101等のユーザ情報を、ユーザU101が利用する端末装置10から取得する。
【0019】
なお、推定装置100は、位置情報や検索情報に限らず、端末装置10から取得される種々のデータ(情報)を用いてもよい。例えば、推定装置100は、加速度情報(データ)や、ユーザによる端末装置10の操作情報(データ)等の種々の情報を用いてもよい。例えば、ユーザによる端末装置10の操作情報には、ユーザの端末装置10に対するクリックやキーストロークなど種々のユーザの操作情報が含まれてもよい。また、例えば、推定装置100は、端末装置10のアプリインストール状況に関する情報など種々の情報を用いてもよい。例えば、端末装置10のアプリインストール状況に関する情報には、端末装置10にインストールされているアプリの一覧など種々の情報が含まれてもよい。
【0020】
なお、上記のように、「データDT*(*は任意の数値)」と記載した場合、そのデータはデータID「DT*」により識別されるデータであることを示す。例えば、「データDT1」と記載した場合、そのデータはデータID「DT1」により識別されるデータである。また、
図1の例では、説明を簡単にするために、位置情報と検索情報のみをユーザ情報として図示するが、ユーザ情報には、ユーザがどのような商品を購入したかを示す購買情報等の種々の情報が含まれてもよい。例えば、ユーザ情報には、ユーザのインターネット(ウェブ)上における種々の行動情報等が含まれてもよい。
【0021】
ここでいうユーザ情報には、ユーザの位置情報やユーザの検索情報等の種々の情報が含まれる。例えば、ユーザU101は、位置情報PDT101に示すように、位置LC11や位置LC12が収集されたユーザであることを示す。なお、
図1では、図示を省略するが、位置情報PDT101には、各位置が取得(検知)された日時に関する情報が位置に対応付けられる。また、
図1の例では「位置LC11」を抽象的な符号で図示するが、位置情報は、具体的な緯度経度情報等であってもよい。
【0022】
例えば、ユーザU101は、検索情報SDT101に示すように、クエリXXやクエリYYを用いて検索を行ったユーザであることを示す。なお、
図1では、図示を省略するが、検索情報SDT101には、各クエリを用いて検索が行われた日時に関する情報が各クエリに対応付けられる。また、
図1の例では「クエリXX」を抽象的な符号で図示するが、クエリ(検索クエリ)は、具体的な商品名や病名等の具体的な対象を示す文字列等であってもよい。なお、ユーザ情報には、上記に限らず種々の情報が含まれてもよいが、この点については後述する。
【0023】
例えば、学習データLD1は、ユーザU102について収集された位置情報PDT102や検索情報SDT102等のユーザ情報と、ユーザU102に対応する診断結果PEDに基づく正解情報RDT102を含むデータDT102を含む。
図1の例では、ユーザU102は、診断結果PEDに示すように、異常なしと診断されており、正解情報RDT102には、Aリスク、Bリスク、Cリスク等の全リスクについて「無」とする、各健康リスクに対応するリスク有無を示す情報が含まれる。例えば、推定装置100は、位置情報PDT102や検索情報SDT102等のユーザ情報を、ユーザU102が利用する端末装置10から取得する。
【0024】
また、学習データLD1は、ユーザU103について収集された位置情報PDT103や検索情報SDT103等のユーザ情報と、ユーザU103に対応する診断結果PEDに基づく正解情報RDT103を含むデータDT103や、ユーザU104について収集された位置情報PDT104や検索情報SDT104等のユーザ情報を含むデータDT104等を含む。例えば、推定装置100は、位置情報PDT103や検索情報SDT103等のユーザ情報を、ユーザU103が利用する端末装置10から取得する。また、例えば、推定装置100は、位置情報PDT104や検索情報SDT104等のユーザ情報を、ユーザU104が利用する端末装置10から取得する。
【0025】
なお、
図1では、データDT101〜DT104のみを図示するが学習データLD1には多数のデータが含まれるものとする。また、例えば、推定装置100は、各ユーザの診断結果PEDを、診断を行った機関(医療機関等)から取得する。例えば、推定装置100は、各ユーザU101〜U104の診断結果PEDに基づいて、正解情報RDT101〜RDT104等を生成してもよい。また、例えば、推定装置100は、各ユーザU101〜U104の診断結果PEDに基づく正解情報RDT101〜RDT104等を、診断を行った機関(医療機関等)から取得してもよい。また、推定装置100は、各ユーザのユーザ情報を、ユーザが利用する端末装置10以外の外部装置から取得してもよい。
【0026】
ここから、推定装置100の各処理について説明する。まず、推定装置100は、学習データLD1を取得する(ステップS11)。具体的には、推定装置100は、データDT101〜DT104等を含む学習データLD1を取得する。なお、
図1の例では、推定装置100は、上記のような学習データLD1を所定の外部情報処理装置から取得してもよい。
【0027】
そして、推定装置100は、ステップS11で取得した学習データLD1に含まれる正解情報とユーザ情報との組み合わせを学習データとして追加する(ステップS12)。具体的には、推定装置100は、学習データLD1を学習データ記憶部121に追加する。
【0028】
そして、推定装置100は、学習データに基づいてモデルを生成する(ステップS13)。
図1の例では、推定装置100は、モデル情報記憶部122に示すように、モデルM1〜M3等を生成する。上記のように、「モデルM*(*は任意の数値)」と記載した場合、そのモデルはモデルID「M*」により識別されるモデルであることを示す。例えば、「モデルM1」と記載した場合、そのモデルはモデルID「M1」により識別されるモデルである。
【0029】
図1中のモデル情報記憶部122に示すように、モデルM1は健康リスク「Aリスク」、すなわちユーザの健康リスクの一の種別であるAリスクの推定のために用いられるモデルであり、その具体的なモデルデータが「モデルデータMDT1」であることを示す。また、
図1中のモデル情報記憶部122に示すように、モデルM2は健康リスク「Bリスク」、すなわちユーザの健康リスクの一の種別であるBリスクの推定のために用いられるモデルであり、その具体的なモデルデータが「モデルデータMDT2」であることを示す。また、
図1中のモデル情報記憶部122に示すように、モデルM3は健康リスク「Cリスク」、すなわちユーザの健康リスクの一の種別であるCリスクの推定のために用いられるモデルであり、その具体的なモデルデータが「モデルデータMDT3」であることを示す。
【0030】
例えば、推定装置100は、学習データ記憶部121中のデータDT101〜DT104等を学習データ(教師データ)として、学習を行なうことにより、モデルを生成する。例えば、推定装置100は、ユーザの位置情報を含むユーザ情報に関する特徴量を用いて、モデルを生成する。例えば、推定装置100は、ユーザの位置情報に関する特徴量を用いて、モデルを生成する。また、例えば、推定装置100は、ユーザの検索情報に関する特徴量を用いて、モデルを生成する。例えば、推定装置100は、ユーザが検索に用いたクエリに関する特徴量を用いて、モデルを生成する。このように、推定装置100は、ユーザに対応する特徴を学習し、そのユーザの健康リスクを推定するモデルを生成する。
図1の例では、推定装置100は、ユーザの位置情報や検索情報等に関する特徴を学習し、そのユーザの健康リスクを推定するモデルを生成する。なお、推定装置100が学習するユーザに対応する特徴は、推定装置100の管理者等の人間が推定装置100に入力してもよいし、推定装置100に自動的に学習(抽出)させてもよい。
【0031】
例えば、推定装置100は、学習データLD1を用いてモデルM1を生成する。例えば、推定装置100は、正解情報RDT101に含まれるユーザU101の診断結果PEDにおいてAリスクが「有」である場合、モデルM1にデータDT101に含まれるユーザ情報が入力された場合に、モデルM1が出力するスコアが「1」に近づくように、学習処理を行う。例えば、推定装置100は、データDT101の位置情報PDT101や検索情報SDT101がモデルM1に入力された場合に、モデルM1が出力するスコアが「1」に近づくように、学習処理を行う。
【0032】
また、例えば、推定装置100は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてAリスクが「無」である場合、モデルM1にデータDT102に含まれるユーザ情報が入力された場合に、モデルM1が出力するスコアが「0」に近づくように、学習処理を行う。例えば、推定装置100は、データDT102の位置情報PDT102や検索情報SDT102がモデルM1に入力され場合に、モデルM1が出力するスコアが「0」に近づくように、学習処理を行う。
【0033】
例えば、推定装置100は、学習データLD1を用いてモデルM2を生成する。例えば、推定装置100は、正解情報RDT103に含まれるユーザU103の診断結果PEDにおいてBリスクが「有」である場合、モデルM2にデータDT103に含まれるユーザ情報が入力された場合に、モデルM2が出力するスコアが「1」に近づくように、学習処理を行う。例えば、推定装置100は、データDT103の位置情報PDT103や検索情報SDT103がモデルM2に入力された場合に、モデルM2が出力するスコアが「1」に近づくように、学習処理を行う。
【0034】
また、例えば、推定装置100は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてBリスクが「無」である場合、モデルM2にデータDT102に含まれるユーザ情報が入力された場合に、モデルM2が出力するスコアが「0」に近づくように、学習処理を行う。例えば、推定装置100は、データDT102の位置情報PDT102や検索情報SDT102がモデルM2に入力され場合に、モデルM2が出力するスコアが「0」に近づくように、学習処理を行う。
【0035】
例えば、推定装置100は、学習データLD1を用いてモデルM3を生成する。例えば、推定装置100は、正解情報RDT104に含まれるユーザU104の診断結果PEDにおいてCリスクが「有」である場合、モデルM3にデータDT104に含まれるユーザ情報が入力された場合に、モデルM3が出力するスコアが「1」に近づくように、学習処理を行う。例えば、推定装置100は、データDT104の位置情報PDT104や検索情報SDT104がモデルM3に入力された場合に、モデルM3が出力するスコアが「1」に近づくように、学習処理を行う。
【0036】
また、例えば、推定装置100は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてCリスクが「無」である場合、モデルM3にデータDT102に含まれるユーザ情報が入力された場合に、モデルM3が出力するスコアが「0」に近づくように、学習処理を行う。例えば、推定装置100は、データDT102の位置情報PDT102や検索情報SDT102がモデルM3に入力され場合に、モデルM3が出力するスコアが「0」に近づくように、学習処理を行う。
【0037】
なお、モデルの学習手法については、上述した手法に限定されるものではなく、任意の公知技術が適用可能である。なお、各モデルの生成は、機械学習に関する種々の従来技術を適宜用いて行われてもよい。例えば、モデルの生成は、SVM(Support Vector Machine)等の教師あり学習の機械学習に関する技術を用いて行われてもよい。また、例えば、モデルの生成は、教師なし学習の機械学習に関する技術を用いて行われてもよい。例えば、モデルの生成は、深層学習(ディープラーニング)の技術を用いて行われてもよい。例えば、モデルの生成は、DNN(Deep Neural Network)やRNN(Recurrent Neural Network)やCNN(Convolutional Neural Network)等の種々のディープラーニングの技術を適宜用いて行われてもよい。なお、上記モデルの生成に関する記載は例示であり、モデルの生成は、取得可能な情報等に応じて適宜選択された学習手法により行われてもよい。すなわち、推定装置100は、学習データに含まれるユーザ情報が入力された場合に、正解情報に対応するスコアを出力するようにモデルM1を学習可能であれば、どのような手法によりモデルM1の生成を行ってもよい。
【0038】
上記のような処理により、推定装置100は、Aリスク〜Cリスク等の各種別の健康リスクに対応するモデルM1〜M3等を生成する。例えば、推定装置100は、モデルM1にユーザ情報を入力することにより、入力したユーザ情報に対応するユーザについて健康リスク「Aリスク」の可能性を示すスコアを、モデルM1に出力させ、モデルM1が出力するスコアに基づいて、そのユーザについてのAリスクの有無を推定する。
【0039】
上述したように、推定装置100は、ユーザ情報と、各健康リスクに対応する正解情報とが対応付けられた学習データを用いて学習することにより、あるユーザの各健康リスクの有無を適切に推定可能にするモデルを生成することができる。したがって、推定装置100は、上述のように生成したモデルを用いることにより、例えば、あるユーザの各健康リスクが生じるかを精度よく推定することを可能にすることができる。
【0040】
(1−1.モデルについて)
モデルの生成については、
図1に限らず、種々の態様であってもよい。
図1の例では、各健康リスクに対応する複数のモデルを生成する場合を示すが、推定装置100は、各健康リスクに対応する複数のスコアを出力する1つのモデルを生成してもよい。
【0041】
また、
図1の例では、説明を簡単にするために、位置情報と検索情報のみをユーザ情報として図示したが、推定装置100は、種々の情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザのインターネット(ウェブ)上における種々の行動情報を含むユーザ情報を入力情報とするモデルを生成してもよい。上述のように、例えば、推定装置100は、ユーザが購入した商品に関する情報を含むユーザ情報を入力情報とするモデルを生成してもよい。
【0042】
また、例えば、推定装置100は、ユーザが閲覧したコンテンツに関する情報を含むユーザ情報を入力情報とするモデルを生成してもよい。また、例えば、推定装置100は、ユーザの飲食に関する情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザの属性情報を含むユーザ情報を入力情報とするモデルを生成してもよい。
【0043】
例えば、推定装置100は、端末装置10から取得した加速度情報(データ)を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザによる端末装置10の操作情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザの端末装置10に対するクリックやキーストロークなど種々のユーザの操作情報を含むユーザ情報を入力情報とするモデルを生成してもよい。また、例えば、推定装置100は、端末装置10のアプリインストール状況に関する情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、端末装置10にインストールされているアプリの一覧など種々の情報を含むユーザ情報を入力情報とするモデルを生成してもよい。
【0044】
例えば、推定装置100は、ユーザが所定のサービスにおいて投稿した投稿情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ソーシャルネットワーキングサービス(SNS:Social Networking Service)においてユーザが投稿した投稿情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、Twitter(登録商標)やFacebook(登録商標)等においてユーザが投稿した投稿情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザがTwitterにおいて投稿した文字情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザがメッセージサービスにおいて入力した情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、ユーザがLINE(登録商標)等のメッセージサービスにおいて入力した情報を含むユーザ情報を入力情報とするモデルを生成してもよい。例えば、推定装置100は、電子メールにおいて入力した情報を含むユーザ情報を入力情報とするモデルを生成してもよい。また、例えば、推定装置100は、ユーザが入力する情報であれば、文字情報や、音声情報や、画像情報や、動画情報(映像)等の種々の情報を含むユーザ情報を入力情報とするモデルを生成してもよい。
【0045】
〔2.推定処理〕
図2を用いて、実施形態に係る推定処理の一例について説明する。
図2は、実施形態に係る推定処理の一例を示す図である。
図2では、推定装置100は、ユーザU1のユーザ情報が与えられた場合に、ユーザU1の健康リスクを推定し、推定に基づく情報を提供する場合を示す。
【0046】
まず、推定装置100は、ユーザU1のユーザ情報UDT1を取得する(ステップS21)。
図2の例では、推定装置100は、ユーザU1が利用する端末装置10からユーザU1の位置情報PDT1や検索情報SDT1を含むユーザ情報UDT1を取得する。例えば、推定装置100は、位置LC1や位置LC2等にユーザU1が位置したことを示す位置情報PDT1や、クエリAAやクエリBB等によりユーザU1が検索を行ったことを示す検索情報SDT1を含むユーザ情報UDT1を取得する。
【0047】
ユーザ情報UDT1を取得した推定装置100は、ユーザ情報UDT1をモデルに入力する。例えば、推定装置100は、ユーザU1の位置情報PDT1や検索情報SDT1を含むユーザ情報UDT1を、モデルM1に入力する。
【0048】
図2の例では、推定装置100は、処理群PS22−1に示すような処理により、ユーザU1に種別「Aリスク」の健康リスクが生じる可能性を示すスコアを算出する。推定装置100は、ユーザ情報UDT1を種別「Aリスク」に対応するモデルM1に入力する(ステップS22−1)。具体的には、推定装置100は、位置情報PDT1や検索情報SDT1を含むユーザ情報UDT1をモデルM1に入力する。ユーザ情報UDT1が入力されたモデルM1は、スコアを出力する(ステップS23−1)。
図2の例では、ユーザ情報UDT1が入力されたモデルM1は、スコアSC11−1に示すようなスコア「0.7」を出力する。
【0049】
また、推定装置100は、処理群PS22−2に示すような処理により、ユーザU1に種別「Bリスク」の健康リスクが生じる可能性を示すスコアを算出する。推定装置100は、ユーザ情報UDT1を種別「Bリスク」に対応するモデルM2に入力する(ステップS22−2)。具体的には、推定装置100は、位置情報PDT1や検索情報SDT1を含むユーザ情報UDT1をモデルM2に入力する。ユーザ情報UDT1が入力されたモデルM2は、スコアを出力する(ステップS23−2)。
図2の例では、ユーザ情報UDT1が入力されたモデルM2は、スコアSC11−2に示すようなスコア「0.2」を出力する。
【0050】
また、推定装置100は、種別「Cリスク」等の他の種別に対応するモデルM3等についても同様に処理する。例えば、推定装置100は、ユーザ情報UDT1を種別「Cリスク」に対応するモデルM3に入力することにより、ユーザU1に種別「Cリスク」の健康リスクが生じる可能性を示すスコアを算出する。
図2の例では、推定装置100は、ユーザU1については、スコア「0.4」と算出する。
【0051】
そして、推定装置100は、各モデルM1〜M3等が出力したスコアに基づいて、ユーザU1の健康リスクを推定する(ステップS24)。
図2の例では、推定装置100は、モデルが出力するスコアが0.25未満である場合、そのモデルに対応する種別について、ユーザの健康リスクが「低」と推定する。また、推定装置100は、ユーザ情報が入力されたモデルM1が出力するスコアが0.25以上0.65未満である場合、そのモデルに対応する種別について、ユーザの健康リスクが「中」と推定する。また、推定装置100は、ユーザ情報が入力されたモデルM1が出力するスコアが0.65以上である場合、そのモデルに対応する種別について、ユーザの健康リスクが「高」と推定する。
【0052】
このように、
図2の例では、推定装置100は、Aリスク〜Cリスク等の各種別の健康リスクが「低」、「中」、「高」のいずれのレベルであるかを推定する。推定装置100は、
図2中の健康リスク一覧HRL1に示すように、Aリスクのリスクレベルを「高」、Bリスクのリスクレベルを「低」、Cリスクのリスクレベルを「中」と推定する。例えば、推定装置100は、健康リスク一覧HRL1を生成する。
【0053】
その後、推定装置100は、推定したユーザの健康リスクに基づいて情報提供を行う(ステップS25)。
図2の例では、推定装置100は、健康リスク一覧HRL1を端末装置10へ提供する。そして、推定装置100から健康リスク一覧HRL1を受信した端末装置10は、健康リスク一覧HRL1を表示する。これにより、ユーザU1は、自身の健康リスクを確認する。
【0054】
上述したように、推定装置100は、ユーザの位置情報を含むユーザ情報に基づいて、そのユーザの健康リスクを推定する。
図2の例では、推定装置100は、ユーザU1の位置情報PDT101を含むユーザ情報UDT1を各モデルM1〜M3等に入力することにより、各モデルM1〜M3等の各々に対応する種別の健康リスクに関するスコアを出力させる。そして、推定装置100は、モデルが出力するスコアが高い程、そのモデルに対応する種別の健康リスクがユーザに生じる可能性が高いと推定する。そして、推定装置100は、生成した健康リスク一覧HRL1を端末装置10へ提供する。このように、推定装置100は、ユーザの健康リスクを推定し、推定したユーザの健康リスクに関する情報をユーザ等に提供することにより、ユーザの健康リスクを適切に把握可能にすることができる。
【0055】
(2−1.推定方法について)
なお、
図2の例では、モデルを用いて推定する場合を示したが、モデルを用いることなくユーザの健康リスクを推定してもよい。例えば、推定装置100は、位置情報により推定されるユーザの移動に関する情報に基づいて、ユーザの健康リスクを推定する。例えば、推定装置100は、位置情報により推定されるユーザの所定期間(例えば1日等)における徒歩による移動距離が所定の閾値(例えば1km等)未満である場合、そのユーザについてメタボや運動不足に起因する健康リスクがあると推定してもよい。
【0056】
また、例えば、推定装置100は、位置情報により推定されるユーザの生活パターンに関する情報に基づいて、ユーザの健康リスクを推定してもよい。例えば、推定装置100は、位置情報に基づいて、定期的に運動しているか否かを含む生活パターン推定し、その情報に基づいてユーザの健康リスクを推定してもよい。例えば、推定装置100は、所定の周期(例えば1週間おき等)で、ユーザがランニングしていることを示す位置情報が取得された場合、そのユーザが定期的に運動しているユーザであると推定してもよい。例えば、推定装置100は、所定のエリアを所定の速度(例えば10km/時等)で周回している位置情報が取得された場合、そのユーザがランニングしていると推定してもよい。このように、推定装置100は、位置情報によりユーザが定期的にランニング等の運動を行っていると推定される場合、そのユーザについてメタボや運動不足に起因する健康リスクがないと推定してもよい。
【0057】
また、例えば、推定装置100は、位置情報に基づいて、ユーザが勤務地(会社)へ車通勤しているか否かを含む生活パターン推定し、その情報に基づいてユーザの健康リスクを推定してもよい。例えば、推定装置100は、ユーザが自宅から勤務地までの間を道路に沿って、移動していることを示す位置情報が取得された場合、そのユーザが会社へ車通勤しているユーザであると推定してもよい。例えば、推定装置100は、ユーザが自宅から勤務地までの間を所定の速度(例えば40km/時等)で移動している位置情報が取得された場合、そのユーザが会社へ車通勤していると推定してもよい。このように、推定装置100は、位置情報によりユーザが会社へ車通勤していると推定される場合、そのユーザについてメタボや運動不足に起因する健康リスクがあると推定してもよい。
【0058】
また、例えば、推定装置100は、位置情報に基づいて、ユーザが自宅に引きこもっているか否かを含む生活パターン推定し、その情報に基づいてユーザの健康リスクを推定してもよい。例えば、推定装置100は、ユーザが所定の期間に亘って、自宅に滞在していることを示す位置情報が取得された場合、そのユーザが自宅に引きこもっているユーザであると推定してもよい。例えば、推定装置100は、ユーザが1日のうち所定の閾値(例えば20時間等)以上の時間に亘って自宅に滞在していることを示す位置情報が取得された場合、そのユーザが自宅に引きこもっていると推定してもよい。このように、推定装置100は、位置情報によりユーザが自宅に引きこもっていると推定される場合、そのユーザについて運動不足やうつ病に起因する健康リスクがあると推定してもよい。また、例えば、推定装置100は、位置情報に基づいて、ユーザが勤務後に飲み屋等の所定の飲食店に行っているか否かを含む生活パターン推定し、その情報に基づいてユーザの健康リスクを推定してもよい。例えば、推定装置100は、ユーザが所定の頻度で飲み屋に滞在していることを示す位置情報が取得された場合、そのユーザが勤務後に飲み屋に行っているユーザであると推定してもよい。例えば、推定装置100は、ユーザが1週間のうち所定の閾値(例えば3日等)以上の頻度で飲み屋に滞在していることを示す位置情報が取得された場合、そのユーザが頻繁に飲み屋に行っていると推定してもよい。このように、推定装置100は、位置情報によりユーザが頻繁に飲み屋に行っていると推定される場合、そのユーザについて飲酒やカロリー過多に起因する健康リスクがあると推定してもよい。
【0059】
また、例えば、推定装置100は、位置情報により推定されるユーザの滞在地に関する情報に基づいて、ユーザの健康リスクを推定してもよい。例えば、推定装置100は、位置情報により推定されるユーザの滞在地が所定の閾値(例えば2等)以下である場合、所定の健康リスクがユーザにあると推定してもよい。例えば、推定装置100は、位置情報によりユーザが自宅と勤務地との2地点のみを滞在地としていると推定される場合、そのユーザについてストレスや運動不足に起因する健康リスクがあると推定してもよい。
【0060】
例えば、推定装置100は、ユーザが所定のサービスにおいて投稿した投稿情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、形態素解析等の種々の自然言語処理技術の従来技術を適宜用いて、投稿情報の意味解析を行った結果に基づいて、ユーザの健康リスクを推定してもよい。例えば、推定装置100は、SNSにおいてユーザが投稿した投稿情報に健康リスクに関する情報が含まれる場合、その健康リスクがあると推定してもよい。例えば、推定装置100は、ユーザの投稿情報に「Aリスクがあると診断された」等の情報が含まれる場合、そのユーザにAリスクがあると推定してもよい。例えば、推定装置100は、ユーザの投稿情報に、健康リスクの要因となるような情報が含まれる場合、その健康リスクがあると推定してもよい。例えば、推定装置100は、ユーザの投稿情報に「最近運動不足」や「最近運動する時間がない」等の情報が含まれる場合、そのユーザに運動不足が要因となる健康リスクがあると推定してもよい。例えば、推定装置100は、ユーザの投稿情報に「休みが取れない」や「仕事のストレスで限界」等の情報が含まれる場合、そのユーザにストレスが要因となる健康リスクがあると推定してもよい。なお、上記は一例であり、推定装置100は、種々の情報を適宜用いて、ユーザの健康リスクを推定してもよい。また、推定装置100は、上記のような方法により推定したユーザの健康リスクを正解情報として、モデルを生成してもよい。これにより、推定装置100は、診断結果が取得されていないユーザについてのデータを用いて、モデルを生成することができる。
【0061】
(2−2.ユーザ情報について)
図1及び
図2の例では、説明を簡単にするために、位置情報と検索情報のみをユーザ情報として図示したが、ユーザ情報には、種々の情報が含まれてもよい。例えば、推定装置100は、ユーザのインターネット(ウェブ)上における種々の行動情報を含むユーザ情報を用いて健康リスクを推定してもよい。
【0062】
例えば、推定装置100は、ユーザが閲覧したコンテンツに関する情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、ユーザが特定の疾病等の健康リスクを示すコンテンツを所定の閾値(例えば1日1回や1時間)以上閲覧している場合、その健康リスクがあると推定してもよい。
【0063】
また、例えば、推定装置100は、ユーザの飲食に関する情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、高カロリー商品等の特定の食品のユーザの購入頻度が所定の閾値(例えば1日1回)以上である場合、肥満や高脂血症や糖尿病等の健康リスクがあると推定してもよい。
【0064】
例えば、推定装置100は、ユーザの属性情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、ユーザの性別や年齢等を用いて、統計的な健康リスクに関する情報を加味して、ユーザの健康リスクを推定してもよい。
【0065】
例えば、推定装置100は、ユーザが所定のサービスにおいて投稿した投稿情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、SNSにおいてユーザが投稿した投稿情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、TwitterやFacebook等においてユーザが投稿した投稿情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、ユーザがTwitterにおいて投稿した文字情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、ユーザがメッセージサービスにおいて入力した情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、ユーザがLINE等のメッセージサービスにおいて入力した情報を含むユーザ情報を用いて健康リスクを推定してもよい。例えば、推定装置100は、電子メールにおいて入力した情報を含むユーザ情報を用いて健康リスクを推定してもよい。また、例えば、推定装置100は、ユーザが入力する情報であれば、文字情報や、音声情報や、画像情報や、動画情報(映像)等の種々の情報を含むユーザ情報を用いて健康リスクを推定してもよい。
【0066】
〔3.推定装置の構成〕
次に、
図4を用いて、実施形態に係る推定装置100の構成について説明する。
図4は、実施形態に係る推定装置の構成例を示す図である。
図4に示すように、推定装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、推定装置100は、推定装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0067】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10との間で情報の送受信を行う。
【0068】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、
図4に示すように、学習データ記憶部121と、モデル情報記憶部122と、健康リスク情報記憶部124とを有する。
【0069】
(学習データ記憶部121)
実施形態に係る学習データ記憶部121は、学習データに関する各種情報を記憶する。
図5は、実施形態に係る学習データ記憶部の一例を示す図である。例えば、学習データ記憶部121は、モデルの生成に用いる教師データを記憶する。
図5に示す学習データ記憶部121には、「データID」、「ユーザID」、「正解情報」、「ユーザ情報」といった項目が含まれる。「ユーザ情報」には、「位置情報」、「検索情報」といった項目が含まれる。なお、「ユーザ情報」には、ユーザの位置情報やユーザの検索情報に限らず、ユーザの他の行動情報やユーザの属性情報等、ユーザに関する情報であればどのような情報が記憶されてもよい。
【0070】
「データID」は、データを識別するための識別情報を示す。例えば、「データID」は、学習データ(教師データ)として用いられるユーザの行動情報と正解情報との組合せを識別するための識別情報を示す。例えば、データID「DT101」により識別されるデータは、
図1の例に示した、データDT101に対応する。「ユーザID」は、ユーザを識別するための識別情報を示す。
【0071】
「正解情報」は、データIDにより識別されるデータに対応する正解情報を示す。例えば、「正解情報」は、データIDにより識別されるデータに対応するユーザの実際の行動有無を示す。
図5では「正解情報」に「RDT101」といった概念的な情報が格納される例を示したが、実際には、ユーザが検診等により診断された健康リスクを示す情報(例えばAリスクやBリスク等)、または、その格納場所を示すファイルパス名などが格納される。
【0072】
「ユーザ情報」中の「位置情報」は、ユーザに対応する位置情報を示す。
図5では「位置情報」に「PDT101」といった概念的な情報が格納される例を示したが、実際には、対応するユーザについて収集された複数の位置情報やその取得日時等、または、その格納場所を示すファイルパス名などが格納される。
【0073】
「ユーザ情報」中の「検索情報」は、ユーザに対応する検索情報を示す。
図5では「検索情報」に「SDT101」といった概念的な情報が格納される例を示したが、実際には、対応するユーザが検索に用いた複数のクエリを示す情報やそのクエリを用いた検索が行われた日時、または、その格納場所を示すファイルパス名などが格納される。
【0074】
例えば、
図5に示す例において、データID「DT101」により識別されるデータ(データDT101)は、ユーザID「U101」により識別されるユーザ(ユーザU101)に対応する情報(データ)であることを示す。例えば、
図5に示す例において、データDT101は、ユーザ情報として、ユーザU101に対応する位置情報PDT101や検索情報SDT101等を含むことを示す。また、データDT101は、正解情報RDT101を含むことを示す。
【0075】
なお、学習データ記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、学習データ記憶部121は、学習データが追加された日時に関する情報を記憶してもよい。また、例えば、学習データ記憶部121は、ユーザ情報として、ユーザの属性に関する情報を記憶してもよい。例えば、学習データ記憶部121は、ユーザ情報として、デモグラフィック属性情報やサイコグラフィック属性情報を記憶してもよい。例えば、学習データ記憶部121は、氏名、年齢、性別、自宅、勤務地、興味、家族構成、収入、ライフスタイル等の情報を記憶してもよい。例えば、学習データ記憶部121は、ユーザ情報として、ユーザのインターネット(ウェブ)上における行動情報を記憶してもよい。例えば、学習データ記憶部121は、ユーザ情報として、ユーザがどのような商品を購入したかを示す購入履歴等を記憶してもよい。また、例えば、学習データ記憶部121は、ユーザ情報として、ユーザがどのようなコンテンツを閲覧したかを示す閲覧履歴等を記憶してもよい。
【0076】
(モデル情報記憶部122)
実施形態に係るモデル情報記憶部122は、モデルに関する情報を記憶する。例えば、モデル情報記憶部122は、生成処理により生成されたモデル情報(モデルデータ)を記憶する。
図6は、実施形態に係るモデル情報記憶部の一例を示す図である。
図6に示すモデル情報記憶部122は、「モデルID」、「健康リスク」、「モデルデータ」といった項目が含まれる。なお、
図6では、モデルM1〜M3のみを図示するが、M4、M5等、各健康リスク(推定の対象となる健康リスク)に応じて多数のモデル情報が記憶されてもよい。
【0077】
「モデルID」は、モデルを識別するための識別情報を示す。例えば、モデルID「M1」により識別されるモデルは、
図1の例に示したモデルM1に対応する。「健康リスク」は、対応するモデルの推定対象となる健康リスクを示す。また、「モデルデータ」は、対応付けられた対応するモデルのデータを示す。例えば、「モデルデータ」には、各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。
【0078】
例えば、
図6に示す例において、モデルID「M1」により識別されるモデル(モデルM1)は、対象となる健康リスクが「Aリスク」であり、入力されたユーザの位置情報を含むユーザ情報に対応するユーザの健康リスク(Aリスク)の推定に用いられることを示す。また、モデルM1のモデルデータは、モデルデータMDT1であることを示す。
【0079】
モデルM1(モデルデータMDT1)は、ユーザの位置情報を含むユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの健康リスクの推定に用いられるスコアの値を出力層から出力するよう、コンピュータを機能させるためのモデルである。
【0080】
ここで、モデルM1〜M3等が「y=a
1*x
1+a
2*x
2+・・・+a
i*x
i」で示す回帰モデルで実現されるとする。この場合、例えば、モデルM1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。
【0081】
また、モデルM1〜M3等がDNN等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、例えば、モデルM1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
【0082】
なお、モデル情報記憶部122は、上記に限らず、目的に応じて種々のモデル情報を記憶してもよい。
【0083】
(ユーザ情報記憶部123)
実施形態に係るユーザ情報記憶部123は、ユーザに関する各種情報を記憶する。
図7は、実施形態に係るユーザ情報記憶部の一例を示す図である。例えば、ユーザ情報記憶部123は、各ユーザの各種の行動情報を記憶する。
図7に示すユーザ情報記憶部123には、「ユーザID」、「ユーザ情報」といった項目が含まれる。「ユーザ情報」には、「位置情報」、「検索情報」といった項目が含まれる。なお、「ユーザ情報」には、ユーザの位置情報やユーザの検索情報に限らず、ユーザの他の行動情報やユーザの属性情報等、ユーザに関する情報であればどのような情報が記憶されてもよい。
【0084】
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U1」により識別されるユーザは、
図2の例に示したユーザU1に対応する。「ユーザ情報」は、データIDにより識別されるデータに対応するユーザのユーザ情報を示す。
【0085】
「ユーザ情報」中の「位置情報」は、ユーザに対応する位置情報を示す。
図7では「位置情報」に「PDT1」といった概念的な情報が格納される例を示したが、実際には、対応するユーザについて収集された複数の位置情報やその取得日時等、または、その格納場所を示すファイルパス名などが格納される。
【0086】
「ユーザ情報」中の「検索情報」は、ユーザに対応する検索情報を示す。
図7では「検索情報」に「SDT1」といった概念的な情報が格納される例を示したが、実際には、対応するユーザが検索に用いた複数のクエリを示す情報やそのクエリを用いた検索が行われた日時、または、その格納場所を示すファイルパス名などが格納される。
【0087】
例えば、
図7に示す例において、ユーザID「U1」により識別されるユーザ(ユーザU1)に対応するユーザ情報には、位置情報PDT1や検索情報SDT1等が含まれることを示す。
【0088】
なお、ユーザ情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。また、
図7では、ユーザIDごとに行動情報がユーザ情報記憶部123に記憶される場合を示したが、行動情報は、ユーザIDごとに限らず、例えば時刻順に記憶されてもよい。
【0089】
なお、ユーザ情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部123は、ユーザ情報として、ユーザの属性に関する情報を記憶してもよい。例えば、ユーザ情報記憶部123は、ユーザ情報として、デモグラフィック属性情報やサイコグラフィック属性情報を記憶してもよい。例えば、ユーザ情報記憶部123は、ユーザ情報として、氏名、年齢、性別、自宅、勤務地、興味、家族構成、収入、ライフスタイル等の情報を記憶してもよい。例えば、ユーザ情報記憶部123は、ユーザ情報として、ユーザのインターネット(ウェブ)上における行動情報を記憶してもよい。例えば、ユーザ情報記憶部123は、ユーザ情報として、ユーザがどのような商品を購入したかを示す購入履歴等を記憶してもよい。また、例えば、ユーザ情報記憶部123は、ユーザ情報として、ユーザがどのようなコンテンツを閲覧したかを示す閲覧履歴等を記憶してもよい。
【0090】
(健康リスク情報記憶部124)
実施形態に係る健康リスク情報記憶部124は、健康リスクに関する各種情報を記憶する。
図8は、実施形態に係る健康リスク情報記憶部の一例を示す図である。例えば、健康リスク情報記憶部124は、推定されたユーザの健康リスクに関する各種情報を記憶する。
図8に示す健康リスク情報記憶部124は、「ユーザID」、「推定健康リスク」といった項目が含まれる。「推定健康リスク」には、「種別」、「スコア」といった項目が含まれる。なお、「推定健康リスク」には、「種別」、「スコア」に限らず、スコアと所定の閾値との比較に基づく、健康リスクの有無を示す情報等、推定された健康リスクに関する情報であればどのような情報が記憶されてもよい。
【0091】
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U1」により識別されるユーザは、
図1の例に示したユーザU1に対応する。「ユーザ情報」は、データIDにより識別されるデータに対応するユーザのユーザ情報を示す。
【0092】
「推定健康リスク」は、対応するユーザについて推定された健康リスクを示す。「種別」は、健康リスクの種別を示す。なお、
図8の例では、健康リスクの種別として「Aリスク」や「Bリスク」等の抽象的な符号を図示したが、種別には、具体的な健康リスクの名称等を記憶されてもよい。例えば、種別「Aリスク」は「高血圧」であり、種別「Bリスク」は「メタボ(メタボリックシンドローム)」であってもよい。また、「スコア」は、対応する種別の健康リスクの評価値となるスコアを示す。
【0093】
例えば、
図8に示す例において、ユーザID「U1」により識別されるユーザ(ユーザU1)は、種別「Aリスク」についてはスコア「0.7」であり、種別「Bリスク」についてはスコア「0.2」であり、種別「Cリスク」についてはスコア「0.4」であることを示す。
【0094】
なお、健康リスク情報記憶部124は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0095】
(制御部130)
図4の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、推定装置100内部の記憶装置に記憶されている各種プログラム(推定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。制御部130は、モデル情報記憶部122に記憶されているモデルM1等に従った情報処理により、ユーザの位置情報を含むユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの健康リスクの推定に用いられるスコアの値を出力層から出力する。
【0096】
図4に示すように、制御部130は、取得部131と、生成部132と、推定部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。制御部130は、記憶部120に記憶されているモデルM1(モデルデータMDT1)に従った情報処理により、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたユーザの位置情報を含むユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの健康リスクの推定に用いられるスコアの値を出力層から出力する。
【0097】
(取得部131)
取得部131は、各種情報を取得する。例えば、取得部131は、学習データ記憶部121と、モデル情報記憶部122と、健康リスク情報記憶部124等から各種情報を取得する。また、取得部131は、各種情報を外部の情報処理装置から取得してもよい。また、取得部131は、各種情報を端末装置10等から取得してもよい。
【0098】
例えば、取得部131は、ユーザの位置情報を含むユーザ情報を取得する。例えば、取得部131は、ユーザが検索に用いた検索クエリに関する情報を含むユーザ情報を取得する。例えば、取得部131は、ユーザが購入した商品に関する情報を含むユーザ情報を取得する。
【0099】
また、例えば、取得部131は、ユーザの属性情報を含むユーザ情報を取得する。例えば、取得部131は、ユーザの性別や年齢等を示す情報を含むユーザ情報を取得する。例えば、取得部131は、デモグラフィック属性情報やサイコグラフィック属性情報を示す情報を含むユーザ情報を取得する。例えば、取得部131は、氏名、年齢、性別、自宅、勤務地、興味、家族構成、収入、ライフスタイル等を示す情報を含むユーザ情報を取得する。
【0100】
図1の例では、取得部131は、位置情報PDT101や検索情報SDT101等のユーザ情報を、ユーザU101が利用する端末装置10から取得する。例えば、取得部131は、位置情報PDT102や検索情報SDT102等のユーザ情報を、ユーザU102が利用する端末装置10から取得する。例えば、取得部131は、位置情報PDT103や検索情報SDT103等のユーザ情報を、ユーザU103が利用する端末装置10から取得する。また、例えば、取得部131は、位置情報PDT104や検索情報SDT104等のユーザ情報を、ユーザU104が利用する端末装置10から取得する。また、例えば、取得部131は、各ユーザの診断結果PEDを、診断を行った機関(医療機関等)から取得する。
【0101】
図1の例では、取得部131は、学習データLD1を取得する。例えば、取得部131は、データDT101〜DT104等を含む学習データLD1を取得する。
【0102】
図2の例では、取得部131は、ユーザU1のユーザ情報UDT1を取得する。例えば、取得部131は、ユーザU1が利用する端末装置10からユーザU1の位置情報PDT1や検索情報SDT1を含むユーザ情報UDT1を取得する。例えば、取得部131は、位置LC1や位置LC2等にユーザU1が位置したことを示す位置情報PDT1や、クエリAAやクエリBB等によりユーザU1が検索を行ったことを示す検索情報SDT1を含むユーザ情報UDT1を取得する。
【0103】
(生成部132)
生成部132は、各種情報を生成する。例えば、生成部132は、学習データ記憶部121に記憶された学習データを用いて、モデル情報記憶部122に示すようなモデルを生成する。例えば、生成部132は、取得部131により取得された学習データに基づいて、ユーザの健康リスクの推定に用いられるモデルを生成する。例えば、生成部132は、ユーザの位置情報を含むユーザ情報と、ユーザに対応付けられた健康リスクの種別を示す正解情報とを含む学習データに基づいて、ユーザの健康リスクの推定に用いられるモデルを生成する。
【0104】
例えば、生成部132は、モデルM1〜M3等を生成し、生成したモデルM1〜M3等をモデル情報記憶部122に格納する。なお、生成部132は、いかなる学習アルゴリズムを用いてモデルM1〜M3等を生成してもよい。例えば、生成部132は、ニューラルネットワーク(neural network)、サポートベクターマシン(SVM)、クラスタリング、強化学習等の学習アルゴリズムを用いてモデルM1〜M3等を生成する。一例として、生成部132がニューラルネットワークを用いてモデルM1〜M3等を生成する場合、モデルM1〜M3等は、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。
【0105】
生成部132は、モデルを生成し、生成したモデルをモデル情報記憶部122に格納する。具体的には、生成部132は、ユーザの位置情報を含むユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの健康リスクの推定に用いられるスコアの値を出力層から出力するモデルを生成する。
【0106】
図1の例では、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、モデル情報記憶部122に示すように、モデルM1〜M3等を生成する。例えば、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、学習データ記憶部121中のデータDT101〜DT104等を学習データ(教師データ)として、学習を行なうことにより、モデルを生成する。
【0107】
例えば、生成部132は、ユーザの位置情報を含むユーザ情報に関する特徴量を用いて、モデルを生成する。例えば、生成部132は、ユーザの位置情報に関する特徴量を用いて、モデルを生成する。また、例えば、生成部132は、ユーザの検索情報に関する特徴量を用いて、モデルを生成する。例えば、生成部132は、ユーザが検索に用いたクエリに関する特徴量を用いて、モデルを生成する。このように、生成部132は、ユーザに対応する特徴を学習し、そのユーザの健康リスクを推定するモデルを生成する。
図1の例では、生成部132は、ユーザの位置情報や検索情報等に関する特徴を学習し、そのユーザの健康リスクを推定するモデルを生成する。
【0108】
図1の例では、生成部132は、学習データLD1を用いてモデルM1を生成する。例えば、生成部132は、正解情報RDT101に含まれるユーザU101の診断結果PEDにおいてAリスクが「有」である場合、モデルM1にデータDT101に含まれるユーザ情報が入力された場合に、モデルM1が出力するスコアが「1」に近づくように、学習処理を行う。例えば、生成部132は、データDT101の位置情報PDT101や検索情報SDT101がモデルM1に入力された場合に、モデルM1が出力するスコアが「1」に近づくように、学習処理を行う。
【0109】
また、例えば、生成部132は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてAリスクが「無」である場合、モデルM1にデータDT102に含まれるユーザ情報が入力された場合に、モデルM1が出力するスコアが「0」に近づくように、学習処理を行う。例えば、生成部132は、データDT102の位置情報PDT102や検索情報SDT102がモデルM1に入力され場合に、モデルM1が出力するスコアが「0」に近づくように、学習処理を行う。
【0110】
例えば、生成部132は、学習データLD1を用いてモデルM2を生成する。例えば、生成部132は、正解情報RDT103に含まれるユーザU103の診断結果PEDにおいてBリスクが「有」である場合、モデルM2にデータDT103に含まれるユーザ情報が入力された場合に、モデルM2が出力するスコアが「1」に近づくように、学習処理を行う。例えば、生成部132は、データDT103の位置情報PDT103や検索情報SDT103がモデルM2に入力された場合に、モデルM2が出力するスコアが「1」に近づくように、学習処理を行う。
【0111】
また、例えば、生成部132は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてBリスクが「無」である場合、モデルM2にデータDT102に含まれるユーザ情報が入力された場合に、モデルM2が出力するスコアが「0」に近づくように、学習処理を行う。例えば、生成部132は、データDT102の位置情報PDT102や検索情報SDT102がモデルM2に入力され場合に、モデルM2が出力するスコアが「0」に近づくように、学習処理を行う。
【0112】
例えば、生成部132は、学習データLD1を用いてモデルM3を生成する。例えば、生成部132は、正解情報RDT104に含まれるユーザU104の診断結果PEDにおいてCリスクが「有」である場合、モデルM3にデータDT104に含まれるユーザ情報が入力された場合に、モデルM3が出力するスコアが「1」に近づくように、学習処理を行う。例えば、生成部132は、データDT104の位置情報PDT104や検索情報SDT104がモデルM3に入力された場合に、モデルM3が出力するスコアが「1」に近づくように、学習処理を行う。
【0113】
また、例えば、生成部132は、正解情報RDT102に含まれるユーザU102の診断結果PEDにおいてCリスクが「無」である場合、モデルM3にデータDT102に含まれるユーザ情報が入力された場合に、モデルM3が出力するスコアが「0」に近づくように、学習処理を行う。例えば、生成部132は、データDT102の位置情報PDT102や検索情報SDT102がモデルM3に入力され場合に、モデルM3が出力するスコアが「0」に近づくように、学習処理を行う。
【0114】
図2の例では、生成部132は、健康リスク一覧HRL1を生成する。例えば、生成部132は、
図2中の健康リスク一覧HRL1に示すように、ユーザU1について、Aリスクのリスクレベルを「高」、Bリスクのリスクレベルを「低」、Cリスクのリスクレベルを「中」と推定したことを示す情報を生成する。
【0115】
(推定部133)
推定部133は、各種情報を推定する。推定部133は、学習データ記憶部121と、モデル情報記憶部122と、健康リスク情報記憶部124等に記憶された情報を用いて種々の情報を推定する。例えば、推定部133は、取得部131により取得された各種情報に基づいて、種々の情報を推定する。
【0116】
また、推定部133は、取得部131により取得されたユーザ情報に基づいて、ユーザの健康リスクを推定する。例えば、推定部133は、位置情報により推定されるユーザの移動に関する情報に基づいて、ユーザの健康リスクを推定する。例えば、推定部133は、位置情報により推定されるユーザの滞在地に関する情報に基づいて、ユーザの健康リスクを推定する。例えば、推定部133は、位置情報により推定されるユーザの滞在地に関する情報に基づいて、ユーザの健康リスクを推定する。例えば、推定部133は、ユーザの飲食に関する情報を含むユーザ情報を取得する。
【0117】
例えば、推定部133は、所定のユーザに対応付けられた健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定する。例えば、推定部133は、所定のユーザが診断された健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定する。
【0118】
図2の例では、推定部133は、各モデルM1〜M3等が出力したスコアに基づいて、ユーザU1の健康リスクを推定する。例えば、推定部133は、モデルが出力するスコアが0.25未満である場合、そのモデルに対応する種別について、ユーザの健康リスクが「低」と推定する。また、推定部133は、ユーザ情報が入力されたモデルM1が出力するスコアが0.25以上0.65未満である場合、そのモデルに対応する種別について、ユーザの健康リスクが「中」と推定する。また、推定部133は、ユーザ情報が入力されたモデルM1が出力するスコアが0.65以上である場合、そのモデルに対応する種別について、ユーザの健康リスクが「高」と推定する。
【0119】
図2の例では、推定部133は、Aリスク〜Cリスク等の各種別の健康リスクが「低」、「中」、「高」のいずれのレベルであるかを推定する。推定部133は、
図2中の健康リスク一覧HRL1に示すように、Aリスクのリスクレベルを「高」、Bリスクのリスクレベルを「低」、Cリスクのリスクレベルを「中」と推定する。
【0120】
例えば、推定部133は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、スコアの算出を行う。具体的には、モデルM1は、ユーザの位置情報を含むユーザ情報(すなわち、上述したスコアの算出に用いられる各要素)が入力された場合に、所定の対象の推定を定量化した値(すなわち、所定のエリアにおいて所定の対象に関する需要が発生する可能性が高いかを示唆するスコア)を出力するように係数が設定される。推定部133は、このようなモデルM1を用いて、各出品の対象に関するスコアを算出する。
【0121】
なお、上記例では、モデルM1が、ユーザの位置情報を含むユーザ情報が入力された場合に、ユーザの健康リスクの推定を定量化した値を出力するモデルである例を示した。しかし、実施形態に係るモデル(モデルX)は、モデルM1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルXは、ユーザの位置情報を含むユーザ情報を入力とし、モデルM1が出力するスコアを出力とするよう学習されたモデル(モデルY)であってもよい。または、モデルM1は、ユーザの位置情報を含むユーザ情報を入力とし、モデルYの出力値を出力とするよう学習されたモデルであってもよい。また、推定部133がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルM1は、GANの一部を構成するモデルであってもよい。
【0122】
(提供部134)
提供部134は、各種情報を提供する。例えば、提供部134は、端末装置10に各種情報を提供する。例えば、提供部134は、推定部133により推定されたユーザの健康リスクに関するサービスを提供する。例えば、提供部134は、推定部133により推定されたユーザの健康リスクに関する情報を、ユーザに提供する。例えば、提供部134は、推定部133により推定されたユーザの健康リスクに関する情報を、ユーザが利用する端末装置10に提供する。また、例えば、提供部134は、生成部132により生成されたモデルに関する情報を外部の情報処理装置へ提供してもよい。また、例えば、提供部134は、モデルが出力する情報を外部の情報処理装置へ提供してもよい。
【0123】
例えば、提供部134は、推定したユーザの健康リスクに基づいて情報提供を行う。
図2の例では、提供部134は、健康リスク一覧HRL1を端末装置10へ提供する。例えば、提供部134は、ユーザU1が利用する端末装置10に健康リスク一覧HRL1を送信する。また、例えば、提供部134は、ユーザU1が属する事業体の情報処理装置に健康リスク一覧HRL1を送信してもよい。
【0124】
〔4.生成処理のフロー〕
次に、
図9を用いて、実施形態に係る推定システム1による生成処理の手順について説明する。
図9は、実施形態に係る生成処理の一例を示すフローチャートである。
【0125】
図9に示すように、推定装置100は、学習データを取得する(ステップS101)。例えば、推定装置100は、学習データ記憶部121から学習データを取得する。
【0126】
その後、推定装置100は、学習データに基づきモデルを生成する(ステップS102)。
図1の例では、推定装置100は、学習データ記憶部121から学習データを用いてモデルM1〜M3等を生成する。
【0127】
〔5.推定処理のフロー〕
次に、
図10を用いて、実施形態に係る推定システム1による生成処理の手順について説明する。
図10は、実施形態に係る推定処理の一例を示すフローチャートである。
【0128】
図10に示すように、推定装置100は、ユーザの位置情報を含むユーザ情報を取得する(ステップS201)。
図2の例では、推定装置100は、ユーザU1のユーザ情報UDT1を取得する。
【0129】
また、推定装置100は、ユーザ情報とモデルを用いてユーザの健康リスクを推定する(ステップS202)。
図2の例では、推定装置100は、各モデルM1〜M3等が出力したスコアに基づいて、ユーザU1の健康リスクを推定する。
【0130】
また、推定装置100は、推定したユーザの健康リスクに関する情報を提供する(ステップS203)。
図2の例では、推定装置100は、健康リスク一覧HRL1を端末装置10へ提供する。
【0131】
〔6.効果〕
上述してきたように、実施形態に係る推定装置100は、取得部131と、推定部133とを有する。取得部131は、ユーザの位置情報を含むユーザ情報を取得する。また、推定部133は、取得部131により取得されたユーザ情報に基づいて、ユーザの健康リスクを推定する。
【0132】
このように、実施形態に係る推定装置100は、ユーザの位置情報を含むユーザ情報に基づいて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0133】
また、実施形態に係る推定装置100において、推定部133は、位置情報により推定されるユーザの移動に関する情報に基づいて、ユーザの健康リスクを推定する。
【0134】
このように、実施形態に係る推定装置100は、位置情報により推定されるユーザの移動に関する情報に基づいて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0135】
また、実施形態に係る推定装置100において、推定部133は、位置情報により推定されるユーザの滞在地に関する情報に基づいて、ユーザの健康リスクを推定する。
【0136】
このように、実施形態に係る推定装置100は、位置情報により推定されるユーザの滞在地に関する情報に基づいて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0137】
また、実施形態に係る推定装置100において、推定部133は、位置情報により推定されるユーザの生活パターンに関する情報に基づいて、ユーザの健康リスクを推定する。
【0138】
このように、実施形態に係る推定装置100は、位置情報により推定されるユーザの生活パターンに関する情報に基づいて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0139】
また、実施形態に係る推定装置100において、取得部131は、ユーザが検索に用いた検索クエリに関する情報を含むユーザ情報を取得する。
【0140】
このように、実施形態に係る推定装置100は、ユーザが検索に用いた検索クエリに関する情報を含むユーザ情報を取得することにより、ユーザの健康リスクを適切に推定することができる。
【0141】
また、実施形態に係る推定装置100において、取得部131は、ユーザが購入した商品に関する情報を含むユーザ情報を取得する。
【0142】
このように、実施形態に係る推定装置100は、ユーザが購入した商品に関する情報を含むユーザ情報を取得することにより、ユーザの健康リスクを適切に推定することができる。
【0143】
また、実施形態に係る推定装置100において、取得部131は、ユーザの飲食に関する情報を含むユーザ情報を取得する。
【0144】
このように、実施形態に係る推定装置100は、ユーザの飲食に関する情報を含むユーザ情報を取得することにより、ユーザの健康リスクを適切に推定することができる。
【0145】
また、実施形態に係る推定装置100において、推定部133は、所定のユーザに対応付けられた健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定する。
【0146】
このように、実施形態に係る推定装置100は、所定のユーザに対応付けられた健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0147】
また、実施形態に係る推定装置100において、推定部133は、所定のユーザが診断された健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定する。
【0148】
このように、実施形態に係る推定装置100は、所定のユーザが診断された健康リスクの種別を示す正解情報と、所定のユーザのユーザ情報とに基づいて生成されるモデルを用いて、ユーザの健康リスクを推定することにより、ユーザの健康リスクを適切に推定することができる。
【0149】
また、実施形態に係る推定装置100は、提供部134を有する。提供部134は、推定部133により推定されたユーザの健康リスクに関するサービスを提供する。
【0150】
このように、実施形態に係る推定装置100は、推定されたユーザの健康リスクに関するサービスを提供することができる。
【0151】
〔7.ハードウェア構成〕
上述してきた実施形態に係る推定装置100は、例えば
図11に示すような構成のコンピュータ1000によって実現される。
図11は、推定装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0152】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0153】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
【0154】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0155】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0156】
例えば、コンピュータ1000が実施形態に係る推定装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムまたはデータ(例えば、モデルM1(モデルデータMDT1))を実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータ(例えば、モデルM1(モデルデータMDT1))を記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0157】
以上、本願の実施形態及び変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0158】
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0159】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0160】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0161】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。