(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-06
(45)【発行日】2024-03-14
(54)【発明の名称】推論装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20240307BHJP
【FI】
G06N20/00
(21)【出願番号】P 2021526041
(86)(22)【出願日】2020-06-03
(86)【国際出願番号】 JP2020021978
(87)【国際公開番号】W WO2020250781
(87)【国際公開日】2020-12-17
【審査請求日】2023-04-07
(31)【優先権主張番号】P 2019108036
(32)【優先日】2019-06-10
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】392026693
【氏名又は名称】株式会社NTTドコモ
(74)【代理人】
【識別番号】100088155
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100121980
【氏名又は名称】沖山 隆
(74)【代理人】
【識別番号】100128107
【氏名又は名称】深石 賢治
(74)【代理人】
【識別番号】100183438
【氏名又は名称】内藤 泰史
(72)【発明者】
【氏名】橋本 雅人
(72)【発明者】
【氏名】倉沢 央
(72)【発明者】
【氏名】山田 直治
【審査官】▲はま▼中 信行
(56)【参考文献】
【文献】国際公開第2016/152053(WO,A1)
【文献】特開2017-151867(JP,A)
【文献】特開2014-157457(JP,A)
【文献】特開2014-71859(JP,A)
【文献】特開2010-73189(JP,A)
【文献】米国特許出願公開第2019/0102718(US,A1)
【文献】韓国登録特許第10-1936283(KR,B1)
【文献】中国特許出願公開第107977638(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
期間の経過に応じた特徴量の値の変化を示す生存期間情報を、特徴量毎に複数の観測対象について取得する第1取得部と、
前記生存期間情報を用いて回帰分析を行うことにより、特徴量の値の変化を予測する特徴量変化モデルを特徴量毎に構築する第1モデル構築部と、
複数の観測対象から、各特徴量に係る属性学習情報を取得する第2取得部と、
前記属性学習情報に各特徴量の前記特徴量変化モデルを適用することにより、複数の観測対象について、期間毎の各特徴量の値を導出する特徴量変化推論部と、
各特徴量の組み合わせ毎に、観測対象の属性を推論する属性推論モデルを構築する第2モデル構築部と、
前記特徴量変化推論部によって導出された、複数の観測対象についての各期間の各特徴量の値に基づき、各期間における各属性推論モデルの推論精度を導出するモデル評価部と、を備える推論装置。
【請求項2】
所定の推論精度の保証期間に関する条件である保証条件を取得する第3取得部と、
前記モデル評価部によって導出された各期間の推論精度が前記保証条件を満たす前記属性推論モデルを出力するモデル出力部と、を更に備える請求項1記載の推論装置。
【請求項3】
前記モデル出力部によって出力された前記属性推論モデルの特徴量に係る属性推論情報を観測対象から取得する第4取得部と、
前記属性推論情報を、前記モデル出力部によって出力された前記属性推論モデルに入力することにより、観測対象の属性を推論する推論処理部と、
前記推論処理部による推論結果を出力する推論結果出力部と、を更に備える請求項2記載の推論装置。
【請求項4】
前記モデル出力部は、出力する前記属性推論モデルが、前記保証条件に係る前記所定の推論精度を満たす期間を、モデル有効期間としてさらに出力する、請求項3記載の推論装置。
【請求項5】
前記推論結果出力部は、前記モデル有効期間を、前記推論結果の保証期間としてさらに出力する、請求項4記載の推論装置。
【請求項6】
前記第1モデル構築部は、前記生存期間情報にワイブル分布を当てはめることにより、前記特徴量変化モデルを構築する、請求項1~5のいずれか一項記載の推論装置。
【請求項7】
前記第2モデル構築部は、前記属性学習情報に基づいて、前記属性推論モデルを構築する、請求項1~6のいずれか一項記載の推論装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一態様は、推論装置に関する。
【背景技術】
【0002】
従来、観測対象の特性(特徴量)を推論モデルに入力することにより、該観測対象の属性を推論する技術が知られている。例えば特許文献1に記載されたシステムでは、推論モデルの推論精度を向上させることを目的として、特徴量選択とモデル評価とを繰り返し行い、探索的に特徴量選択を行っている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、上述したような従来の技術においては、推論モデルの経年劣化が考慮されていない。すなわち、従来の技術においては、期間が経過したことによる推論精度の変化がわからず、経年劣化を考慮した推論モデルを構築することができていない。このことにより、構築した推論モデルが早期に劣化してしまい、期間の経過に伴って推論精度が大きく低下するおそれがある。また、推論モデルの更新頻度を適切に設定することができないため、推論装置の開発コストを正確に算出することが困難である。
【0005】
本発明の一態様は上記実情に鑑みてなされたものであり、期間の経過に対する推論精度の変化を適切に推論することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係る推論装置は、期間の経過に応じた特徴量の値の変化を示す生存期間情報を、特徴量毎に複数の観測対象について取得する第1取得部と、生存期間情報を用いて回帰分析を行うことにより、特徴量の値の変化を予測する特徴量変化モデルを特徴量毎に構築する第1モデル構築部と、複数の観測対象から、各特徴量に係る属性学習情報を取得する第2取得部と、属性学習情報に各特徴量の特徴量変化モデルを適用することにより、複数の観測対象について、期間毎の各特徴量の値を導出する特徴量変化推論部と、各特徴量の組み合わせ毎に、観測対象の属性を推論する属性推論モデルを構築する第2モデル構築部と、特徴量変化推論部によって導出された、複数の観測対象についての各期間の各特徴量の値に基づき、各期間における各属性推論モデルの推論精度を導出するモデル評価部と、を備える。
【0007】
本発明の一態様に係る推論装置では、生存期間情報に基づき構築された特徴量変化モデルによって、期間毎の特徴量の値が導出される。そして、複数の観測対象についての各期間の各特徴量の値に基づいて、各特徴量の組み合わせ毎に構築される属性推論モデルの各期間における推論精度が導出される。このように、本発明の一態様に係る推論装置では、期間が経過したことによる特徴量の値の変化を考慮して、各期間における各属性推論モデルの推論精度が導出されるので、各属性推論モデルについて、期間の経過に対する推論精度の変化(各属性推論モデルの経年劣化)を適切に推論することができる。このことにより、早期に劣化しにくい属性推論モデルを選択することが可能になり、期間の経過に伴って推論精度が低下することを抑制できる。また、期間の経過に対する推論精度の変化(経年劣化する時期)を特定することができるため、属性推論モデルの更新頻度を適切に設定し、推論装置の開発コスト等を高精度に算出することができる。
【発明の効果】
【0008】
本発明の一態様によれば、期間の経過に対する推論精度の変化を適切に推論することができる。
【図面の簡単な説明】
【0009】
【
図1】本実施形態に係る推論装置の機能構成を示す図である。
【
図2】特徴量変化モデルの構築について説明する図である。
【
図3】特徴量の値の経年変化の推論について説明する図である。
【
図4】特徴量の組み合わせ集合の一例を示す図である。
【
図5】属性推論モデルの推論精度の評価を説明する図である。
【
図6】各特徴量の組み合わせの推論精度保証曲線を示す図である。
【
図7】各特徴量の組み合わせのスコア及び有効期限を示す図である。
【
図8】ユーザの属性を推論する推論処理を説明する図である。
【
図9】推論装置が実行する処理を示すフローチャートである。
【
図10】推論装置が実行する処理を示すフローチャートである。
【
図11】推論装置が実行する処理を示すフローチャートである。
【
図12】推論装置が実行する処理を示すフローチャートである。
【
図13】推論装置が実行する処理を示すフローチャートである。
【
図14】推論装置のハードウェア構成を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。図面の説明において、同一又は同等の要素には同一符号を用い、重複する説明を省略する。
【0011】
図1は、本実施形態に係る推論装置1の機能構成を示す図である。推論装置1は、観測対象の一例であるユーザの属性を推論する属性推論モデルを構築する。なお、推論装置1は、ユーザ(すなわち人)以外の観測対象の属性を推論する属性推論モデルを構築してもよい。以下では、推論装置1がユーザの属性を推論する属性推論モデルを構築するとして説明する。属性推論モデルは、ユーザの特性(特徴量)を入力として、推論結果であるユーザの属性を出力するものである。ユーザの特徴量とは、ユーザの行動又は性質等から得られる情報であり、例えば、「楽曲Aの再生有無」(ユーザの行動)、「映画好き」(ユーザの性質)等である。ユーザの特徴量の値は、例えば「1」又は「0」の2値で示され、例えば「楽曲Aの再生有無」との特徴量に対して、再生していれば「1」、再生していなければ「0」のように示される。ユーザの属性とは、一又は複数のユーザの特徴量の値に基づき推論される、ユーザの性質である。例えば、「楽曲Aの再生有無」及び「楽曲Bの再生有無」との特徴量の値に応じて、「演歌好きである」とのユーザの属性が推論される。なお、ユーザの属性は、2値(例えば「好き」か「嫌い」か)ではなく、スコアで示されてもよい。すなわち、例えば複数の特徴量の値に応じて、「演歌好きである」とのユーザの属性がスコアで示されてもよい。
【0012】
推論装置1は、特徴量の組み合わせ毎に属性推論モデルを構築し(詳細は後述)、各属性推論モデルについて、各期間の推論精度を導出する。このように、各期間の推論精度が導出されることによって、期間の経過に対する推論精度の変化(属性推論モデルの経年劣化)を適切に推論することができる。このことで、各属性推論モデルのうち、経年劣化しにくい属性推論モデルを特定し、該属性推論モデルを用いて、長期間にわたって、高精度にユーザの属性を推定することが可能となる。以下では、推論装置1の詳細な機能について説明する。
【0013】
図1に示されるように、推論装置1は、生存期間情報入力部10(第1取得部)と、特徴量変化モデル構築部11(第1モデル構築部)と、特徴量変化モデル記憶部12と、属性学習情報入力部20(第2取得部)と、特徴量変化推論部21と、特徴量変化値記憶部22と、属性推論モデル構築部30(第2モデル構築部)と、属性推論モデル記憶部31と、推論精度保証条件入力部40(第3取得部)と、モデル評価部41と、モデル出力部50と、属性推論情報入力部60(第4取得部)と、推論処理部61と、推論結果出力部62と、を備えている。
【0014】
生存期間情報入力部10は、期間の経過に応じた特徴量の変化を示す特徴量生存期間情報(生存期間情報)を、特徴量毎に複数のユーザについて取得する。生存期間情報入力部10は、上述した特徴量生存期間情報を、複数のユーザそれぞれから取得してもよいし、複数のユーザ分まとめて外部装置から取得してもよい。
図2には、「楽曲Aの再生有無」という特徴量について、m-1月の複数のユーザのデータ(特徴量の値)D_{-1}、及び、m月の複数のユーザのデータ(特徴量の値)D_{0}の2つのデータからなる、特徴量生存期間情報が示されている。すなわち、
図2には、特徴量生存期間情報として、期間の経過(1月の経過)に応じた「楽曲Aの再生有無」という特徴量の変化が示されている。なお、特徴量生存期間情報としては、
図2のように2つの期間だけでなく、3つ以上のより多くの期間のデータが用いられてもよい。生存期間情報入力部10は、取得した特徴量生存期間情報を特徴量変化モデル構築部11に出力する。
【0015】
特徴量変化モデル構築部11は、特徴量生存期間情報を用いて回帰分析を行うことにより、特徴量の値の変化を予測する特徴量変化モデルを特徴量毎に構築する。
図2に示される例では、m-1月のデータ(特徴量の値)D_{-1}と、m月のデータ(特徴量の値)D_{0}とを比較すると、一部のユーザの特徴量の値が変化している。特徴量変化モデル構築部11は、このような経年変化を回帰分析でモデル化することにより特徴量変化モデルを構築する。特徴量変化モデル構築部11は、例えば特徴量生存期間情報にワイブル分布を当てはめることにより、特徴量変化モデルを構築してもよい。ワイブル分布が用いられる場合には、
図2の右図に示されるように、生存率分析が行われて、経年変化の確率が生存率曲線で示される。
図2に示される生存率曲線の例では、1か月後において40%の確率で特徴量の値が変化する(生存率60%である)ことを示している。
【0016】
特徴量変化モデル記憶部12は、特徴量変化モデル構築部11によって構築された特徴量変化モデルを記憶(保存)する。
【0017】
属性学習情報入力部20は、複数のユーザから、各特徴量に係る属性学習情報を取得する。ここでは、属性学習情報には、特徴量変化モデル構築部11によって特徴量変化モデルが構築された特徴量に関する情報が含まれているとする。属性学習情報入力部20は、取得した属性学習情報を特徴量変化推論部21及び属性推論モデル構築部30に出力する。
【0018】
特徴量変化推論部21は、属性学習情報に各特徴量の特徴量変化モデルを適用することにより、複数のユーザについて、期間毎の各特徴量の値(変化値)を導出する。特徴量変化推論部21は、特徴量変化モデル記憶部12を参照することにより特徴量変化モデルを取得する。そして、特徴量変化推論部21は、特徴量毎に、特徴量変化モデルに属性学習情報を入力することにより、各期間における各ユーザの特徴量の値(変化値)を導出する。
図3に示される例では、各ユーザの属性学習情報に基づき、特徴量である「楽曲Aの再生有無」のm月のデータ(特徴量の値)D_{0}が得られている。この場合、特徴量変化推論部21は、m月のデータD_{0}に、「楽曲Aの再生有無」の特徴量変化モデルを適用することにより、各月(1ヶ月後、2ヶ月後、…Lヶ月後)の特徴量の値(変化値)を導出する。
【0019】
特徴量変化値記憶部22は、特徴量変化推論部21によって導出された期間毎の各特徴量の値(変化値)を記憶(保存)する。
【0020】
属性推論モデル構築部30は、各特徴量の組み合わせ毎に、ユーザの属性を推論する属性推論モデルを構築する。各特徴量の組み合わせとは、例えば、ユーザの属性を推論する際に用いられる各特徴量について考えうる全ての組み合わせである。いま、特徴量として、「楽曲Aの再生有無」及び「楽曲Bの再生有無」があるとする。この場合、特徴量の組み合わせしては、
図4に示されるように、組み合わせ番号1で示された「楽曲Aの再生有無」単独(
図4中では「A」と記載)、組み合わせ番号2で示された「楽曲Bの再生有無」単独(
図4中では「B」と記載)、組み合わせ番号3で示された「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせ(
図4中では「A,B」と記載)の3種類が考えられる。この場合、属性推論モデル構築部30は、3種類の組み合わせのそれぞれについて、属性推論モデルを構築する。
【0021】
いま、例えば、「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせについて属性推論モデルを構築する場合を考える。この場合、
図5に示されるように、属性推論モデル構築部30は、属性学習情報である、「楽曲Aの再生有無」のm月のデータ(特徴量の値)D_{0}及び「楽曲Bの再生有無」のm月のデータ(特徴量の値)D_{0}を学習することにより、「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせの属性推論モデルを構築する。
【0022】
属性推論モデル記憶部31は、属性推論モデル構築部30によって構築された各特徴量の組み合わせ毎の属性推論モデルを記憶(保存)する。
【0023】
推論精度保証条件入力部40は、所定の推論精度の保証期間に関する条件である保証条件を取得する。保証条件は、推論精度の目標値(Y%)を継続して達成する期間Xで規定されている。推論精度保証条件入力部40は、保証条件をモデル評価部41に出力する。
【0024】
モデル評価部41は、特徴量変化推論部21によって導出された、複数のユーザについての各期間の各特徴量の値(変化値)に基づき、各期間における各属性推論モデルの推論精度を導出し、各属性推論モデルを評価する。
図5に示される例では、モデル評価部41は、特徴量変化値記憶部22を参照し、m月を基準として、m+1月、m+2月、…m+L月の各特徴量の値(すなわち、「楽曲Aの再生有無」の値及び「楽曲Bの再生有無」の値)を取得する。そして、モデル評価部41は、それぞれの期間について、特徴量の値を、「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせの属性推論モデルに入力して、該属性推論モデルの推論精度を導出し、該属性推論モデルを評価する。モデル評価部41は、例えばk分割交差検定により各期間における属性推論モデルの推論精度の評価を行う。評価値は、例えばAccuracy(正答率)である。期間が経過するにつれて特徴量の値の変化が大きくなるため、属性推論モデルの推論精度は、期間が経過するにつれて悪化する。
【0025】
モデル評価部41は、導出した各期間の評価値に基づき推論精度保証曲線を生成する。
図6は、各特徴量の組み合わせ(
図4参照)の推論精度保証曲線を示す図である。
図6において、横軸は経過期間を示しており、縦軸は評価精度(%)を示しており、横軸には保証条件の期間Xが示されており、縦軸には推論精度の目標値Yが示されている。
図6に示される例では、モデル評価部41は、組み合わせ番号1:「楽曲Aの再生有無」に基づく属性推論モデルの推論精度保証曲線と、組み合わせ番号2:「楽曲Bの再生有無」に基づく属性推論モデルの推論精度保証曲線と、組み合わせ番号3:「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせに基づく属性推論モデルの推論精度保証曲線とを生成している。各推論精度保証曲線は、期間とその期間における評価値(正答率)とで決まる座標を曲線で結ぶ(評価値を導出した期間分だけ存在する座標を曲線で結ぶ)ことにより定まる。ここで、
図6に示される例では、組み合わせ番号3:「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせに基づく属性推論モデルの推論精度保証曲線のみが、期間Xにおいて推論精度の目標値Yを達成している(すなわち保証条件を満たしている)。モデル評価部41は、例えば、推論精度保証曲線が保証条件を満たす属性推論モデルの評価を高くする。
【0026】
図6に示される例において、モデル評価部41は、推論精度保証曲線における、推論精度の目標値Yよりも評価精度が高い領域の大きさを、該推論精度保証曲線のスコアとして導出する。また、モデル評価部41は、推論精度保証曲線における、推論精度の目標値Yよりも推論精度が高い期間(保証条件に係る所定の推論精度を満たす期間)を、該推論精度保証曲線の有効期限(モデル有効期間)として導出する。
図7は、各特徴量の組み合わせ(推論精度保証曲線)のスコア及び有効期限を示す図である。
図7に示されるように、上述した例では、組み合わせ番号3:「楽曲Aの再生有無」及び「楽曲Bの再生有無」の組み合わせに基づく属性推論モデルが、スコアが最も高く有効期限が長くなっている。
モデル評価部41は、属性推論モデルが構築された各特徴量の組み合わせと、生成した各推論精度保証曲線と、各推論精度保証曲線のスコア及び有効期限とを属性推論モデル記憶部31に格納する。
【0027】
モデル出力部50は、モデル評価部41による評価が高い属性推論モデルを選択して出力する。モデル出力部50は、例えば、モデル評価部41によって導出された各期間の推論精度が保証条件を満たす(すなわち有効期限が保証条件の期間Xよりも長い)属性推論モデルを出力する。モデル出力部50は、推論精度保証条件を満たす最も精度が高い属性推論モデルを出力してもよい。モデル出力部50は、属性推論モデル記憶部31を参照し、出力対象の属性推論モデルの推論精度保証曲線と、特徴量の組み合わせパターンと、スコア及び有効期限とを、外部装置(不図示)及び推論処理部61に出力する。ここでの外部装置(不図示)とは、例えばユーザに情報を表示する表示装置等である。
【0028】
属性推論情報入力部60は、属性推論情報を取得する。属性推論情報とは、属性を推論する対象のユーザから入力される該ユーザの特徴量に係る情報である。ここでは、属性推論情報とは、上述したモデル出力部50によって推論処理部61に出力された属性推論モデルの特徴量に係る情報である。属性推論情報入力部60は、属性推論情報を推論処理部61に出力する。
【0029】
推論処理部61は、属性推論情報を、モデル出力部50によって出力された属性推論モデルに入力することにより、ユーザの属性を推論する。例えば
図8に示される例では、属性推論情報として「楽曲Aの再生有無」及び「楽曲Bの再生有無」が属性推論モデル(有効期限:18カ月)に入力され、各ユーザについて、「演歌好きである」というユーザの属性のスコアが導出(推論)されている。推論処理部61は、推論結果を推論結果出力部62に出力する。
【0030】
推論結果出力部62は、推論処理部61による推論結果を外部装置(不図示)に出力する。推論結果出力部62は、推論結果として、ユーザの属性の確度であるスコア(推定値)を出力すると共に、推論に用いた属性推論モデルの有効期限を推論結果の保証期間として出力する。
【0031】
次に、
図9~
図13を参照して推論装置1が実行する処理を説明する。
【0032】
図9は、特徴量変化モデルの構築に係る処理を示すフローチャートである。
図9に示されるように、推論装置1では、まず、特徴量毎に複数のユーザについて特徴量生存期間情報が取得される(ステップS1)。つづいて、特徴量生存期間情報に対して回帰分析が行われることにより、特徴量毎に特徴量変化モデルが構築される(ステップS2)。推論装置1は、特徴量変化モデルを記憶する(ステップS3)。
【0033】
図10は、期間毎の特徴量の値(変化値)の導出に係る処理を示すフローチャートである。
図10に示されるように、推論装置1では、まず、複数のユーザから各特徴量に係る属性学習情報が取得される(ステップS11)。つづいて、記憶されている特徴量変化モデルが取得される(ステップS12)。つづいて、特徴量毎に、特徴量変化モデルに属性学習情報が入力されることにより、各期間における各ユーザの特徴量の値(変化値)が導出される(ステップS13)。推論装置1は、導出した各期間における各ユーザの特徴量の値(変化値)を記憶する(ステップS14)。
【0034】
図11は、属性推論モデルの構築及び属性推論モデルの評価に係る処理を示すフローチャートである。
図11に示されるように、推論装置1では、まず、特徴量変化値記憶部22から各期間における各ユーザの特徴量の値(変化値)Dが取得される(ステップS21)。つづいて、変化値Dが学習データDtrainとテストデータDtestとに分割される(ステップS22)。そして、例えば
図4に示されるような、特徴量の組み合わせ集合Cが生成される(ステップS23)。推論装置1は、各特徴量の組み合わせ毎に、学習データDtrainを学習することにより、属性推論モデルを構築する(ステップS24)。そして、構築した属性推論モデルに、テストデータDtestが入力されることにより、各期間における属性推論モデルの推論精度が導出され、属性推論モデルが評価される(ステップS25)。
【0035】
つづいて、推論装置1では、推論精度保証条件の推論保証期間Xと目標評価値Yとが取得される(ステップS26)。そして、期間Xと目標値Yと各期間の評価値とに基づいて、推論精度保証曲線が構築される(ステップS27)。最後に、属性推論モデルが構築された各特徴量の組み合わせと、生成した各推論精度保証曲線と、各推論精度保証曲線のスコア及び有効期限とが属性推論モデル記憶部31に記憶される(ステップS28)。
【0036】
図12は、属性推論モデルの出力処理を示すフローチャートである。
図12に示されるように、推論装置1では、まず、属性推論モデル記憶部31が参照され(ステップS31)、推論精度保証条件を満たす最も精度が高い属性推論モデルが選択される(ステップS32)。そして、推論装置1は、選択した属性推論モデルを出力する(ステップS33)。
【0037】
図13は、ユーザの属性推論に係る処理を示すフローチャートである。
図13に示されるように、推論装置1では、まず、属性推論情報が取得される(ステップS41)。つづいて、モデル出力部50の出力結果が参照され(ステップS42)、属性推論モデルに属性推論情報が入力されることにより、ユーザの属性が推論される(ステップS43)。最後に、推論装置1は、ユーザの属性の確度であるスコア(推定値)を出力する(ステップS44)。
【0038】
次に、本実施形態の作用効果について説明する。
【0039】
本実施形態に係る推論装置1は、期間の経過に応じた特徴量の値の変化を示す生存期間情報を、特徴量毎に複数のユーザ(観測対象)について取得する生存期間情報入力部10と、生存期間情報を用いて回帰分析を行うことにより、特徴量の値の変化を予測する特徴量変化モデルを特徴量毎に構築する特徴量変化モデル構築部11と、複数のユーザ(観測対象)から、各特徴量に係る属性学習情報を取得する属性学習情報入力部20と、属性学習情報に各特徴量の特徴量変化モデルを適用することにより、複数のユーザ(観測対象)について、期間毎の各特徴量の値を導出する特徴量変化推論部21と、各特徴量の組み合わせ毎に、ユーザ(観測対象)の属性を推論する属性推論モデルを構築する属性推論モデル構築部30と、特徴量変化推論部21によって導出された、複数のユーザ(観測対象)についての各期間の各特徴量の値に基づき、各期間における各属性推論モデルの推論精度を導出するモデル評価部41と、を備える。
【0040】
このような推論装置1では、生存期間情報に基づき構築された特徴量変化モデルによって、期間毎の特徴量の値が導出される。そして、複数のユーザ(観測対象)についての各期間の各特徴量の値に基づいて、各特徴量の組み合わせ毎に構築される属性推論モデルの各期間における推論精度が導出される。このように、推論装置1では、期間が経過したことによる特徴量の値の変化を考慮して、各期間における各属性推論モデルの推論精度が導出されるので、各属性推論モデルについて、期間の経過に対する推論精度の変化(各属性推論モデルの経年劣化)を適切に推論することができる。このことにより、早期に劣化しにくい属性推論モデルを選択することが可能になり、期間の経過に伴って推論精度が低下することを抑制できる。すなわち、ユーザ(観測対象)の長期的な属性の推定に有効なモデルを構築することができる。また、期間の経過に対する推論精度の変化(経年劣化する時期)を特定することができるため、属性推論モデルの更新頻度を適切に設定し、推論装置の開発コスト等を高精度に算出することができる。なお、期間の経過に対する推論精度の変化を適切に把握することによって、例えば生存期間が短い特徴量の組み合わせの属性推論モデルを用いてユーザ(観測対象)の短期的属性の推定(人のライフイベント等)を適切に行うことができる。そして、上述したように、早期に劣化しにくい属性推論モデルを適切に選択することができるため、属性推論モデルの選択に係る処理量を抑制することができ、CPU等の処理部における処理負荷を軽減するという技術的効果も併せて奏する。
【0041】
推論装置1は、所定の推論精度の保証期間に関する条件である保証条件を取得する推論精度保証条件入力部40と、モデル評価部41によって導出された各期間の推論精度が保証条件を満たす属性推論モデルを出力するモデル出力部50と、を備えている。これにより、予め設定した推論精度が所定の期間において担保される属性推論モデルのみ、すなわち、所望の期間においてユーザ(観測対象)の属性の推論を高精度に行うことができる属性推論モデルのみを出力することができる。
【0042】
推論装置1は、モデル出力部50によって出力された属性推論モデルの特徴量に係る属性推論情報をユーザ(観測対象)から取得する属性推論情報入力部60と、属性推論情報を、モデル出力部50によって出力された属性推論モデルに入力することにより、ユーザ(観測対象)の属性を推論する推論処理部61と、推論処理部61による推論結果を出力する推論結果出力部62と、を備える。これにより、経年劣化しにくい属性推論モデルを用いて、ユーザ(観測対象)の属性を高精度に推論して出力することができる。
【0043】
モデル出力部50は、出力する属性推論モデルが、保証条件に係る所定の推論精度を満たす期間を、有効期限(モデル有効期間)としてさらに出力する。これにより、どのぐらいの期間については推論精度が担保される属性推論モデルであるのかを、モデル構築者に適切に通知することができる。
【0044】
推論結果出力部62は、上述した有効期限(モデル有効期間)を、推論結果の保証期間としてさらに出力する。これにより、推論結果の保証期間を適切に設定することができると共に、推論結果の保証期間を出力することによって、推論結果が有効な期間をモデル構築者に適切に通知することができる。
【0045】
特徴量変化モデル構築部11は、生存期間情報にワイブル分布を当てはめることにより、特徴量変化モデルを構築する。これにより、時間に対する劣化現象(経年劣化)を考慮した特徴量変化モデルを適切に構築することができる。
【0046】
属性推論モデル構築部30は、属性学習情報に基づいて、属性推論モデルを構築する。これにより、推定値ではなく実際の複数のユーザ(観測対象)の特徴量に基づいて、推論精度が高い属性推論モデルを構築することができる。
【0047】
最後に、推論装置1のハードウェア構成について、
図14を参照して説明する。上述の推論装置1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
【0048】
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。推論装置1のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
【0049】
推論装置1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
【0050】
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、推論装置1のモデル評価部41等の制御機能はプロセッサ1001で実現されてもよい。
【0051】
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、推論装置1のモデル評価部41等の制御機能は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
【0052】
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る無線通信方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
【0053】
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
【0054】
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
【0055】
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
【0056】
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
【0057】
また、推論装置1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
【0058】
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
【0059】
本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G、5G、FRA(Future Radio Access)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broad-band)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-Wide Band)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。
【0060】
本明細書で説明した各態様/実施形態の処理手順、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
【0061】
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
【0062】
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
【0063】
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
【0064】
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
【0065】
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
【0066】
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
【0067】
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
【0068】
また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
【0069】
ユーザ端末は、当業者によって、移動通信端末、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、またはいくつかの他の適切な用語で呼ばれる場合もある。
【0070】
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
【0071】
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
【0072】
本明細書で「第1の」、「第2の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1および第2の要素への参照は、2つの要素のみがそこで採用され得ること、または何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
【0073】
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
【0074】
本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。
【0075】
本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
【符号の説明】
【0076】
1…推論装置、10…生存期間情報入力部(第1取得部)、11…特徴量変化モデル構築部(第1モデル構築部)、20…属性学習情報入力部(第2取得部)、21…特徴量変化推論部、30…属性推論モデル構築部(第2モデル構築部)、40…推論精度保証条件入力部(第3取得部)、41…モデル評価部、50…モデル出力部、60…属性推論情報入力部(第4取得部)、61…推論処理部、62…推論結果出力部。