IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

特開2024-144924データ判定装置及びデータ判定システム
<>
  • 特開-データ判定装置及びデータ判定システム 図1
  • 特開-データ判定装置及びデータ判定システム 図2
  • 特開-データ判定装置及びデータ判定システム 図3
  • 特開-データ判定装置及びデータ判定システム 図4
  • 特開-データ判定装置及びデータ判定システム 図5
  • 特開-データ判定装置及びデータ判定システム 図6
  • 特開-データ判定装置及びデータ判定システム 図7
  • 特開-データ判定装置及びデータ判定システム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024144924
(43)【公開日】2024-10-15
(54)【発明の名称】データ判定装置及びデータ判定システム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241004BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2023057104
(22)【出願日】2023-03-31
(71)【出願人】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】100103850
【弁理士】
【氏名又は名称】田中 秀▲てつ▼
(74)【代理人】
【識別番号】100114177
【弁理士】
【氏名又は名称】小林 龍
(74)【代理人】
【識別番号】100066980
【弁理士】
【氏名又は名称】森 哲也
(72)【発明者】
【氏名】氏家 秀紀
(72)【発明者】
【氏名】高橋 文彦
(72)【発明者】
【氏名】西村 拓真
(72)【発明者】
【氏名】能上 絢香
(72)【発明者】
【氏名】佐藤 昌宏
(72)【発明者】
【氏名】黒川 高晴
(57)【要約】
【課題】ある学習モデルにより入力データのクラスを識別した推論結果や入力データを説明変数として目的変数を予測した推論結果の確信度が低い場合に、より信頼性の高い推論結果を取得できるデータ判定装置を提供する。
【解決手段】データ判定装置10は、入力データのクラスを識別する基本モデル40と、基本モデル40が入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部43と、推論結果の確信度が所定値未満の場合に、基本モデル40と所定の関係性を有する学習モデルとして選択された参照モデル41によって入力データのクラスを識別した推論結果に基づいて、入力データのクラスを判定するデータ判定部44とを備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
入力データのクラスを識別する基本モデルと、
前記基本モデルが前記入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部と、
前記推論結果の確信度が所定値未満の場合に、前記基本モデルと所定の関係性を有する学習モデルとして選択された参照モデルによって前記入力データのクラスを識別した推論結果に基づいて、前記入力データのクラスを判定するデータ判定部と、
を備えることを特徴とするデータ判定装置。
【請求項2】
入力データを説明変数として目的変数を予測する基本モデルと、
前記基本モデルが前記入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出部と、
前記推論結果の確信度が所定値未満の場合に、前記基本モデルと所定の関係性を有する学習モデルとして選択された参照モデルによって前記入力データに対する目的変数を予測した推論結果に基づいて、前記入力データに対する目的変数を判定するデータ判定部と、
を備えることを特徴とするデータ判定装置。
【請求項3】
前記参照モデルは、前記所定の関係性として、前記基本モデルと前記参照モデルとの間の相補性に基づいて選択された学習モデルであることを特徴とする請求項1又は2に記載のデータ判定装置。
【請求項4】
前記基本モデルと前記参照モデルとの間の前記相補性は、前記基本モデルによる推論結果と前記参照モデルによる推論結果との間の相関に基づいて設定されることを特徴とする請求項3に記載のデータ判定装置。
【請求項5】
前記参照モデルは、前記所定の関係性として、前記基本モデルが利用される環境の属性と前記参照モデルが利用される環境の属性との間の類似性に基づいて選択された学習モデルであることを特徴とする請求項1又は2に記載のデータ判定装置。
【請求項6】
前記参照モデルは、前記所定の関係性として、前記基本モデルの代替として過去に前記参照モデルが利用された利用履歴に基づいて選択された学習モデルであることを特徴とする請求項1又は2に記載のデータ判定装置。
【請求項7】
前記確信度算出部は、前記入力データが入力された場合に前記基本モデルから出力される識別スコア、前記識別スコアと判定閾値との乖離量、前記入力データを摂動させた場合の前記識別スコアの変動量、前記基本モデルにより算出された前記推論結果の不確実性、前記基本モデルの使用を開始してからの経過期間の期間長のうち少なくとも1つに基づいて前記確信度を算出することを特徴とする請求項1に記載のデータ判定装置。
【請求項8】
前記確信度算出部は、前記入力データを摂動させた場合の前記推論結果の変動量、前記基本モデルにより算出された前記推論結果の不確実性、前記基本モデルの使用を開始してからの経過期間の期間長のうち少なくとも1つに基づいて前記確信度を算出することを特徴とする請求項2に記載のデータ判定装置。
【請求項9】
前記基本モデルの推論結果の確信度が所定値未満の場合に前記参照モデルとして推論結果を出力させる学習モデルの候補リストを設定する利用者の操作入力を受け付ける入力受付部と、
複数の前記利用者ごとに設定された前記基本モデルの複数の前記候補リストを記憶する記憶部と、
を備え、
前記基本モデルの推論結果の確信度が所定値未満の場合に、前記データ判定部は、当該基本モデルについて記憶された前記複数の候補リストに基づいて推論結果を出力させる前記参照モデルを選択する、
ことを特徴とする請求項1又は2に記載のデータ判定装置。
【請求項10】
入力データのクラスを識別する基本モデル及び複数の参照モデルと、
前記基本モデルが前記入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部と、
前記基本モデルと前記参照モデルとの間の各々の所定の関係性を利用者に表示する表示部と、
前記複数の参照モデルのうち入力データの識別に使用する1以上の参照モデルを選択する前記利用者の操作入力を受け付ける入力受付部と、
前記推論結果の確信度が所定値未満の場合に、前記利用者によって選択された参照モデルによって前記入力データのクラスを識別した推論結果に基づいて、前記入力データのクラスを判定するデータ判定部と、
を備えることを特徴とするデータ判定装置。
【請求項11】
入力データを説明変数として目的変数を予測する基本モデル及び複数の参照モデルと、
前記基本モデルが前記入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出部と、
前記基本モデルと前記参照モデルとの間の各々の所定の関係性を利用者に表示する表示部と、
前記複数の参照モデルのうち目的変数の予測に使用する1以上の参照モデルを選択する前記利用者の操作入力を受け付ける入力受付部と、
前記推論結果の確信度が所定値未満の場合に、前記利用者によって選択された参照モデルによって前記入力データに対する目的変数を予測した推論結果に基づいて、前記入力データに対する目的変数を判定するデータ判定部と、
を備えることを特徴とするデータ判定装置。
【請求項12】
互いに異なる環境で取得された入力データを入力し、当該入力データのクラスを識別する複数の基本モデルと、
第1の前記基本モデルを用いて第1の入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部と、
前記推論結果の確信度が所定値未満の場合に、前記第1の基本モデルと所定の関係性を有する第2の前記基本モデルを選択し、当該第2の基本モデルを用いて前記第1の入力データのクラスを識別した推論結果に基づいて、前記第1の入力データのクラスを判定するデータ判定部と、
を備えることを特徴とするデータ判定システム。
【請求項13】
互いに異なる環境で取得された入力データを入力し、当該入力データを説明変数として目的変数を予測する複数の基本モデルと、
第1の前記基本モデルを用いて第1の入力データを説明変数として目的変数を予測した結果である推論結果の確信度を算出する確信度算出部と、
前記推論結果の確信度が所定値未満の場合に、前記第1の基本モデルと所定の関係性を有する第2の前記基本モデルを選択し、当該第2の基本モデルを用いて前記第1の入力データに対する目的変数を予測した推論結果に基づいて、前記第1の入力データに対する目的変数を判定するデータ判定部と、
を備えることを特徴とするデータ判定システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ判定装置及びデータ判定システムに関する。
【背景技術】
【0002】
入力データを識別したり入力データを説明変数として目的変数を予測するための手段として、サポートベクターマシン、ニューラルネットワーク、ブースティングなどの学習モデルが広く活用されている。
下記特許文献1には、初期設定の学習データを用いた学習により構成された既存の識別器と、新たに設定された学習データを用いた学習により新規の識別器を一又は複数構成し、これらの識別器の判別精度をそれぞれ算出し、最も判別精度に優れた識別器を選択して、既存の識別器を選択された識別器に切り替える情報処理装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2010/050334号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、最も判別精度に優れた識別器として選択された識別器が、あらゆる入力データに対して高精度に識別できるとは限らない。ある入力データのクラスを識別器が識別した場合に、識別結果の確信度が低い場合がある。例えば、入力データに対して算出した識別スコアと判定閾値との比較によりクラスを判定する場合に、識別スコアが判定閾値を超えてもその差があまり大きくない場合に確信度が低いと考えられる。このように識別結果の確信度が低い場合には、そのまま識別結果を信用して利用することはあまり好ましくない。
本発明は、上記の問題点を鑑みてなされたものであり、ある学習モデルにより入力データのクラスを識別した推論結果や入力データを説明変数として目的変数を予測した推論結果の確信度が低い場合に、より信頼性の高い推論結果を取得できるデータ判定装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一形態によるデータ判定装置は、入力データのクラスを識別する基本モデルと、基本モデルが入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部と、推論結果の確信度が所定値未満の場合に、基本モデルと所定の関係性を有する学習モデルとして選択された参照モデルによって入力データのクラスを識別した推論結果に基づいて、入力データのクラスを判定するデータ判定部と、を備える。
【0006】
本発明の他の形態によるデータ判定装置は、入力データを説明変数として目的変数を予測する基本モデルと、基本モデルが入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出部と、推論結果の確信度が所定値未満の場合に、基本モデルと所定の関係性を有する学習モデルとして選択された参照モデルによって入力データに対する目的変数を予測した推論結果に基づいて、入力データに対する目的変数を判定するデータ判定部と、を備える。
【0007】
本発明の更なる他の形態によるデータ判定装置は、入力データのクラスを識別する基本モデル及び複数の参照モデルと、基本モデルが入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出部と、基本モデルと参照モデルとの間の各々の所定の関係性を利用者に表示する表示部と、複数の参照モデルのうち入力データの識別に使用する1以上の参照モデルを選択する利用者の操作入力を受け付ける入力受付部と、推論結果の確信度が所定値未満の場合に、利用者によって選択された参照モデルによって入力データのクラスを識別した推論結果に基づいて、入力データのクラスを判定するデータ判定部と、を備える。
【0008】
本発明の更なる他の形態によるデータ判定装置は、入力データを説明変数として目的変数を予測する基本モデル及び複数の参照モデルと、基本モデルが入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出部と、基本モデルと参照モデルとの間の各々の所定の関係性を利用者に表示する表示部と、複数の参照モデルのうち目的変数の予測に使用する1以上の参照モデルを選択する利用者の操作入力を受け付ける入力受付部と、推論結果の確信度が所定値未満の場合に、利用者によって選択された参照モデルによって入力データに対する目的変数を予測した推論結果に基づいて、入力データに対する目的変数を判定するデータ判定部を、を備える。
【発明の効果】
【0009】
本発明によれば、ある学習モデルにより入力データのクラスを識別した推論結果や入力データを説明変数として目的変数を予測した推論結果の確信度が低い場合に、より信頼性の高い推論結果を取得できるデータ判定装置を提供できる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態のデータ判定システムの全体構成の一例の概略図である。
図2】第1実施形態のデータ判定装置の機能構成の一例を示すブロック図である。
図3】(a)は識別モデル間の相関係数の一例の模式図であり、(b)は(a)の相関係数を算出するために使用したテストデータの識別スコアの一例の模式図である。
図4】第1実施形態のデータ判定方法の一例のフローチャートである。
図5】第2実施形態のデータ判定装置の機能構成の一例を示すブロック図である。
図6】第2実施形態のデータ判定方法の一例のフローチャートである。
図7】第3実施形態のデータ判定装置の機能構成の一例を示すブロック図である。
図8】第3実施形態のデータ判定方法の一例のフローチャートである。
【発明を実施するための形態】
【0011】
以下において、図面を参照して本発明の実施形態を説明する。なお、以下に示す本発明の実施形態は、本発明の技術的思想を具体化するための装置や方法を例示するものであって、本発明の技術的思想は、構成部品の構造、配置等を下記のものに特定するものではない。本発明の技術的思想は、特許請求の範囲に記載された請求項が規定する技術的範囲内において、種々の変更を加えることができる。
【0012】
本発明の実施形態の一例として、入力データとして画像を受け付けて、入力画像のクラスを識別するデータ判定装置の例を説明する。本実施形態におけるデータ判定装置は、入力画像の中に予め定めた対象物(例えば人間)が含まれているか否かを判定する2クラス分類問題を扱う(人物の識別)。しかし、データ判定装置は、人物識別だけでなく、例えば顔認証、人物同定(Re-Identification:ReID)、入力画像中の人物位置を検知する人物検知を行ってもよい。また、本発明はこれに限定されず、例えば可視画像だけでなく熱画像や距離画像等を入力画像とし、人を識別したり、事前に定義した対象物を検知してもよい。また例えば動画像を入力データとして受け付けて、人物の行動認識をしてもよい。また例えば点群データを入力データとして受け付けて物体のカテゴリを識別するものであってもよい。また例えば入力データとして音声信号を受け付けて入力音声のクラスを識別する識別装置に対しても適用できる。
以下の説明では、図1に示すように特定の監視領域1内に存在する識別対象2(図1の例では人物)を識別するために、監視領域1を監視するためのカメラ等のセンサ3と、センサ3の出力値を入力データとして識別対象2を識別する学習モデル(識別器、識別モデル)とを導入する場合を想定する。
【0013】
(第1実施形態)
図1は、本発明の実施形態のデータ判定システムの全体構成の一例の概略図である。データ判定システムは、監視領域1やその近傍に設置されるデータ判定装置10と、構内LAN又はインターネット等の通信ネットワークを介してデータ判定装置10と接続されるサーバ装置20とを有する。
【0014】
データ判定装置10は、入力部12、通信部13、記憶部14、制御部15及び出力部16を備える。これらのうちの記憶部14及び制御部15はいわゆるコンピュータで実現でき、入力部12、通信部13及び出力部16は、当該コンピュータの周辺機器として実現できる。
【0015】
入力部12は、利用者に操作されてデータの入力等に用いられるキーボード、マウス等のユーザーインターフェースを含む。入力部12は、制御部15に接続され、利用者の操作を操作信号に変換して制御部15に出力する。
また、入力部12はDVD(Digital Versatile Disc)ドライブ、USB(Universal Serial Bus)インターフェースを含んでもよい。入力部12は、データをファイルとして制御部15に入力し、およびデータをファイルとして制御部15から出力する。
【0016】
通信部13は、有線通信又は無線通信によりデータ判定装置10とサーバ装置20との間でデータの送受信を行うネットワークインターフェース等を含む。
記憶部14は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶する。
制御部15は、センサ3が写した入力データを取得し、入力データのクラスを識別するコントローラであり、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)、GPU(Graphics Processing Unit)等の演算装置(プロセッサ)で構成される。
【0017】
制御部15は、記憶部14と接続され、記憶部14からコンピュータプログラムを読み出して実行することにより各種処理部として動作し、各種データを記憶部14に記憶したり、これらデータを読み出す。以下に説明するデータ判定装置10の機能は、記憶部14に記憶されたコンピュータプログラムを制御部15が実行することにより実現される。
また制御部15は、入力部12と接続されて利用者によるデータ判定装置10に対する操作入力を受け付ける。
【0018】
また制御部15は、出力部16に接続され、制御部15による識別対象2の識別結果を出力部16に出力する。
制御部15は、通信部13とも接続され、通信部13を経由してサーバ装置20との間で各種データを送受信する。例えば制御部15は、センサ3が写した識別対象2の識別に使用する学習モデル(識別器、識別モデル)である参照モデルをサーバ装置20から取得する。
サーバ装置20の記憶部22には、後述する参照モデル41としてデータ判定装置10に利用可能な複数の参照モデル24a、24b、24c…が記憶されている。以下の説明において参照モデル24a、24b、24c…を総称して「参照モデル24」と表記することがある。
【0019】
参照モデル24は、例えばニューラルネットワーク、サポートベクターマシン、ブースティングであってよい。例えば参照モデル24は、センサ3の出力値から識別対象2の識別スコアを算出する識別スコア算出関数の係数等のパラメータと、識別器から出力される識別スコアと比較する判定閾値とにより表される。例えば、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)のような多層のネットワークで識別器がモデル化されている場合には、識別スコア算出関数のパラメータは、ネットワークのフィルタ係数などの各層のパラメータであってよい。後述する基本モデル40及び参照モデル41、41a、41b、41c…も同様である。以下の説明において、これらの識別器のパラメータを単に「パラメータ」と表記することがある。
【0020】
出力部16は、液晶ディスプレイ又はCRT(Cathode Ray Tube)ディスプレイ等のディスプレイ装置を含んでよい。出力部16は、制御部15と接続され、データ判定装置10による識別対象2の識別結果を表示してよい。出力部16は、制御部15による識別結果を音声情報として出力するための音声信号出力装置(スピーカ又はブザー等)を備えてもよい。また、出力部16は、制御部15による識別結果を外部装置(例えば遠隔のセンタ装置等)に送信してよい。
【0021】
サーバ装置20は、通信部21、記憶部22と、制御部23とを備える。通信部21は、有線通信又は無線通信によりサーバ装置20とデータ判定装置10との間でデータの送受信を行うネットワークインターフェース等を含む。
記憶部22は、ROM、RAM等のメモリ装置であり、各種プログラムや各種データを記憶する。記憶部22は、複数の参照モデル24a、24b、24c…を記憶する。
【0022】
制御部23は、データ判定装置10の制御部15と同様の演算装置を有し、サーバ装置20の各種信号処理を実行する。
例えば制御部23は、データ判定装置10からの要求信号に応じて参照モデル24を記憶部22から読み出して、読み出した参照モデル24をデータ判定装置10に送信する。
【0023】
図2は、第1実施形態のデータ判定装置10の機能構成の一例を示すブロック図である。データ判定装置10は、基本モデル40と、参照モデル41と、モデル取得手段42と、確信度算出手段43と、データ判定手段44と、識別結果出力手段45を備える。
図1の制御部15は、基本モデル40と、参照モデル41と、確信度算出手段43と、データ判定手段44として機能する。通信部13と制御部15は、モデル取得手段42として機能する。出力部16は、識別結果出力手段45として機能する。
【0024】
基本モデル40と参照モデル41は、センサ3が識別対象2を写した入力データを取得して、入力データのクラスを識別する学習モデル(識別器、識別モデル)である。例えば基本モデル40と参照モデル41は、入力データから識別対象2の識別スコアを算出して、識別スコアと判定閾値とを比較することにより入力データのクラスを判定する。
【0025】
例えば基本モデル40は、監視領域1にデータ判定装置10を設置する前に、監視領域1において想定される入力データのデータベース(想定環境データベース)を学習データとして用いて学習させた識別器であってよい。また、監視領域1にデータ判定装置10を設置した後に、監視領域1においてセンサ3で実際に写した入力データを学習データとして基本モデル40を学習(オンライン学習、又は再学習)させてもよい。
【0026】
参照モデル41は、基本モデル40とは異なる識別モデルである。例えば参照モデル41は、サーバ装置20の記憶部22に記憶されている複数の参照モデル24a、24b、24c…のうちから選択された識別器であってよい。
例えば参照モデル41は、基本モデル40の学習に使用された想定環境データベースとは異なる学習データを用いて学習した識別器であってよく、また監視領域1とは異なる環境において実際にセンサで写したデータを学習データとして用いて学習した識別器であってもよい。また例えば、参照モデル41と基本モデル40とは、互いに異なるパラメータの初期値から学習させた識別器であってもよい。また例えば参照モデル41と基本モデル40とは、手法、種類又はアルゴリズムの異なる識別器(例えばニューラルネットワーク、サポートベクターマシン、ブースティング、決定木など)であってもよい。
【0027】
モデル取得手段42は、通信部13を介して、サーバ装置20の記憶部22に記憶されている複数の参照モデル24a、24b、24c…のいずれかを参照モデル41として取得する。
なお、複数の参照モデル24a、24b、24c…から、どのようにデータ判定装置10の参照モデル41を選択するかは後述する。
【0028】
確信度算出手段43は、基本モデル40が入力データのクラスを識別した推論結果である識別結果の確信度Cを算出する。
例えば確信度算出手段43は、算出した識別スコアと判定閾値との間の乖離量に基づいて確信度Cを算出してよい。例えば確信度算出手段43は、識別スコアが判定閾値以上である場合、識別スコアと判定閾値との間の乖離量が小さいほど低くなる確信度Cを算出してよい。
また例えば確信度算出手段43は、算出した識別スコア自身に基づいて確信度Cを算出してもよい。例えば識別スコアの大小に応じて確信度Cを算出してもよい。例えば識別スコアが小さいほど低くなる確信度Cを算出してもよい。
【0029】
また例えば確信度算出手段43は、入力データを摂動させた場合の識別スコアの変動量に基づいて確信度Cを算出してよい。例えば入力データにノイズを付与したり、入力データである映像を拡大又は縮小したり、入力データである映像の輝度を変動させたり、入力データである映像データを圧縮したり、圧縮率を変化することで、入力データを摂動させることができる。例えば確信度算出手段43は、変動量が大きいほど低くなる確信度Cを算出してよい。
【0030】
また、多クラス識別において最大スコアのクラスを選択する場合は、2番目に高いスコアと比較してあまり差が無いと信頼度が低いと考えられる。例えば、3クラス問題の場合、出力されたスコアが0.5、0.25、0.25の場合と、0.5、0.45、0.05の場合を考える。両者とも最大スコアは0.5だが、後者の最大スコアは2番目のスコアと比較してわずかにスコアが高い状態である。このような場合は、最大のスコアを出したクラスを判定結果に用いるには信頼度が低いと考えられる。
そこで、例えば、最大スコアと2番目のスコアの差から確信度Cを算出することができる。この場合、最大スコアと2番目のスコアの差が小さいほど、確信度Cは小さくなる。
【0031】
また、学習データの典型的なもの(分布)からの外れ度合いを確信度Cとしてもよい。すなわち、学習データの典型的なものから外れているものほど、確信度Cは低くなる。例えば、学習データに対して特徴量を計算して平均と共分散行列を求める。入力されたデータの確信度Cを計算するためには、入力されたデータの特徴量と学習データの平均と共分散行列からマハラノビス距離を計算し、距離が大きいものほど低い確信度Cを算出してよい。
【0032】
また例えば学習モデル(識別器、識別モデル)にネットワークを使う場合は、入力の摂動ではなく、ネットワーク側の摂動(Dropout)をした時のスコアのブレ度合いを確信度Cとしてもよい。
【0033】
また例えば基本モデル40は、入力データから識別スコアを算出するとともに、識別スコアの「不確かさ」すなわち識別スコアの不確実性を算出してもよい。例えば、基本モデル40は識別スコアと識別スコアの分散(不確かさ)という2種類を推定値として出力するネットワークであってよい。
このネットワークを学習する場合、損失関数は2種類の損失で構成する。1つは正解クラスと推定クラスの差異を算出する識別損失で、もう1つは分散の制約損失である。正解クラスと推定クラスの差異を算出する識別損失は、出力される分散が大きいデータに対しては損失が小さくなるように、また出力される分散が小さいデータに対しては損失が大きくなるように重みづけをする。一方で、分散の制約損失により全データに対して分散が大きくなることを防ぐ。
【0034】
すなわち、ほとんどのデータで分散が大きくなってしまうと、損失関数が小さくなり意味がなくなってしまうため、そのような不都合を回避する。よって、識別損失と制約損失のトレードオフにより、不確さが高いデータほど分散が大きく、不確さが低いデータほど分散が小さくなるように学習される。このようなネットワークの学習は、例えばAlex Kendall and Yarin Gal著、"What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision"、Advances in neural information processing systems, p5574-5584、2017に記載されている。分散が大きいほどより低い確信度Cを算出してよい。すなわち不確実性が大きいほどより低い確信度Cを算出してよい。
【0035】
また例えば、不確かさを出力するものとして、Gaussian Processを利用してもよい。Gaussian Processでは、推定結果を分布として出力する。具体的には分布のパラメータである平均と分散を出力する。分散が大きいほどより低い確信度Cを算出してよい。
【0036】
また例えば、監視領域1にデータ判定装置10を設置した後に、実際にセンサ3で写される入力データを学習データとして基本モデル40を学習させる場合には、確信度算出手段43は、データ判定装置10を監視領域1に設置して基本モデル40の使用を開始してからの経過期間の期間長に基づいて確信度Cを算出してよい。例えば確信度算出手段43は、経過期間の期間長が短いほど低くなる確信度Cを算出してよい。
【0037】
確信度Cが所定値未満の場合に、参照モデル41は、センサ3から取得した入力データのクラスを識別する。
データ判定手段44は、確信度Cが所定値未満の場合に、参照モデル41による識別結果に基づいて入力データのクラスを判定する。例えばデータ判定手段44は、参照モデル41が識別したクラスを入力データのクラスとして識別結果出力手段45へ出力する。
確信度Cが所定値以上の場合には、基本モデル40による識別結果に基づいて、入力データのクラスを判定する。例えばデータ判定手段44は、基本モデル40が識別したクラスを、入力データのクラスとして識別結果出力手段45へ出力する。
【0038】
識別結果出力手段45は、データ判定手段44が判定したクラスを、入力データのクラスとして出力部16のディスプレイ装置に表示する。また識別結果出力手段45は、データ判定手段44が判定した入力データのクラスを、外部装置(例えば遠隔のセンタ装置等)に送信してもよい。
【0039】
次に、サーバ装置20に記憶されている複数の参照モデル24a、24b、24c…から、どのようにデータ判定装置10の参照モデル41を選択するかについて説明する。
モデル取得手段42は、記憶部22に記憶されている参照モデル24のうち、基本モデル40と所定の関係性を有する識別器として選択されたものを、参照モデル41として取得する。
【0040】
例えば参照モデル41は、上記の所定の関係性として、基本モデル40と参照モデル24との間の相補性に基づいて選択された識別器であってよい。
ここで、基本モデル40と参照モデル24との間の「相補性」とは、基本モデル40が誤り易い入力データに対して参照モデル24が正しい識別結果を出力する確率が高く、参照モデル24が誤り易い入力データに対して基本モデル40が正しい識別結果を出力する確率が高い関係性をいう。
【0041】
例えば基本モデル40と参照モデル24との間の相補性は、基本モデル40による識別結果と参照モデル24による識別結果との間の相関に基づいて設定してよい。
図3(a)は識別モデル間の相関係数の一例の模式図であり、図3(b)は図3(a)の相関係数を算出するために使用するテストデータA~Dに対する識別モデルA~C…の識別スコアの一例の模式図である。なお、図3(b)のテストデータA~Dの正解クラスは既知であり、識別スコアは正解クラスに対する識別スコアである。
【0042】
図3(b)に示すように、データA、B、C及びDを入力したときに識別モデルAが算出した識別スコアは、それぞれ「0.9」、「0.4」、「0.3」及び「0.8」である。同様にデータA、B、C及びDを入力したときに識別モデルBが算出した識別スコアは、それぞれ「0.8」、「0.7」、「0.2」及び「0.7」である。またデータA、B、C及びDを入力したときに識別モデルCが算出した識別スコアは、それぞれ「0.1」、「0.7」、「0.7」及び「0.2」である。
【0043】
このように識別モデルAが算出した識別スコアと識別モデルBが算出した識別スコアとが類似している場合(すなわち相関が高い場合)には、識別モデルAの識別スコアと識別モデルBの識別スコアとの間の相関係数は高くなる。例えば図3(a)の例では、識別モデルAと識別モデルBとの間の相関係数は「0.7」となる。このような場合は、識別モデルAの識別結果が正解であるとき識別モデルBの識別結果も正解になり易く、また識別モデルAが誤る場合には識別モデルBも誤りやすい。
【0044】
一方で、識別モデルCが算出した識別スコアと識別モデルAが算出した識別スコアとが大きく異なっている。この結果、識別モデルAと識別モデルCの識別スコアの相関係数は「0.1」と低くなっている。このような場合は、識別モデルAが誤り易い入力データに対して識別モデルCが正しい識別結果を出力する確率が高く、反対に識別モデルCが誤り易い入力データに対して識別モデルAが正しい識別結果を出力する確率が高くなる。
【0045】
また、識別モデルBが算出した識別スコアも、識別モデルCが算出した識別スコアと異なっているが、識別モデルBと識別モデルCの識別スコアの相関は、識別モデルAと識別モデルCの識別スコアの相関よりも高い。このため、識別モデルBと識別モデルCの識別スコアの相関係数は「0.3」となり、識別モデルAと識別モデルCの識別スコアの相関係数「0.1」よりも大きくなっている。
【0046】
このように、基本モデル40と参照モデル24との識別結果との間の相関が低いほど、基本モデル40と参照モデル24との間の相補性が大きくなることが期待できる。したがって、基本モデル40と参照モデル24との識別結果との間の相関係数を1から引いた値を、基本モデル40と参照モデル24との間の相補性の大きさとして算出できる。
【0047】
このため例えば複数の参照モデル24a、24b、24c…のうち、基本モデル40との相補性が閾値以上である識別器を、参照モデル41として選択してよい。例えば基本モデル40が算出した識別スコアとの間の相関係数が、閾値以下の相関となる識別スコアを算出する識別器を参照モデル41として選択してよい。
【0048】
また例えば、各テストデータに対する識別スコアに代えて、正解したか否かを表す1(正解)、0(不正解)を識別結果として用いて識別モデル同士の相関を求めてもよい。例えば、同じような正解・間違え方をした場合は、相関が高く(つまり、相補性が低く)、異なる正解・間違え方をしている場合は相関が低い(つまり、相補性が高い)。
そこで、識別モデルA及び識別モデルBがそれぞれ正解したテストデータの不一致率(識別モデルAと識別モデルBの正否が一致しないテストデータの個数/テストデータの全データ数)を相補性として算出してもよい。
また例えば、識別モデルAが間違えたデータのうち識別モデルBが正解したテストデータの個数を、相補性として算出してもよい。
【0049】
また例えば参照モデル41は、前記所定の関係性として、基本モデル40が利用される環境(すなわち監視領域1)の属性と参照モデル24が利用された環境の属性との間の類似性に基づいて選択された識別器であってよい。例えば環境の属性は、屋内と屋外の違いや、環境の利用目的(例えば、店舗用物件であるか、居住用物件であるか、オフィス用物件であるか)であってよい。例えば、基本モデル40が利用される環境の属性の一致度合いが閾値以上の類似性を有する属性の環境で利用された参照モデル24を、参照モデル41として選択してよい。
【0050】
例えば参照モデル24が、現実環境において実際にセンサで写したデータを学習データとして用いて学習した識別器である場合には、参照モデル24が利用される環境と基本モデル40が利用される監視領域1の属性とが類似していれば、現実環境で取得したデータを用いて学習した参照モデル24を用いることにより、監視領域1において精度の高い識別結果が得られることが期待できる。
【0051】
また例えば参照モデル41は、所定の関係性として、基本モデル40の代替として過去に参照モデル41が利用された利用履歴に基づいて選択された識別器であってもよい。ここで、基本モデル40の代替として参照モデル41が利用された履歴とは、基本モデル40の識別結果の確信度C(例えば確信度算出手段43が算出した確信度C)が所定値よりも低いために、基本モデル40の代わりに参照モデル41の識別結果に基づいて入力データのクラスを判定した履歴(例えば参照モデル41の識別したクラスが識別結果出力手段45から出力された履歴)をいう。
例えば、複数の参照モデル24a、24b、24c…のうち基本モデル40の代替として過去に利用された回数や頻度が、予め定めた閾値よりも大きい識別器を、参照モデル41として選択してよい。
【0052】
(動作)
図4は、第1実施形態のデータ判定方法の一例のフローチャートである。
ステップS1においてデータ判定装置10は、監視領域1においてセンサ3が識別対象2を写した入力データを取得する。
ステップS2においてデータ判定装置10の基本モデル40は、入力データのクラスを識別する。
【0053】
ステップS3において確信度算出手段43は、基本モデル40による識別結果の確信度Cを算出する。
ステップS4においてデータ判定手段44は、確信度Cが所定値未満であるか否かを判定する。確信度Cが所定値未満でない場合(ステップS4:N)に処理はステップS5へ進む。確信度Cが所定値未満である場合(ステップS4:Y)に処理はステップS6へ進む。
【0054】
ステップS5においてデータ判定手段44は、基本モデル40による識別結果に基づいて入力データのクラスを判定する。識別結果出力手段45は、データ判定手段44が判定したクラスを入力データのクラスとして出力する。その後に処理は終了する。
ステップS6において参照モデル41は、入力データのクラスを識別する。データ判定手段44は、参照モデル41による識別結果に基づいて入力データのクラスを判定する。識別結果出力手段45は、データ判定手段44が判定したクラスを入力データのクラスとして出力する。その後に処理は終了する。
【0055】
(変形例)
(1)データ判定装置10の利用者は、データ判定装置10で利用する参照モデル41の候補を自分で選択して、参照モデル24としてサーバ装置20に記憶させてもよい。例えばデータ判定装置10の利用者は、自分の感性(好み)に適合する識別器を選んで参照モデル24としてサーバ装置20に記憶させてもよい。
また、利用者に利用されるデータ判定装置10の基本モデル40が複数個存在する場合(例えば、利用者が複数の監視領域1の各々でデータ判定装置10を利用する場合や、1つのデータ判定装置10で利用する基本モデル40を切り替えることができる場合)には、基本モデル40毎に異なる参照モデル41の候補を選択して参照モデル24としてサーバ装置20に記憶させてもよい。または、複数個の基本モデル40に共通して同じ参照モデル41の候補を選択して参照モデル24としてサーバ装置20に記憶させてもよい。
【0056】
(2)上記の変形例(1)のようにデータ判定装置10の利用者が選んだ識別器を参照モデル24としてサーバ装置20に記憶させる場合に、サーバ装置20は、利用者が選んだ識別器(ここでは「第1識別器」と表記する)に基づいて、第1識別器以外の他の識別器(ここでは「第2識別器」と表記する)を選んで、参照モデル24としてサーバ装置20に記憶させてもよい。
【0057】
例えば、データ判定装置10の利用者(ここでは「第1利用者」と表記する)が選んだ第1識別器を、他の利用者(ここでは「第2利用者」と表記する)が参照モデル24としてサーバ装置20に記憶させるとともに、第1識別器以外の第2識別器も参照モデル24としてサーバ装置20に記憶させた場合を想定する。このような場合に、サーバ装置20は、第1利用者のデータ判定装置10で利用する参照モデル41の候補である参照モデル24として、第2識別器をサーバ装置20に記憶してもよい。
【0058】
(3)上記の変形例(1)のようにデータ判定装置10の利用者が選んだ識別器を参照モデル24としてサーバ装置20に記憶させる場合に、特定の基本モデルの推論結果の確信度が所定値未満の場合に参照モデルとして推論結果を出力させる学習モデルの候補リストを、複数の利用者ごとに設定してサーバ装置20に記憶させてもよい。
データ判定手段44は、特定の基本モデル40の推論結果の確信度が所定値未満の場合に、特定の基本モデル40に対して複数の利用者が記憶させた候補リストに基づいて推論結果を出力させる参照モデルを選択してもよい。
【0059】
例えば、特定の基本モデルXの推論結果の確信度が所定値未満の場合に参照モデルとして推論結果を出力させる学習モデルの候補リストを、複数の利用者A、B、Cがそれぞれサーバ装置20に記憶させた場合を想定する。このとき、他の利用者Dのデータ判定装置10の基本モデル40が特定の基本モデルXであり、当該基本モデルXの推論結果の確信度が所定値未満の場合に、データ判定手段44は、複数の利用者A、B、Cの候補リストにそれぞれ含まれる学習モデルに基づいて、推論結果を出力させる参照モデルを選択してもよい。例えば、複数の利用者A、B、Cのそれぞれの候補リストのうち最も多くのリストに共通して含まれる学習モデルを参照モデルとして選択してもよい。
【0060】
(4)上述の所定の関係性「相補性」、「環境の属性の類似性」及び「利用履歴」のうち複数の関係性の組合せを用いて参照モデル24を選択してもよい。例えば「相補性」を用いて選択された複数の参照モデル24の候補の中から、さらに「環境の属性の類似性」に基づいて参照モデル24を選択してもよい。例えば基本モデル40と「相補性」が高い複数の参照モデル24が存在する場合に、更にこれらの参照モデル24と基本モデル40との間の「環境の属性の類似性」が高いかに応じて、参照モデル24を選択してもよい。
【0061】
(5)なお上記の例では、参照モデル24、41及び基本モデル40が入力データのクラスを識別する識別モデルである場合の例を示したが、参照モデル24、41及び基本モデル40は、入力データを説明変数として目的変数を予測する回帰モデルであってもよい。後述する第2実施形態及び第3実施形態においても同様である。
【0062】
確信度算出手段43は、基本モデル40が入力データに対する目的変数を予測した結果である推論結果の確信度Cを算出してよい。例えば入力データを摂動させた場合の回帰モデルである基本モデル40の推論結果の変動量、基本モデル40により算出された推論結果の不確実性、基本モデル40の使用を開始してからの経過期間の期間長のうち少なくとも1つに基づいて確信度Cを算出してよい。
【0063】
また、データ判定手段44は、推論結果の確信度Cが所定値未満の場合に、基本モデル40と所定の関係性を有する学習モデルとして選択された参照モデル41によって入力データに対する目的変数を予測した推論結果に基づいて、入力データに対する目的変数を判定してもよい。
例えば、基本モデル40が識別モデルである場合と同様に、参照モデル41は、所定の関係性として、基本モデル40と参照モデル24との間の相補性に基づいて選択された識別器であってよい。回帰モデルの場合についても、識別の場合と同様に相補性を計算できる。
【0064】
識別モデルの場合には、予め正解クラスが既知のテストデータを用い、正解クラスに対する識別スコアを算出し識別モデル間の相関を計算した。
これに対して回帰モデルの場合には、予め正解値が既知のテストデータを用い、テストデータを回帰モデルに入力して得られる推定値と正解値の誤差(差の絶対値)を用いて相補性を計算できる。
【0065】
例えば、二つの回帰モデル(回帰モデルAと回帰モデルB)があった場合、回帰モデルAの誤差より回帰モデルBの誤差が小さいテストデータが多いほど、回帰モデルAに対する回帰モデルBの相補性が高く、回帰モデルAで推定精度が悪いデータに対して回帰モデルBで推定精度が良くなる確率が高くなる。
【0066】
逆に、回帰モデルBの誤差より回帰モデルAの誤差が小さいテストデータが多いほど、回帰モデルBに対する回帰モデルAの相補性が高く、回帰モデルBで推定精度が悪いデータに対して回帰モデルAで推定精度が良くなる確率が高くなる。
よって、誤差が小さいテストデータの個数(または、テストデータの全データ数に対する割合)を相補性として算出することができる。
【0067】
(第2実施形態)
図5は、第2実施形態のデータ判定装置10の機能構成の一例を示すブロック図である。第2実施形態のデータ判定装置10は、第1実施形態のデータ判定装置10に類似する構成を有しており同一又は類似の構成要素には同じ参照符号を付与する。
第2実施形態のデータ判定装置10は、複数の参照モデル41a、41b、41c…と、モデル選択手段46と、データ記憶手段47を備える。
【0068】
以下の説明において、複数の参照モデル41a、41b、41c…を「参照モデル41」として総称することがある。
図1の制御部15は、参照モデル41と、モデル選択手段46して機能する。記憶部14は、データ記憶手段47として機能する。
【0069】
モデル取得手段42は、通信部13を介して、サーバ装置20の記憶部22に記憶されている参照モデル24を参照モデル41として取得する。
データ記憶手段47には、基本モデル40と参照モデル41との間の関係性を表すデータである関係性データ48が記憶されている。例えば関係性データ48は、基本モデル40と参照モデル41との間の相補性を表すデータであってよい。
【0070】
また例えば関係性データ48は、参照モデル41としてサーバ装置20から取得した参照モデル24が利用された環境の属性と、基本モデル40が利用される環境(すなわち監視領域1)の属性と参照モデル41が利用される環境の属性との間の類似性を表すデータであってもよい。
また例えば関係性データ48は、基本モデル40の代替として過去に参照モデル41が利用された利用履歴を表すデータであってもよい。
【0071】
確信度Cが所定値未満の場合に、モデル選択手段46は、関係性データ48に基づいて、複数の参照モデル41a、41b、41c…のうち基本モデル40と所定の関係性を有する参照モデル41を選択する。
確信度Cが所定値未満の場合に、モデル選択手段46によって選択された参照モデル41は、センサ3から取得した入力データのクラスを識別する。
データ判定手段44と識別結果出力手段45の機能は、第1実施形態と同様である。
【0072】
図6は、第2実施形態のデータ判定方法の一例のフローチャートである。ステップS11~S15の処理は、図4を参照して説明したステップS1~S5の処理と同様である。
確信度Cが所定値未満である場合(ステップS14:Y)に処理はステップS16へ進む。ステップS16においてモデル選択手段46は、複数の参照モデル41a、41b、41c…のうち基本モデル40と所定の関係性を有する参照モデル41を選択する。
【0073】
ステップS17において、モデル選択手段46が選択した参照モデル41は、入力データのクラスを識別する。
ステップS18においてデータ判定手段44は、参照モデル41による識別結果に基づいて、入力データのクラスを判定する。識別結果出力手段45は、データ判定手段44が判定したクラスを入力データのクラスとして出力する。その後に処理は終了する。
【0074】
(変形例)
(1)基本モデル40が入力データのクラスを識別した結果である識別結果の確信度Cが所定値未満であり、モデル選択手段46が第1の参照モデル41αを選択した場合に、確信度算出手段43は、第1の参照モデル41αの識別結果の確信度である第2の確信度C2を算出してもよい。
第2の確信度C2が所定値未満である場合に、モデル選択手段46は、基本モデル40と所定の関係性を有するとともに、第1の参照モデル41αと所定の関係性を有する第2の参照モデル41βを選択してもよい。なお、基本モデル40及び第1の参照モデル41αの少なくとも一方と所定の関係性を有する第2の参照モデル41βを選択してもよい。
【0075】
第1の参照モデル41αとの相補性が閾値以上である参照モデル41を第2の参照モデル41βとして選択してもよい。また例えば、第1の参照モデル41αが利用された環境の属性と閾値以上の類似性を有する属性の環境で利用された参照モデル41を第2の参照モデル41βとして選択してもよい。また例えば、第1の参照モデル41αの代替として過去に利用された回数や頻度が、予め定めた閾値よりも大きい参照モデル41を第2の参照モデル41βとして選択してもよい。
【0076】
データ判定手段44は、第2の参照モデル41βによる識別結果に基づいて、入力データのクラスを判定してよい。
以下同様に、確信度算出手段43は、第2の参照モデル41βの識別結果の確信度である第3の確信度C3を算出してもよい。第3の確信度C3が所定値未満である場合に、モデル選択手段46は、基本モデル40、第1の参照モデル41α及び第2の参照モデル41βの各々と所定の関係性を有するとともに、所定の関係性を有する第3の参照モデル41γを選択してもよい。データ判定手段44は、第3の参照モデル41γによる識別結果に基づいて、入力データのクラスを判定してよい。
なお、データ判定手段44は、全ての参照モデル41(第1の参照モデル41α、第2の参照モデル41β、及び第3の参照モデル41γ)の識別結果に基づいて、入力データのクラスを判定してよい。例えば、全ての参照モデル41の識別結果が一致した場合は当該識別結果を「正」として入力データのクラスを判定してよい。
【0077】
(2)データ判定装置10の機能の一部をサーバ装置20に設けてもよい。例えば基本モデル40、参照モデル41、確信度算出手段43、モデル選択手段46をサーバ装置20に設け、記憶部22に記憶された参照モデル24を読み出して基本モデル40及び参照モデル41として使用してもよい。
例えばサーバ装置20は、複数の異なる環境において写される入力データのクラスをそれぞれ識別する複数の識別器を備えてもよい。サーバ装置20は、監視領域1のデータ判定装置10で利用する参照モデル41として、監視領域1以外の環境で写したデータの識別に現在利用されている識別器を使用してもよい。
【0078】
(3)モデル選択手段46は、基本モデル40と所定の関係性を有する複数の参照モデル41を選択してもよい。データ判定手段44は、複数の参照モデル41のそれぞれの識別結果に基づいて入力データのクラスを判定してもよい。例えば、複数の参照モデル41によって最も多く判定されたクラスを最終的な判定結果としてよい。
【0079】
(4)また、データ判定装置10は、サーバ装置20に記憶されている参照モデル24や、データ判定装置10自身が備える参照モデル41だけでなく、監視領域1以外の他の環境に設置された他のデータ判定装置において基本モデル40として利用されている学習モデルを、データ判定装置10の参照モデル41として利用してよい。
例えば、モデル選択手段46は、データ判定装置10自身が備える基本モデル40と他の環境に配置された他のデータ判定装置の基本モデル40との関係性データに基づいて、データ判定装置10の参照モデル41として利用する他のデータ判定装置の基本モデル40を選択してよい。そして、選択された他の環境に設置されたデータ判定装置に対して、データ判定装置10自身のセンサ3から入力された入力データを送信し、他の環境に設置されたデータ判定装置に入力データを識別させて、その識別結果を取得してよい。そして、取得した識別結果に基づいてデータ判定装置10自身の推論結果の妥当性を判定してよい。
【0080】
すなわち、データ判定システムは、互いに異なる環境で取得された入力データを入力し、入力データのクラスを識別する複数の基本モデル40と、第1の基本モデル40を用いて第1の入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出手段43と、推論結果の確信度が所定値未満の場合に、第1の基本モデル40と所定の関係性を有する第2の基本モデル40を選択し、当該第2の基本モデル40を用いて第1の入力データのクラスを識別した推論結果に基づいて、第1の入力データのクラスを判定するデータ判定手段44を備えてもよい。
【0081】
また、データ判定システムは、互いに異なる環境で取得された入力データを入力し、当該入力データを説明変数として目的変数を予測する複数の基本モデル40と、第1の基本モデル40を用いて第1の入力データを説明変数として目的変数を予測した結果である推論結果の確信度を算出する確信度算出手段43と、推論結果の確信度が所定値未満の場合に、第1の基本モデル40と所定の関係性を有する第2の基本モデル40を選択し、当該第2の基本モデル40を用いて第1の入力データに対する目的変数を予測した推論結果に基づいて、第1の入力データに対する目的変数を判定するデータ判定手段44を備えてもよい。
【0082】
(第3実施形態)
図7は、第3実施形態のデータ判定装置10の機能構成の一例を示すブロック図である。第3実施形態のデータ判定装置10は、第2実施形態のデータ判定装置10に類似する構成を有しており同一又は類似の構成要素には同じ参照符号を付与する。
第3実施形態のデータ判定装置10は、モデル選択入力受付手段49と、識別結果選択入力受付手段50を備える。
図1の入力部12、制御部15及び出力部16は、モデル選択入力受付手段49と、識別結果選択入力受付手段50として機能する。
【0083】
確信度Cが所定値未満の場合に、モデル選択入力受付手段49は、複数の参照モデル41a、41b、41cのうち入力データの識別に使用する参照モデル41を選択する利用者の操作入力を、入力部12から受け付ける。
例えばモデル選択入力受付手段49は、利用者が参照モデル41を選択する際の参考のために、基本モデル40と参照モデル41との間の関係性を表すデータである関係性データ48を出力部16のディスプレイ装置に表示してもよい。
【0084】
参照モデル41を選択する利用者の操作入力をモデル選択入力受付手段49が受け付けると、利用者によって選択された参照モデル41は、センサ3から取得した入力データのクラスを識別する。
識別結果選択入力受付手段50は、基本モデル40の識別結果と参照モデル41による識別結果とを出力部16のディスプレイ装置に表示する。
【0085】
識別結果選択入力受付手段50は、基本モデル40による識別結果と参照モデル41による識別結果のうち、入力データのクラスとしてデータ判定装置10から最終的に出力すべき識別結果を選択する利用者の操作入力を、入力部12から受け付ける。
識別結果を選択する利用者の操作入力を識別結果選択入力受付手段50が受け付けると、識別結果出力手段45は、利用者が選択した識別結果を、入力データのクラスとして出力部16のディスプレイ装置に表示する。また識別結果出力手段45は、利用者が選択した識別結果を、外部装置に送信してもよい。
【0086】
なお、第3実施形態のデータ判定装置10は、モデル選択入力受付手段49と識別結果選択入力受付手段50の両方を備えている必要はなく、いずれか一方のみを備えていてもよい。
【0087】
図8は、第3実施形態のデータ判定方法の一例のフローチャートである。ステップS21~S25の処理は、図4を参照して説明したステップS1~S5の処理と同様である。
確信度Cが所定値未満である場合(ステップS24:Y)に処理はステップS26へ進む。ステップS26においてモデル選択入力受付手段49は、基本モデル40と参照モデル41との間の関係性データ48を出力部16のディスプレイ装置に表示する。
【0088】
ステップS27においてモデル選択入力受付手段49は、入力データの識別に使用する参照モデル41を選択する利用者の操作入力を、入力部12から受け付ける。
利用者によって選択された参照モデル41は、ステップS28において入力データのクラスを識別する。
ステップS29において識別結果選択入力受付手段50は、基本モデル40の識別結果と参照モデル41による識別結果とを出力部16のディスプレイ装置に表示する。
【0089】
ステップS30において識別結果選択入力受付手段50は、基本モデル40による識別結果と参照モデル41による識別結果のうちのいずれかを選択する利用者の操作入力を、入力部12から受け付ける。
ステップS31において識別結果出力手段45は、利用者が選択した識別結果を、入力データのクラスとして出力部16のディスプレイ装置に表示する。また識別結果出力手段45は、利用者が選択した識別結果を外部装置に送信する。その後に処理は終了する。
【0090】
(変形例)
(1)上記の第2実施形態の変形例(1)のように、複数の参照モデル41(例えば上記例では参照モデル41α、41β、41γ)の識別結果が一致した場合には、識別結果選択入力受付手段50において利用者の操作入力を受け付けることなく、識別結果出力手段45が参照モデル41による識別結果を出力してもよい。例えば図8のフローチャートにおいて、ステップS29及びS30をスキップしてもよい。
【0091】
(2)モデル選択入力受付手段49は、利用者による複数の参照モデル41の選択を許容してもよい。モデル選択入力受付手段49に代えて、モデル選択手段46が、基本モデル40と所定の関係性を有する複数の参照モデル41を選択してもよい。識別結果選択入力受付手段50は、複数の参照モデル41による識別結果を出力部16のディスプレイ装置に表示して、その中から最終的に出力すべき識別結果を選択する利用者の操作入力を、入力部12から受け付けてもよい。
【0092】
(3)モデル選択入力受付手段49は、関係性データ48を出力部16のディスプレイ装置に表示する際に、上述の所定の関係性「相補性」、「環境の属性の類似性」及び「利用履歴」のうち複数の関係性の関係性データ48を表示してもよい。モデル選択入力受付手段49は、複数の関係性の関係性データ48を同時に表示してもよく、異なるタイミングで順次表示してもよい。例えば「相補性」の関係性データ48を先に表示して、「相補性」に基づいて複数の参照モデル41を選択するユーザの操作入力を受け付けた後に、「環境の属性の類似性」の関係性データ48を表示してもよい。そして「相補性」に基づいて選択された参照モデル41の中から1つ又は複数の参照モデル41を選択するユーザの操作入力を受け付けてもよい。
【0093】
(実施形態の効果)
(1)データ判定装置10は、入力データのクラスを識別する基本モデル40と、基本モデル40が入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出手段43と、推論結果の確信度が所定値未満の場合に、基本モデル40と所定の関係性を有する学習モデルとして選択された参照モデル41によって入力データのクラスを識別した推論結果に基づいて、入力データのクラスを判定するデータ判定手段44と、を備える。
【0094】
これにより、基本モデル40による推論結果の確信度が低い場合に、より確信度が高い推論結果を出力する参照モデル41を用いて入力データのクラスを判定することが可能となる。
また、センサが写した入力データのクラスを識別する学習モデルを、複数の異なる監視領域に個別に設置し、個々の監視領域で取得したデータを学習データとして用いて学習モデルを学習させてそれぞれの監視領域に学習モデルを適応させた場合に、他の監視領域において学習した学習モデルを参照モデル41として使用して、複数の異なる監視領域の学習モデル同士を連携させることにより、個々の監視領域における識別精度を向上させることができる。
【0095】
(2)データ判定装置10は、入力データを説明変数として目的変数を予測する基本モデル40と、基本モデル40が入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出手段43と、推論結果の確信度が所定値未満の場合に、基本モデルと所定の関係性を有する学習モデルとして選択された参照モデル41によって入力データに対する目的変数を予測した推論結果に基づいて、入力データに対する目的変数を判定するデータ判定手段44と、を備える。
これにより、基本モデル40による推論結果の確信度が低い場合に、より確信度が高い識別結果を出力する参照モデル41を用いて入力データに対する目的変数を判定することが可能となる。
【0096】
(3)参照モデル41は、所定の関係性として、基本モデル40と参照モデル41との間の相補性に基づいて選択された学習モデルであってよい。
これにより、基本モデル40が誤り易い入力データに対して正しい識別結果を出力する確率が高い参照モデル41を利用できる。
【0097】
(4)基本モデル40と参照モデル41との間の相補性は、基本モデル40による推論結果と参照モデル41による推論結果との間の相関に基づいて設定してもよい。
これにより、同じデータに対して異なる推論結果を出力する学習モデルどうしを、相補性の大きな学習モデルとして関係付けることができる。
【0098】
(5)参照モデル41は、所定の関係性として、基本モデル40が利用される環境の属性と参照モデル41が利用される環境の属性との間の類似性に基づいて選択された学習モデルであってよい。
これにより、基本モデル40が利用される環境の属性と類似する属性の環境で取得した入力データを学習データとして用いて学習した学習モデルを、参照モデル41として選択できる。このような参照モデル41を用いることにより、基本モデル40の推論結果の確信度が低い場合であっても精度の高い推論結果を期待できる。
【0099】
(6)参照モデル41は、所定の関係性として、基本モデル40の代替として過去に参照モデルが利用された利用履歴に基づいて選択された学習モデルであってもよい。
このように過去に利用された実績がある参照モデル41を利用することにより、基本モデル40の推論結果の確信度が低い場合であっても精度の高い推論結果を期待できる。
【0100】
(7)基本モデル40が識別モデルである場合に、確信度算出手段43は、入力データが入力された場合に基本モデル40から出力される識別スコア、識別スコアと判定閾値との乖離量、入力データを摂動させた場合の識別スコアの変動量、基本モデル40により算出された推論結果の不確実性、基本モデル40の使用を開始してからの経過期間の期間長のうち少なくとも1つに基づいて確信度を算出してよい。基本モデル40が回帰モデルである場合に、確信度算出手段43は、入力データを摂動させた場合の推論結果の変動量、基本モデル40により算出された前記推論結果の不確実性、基本モデル40の使用を開始してからの経過期間の期間長のうち少なくとも1つに基づいて確信度を算出してよい。
これにより、基本モデル40の推論結果の確信度を定量的に評価することができる。
【0101】
(8)データ判定装置10は、基本モデル40の推論結果の確信度が所定値未満の場合に参照モデル41として推論結果を出力させる学習モデルの候補リストを設定する利用者の操作入力を受け付ける入力受付手段と、複数の利用者ごとに設定された基本モデル40の複数の候補リストを記憶する記憶手段と、を備えてもよい。データ判定手段44は、基本モデル40の推論結果の確信度が所定値未満の場合に、基本モデル40について記憶された複数の候補リストに基づいて推論結果を出力させる参照モデル41を選択してよい。
これにより利用者の嗜好に合う参照モデル41を用いて、入力データのクラスの識別や、入力データを説明変数とする目的変数の予測が可能となる。
【0102】
(9)データ判定装置10は、入力データのクラスを識別する基本モデル40及び複数の参照モデル41と、基本モデル40が入力データのクラスを識別した結果である推論結果の確信度を算出する確信度算出手段43と、基本モデルと参照モデルとの間の各々の所定の関係性を利用者に表示する表示部16と、複数の参照モデル41のうち入力データの識別に使用する1以上の参照モデル41を選択する利用者の操作入力を受け付ける入力受付部12と、推論結果の確信度が所定値未満の場合に、利用者によって選択された参照モデル41によって入力データのクラスを識別した推論結果に基づいて、入力データのクラスを判定するデータ判定手段44と、を備えてもよい。
これにより、基本モデル40による推論結果の確信度が低い場合に、より確信度が高い推論結果を出力する参照モデル41を用いて入力データのクラスを判定することが可能となる。
【0103】
(10)データ判定装置10は、入力データを説明変数として目的変数を予測する基本モデル40及び複数の参照モデル41と、基本モデル40が入力データに対する目的変数を予測した結果である推論結果の確信度を算出する確信度算出部43と、基本モデル40と参照モデル43との間の各々の所定の関係性を利用者に表示する表示部16と、複数の参照モデル41のうち目的変数の予測に使用する1以上の参照モデル41を選択する利用者の操作入力を受け付ける入力受付部と、推論結果の確信度が所定値未満の場合に、利用者によって選択された参照モデル41によって入力データに対する目的変数を予測した推論結果に基づいて、入力データに対する目的変数を判定するデータ判定手段44と、を備えてもよい。
これにより、基本モデル40による推論結果の確信度が低い場合に、より確信度が高い識別結果を出力する参照モデル41を用いて入力データに対する目的変数を判定することが可能となる。
【符号の説明】
【0104】
1…監視領域、2…識別対象、3…センサ、10…データ判定装置、12…入力部、13、21…通信部、14、22…記憶部、15、23…制御部、16…出力部、20…サーバ装置、24、24a~24c、41、41a~41c…参照モデル、40…基本モデル、42…モデル取得手段、43…確信度算出手段、44…データ判定手段、45…識別結果出力手段、46…モデル選択手段、47…データ記憶手段、48…関係性データ、49…モデル選択入力受付手段、50…識別結果選択入力受付手段
図1
図2
図3
図4
図5
図6
図7
図8