特開2022-37734 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 公立大学法人会津大学の特許一覧 ▶ アルプス電気株式会社の特許一覧

特開2022-37734学習プログラム、学習装置及び学習方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022037734

(43)【公開日】2022-03-09

(54)【発明の名称】学習プログラム、学習装置及び学習方法

(51)【国際特許分類】

G06T 7/00 20170101AFI20220302BHJP

【ＦＩ】

G06T7/00 350B

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2020142017

(22)【出願日】2020-08-25

(71)【出願人】

【識別番号】506301140

【氏名又は名称】公立大学法人会津大学

(71)【出願人】

【識別番号】000010098

【氏名又は名称】アルプスアルパイン株式会社

(74)【代理人】

【識別番号】100094525

【弁理士】

【氏名又は名称】土井健二

(74)【代理人】

【識別番号】100094514

【弁理士】

【氏名又は名称】林恒徳

(72)【発明者】

【氏名】富岡洋一

(72)【発明者】

【氏名】趙強福

(72)【発明者】

【氏名】志村魁星

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096AA02

5L096AA06

5L096BA04

5L096BA08

5L096CA04

5L096DA03

5L096FA59

5L096FA66

5L096FA69

5L096KA04

(57)【要約】

【課題】走行経路上における踏切の検出を精度良く行うことを可能とする学習プログラム、学習装置及び学習方法を提供する。
【解決手段】撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出し、複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成し、複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する。
【選択図】図１０

【特許請求の範囲】

【請求項1】

撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、前記複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出し、
前記複数の学習用画像データごとに、各学習用画像データに映る前記複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成し、
前記複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する、
処理をコンピュータに実行させることを特徴とする学習プログラム。

【請求項2】

請求項１において、
前記複数種類の物体は、踏切警標を含む、
ことを特徴とする学習プログラム。

【請求項3】

請求項２において、
前記複数種類の物体は、前記踏切警標に取り付けられた信号機、方向指示器及び注意柵のうちの少なくとも１つを含む、
ことを特徴とする学習プログラム。

【請求項4】

請求項１において、
前記所定の場所は、踏切が存在する場所である、
ことを特徴とする学習プログラム。

【請求項5】

請求項１において、
前記学習モデルは、決定木モデルである、
ことを特徴とする学習プログラム。

【請求項6】

請求項１において、さらに、
撮像装置によって撮像された検出用画像データを取得したことに応じて、前記検出用画像データに映る前記複数種類の物体をそれぞれの数を特定し、
前記複数種類の物体のそれぞれの数の入力に伴って前記学習モデルから出力される値から、前記検出用画像データに映る場所が前記所定の場所であるか否かの判定を行い、
前記判定の結果を出力する、
処理をコンピュータに実行させることを特徴とする学習プログラム。

【請求項7】

撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、前記複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出する物体検出部と、
前記複数の学習用画像データごとに、各学習用画像データに映る前記複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成する学習データ生成部と、
前記複数の学習データを用いた機械学習を行うことによって、学習モデルを生成するモデル生成部と、を有する、
ことを特徴とする学習装置。

【請求項8】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習プログラム、学習装置及び学習方法に関する。

【背景技術】

【0002】

近年、高齢者の生活活動を支援することを目的とした電動カート（以下、シニアカーとも呼ぶ）の利用が広がっている。高齢者は、例えば、シニアカーに乗車して買い物等の外出を行うことで、外出に伴う身体への負担を軽減させることが可能になる。

【0003】

ここで、上記のようなシニアカーは、例えば、悪路等の影響によって走行中に転倒する可能性がある。そして、高齢者は、この場合、自力で立ち上がることができない可能性がある。

【0004】

そのため、シニアカーは、例えば、特に走行を慎重に行う必要がある場所（例えば、走行経路上にある踏切）の存在を検出しながら走行を行う。そして、シニアカーは、例えば、走行経路上における踏切の存在を検知した場合、存在を検知した踏切についての情報を運転者（高齢者）に通知する。これにより、シニアカーは、走行時における運転者（高齢者）の安全を確保することが可能になる（特許文献１乃至３を参照）。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０２０－０４２８５３号公報

【特許文献2】特開２０１７－０１６６０４号公報

【特許文献3】特開平１１－３３９１９７号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

上記のような踏切の検知は、シニアカーの運転者の安全性を確保する観点から、可能な限り精度良く行う必要がある。しかしながら、従来の方法による検知方法は、精度の点においてまだ不十分である場合がある。そのため、シニアカーの分野では、走行経路上における踏切の検知をより精度良く行うことができる方法が求められている。

【0007】

そこで、本発明の目的は、走行経路上における踏切の検出を精度良く行うことを可能とする学習プログラム、学習装置及び学習方法を提供することにある。

【課題を解決するための手段】

【0008】

上記目的を達成するための本発明における学習プログラムは、撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、前記複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出し、前記複数の学習用画像データごとに、各学習用画像データに映る前記複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成し、前記複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する、処理をコンピュータに実行させることを特徴とする。

【0009】

また、上記目的を達成するための本発明における学習プログラムは、撮像装置によって撮像された検出用画像データを取得したことに応じて、前記検出用画像データに映る前記複数種類の物体をそれぞれの数を特定し、前記複数種類の物体のそれぞれの数の入力に伴って前記学習モデルから出力される値から、前記検出用画像データに映る場所が前記所定の場所であるか否かの判定を行い、前記判定の結果を出力する、処理をコンピュータに実行させることを特徴とする。

【0010】

また、上記目的を達成するための本発明における学習装置は、撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、前記複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出する物体検出部と、前記複数の学習用画像データごとに、各学習用画像データに映る前記複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成する学習データ生成部と、前記複数の学習データを用いた機械学習を行うことによって、学習モデルを生成するモデル生成部と、を有する、ことを特徴とする。

【0011】

また、上記目的を達成するための本発明における学習方法は、撮像装置によって撮像された複数の学習用画像データを取得したことに応じて、前記複数の学習用画像データごとに、各学習用画像データに映る複数種類の物体をそれぞれ検出し、前記複数の学習用画像データごとに、各学習用画像データに映る前記複数種類の物体のそれぞれの数に対して、各学習用画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成し、前記複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する、処理をコンピュータに実行させることを特徴とする。

【発明の効果】

【0012】

本発明における学習プログラム、学習装置、学習方法によれば、走行経路上における踏切の検出を精度良く行うことが可能になる。

【図面の簡単な説明】

【0013】

【図1】図１は、第１の実施の形態における情報処理装置１の構成例を示す図である。

【図2】図２は、シニアカー３と踏切４との関係を説明する図である。

【図3】図３は、第１の実施の形態における検出端末２の構成例を示す図である。

【図4】図４は、第１の実施の形態における学習処理の概略について説明する図である。

【図5】図５は、第１の実施の形態における推論処理の概略について説明する図である。

【図6】図６は、第１の実施の形態における学習処理の詳細を説明するフローチャート図である。

【図7】図７は、第１の実施の形態における推論処理の詳細を説明するフローチャート図である。

【図8】図８は、踏切４の具体例について説明する図である。

【図9】図９は、学習モデルの具体例について説明する図である。

【図10】図１０は、学習モデルの具体例について説明する図である。

【図11】図１１は、第１の実施の形態における推論処理の判定精度について説明する図である。

【発明を実施するための形態】

【0014】

以下、図面を参照して本発明の実施の形態について説明する。しかしながら、かかる実施の形態例が、本発明の技術的範囲を限定するものではない。

【0015】

初めに、第１の実施の形態における情報処理装置１（以下、学習装置１とも呼ぶ）の構成例について説明を行う。図１は、第１の実施の形態における情報処理装置１の構成例を示す図である。

【0016】

情報処理装置１は、コンピュータ装置であって、例えば、汎用的なＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）である。そして、情報処理装置１は、図２に示すように、シニアカー３の走行経路上に存在する踏切４の検出を行う学習モデルの学習処理（以下、単に学習処理とも呼ぶ）を行う。

【0017】

情報処理装置１は、汎用的なコンピュータ装置のハードウエア構成を有し、例えば、図１に示すように、プロセッサであるＣＰＵ１０１と、メモリ１０２と、通信インタフェース１０３と、記憶媒体１０４とを有する。各部は、バス１０５を介して互いに接続される。

【0018】

記憶媒体１０４は、例えば、学習処理を行うためのプログラム（図示しない）を記憶するプログラム格納領域（図示しない）を有する。

【0019】

また、記憶媒体１０４は、例えば、学習処理を行う際に用いられる情報を記憶する記憶部１１０（以下、記憶領域１１０とも呼ぶ）を有する。なお、記憶媒体１０４は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）であってよい。

【0020】

ＣＰＵ１０１は、記憶媒体１０４からメモリ１０２にロードされたプログラムを実行して学習処理を行う。

【0021】

通信インタフェース１０３は、例えば、インターネット網等のネットワークＮＷを介して検出端末２と通信を行う。

【0022】

次に、第１の実施の形態における検出端末２の構成例について説明を行う。図３は、第１の実施の形態における検出端末２の構成例を示す図である。

【0023】

検出端末２は、コンピュータ装置であって、例えば、スマートフォン等の携帯端末である。そして、検出端末２は、図２に示すように、例えば、シニアカー３の進行方向前方付近に取り付けられる機器であって、情報処理装置１が生成した学習モデルを用いることによる推論処理（以下、単に推論処理とも呼ぶ）を行う。

【0024】

検出端末２は、汎用的なコンピュータ装置のハードウエア構成を有し、例えば、図３に示すように、プロセッサであるＣＰＵ２０１と、メモリ２０２と、通信インタフェース２０３と、記憶媒体２０４とを有する。各部は、バス２０５を介して互いに接続される。

【0025】

記憶媒体２０４は、例えば、学習処理を行うためのプログラム（図示しない）を記憶するプログラム格納領域（図示しない）を有する。

【0026】

また、記憶媒体２０４は、例えば、情報処理装置１が生成した学習モデルを用いることによる推論処理を行う際に用いられる情報を記憶する記憶部２１０（以下、記憶領域２１０とも呼ぶ）を有する。なお、記憶媒体２０４は、例えば、ＨＤＤやＳＳＤであってよい。

【0027】

ＣＰＵ２０１は、記憶媒体２０４からメモリ２０２にロードされたプログラムを実行して学習処理を行う。

【0028】

通信インタフェース２０３は、例えば、インターネット網等のネットワークＮＷを介して情報処理装置１と通信を行う。なお、情報処理装置１と検出端末２との間における情報の移動は、例えば、作業者がＵＳＢメモリ等の記憶媒体等を用いることによって手動で行うものであってもよい。

【0029】

具体的に、検出端末２は、例えば、シニアカー３の走行時において、カメラ等の撮像装置２ａが撮像した走行経路についての動画データに含まれる画像データを、情報処理装置１から予め受信した学習モデルに対して連続的に入力する。そして、検出端末２は、学習モデルから出力された値を用いることにより、シニアカー３の走行経路上に存在する踏切４の検出を連続的に行う。さらに、検出端末２は、例えば、シニアカー３の運転手（高齢者）に対して、走行経路上に踏切４が存在していることを通知する。

【0030】

なお、検出端末２は、走行経路についての動画データを撮像する撮像装置２ａを内蔵するものであってもよい。

【0031】

また、以下、学習処理が情報処理装置１において行われる場合について説明を行うが、学習処理は、検出端末２において行われるものであってもよい。すなわち、検出端末２は、自装置において生成した学習モデルを用いることによって推論処理を行うものであってもよい。

【0032】

［第１の実施の形態の概略］
次に、第１の実施の形態における学習処理及び推論処理の概略について説明を行う。

【0033】

初めに、第１の実施の形態における学習処理の概略について説明を行う。図４は、第１の実施の形態における学習処理の概略について説明する図である。

【0034】

情報処理装置１の画像取得部１１１は、例えば、学習モデルの生成に用いられる複数の画像データ（以下、学習用画像データとも呼ぶ）を取得する。

【0035】

具体的に、画像取得部１１１は、例えば、作業者によって予め記憶領域１１０に記憶された動画データ（例えば、撮像装置２ａによって予め撮像された動画データ）を構成する複数の画像データを取得する。

【0036】

そして、情報処理装置１の物体検出部１１２は、画像取得部１１１が取得した複数の画像データごとに、各画像データに映る複数種類の物体をそれぞれ検出する。

【0037】

具体的に、物体検出部１１２は、画像取得部１１１が取得した複数の画像データごとに、各画像データに映る踏切警標、信号機、方向指示器及び注意柵のそれぞれを検出する。

【0038】

続いて、情報処理装置１の学習データ生成部１１３は、画像取得部１１１が取得した複数の画像データごとに、各画像データに映る複数種類の物体のそれぞれの数に対して、各画像データに映る場所が踏切４であるか否かを示す情報（正解ラベル）を付加することによって、複数の学習データを生成する。

【0039】

具体的に、学習データ生成部１１３は、例えば、踏切４が存在する場所を映した画像データごとに、物体検出部１１２が検出した踏切警標、信号機、方向指示器及び注意柵のそれぞれの数に対して、踏切４が映る画像データであることを示す正解ラベルを付加することによって、複数の学習データを生成する。

【0040】

また、学習データ生成部１１３は、例えば、踏切４が存在しない場所を映した画像データごとに、物体検出部１１２が検出した踏切警標、信号機、方向指示器及び注意柵のそれぞれの数に対して、踏切４が映らない画像データであることを示す正解ラベルを付加することによって、複数の学習データを生成する。

【0041】

すなわち、学習データ生成部１１３は、踏切４が存在する場所を映した画像データと、踏切４が映る画像データであることを示す正解ラベルとを対応付けた学習データだけでなく、踏切４が存在しない場所を映した画像データ（例えば、踏切警標、信号機、方向指示器及び注意柵のいずれもが映っていない画像データ）と、踏切４が映らない画像データであることを示す正解ラベルとを対応付けた学習データを生成する。

【0042】

これにより、情報処理装置１は、踏切４が存在する場所を映した画像データを含む学習データのみを用いた場合と比較して、踏切４の検出精度が高い学習モデルを生成することが可能になる。具体的に、情報処理装置１は、踏切４が存在する場所を映した画像データを含む学習データのみを用いた場合と比較して、例えば、踏切４が映っている画像データにおいて踏切４の検出を確率が高く、かつ、踏切４が映っていない画像データにおいて踏切４の誤検出を行う確率が低い学習モデルの生成を行うことが可能になる。

【0043】

その後、情報処理装置１のモデル生成部１１４は、学習データ生成部１１３が生成した複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する。

【0044】

具体的に、モデル生成部１１４は、例えば、学習データ生成部１１３が生成した複数の学習データを用いた機械学習を行うことによって、決定木を用いた学習モデル（以下、決定木モデルとも呼ぶ）を生成する。

【0045】

次に、第１の実施の形態における推論処理の概略について説明を行う。図５は、第１の実施の形態における推論処理の概略について説明する図である。

【0046】

検出端末２の画像取得部２１１は、例えば、撮像装置２ａによって撮像された動画データに含まれる画像データ（以下、検出用画像データとも呼ぶ）を取得する。具体的に、画像取得部２１１は、例えば、検出端末２から送信された画像データを受信する。

【0047】

そして、検出端末２の物体検出部２１２は、画像取得部２１１が取得した画像データに映る複数種類の物体をそれぞれの数を特定する。

【0048】

具体的に、物体検出部２１２は、画像取得部２１１が取得した画像データに映る踏切警標、信号機、方向指示器及び注意柵のそれぞれの数を特定する。

【0049】

続いて、検出端末２の場所判定部２１３は、物体検出部２１２が検出した複数種類の物体のそれぞれの数の入力に伴って学習モデルから出力される値から、画像取得部２１１が取得した画像データに映る場所が踏切４であるか否かの判定を行う。

【0050】

その後、検出端末２の情報出力部２１４は、例えば、場所判定部２１３による判定結果をシニアカー３の運転者（高齢者）に対して通知する。

【0051】

すなわち、本実施の形態における情報処理装置１は、例えば、画像データに含まれる踏切警標や信号機の数を特徴量として抽出した学習データを用いることによって、シニアカー３の走行経路上に踏切４が存在するか否かについての判定を行う学習モデル（決定木モデル）を生成する。

【0052】

これにより、情報処理装置１は、生成した学習モデルを用いることで、シニアカー３の走行経路上における踏切４の検出を高い精度で行うことが可能になる。そのため、情報処理装置１は、シニアカー３の走行中における運転者の安全性をより確保することが可能になる。

【0053】

［第１の実施の形態の詳細］
次に、第１の実施の形態における学習処理及び推論処理の詳細について説明を行う。図６及び図７は、第１の実施の形態における学習処理及び推論処理の詳細を説明するフローチャート図である。また、図８から図１１は、第１の実施の形態における学習処理及び推論の詳細を説明する図である。

【0054】

［学習処理の詳細］
初めに、第１の実施の形態における学習処理の詳細について説明を行う。図６は、学習処理の詳細について説明する図である。

【0055】

画像取得部１１１は、図６に示すように、例えば、学習タイミングになるまで待機する（Ｓ１１のＮＯ）。学習タイミングは、例えば、作業者が操作端末（図示しない）を介して学習モデルの学習処理を開始する旨の情報を入力したタイミングであってよい。

【0056】

そして、学習タイミングになった場合（Ｓ１１のＹＥＳ）、画像取得部１１１は、記憶領域１１０に記憶された動画データを構成する複数の画像データを取得する（Ｓ１２）。

【0057】

続いて、物体検出部１１２は、Ｓ１２の処理で取得した複数の画像データごとに、各画像データに映る複数種類の物体のそれぞれを検出する（Ｓ１３）。

【0058】

具体的に、図８に示す踏切４は、踏切警標４１ａ及び踏切警標４２ａ（以下、これらを総称して単に踏切警標４ａとも呼ぶ）と、信号機４１ｂ及び信号機４２ｂ（以下、これらを総称して単に信号機４ｂとも呼ぶ）と、方向指示器４ｃと、注意柵４ｄとを有している。そのため、物体検出部１１２は、Ｓ１３の処理において、例えば、図８に示す踏切４が映る画像データから、踏切警標４１ａ、踏切警標４２ａ、信号機４１ｂ、信号機４２ｂ、方向指示器４ｃ及び注意柵４ｄのそれぞれを検出する。

【0059】

なお、物体検出部１１２は、この場合、例えば、学習済の学習モデル（ＹＯＬＯ（ＹｏｕＯｎｌｙＬｉｖｅＯｎｃｅ）やＳＳＤ（ＳｉｎｇｌｅＳｈｏｔＭｕｌｔｉｂｏｘＤｅｔｅｃｔｏｒ）等による学習モデル）を用いることによって、踏切警標４ａ等の検出を行うものであってよい。

【0060】

その後、学習データ生成部１１３は、Ｓ１２の処理で取得した複数の画像データごとに、各画像データに映る複数種類の物体のそれぞれの数に対して、各画像データに映る場所が所定の場所であるか否かを示す情報を付加することによって、複数の学習データを生成する（Ｓ１３）。そして、学習データ生成部１１３は、例えば、生成した複数の学習データを記憶領域１１０に記憶する。

【0061】

具体的に、図８に示す踏切４には、２つの踏切警標４ａ（踏切警標４１ａ及び踏切警標４２ａ）と、２つの信号機４ｂ（信号機４１ｂ及び信号機４２ｂ）と、１つの方向指示器４ｃと、１つの注意柵４ｄとが含まれている。そのため、学習データ生成部１１３は、この場合、踏切警標４ａの数を示す「２」と、信号機４ｂの数を示す「２」と、方向指示器４ｃの数を示す「１」と、注意柵４ｄの数を示す「１」とに対して、踏切４が映る画像データであることを示す正解ラベルを付加することによって、学習データを生成する。

【0062】

その後、モデル生成部１１４は、Ｓ１４の処理で生成した複数の学習データを用いた機械学習を行うことによって、学習モデルを生成する（Ｓ１５）。以下、Ｓ１５の処理で生成される学習モデルの具体例について説明を行う。

【0063】

［学習モデルの具体例］
図９は、学習モデルの具体例について説明する図である。具体的に、図９は、決定木モデルの具体例である。

【0064】

モデル生成部１１４は、図９に示すように、学習データ生成部１１３が生成した複数の学習データを学習させることによって、踏切警標４ａの数が１以上であるか否かを判定する分岐ＢＲ１と、方向指示器４ｃの数が２以上であるか否かを判定する分岐ＢＲ２と、信号機４ｂの数が１以上であるか否かを判定する分岐ＢＲ３とを含む決定木モデルＭＤ１を生成する。

【0065】

そして、学習モデルＭＤ１は、推論処理において、例えば、画像データ（検出用画像データ）に映る複数種類の物体の数を示す情報が入力された場合、その画像データに踏切４が映っているか否かについての情報を出力する。

【0066】

具体的に、例えば、画像データ（検出用画像データ）に映る踏切警標４ａの数が０であって方向指示器４ｃの数が１以下であることを示す情報が入力された場合、決定木モデルＭＤ１は、図９に示すように、その画像データに踏切４が映っていないと判定する。また、例えば、画像データに映る踏切警標４ａの数が０であって方向指示器４ｃの数が２以上であることを示す情報が入力された場合、決定木モデルＭＤ１は、その画像データに踏切４が映っていると判定する。また、例えば、画像データに映る踏切警標４ａの数が１以上であって信号機４ｂの数が０であることを示す情報が入力された場合、決定木モデルＭＤ１は、その画像データに踏切４が映っていないと判定する。さらに、例えば、画像データに映る踏切警標４ａの数が１以上であって信号機４ｂの数が１以上であることを示す情報が入力された場合、決定木モデルＭＤ１は、その画像データに踏切４が映っていると判定する。

【0067】

［推論処理の詳細］
次に、第１の実施の形態における推論処理の詳細について説明を行う。図７は、推論処理の詳細について説明する図である。

【0068】

画像取得部２１１は、図７に示すように、例えば、推論タイミングになるまで待機する（Ｓ２１のＮＯ）。推論タイミングは、例えば、走行中のシニアカー３に搭載された撮像装置２ａによって画像データが撮像されたタイミングであってよい。すなわち、推論タイミングは、シニアカー３に搭載された撮像装置２ａが進行方向前方についての画像データ（フレーム）を撮影するごとに訪れるタイミングであってよい。具体的に、撮像装置２ａが撮影する動画データのフレーム数が３０フレームである場合、推論タイミングは、１秒間に３０回訪れるタイミングであってよい。

【0069】

そして、推論タイミングになった場合（Ｓ２１のＹＥＳ）、画像取得部２１１は、撮像装置２ａによって撮像された画像データを取得する（Ｓ２２）。

【0070】

続いて、物体検出部２１２は、Ｓ２２の処理で取得した画像データに映る複数種類の物体のそれぞれの数を特定する（Ｓ２３）。

【0071】

具体的に、物体検出部２１２は、例えば、Ｓ２２の処理で取得した画像データから、踏切警標４ａ、信号機４ｂ、方向指示器４ｃ及び注意柵４ｄのそれぞれを検出する。

【0072】

さらに、場所判定部２１３は、Ｓ２３の処理で特定した数の入力に伴って学習モデルから出力される値から、Ｓ２２の処理で取得した画像データに映る場所が踏切４であるか否かの判定を行う（Ｓ２４）。

【0073】

具体的に、例えば、Ｓ２２の処理で取得した画像データに映る踏切警標４ａ、信号機４ｂ、方向指示器４ｃ及び注意柵４ｄの数のそれぞれが「２」、「２」、「１」及び「１」であることを示す情報が入力された場合、学習モデルＭＤ１は、図１０に示すように、Ｓ２２の処理で取得した画像データが映る場所が踏切４であることを示す情報を出力する。そのため、場所判定部２１３は、この場合、Ｓ２２の処理で取得した画像データに映る場所が踏切４であると判定する。

【0074】

その後、情報出力部２１４は、Ｓ２４の処理における判定結果を出力する（Ｓ２５）。

【0075】

具体的に、情報出力部２１４は、例えば、Ｓ２４の処理において、Ｓ２２の処理で取得した画像データに映る場所が踏切４であると判定した場合、走行経路上に踏切が存在していることを示す情報をシニアカー３の運転者（高齢者）に通知する。

【0076】

なお、場所判定部２１３は、この場合、例えば、走行経路上に踏切が存在していることを示す情報を音声によって通知するものであってもよい。

【0077】

そして、Ｓ２２の処理において全ての画像データを取得していない場合（Ｓ２６のＮＯ）、画像取得部２１１は、Ｓ２２以降の処理を再度行う。

【0078】

一方、Ｓ２２の処理において全ての画像データを取得した場合（Ｓ２６のＹＥＳ）、検出端末２は、推論処理を終了する。

【0079】

すなわち、本実施の形態における情報処理装置１は、例えば、画像データに含まれる踏切警標４ａや信号機４ｂの数を特徴量として抽出した学習データを用いることによって、シニアカー３の走行経路上に踏切４が存在するか否かについての判定を行う決定木モデルを生成する。そして、情報処理装置１は、シニアカー３の走行経路上における踏切４の検出を行う場合、踏切警標４ａ等の物体の検出を行う学習モデル（ＹＯＬＯ等による学習モデル）と決定木モデルとの両方を用いる。

【0080】

これにより、情報処理装置１は、例えば、踏切警標４ａ等の物体の検出を行う学習モデルにおいて誤検出が発生した場合であっても、シニアカー３の走行経路上における踏切４が存在するか否かについての判定を正しく行うことが可能になる。そのため、情報処理装置１は、シニアカー３の走行経路上における踏切４の検出を高い精度で行うことが可能になる。したがって、情報処理装置１は、シニアカー３の走行中における運転者の安全性をより確保することが可能になる。

【0081】

なお、上記の例では、情報処理装置１及び検出端末２が踏切４の検出を行う場合について説明を行ったが、情報処理装置１及び検出端末２は、踏切４以外の場所（例えば、交差点や歩道橋）の検出を行うものであってもよい。

【0082】

［推論処理の判定精度］
次に、第１の実施の形態における推論処理の判定精度について説明を行う。図１１は、第１の実施の形態における推論処理の判定精度について説明する図である。

【0083】

図１１は、画像分類用のＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）による第１学習モデルを用いた場合の推論処理の判定精度と、ＹＯＬＯによる第２学習モデルを用いた場合の推論処理の判定精度と、ＹＯＬＯによる第２学習モデルと決定木モデル（本実施の形態において生成した決定木モデル）との両方を用いた場合の推論処理の判定精度とを示す図である。

【0084】

なお、図１１に示す例では、踏切４が映る５００枚の画像データと、踏切４が映らない１２００枚の画像データとのそれぞれを含む各学習データを用いることによって、各学習モデルの学習処理及び各学習モデルを用いた推論処理を行っている。また、第２学習モデルのみを用いることによる推論処理では、画像データにおいて踏切４に関連する１以上の物体（踏切警標４ａや信号機４ｂ等）が検出された場合、その画像データに踏切４が映っていると判定している。

【0085】

具体的に、図１１は、第１学習モデルを用いた推論処理が行われた場合、「Ａｃｃｕｒａｃｙ」が「９２．４（％）」であり、「Ｒｅｃａｌｌ」が「９９．０（％）」であり、「Ｐｒｅｃｉｓｉｏｎ」が「１１．４（％）」であり、「Ｆ－ｓｃｏｒｅ」が「２０．４（％）」であることを示している。

【0086】

また、図１１は、第２学習モデルのみを用いた推論処理が行われた場合、「Ａｃｃｕｒａｃｙ」が「９８．２（％）」であり、「Ｒｅｃａｌｌ」が「１００．０（％）」であり、「Ｐｒｅｃｉｓｉｏｎ」が「３５．２（％）」であり、「Ｆ－ｓｃｏｒｅ」が「５２．１（％）」であることを示している。

【0087】

さらに、図１１は、第２学習モデルと決定木モデルとの両方を用いた推論処理（本実施の形態における推論処理）が行われた場合、「Ａｃｃｕｒａｃｙ」が「１００．０（％）」であり、「Ｒｅｃａｌｌ」が「１００．０（％）」であり、「Ｐｒｅｃｉｓｉｏｎ」が「１００．０（％）」であり、「Ｆ－ｓｃｏｒｅ」が「１００．０（％）」であることを示している。

【0088】

すなわち、図１１に示す例は、第２学習モデルを用いた推論処理の方が第１学習モデルを用いた推論処理よりも判定精度が高い（誤検出が少ない）ことを示してる。さらに、図１１に示す例は、第２学習モデルと決定木モデルとの両方を用いた推論処理の方が第２学習モデルのみを用いた推論処理よりも判定精度が高い（誤検出が少ない）ことを示している。

【符号の説明】

【0089】

１：情報処理装置
２：検出端末
１０１：ＣＰＵ
１０２：メモリ
１０３：通信インタフェース
１０４：記憶媒体
１０５：バス

【図1】