(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】運転評価システム、学習装置、評価結果出力装置、方法およびプログラム
(51)【国際特許分類】
G09B 19/00 20060101AFI20240910BHJP
G09B 19/16 20060101ALI20240910BHJP
G09B 9/042 20060101ALI20240910BHJP
G08G 1/00 20060101ALI20240910BHJP
【FI】
G09B19/00 H
G09B19/16
G09B9/042 A
G08G1/00 D
(21)【出願番号】P 2022570949
(86)(22)【出願日】2020-12-25
(86)【国際出願番号】 JP2020048743
(87)【国際公開番号】W WO2022137506
(87)【国際公開日】2022-06-30
【審査請求日】2023-05-25
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103090
【氏名又は名称】岩壁 冬樹
(74)【代理人】
【識別番号】100124501
【氏名又は名称】塩川 誠人
(72)【発明者】
【氏名】藤井 秋紗子
(72)【発明者】
【氏名】鹿嶋 卓郎
【審査官】松山 紗希
(56)【参考文献】
【文献】国際公開第2019/167457(WO,A1)
【文献】国際公開第2020/115904(WO,A1)
【文献】国際公開第2020/183609(WO,A1)
【文献】国際公開第2019/150452(WO,A1)
【文献】「熟練者と同レベルの意思決定ができる」AI、NECが開発 「逆強化学習」で「意図」を学習,ITmedia NEWS,2019年07月17日,[online], <URL>https://www.itmedia.co.jp/news/articles/1907/17/news095.html ,[2024年7月29日検索]
(58)【調査した分野】(Int.Cl.,DB名)
G09B 19/00
G09B 19/16
G09B 9/042
G06N 20/00
G08G 1/00
(57)【特許請求の範囲】
【請求項1】
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習手段と、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、
前記利用者が運転する地域を位置情報から特定して、当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価手段とを備えた
ことを特徴とする運転評価システム。
【請求項2】
コスト関数に含まれる特徴量と、当該特徴量の重みとを対応付けて出力する学習結果出力手段を備えた
請求項1記載の運転評価システム。
【請求項3】
地域ごとにトレーニングデータを抽出するデータ抽出手段を備え、
学習手段は、抽出された地域ごとのトレーニングデータを用いて、当該地域ごとのコスト関数を学習する
請求項1または請求項2記載の運転評価システム。
【請求項4】
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習手段とを備えた
ことを特徴とする学習装置。
【請求項5】
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価手段とを備えた
ことを特徴とする評価結果出力装置。
【請求項6】
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習し、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付け、
前記利用者が運転する地域を位置情報から特定して、当該地域に対応するコスト関数を選択し、
選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、
推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する
ことを特徴とする運転評価方法。
【請求項7】
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する
ことを特徴とする学習方法。
【請求項8】
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、
選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、
推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する
ことを特徴とする評価結果出力方法。
【請求項9】
コンピュータに、
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習処理
を実行させるための学習プログラ
ム。
【請求項10】
コンピュータに、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価処理
を実行させるための評価結果出力プログラ
ム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対象者の運転を評価する運転評価システム、および、運転評価方法、運転の評価に用いられるコスト関数を学習する学習装置、学習方法および学習プログラム、並びに、運転の評価結果を出力する評価結果出力装置、評価結果出力方法および評価結果出力プログラムに関する。
【背景技術】
【0002】
様々な指標や模範データを用いて、運転者の走行を評価する方法が各種知られている。例えば、急アクセルや急ブレーキ、急ハンドルは、エコロジカルな運転か否か判断する指標として用いることが可能である。
【0003】
また、他にも、例えば、特許文献1には、被験者の運転技能を自動的に評価する運転技能評価システムが記載されている。特許文献1に記載されたシステムは、見本となる運転データを記録し、記録された運転データに基づいて模範的な運転の走行パターンを学習する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
一方、上述するような急アクセルや急ブレーキ、急ハンドルを検出しただけは、安全な運転か否か(例えば、事故が減っているか否か)を客観的に評価することは難しい。これに対し、特許文献1に記載されているような模範的な走行パターンを学習することで、被験者の運転技能を客観的に評価することができるようになる。
【0006】
ここで、特許文献1に記載されたシステムは、車両の走行位置を評価に加味して学習することで、自動車教習所などにおいて、被験者の運転技能を自動的に評価するものである。しかし、特許文献1に記載されたシステムで学習される模範的な運転者の走行パターンは、実際の運転環境に応じた運転を評価できるものとは言い難い。
【0007】
例えば、交通量の少ない地域では、制限速度よりも低速で運転をしていたとしても、危険な運転とは評価されないと考えられる。一方、交通量の多い地域において低速で運転を続けていた場合、交通渋滞を引き起こす可能性が高く、危険な運転と評価される場合も考えられる。さらに、運転の評価は、地域性や文化、時代などが反映されるものであり、安全運転の定義をグローバルに定義することは難しいと言える。このような内容の評価を、自動車教習所における模範的な運転だけでは補うことは難しい。
【0008】
そのため、運転する地域を考慮することで、誤った指標に基づく評価を抑制し、安全運転に導く評価を行えることが望まれている。
【0009】
そこで、本発明は、運転する地域を考慮して対象者の運転の評価を行うことができる運転評価システムおよび運転評価方法、運転の評価結果を出力する評価結果出力装置、評価結果出力方法および評価結果出力プログラム、並びに、その運転の評価に用いられるコスト関数を学習する学習装置、学習方法および学習プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明による運転評価システムは、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する学習手段と、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、利用者が運転する地域を位置情報から特定して、その地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する評価手段とを備えたことを特徴とする
【0011】
本発明による学習装置は、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する学習手段とを備えたことを特徴とする。
【0012】
本発明による評価結果出力装置は、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、利用者が運転する地域を位置情報から特定してその地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する評価手段とを備えたことを特徴とする。
【0013】
本発明による運転評価方法は、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習し、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付け、利用者が運転する地域を位置情報から特定して、その地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力することを特徴とする。
【0014】
本発明による学習方法は、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習することを特徴とする。
【0015】
本発明による評価結果出力方法は、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付け、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、利用者が運転する地域を位置情報から特定してその地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力することを特徴とする。
【0016】
本発明による学習プログラムは、コンピュータに、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力処理、および、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する学習処理を実行させることを特徴とする。
【0017】
本発明による評価結果出力プログラムは、コンピュータに、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力処理、および、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、利用者が運転する地域を位置情報から特定してその地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する評価処理を実行させることを特徴とする。
【発明の効果】
【0018】
本発明によれば、運転する地域を考慮して対象者の運転の評価を行うことができる。
【図面の簡単な説明】
【0019】
【
図1】本発明による運転評価システムの一実施形態の構成例を示すブロック図である。
【
図4】運転中の差異を可視化する処理の例を説明する説明図である。
【
図5】運転の差異を得点化して出力する処理の例を説明する説明図である。
【
図6】学習装置の動作例を示すフローチャートである。
【
図7】評価結果出力装置の動作例を示すフローチャートである。
【
図8】本発明による運転評価システムの概要を示すブロック図である。
【
図9】本発明による学習装置の概要を示すブロック図である。
【
図10】本発明による評価結果出力装置の概要を示すブロック図である。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態を図面を参照して説明する。
【0021】
図1は、本発明による運転評価システムの一実施形態の構成例を示すブロック図である。本実施形態の運転評価システム1は、評価結果出力装置300と、学習装置400とを備えている。評価結果出力装置300は、車載器101を搭載した車両100、および、スマートフォン200に接続され、併せて、学習装置400にも接続される。
【0022】
なお、本実施形態では、車両100(より具体的には、車載器101)とスマートフォン200とが同じように移動するものとし、各種情報の入力や車載器101への指示、車両100の位置情報の取得にスマートフォン200が用いられる場合を想定する。手軽なスマートフォン200を用いることで、車両100(より具体的には、車載器101)への移動情報の入力や、機能拡張の際の処理を簡素化することが可能になる。ただし、車両100自体がコネクテッド化され、スマートフォン200の機能を車載器101が一体化して実現するように構成されていてもよい。
【0023】
さらに、本実施形態では、評価結果出力装置300が車両100(より具体的には、車載器101)とは別に設けられている場合を例示する。ただし、評価結果出力装置300が車載器101と一体化して実現されるように構成されていてもよい。
【0024】
また、学習装置400は、学習に用いられる各種情報を記憶する記憶装置500および学習結果を表示する表示装置600に接続される。記憶装置500は、例えば、外部ストレージサーバによって実現される。また、表示装置600は、例えば、ディスプレイ装置により実現される。なお、学習装置400が、記憶装置500および表示装置600のいずれか一方または両方を含む構成であってもよい。
【0025】
記憶装置500は、学習に用いられる各種情報として、車両の運転実績を表わすデータ(以下、運転データと記す。)を記憶する。運転データには、運転者の運転(例えば、車両を操作する操作情報)を示す情報、その運転の際の環境を示す情報、および、これらの情報が取得された位置情報(すなわち、運転をした場所を示す位置情報)とが含まれる。なお、これらの情報は、運転の際の特徴を示す特徴量と言うことができる。環境を示す情報には、運転者自身の属性のほか、車外の状況等が含まれていてもよい。記憶装置500は、熟練者と定義される運転者の運転データのみ記憶していてもよく、一般の運転者も含めた運転データを記憶していてもよい。なお、熟練者の定義については後述される。
【0026】
図2は、運転データの例を示す説明図である。
図2に例示する運転データは、項目として、大きく4つの区分(車両に関する情報(車内情報)、車外情報、時間情報、および、天気情報)に分類される項目を含む。運転者の運転を示す情報の一例が、
図2に例示する操作情報(アクセル開度、ブレーキ操作、ハンドル操作など)やエンジン情報における車速などであり、運転をした場所を示す位置情報が、GPSで取得される位置情報に該当する。
【0027】
なお、
図2に例示する運転データは一例であり、運転データが、
図2に例示する全ての項目を含んでいてもよく、一部の項目を含んでいてもよい。また、運転データが、
図2に例示する以外の項目を含んでいてもよい。
【0028】
上述するように、本実施形態で例示する車両100は、車載器101を含む。車載器101には、車外カメラ140、車両情報用センサ150、生体センサ160、車内カメラ170など、各種センサが接続される。また、車載器101は、CPU(Central Processing Unit )111およびメモリ112を備えた制御部110と、通信部120と、記憶部130とを有する。通信部120は、評価結果出力装置300と各種通信を行う。また、記憶部130は、制御部110が処理に用いる各種情報を記憶する。
【0029】
車外カメラ140は、車両100の外部を撮影するカメラである。車外カメラ140は、例えば、車外に存在する他の車両や歩行者、オートバイや自転車などを撮影してもよい。また、車外カメラ140は、車両100が走行している道路の状態(道路形状、混雑情報、信号情報など)を合わせて撮影してもよい。その際、制御部110は、例えば、撮影した画像から、車両や歩行者などの物体認識処理を行ってもよい。
【0030】
車両情報用センサ150は、車両100の各種状態を検出する。車両情報用センサ150は、例えば、CAN(Controller Area Network)に基づいて、エンジン回転数やアクセル開度などの情報を検出してもよい。
【0031】
生体センサ160は、運転者の各種生体情報を検出する。生体センサ160は、例えば、運転者の脈拍や心拍、体温を検出可能なセンサであってもよい。また、生体センサ160は、運転者の生体情報だけでなく、同乗者の生体情報を検出してもよい。
【0032】
車内カメラ170は、車内を撮影するカメラである。車内カメラ170は、例えば、同乗者の有無を撮影してもよい。
【0033】
なお、
図1に記載したセンサは例示であり、車載器101には、これらの一部または全部のセンサが接続されていてもよく、他のセンサが接続されていてもよい。これらのセンサにより検出された情報は、記憶部130に記憶され、また、通信部120を介して評価結果出力装置300に送信される。
【0034】
スマートフォン200は、CPU211およびメモリ212を備えた制御部210と、通信部220と、記憶部230と、入力部240と、移動情報データベース(以下、DB)250とを含む。
【0035】
制御部210は、スマートフォン200が行う各種処理を制御する。通信部220は、評価結果出力装置300と各種通信を行う。また、記憶部230は、制御部210が処理に用いる各種情報を記憶する。入力部240は、スマートフォン200に対する各種入力の他、車載器101に対する制御の入力をユーザから受け付ける。
【0036】
移動情報DB250は、車両100の移動情報を記憶する。具体的には、移動情報DB250は、制御部210によってGPS(Global Positioning System )から取得された車両100の位置情報を時系列に記憶する。これにより、車両100の位置情報(すなわち、運転をした場所を示す位置情報)を運転データに対応付けることが可能になる。
【0037】
学習装置400は、CPU411およびメモリ412を備えた制御部410と、通信部420と、入力部430と、記憶部440と、学習部450とを含む。
【0038】
制御部410は、後述する学習部450の処理を制御する。通信部420は、評価結果出力装置300と各種通信を行う。記憶部440は、制御部410および学習部450が処理に用いる各種情報を記憶する。また、記憶部440は、後述する入力部430が入力を受け付けた運転データを記憶してもよい。記憶部440は、例えば、磁気ディスク等により実現される。
【0039】
入力部430は、記憶装置500から運転データの入力を受け付ける。入力部430は、学習装置400への明示の指示に応じて運転データを記憶装置500から取得してもよく、記憶装置500からの通知に応じて運転データを取得してもよい。また、入力部430は、取得した運転データを記憶部440に記憶させてもよい。なお、受け付けた運転データは、後述する逆強化学習部453が学習に用いるデータであるため、運転データのことを熟練者運転データ、または、トレーニングデータと言うこともある。
【0040】
図3は、学習部450の構成例を示すブロック図である。本実施形態の学習部450は、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454とを含む。
【0041】
コスト関数入力部451は、後述する逆強化学習部453が学習に用いるコスト関数の入力を受け付ける。具体的には、コスト関数入力部451は、
図2に例示するような運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける。なお、この重視度合いは、評価の際の意図を表わしていると言うこともできる。そのため、コスト関数によって算出される値は、運転の評価に用いられる評価指標とも言える。
【0042】
また、コスト関数入力部451は、運転者の運転を示す特徴量だけでなく、運転の際の環境を示す各特徴量に重視度合いがそれぞれ重み付けされた項を線形和として含むコスト関数の入力を受け付けてもよい。運転者の運転を示す特徴量は、例えば、速度や前方車との距離、アクセルペダル踏み込み量である。また、運転の際の環境を示す特徴量は、例えば、道路形状や混雑情報などである。
【0043】
また、コスト関数入力部451は、コスト関数と共に、満たすべき制約条件の入力を受け付けてもよい。コスト関数および制約条件は、分析者等により予め定められる。すなわち、運転を評価する際に考慮すべき特徴量の候補が分析者等により予め選択され、コスト関数として定義される。
【0044】
例えば、運転を評価する際に、速度、前方車のとの距離およびアクセルペダル踏み込み量を特徴量の候補とする場合、コスト関数は、以下に例示する式1で表わされる。
【0045】
コスト関数=α1×速度+α2×前方車との距離+α3×アクセルペダル踏み込み量+β (式1)
【0046】
データ抽出部452は、入力部430が受け付けた運転データから地域ごとにトレーニングデータを抽出する。具体的には、データ抽出部452は、運転データ(トレーニングデータ)が取得された位置情報に基づいて地域ごとにトレーニングデータを抽出する。データ抽出部452は、例えば、GPSから取得した緯度および経度から地域を判断して、トレーニングデータを抽出してもよい。
【0047】
また、データ抽出部452は、コスト関数に含まれる特徴量に合わせるため、運転データに含まれる項目を特徴量へ変換する処理(演算や2値への変換等)やデータの統合処理、データクレンジングなどを行ってもよい。
【0048】
なお、後述する逆強化学習では、運転の上手い人(いわゆる熟練者)の運転データが必要とされる。そこで、運転データに一般の運転者による運転データが含まれている場合、データ抽出部452は、予め定めた基準に基づいて候補とする運転データから熟練者の運転データを抽出する。
【0049】
熟練者の運転データを抽出する方法は任意であり、分析者等により予め定められる。データ抽出部452は、例えば、総運転時間の長い運転者、事故歴や違反歴の少ない運転者を熟練者とし、その運転者の運転データを熟練者の運転データとして抽出してもよい。
【0050】
さらに、データ抽出部452は、熟練者の運転データのうち、該当する地域に関連する運転者の運転データを、より適切な熟練者の運転データとして優先的に選択してもよい。例えば、該当する地域に居住する運転者は、その地域の状況をより把握していると考えられるからである。データ抽出部452は、例えば、ナンバープレートから運転者の関連する地域を判断してもよい。
【0051】
逆強化学習部453は、データ抽出部452によって抽出された地域ごとのトレーニングデータを用いた逆強化学習により、地域ごとのコスト関数を学習する。具体的には、逆強化学習部453は、地域ごとに収集された熟練者の運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する。すなわち、このトレーニングデータには、熟練者の運転の内容を表わす情報が含まれる。また、このトレーニングデータに、その運転の際の環境を示す情報が含まれていてもよい。
【0052】
逆強化学習部453が逆強化学習を行う方法は任意である。逆強化学習部453は、例えば、入力されたコスト関数および制約条件に基づいて熟練者の運転データを生成する数理最適化処理の実行と、生成された熟練者の運転データとトレーニングデータとの差分を小さくするようにコスト関数のパラメータ(重視度合い)を更新するコスト関数の推定処理を繰り返すことで、コスト関数を学習してもよい。
【0053】
学習結果出力部454は、学習されたコスト関数を出力する。具体的には、学習結果出力部454は、地域ごとに学習されたコスト関数に含まれる特徴量と、その特徴量の重みとを対応付けて出力する。学習結果出力部454は、コスト関数の内容を表示装置600に表示してもよく、記憶部440に記憶させてもよい。表示装置600にコスト関数の内容を表示することにより、地域ごとに重視する項目を視認することが可能になる。
【0054】
例えば、上記式1に例示するコスト関数のパラメータ(重視度合い)が、以下に例示する式2のように学習されたとする。
コスト関数=100×速度+50×前方車との距離+10×アクセルペダル踏み込み量 (式2)
この場合、学習結果出力部454は、[速度,前方車との距離]の評価の重みを[100,50,10]と出力してもよい。
【0055】
また、学習結果出力部454は、評価の重みとして、重視度合いの大きい特徴量から順に予め定めた数だけ出力するようにしてもよい。そのようにすることで、熟練者の意図をより反映した特徴量を把握することが可能になる。
【0056】
学習部450(より具体的には、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454)は、プログラム(学習プログラム)に従って動作するコンピュータのプロセッサによって実現される。
【0057】
例えば、プログラムは、学習装置400の記憶部440に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、学習部450(より具体的には、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454)として動作してもよい。また、学習部450(より具体的には、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454)の各機能がSaaS(Software as a Service )形式で提供されてもよい。
【0058】
また、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454は、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
【0059】
また、学習部450(より具体的には、コスト関数入力部451と、データ抽出部452と、逆強化学習部453と、学習結果出力部454)の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
【0060】
なお、学習部450が制御部410自体に含まれていてもよい。この場合、制御部410は、CPU411によってメモリ412に記憶されたプログラム(学習プログラム)が読み込まれ、そのプログラムに従って、学習部450として動作してもよい。
【0061】
評価結果出力装置300は、CPU311およびメモリ312を備えた制御部310と、通信部320と、入力部330と、運転実績DB340と、利用者DB350と、表示部360と、評価部370とを含む。
【0062】
制御部310は、後述する評価部370の処理を制御する。通信部320は、車両100(より具体的には、車載器101)、スマートフォン200、学習装置400等と各種通信を行う。
【0063】
運転実績DB340は、車載器101やスマートフォン200から送られてきた各種情報を基に生成される運転データを記憶する。利用者DB350は、運転を評価する対象の利用者の各種情報(例えば、年齢や性別、過去運転履歴、自己履歴、総運転時間など)を記憶する。運転実績DB340および利用者DB350は、例えば、磁気ディスク等により実現される。
【0064】
入力部330は、通信部320を介して受信した利用者の運転データの入力を受け付ける。具体的には、入力部330は、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、これらの情報が取得された位置情報を含む運転データの入力を受け付ける。なお、上述する熟練者の運転データ(熟練者運転データ)と区別するため、ここで入力された利用者の運転のことを、利用者運転データと記すこともある。
【0065】
評価部370は、熟練者の運転と対象者の運転とを比較した評価結果を出力する。具体的には、評価部370は、利用者が運転する地域を位置情報から特定して、その地域に対応するコスト関数を選択する。次に、評価部370は、対象者が運転する環境の情報を選択されたコスト関数に適用して、同一の環境における熟練者の運転を推定する。そして、評価部370は、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する。評価部370は、評価結果を表示部360に表示させてもよい。
【0066】
評価部370は、利用者の運転を一括して(すなわち、運転開始から運転終了までの期間をまとめて)評価してもよいし、利用者の運転時に逐次評価してもよい。
【0067】
表示部360は、評価部370による評価結果を出力する表示装置である。なお、評価結果出力装置300は、表示部360に表示させる内容を、車載器101や、スマートフォン200に送信して表示させてもよい。
【0068】
以下、評価部370が出力する評価結果の具体例を説明する。第一の具体例は、対象者の運転と熟練者の運転との差異を可視化する例である。
図4は、第一の具体例(運転中の差異を可視化する処理の例)を説明する説明図である。
【0069】
対象者が、ある環境(条件)のもとで運転を行っている状況を想定する。ここでは、具体例として、「東京都港区、緩やかなカーブ、渋滞中」という環境(条件)を想定する。この環境(条件)において、対象者は、ある時刻Tにおいて「時速60km、アクセルペダル踏み込み量20%」で運転をしていたとする。
【0070】
ここで、評価部370は、同じ環境(条件)において推定される熟練者の運転を、学習されたコスト関数に基づいて推定する。この場合の熟練者として、例えば、該当する地域に関連する運転者である「東京都港区の自動車教習所の教官」が挙げられる。その結果、例えば、熟練者の運転が「時速65km、アクセルペダル踏み込み量30%」と推定される。評価部370は、この推定結果に基づき、対象者の運転と熟練者の運転との差異を時系列に算出する。評価部370は、この算出結果を
図4に例示するように可視化してもよい。
【0071】
また、例えば、運転者に通知する条件(通知条件)が「速度差が±5kmを超えた場合」と定義されていたとする。
図4に示す例において、時刻Tにおける熟練者の運転との速度差は、「+5km」である。そこで、評価部370は、速度を上昇させるために、運転者に対して「アクセルを強く踏みましょう」と音声や表示等で通知してもよい。このように、評価部370は、算出した差異が予め定めた通知条件を満たした場合に、その差異を示す内容を通知してもよい。
【0072】
また、通知の条件が、学習済みのコスト関数に基づいて定められてもよい。例えば、重視度合いの高いコスト関数の特徴量に基づいて通知の条件が定められてもよい。このように、学習済みのコスト関数を利用することで、より注視すべき評価項目に着目して通知の条件を定義することが可能になる。
【0073】
次に、評価結果の第二の具体例を説明する。第二の具体例は、対象者の運転と熟練者の運転との差異を得点化して出力する例である。
図5は、第二の具体例(運転の差異を得点化して出力する処理の例)を説明する説明図である。
【0074】
ここでも、対象者が、第一の具体例と同様の環境(条件)のもとで運転を行っている状況を想定し、評価部370は、熟練者の運転を同様に推定するものとする。第一の具体例では、速度差が予め定めた閾値を超えた場合に通知する方法を例示した。本具体例では、評価部370は、熟練者の運転と対象者の運転との差異に応じて得点化する予め定めた方法に基づき、時系列に得点を累積的に加算し、加算した結果を表示する。
【0075】
例えば、得点化の方法として「熟練者との差が時速5km以上の時に減点し、熟練者との差が時速5km未満の状態が10秒継続したときに加点する」と定義されていたとする。評価部370は、定義された方法に基づいて得点を累積的に加算する。評価部370は、例えば、
図5に例示するように、熟練者の運転と対象者の運転との差異を示すグラフに重畳させて得点化の結果を表示してもよい。
図5に示す例では、運転者Aの運転は、走行全体を通して熟練者との差が多いため、原点が多く、運転者Bの運転は、熟練者とほぼ差がないため、加点が多くなる。
【0076】
また、評価部370は、個人のある1回の走行記録を得点化するだけでなく、複数の走行記録の累計値を算出してもよい。これにより、例えば、所定期間(月間)での得点化や、地域ごとに得点化することも可能になる。
【0077】
さらに、評価部370は、特徴量別に差異の大きさを集計し、差異の大きい特徴量に対応する評価を出力してもよい。例えば、発進時の加速を示す特徴量の差異が大きい場合、評価部370は、「発進時の加速を抑えて下さい」等のメッセージを出力してもよい。
【0078】
評価部370は、プログラム(評価結果出力プログラム)に従って動作するコンピュータのプロセッサによって実現される。また、評価部370が、制御部310自体に含まれていてもよい。
【0079】
次に、本実施形態の運転評価システムの動作例を説明する。
図6は、本実施形態の学習装置400の動作例を示すフローチャートである。入力部430は、コスト関数の入力を受け付ける(ステップS11)。学習部450は、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する(ステップS12)。
【0080】
図7は、本実施形態の評価結果出力装置300の動作例を示すフローチャートである。入力部330は、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付ける(ステップS21)。
【0081】
評価部370は、利用者が運転する地域を位置情報から特定して、その地域に対応するコスト関数を選択する(ステップS22)。評価部370は、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定する(ステップS23)。そして、評価部370は、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する(ステップS24)。
【0082】
以上のように、本実施形態では、入力部430がコスト関数の入力を受け付け、学習部450が、地域ごとに収集された熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する。また、入力部330が、利用者運転データの入力を受け付け、評価部370は、利用者が運転する地域を位置情報から特定して対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定する。そして、評価部370が、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する。よって、運転する地域を考慮して対象者の運転の評価を行うことができる。
【0083】
例えば、「上手い運転」を定義するのは難しい。これは、地域性を考慮した場合、なおさらである。さらに、例えば、「坂道発進は得意であるが、カーブの運転は苦手」などの個人の特性を抽出するには、膨大なパラメータが必要になる。
【0084】
一方、本願発明では、学習部450が、上手い運転を行うと想定される熟練者(例えば、熟練者ドライバー、タクシードライバー、自動車教習所の教官、パトカーの運転手)を定義し、その熟練者の運転データから機械学習を行うことで、運転者の特徴を抽出する。これにより、運転を評価する特徴量を抽出することが可能になる。
【0085】
さらに、本実施形態では、地域ごとの住民の運転データから運転者の特徴を抽出することで、運転の上手さとは異なる評価軸として、地域ごとの運転評価に必要な特徴量を抽出することが可能になる。
【0086】
また、本実施形態では、学習部450(より具体的には、学習結果出力部454)が評価の重みを可視化するため、改善すべき項目を抽出することが可能になる。
【0087】
以下、本実施形態の運転評価システムの適用例について説明する。
第一の例として、OEM(original equipment manufacturer)への適用が考えられる。本実施形態の運転評価システムを用いることで、車両の実際の使用傾向が把握できるため、対象とする国や地域専用の車両(例えば、寒冷地専用車、名古屋用専用車、など)を開発することが可能になり、社会価値の高い車両作りが可能になる。
【0088】
さらに、不具合の発生に関しても、実際の運転から不具合の傾向を把握することが可能になるため、例えば、安全運転通知機能がついた車両の販売の必要性や、自動運転方式の評価を行うことも可能になる。
【0089】
第二の例として、一般ユーザへの適用が考えられる。本実施形態の運転評価システムを用いることで、初めて訪れる場所でも安全な運転をすることができる。また、運転が上手い人の操作が明示されるため、不足するスキルを具体的に学習することも可能になる。具体的な一般ユーザの学習方法として、例えば、運転に基づいてナビゲーションシステムによる通知(「この地域は、車間を詰めてくるので注意しましょう」、「もう少し加速しましょう」)を行う方法が挙げられる。
【0090】
第三の例として、自動車教習所への適用が考えられる。本実施形態の運転評価システムを用いることで、教官が生徒に対して行う指導を具体化することができ、卒業生の技能を向上させることができるとともに、教官の質も向上させることが可能になる。例えば、本実施形態の運転評価システムを、運転シミュレータに適用して、生徒の運転と熟練者との運転との差異を可視化することが考えられる。さらに地域特有で必要な運転スキルや運転マナーを明示化することも可能になる。
【0091】
第四の例として、保険会社への適用が考えられる。本実施形態の運転評価システムを用いることで、地域ごとの運転の傾向が把握できるため、地域ごとに車両保険を設定(運転能力レベルによる保険料の変更)することが可能になる。また、結果として安全運転が増加するため、補償金の支払いも低減し、保険料を下げることができる結果、市場の競争性を優位にすることも可能になる。
【0092】
具体的には、運転をスコア化することで、所定のスコア以上の保険加入者の保険料を割引したり、年齢ではなくスコアの高い(すなわち、事故が少ないと想定される)対象者をターゲットに勧誘を進めたりすることが可能になる。
【0093】
第五の例として、国や自治体への適用が考えられる。本実施形態の運転評価システムを用いることで、地域に応じた速度制限等の見直しを行うことが可能になる。また、地域内の事故を減少させることができれば、対外的に安全な地域であることをアピールすることも可能になる。具体的には、熟練者の走行速度と法定速度との差異を比較して速度制限を見直すことができる。また、事故が多い地域の運転の傾向を把握して、直接注意喚起したり、事故を低減させるようなインフラストラクチャを整備したりすることも可能になる。
【0094】
次に、本発明の概要を説明する。
図8は、本発明による運転評価システムの概要を示すブロック図である。本発明による運転評価システム70(例えば、運転評価システム1)は、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段71(例えば、コスト関数入力部451)と、地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、地域ごとのコスト関数を学習する学習手段72(例えば、逆強化学習部453)と、運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、その情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段73(例えば、入力部330)と、利用者が運転する地域を位置情報から特定して、その地域に対応するコスト関数を選択し、選択されたコスト関数に対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と対象者の運転とを比較した評価結果を出力する評価手段74(例えば、評価部370)とを備えている。
【0095】
そのような構成により、運転する地域を考慮して対象者の運転の評価を行うことができる。
【0096】
また、運転評価システム70は、コスト関数に含まれる特徴量と、その特徴量の重みとを対応付けて出力する学習結果出力手段(例えば、学習結果出力部454)を備えていてもよい。そのような構成により、運転を評価する特徴量を把握することが可能になる。
【0097】
また、運転評価システム70は、地域ごとにトレーニングデータを抽出するデータ抽出手段(例えば、データ抽出部452)を備えていてもよい。そして、学習手段72は、抽出された地域ごとのトレーニングデータを用いて、地域ごとのコスト関数を学習してもよい。
【0098】
さらに、データ抽出手段は、予め定めた基準に基づいて、候補とするトレーニングデータから熟練者のトレーニングデータを抽出してもよい。
【0099】
また、評価手段74は、熟練者の運転と対象者の運転との差異を時系列に算出し、算出した差異が予め定めた通知条件を満たした場合に、その差異を示す内容を通知してもよい。
【0100】
また、評価手段74は、熟練者の運転と対象者の運転との差異に応じて得点化する予め定めた方法に基づき、時系列に得点を累積的に加算し、加算した結果を表示してもよい。
【0101】
また、関数入力手段71は、運転の際の環境を示す各特徴量に重視度合いがそれぞれ重み付けされた項を線形和として含むコスト関数の入力を受け付けてもよい。
【0102】
図9は、本発明による学習装置の概要を示すブロック図である。本発明による学習装置80(例えば、学習装置400)は、関数入力手段81と、学習手段82とを備えている。関数入力手段81および学習手段82の内容は、
図8に例示する関数入力手段71および学習手段72と同様である。
【0103】
図10は、本発明による評価結果出力装置の概要を示すブロック図である。本発明による評価結果出力装置90(例えば、評価結果出力装置300)は、運転データ入力手段91と、評価手段92とを備えている。運転データ入力手段91および評価手段92の内容は、
図8に例示する運転データ入力手段73および評価手段74と同様である。
【0104】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0105】
(付記1)運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習手段と、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、
前記利用者が運転する地域を位置情報から特定して、当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価手段とを備えた
ことを特徴とする運転評価システム。
【0106】
(付記2)コスト関数に含まれる特徴量と、当該特徴量の重みとを対応付けて出力する学習結果出力手段を備えた
付記1記載の運転評価システム。
【0107】
(付記3)地域ごとにトレーニングデータを抽出するデータ抽出手段を備え、
学習手段は、抽出された地域ごとのトレーニングデータを用いて、当該地域ごとのコスト関数を学習する
付記1または付記2記載の運転評価システム。
【0108】
(付記4)データ抽出手段は、予め定めた基準に基づいて、候補とするトレーニングデータから熟練者のトレーニングデータを抽出する
付記3記載の運転評価システム。
【0109】
(付記5)評価手段は、熟練者の運転と対象者の運転との差異を時系列に算出し、算出した差異が予め定めた通知条件を満たした場合に、当該差異を示す内容を通知する
付記1から付記4のうちのいずれか1つに記載の運転評価システム。
【0110】
(付記6)評価手段は、熟練者の運転と対象者の運転との差異に応じて得点化する予め定めた方法に基づき、時系列に得点を累積的に加算し、加算した結果を表示する
付記1から付記5のうちのいずれか1つに記載の運転評価システム。
【0111】
(付記7)関数入力手段は、運転の際の環境を示す各特徴量に重視度合いがそれぞれ重み付けされた項を線形和として含むコスト関数の入力を受け付ける
付記1から付記6のうちのいずれか1つに記載の運転評価システム。
【0112】
(付記8)運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習手段とを備えた
ことを特徴とする学習装置。
【0113】
(付記9)運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力手段と、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価手段とを備えた
ことを特徴とする評価結果出力装置。
【0114】
(付記10)運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習し、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付け、
前記利用者が運転する地域を位置情報から特定して、当該地域に対応するコスト関数を選択し、
選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、
推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する
ことを特徴とする運転評価方法。
【0115】
(付記11)コスト関数に含まれる特徴量と、当該特徴量の重みとを対応付けて出力する
付記10記載の運転評価方法。
【0116】
(付記12)運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する
ことを特徴とする学習方法。
【0117】
(付記13)運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付け、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、
選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、
推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する
ことを特徴とする評価結果出力方法。
【0118】
(付記14)コンピュータに、
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習処理
を実行させるための学習プログラムを記憶するプログラム記憶媒体。
【0119】
(付記15)コンピュータに、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価処理
を実行させるための評価結果出力プログラムを記憶するプログラム記憶媒体。
【0120】
(付記16)コンピュータに、
運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の入力を受け付ける関数入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により、当該地域ごとの前記コスト関数を学習する学習処理
を実行させるための学習プログラム。
【0121】
(付記17)コンピュータに、
運転を評価する対象者の運転を示す情報、運転の際の環境を示す情報、および、当該情報が取得された位置情報を含む利用者運転データの入力を受け付ける運転データ入力処理、および、
地域ごとに収集された熟練者の運転の内容を表わす情報を含む熟練者運転データをトレーニングデータとして用いた逆強化学習により当該地域ごとに学習された、運転者の運転を示す各特徴量に重視度合いがそれぞれ重み付けされた項の線形和で表されたコスト関数の中から、前記利用者が運転する地域を位置情報から特定して当該地域に対応するコスト関数を選択し、選択されたコスト関数に前記対象者の運転の際の環境を示す情報を適用して、同一の環境における熟練者の運転を推定し、推定された熟練者の運転と前記対象者の運転とを比較した評価結果を出力する評価処理
を実行させるための評価結果出力プログラム。
【0122】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0123】
1 運転評価システム
100 車両
101 車載器
110,210,310,410 制御部
111,211,311,411 CPU
112,212,312,412 メモリ
120,220,320,420 通信部
130,230,440 記憶部
140 車外カメラ
150 車両情報用センサ
160 生体センサ
170 車内カメラ
200 スマートフォン
240,330,430 入力部
250 移動情報DB
300 評価結果出力装置
340 運転実績DB
350 利用者DB
360 表示部
370 評価部
400 学習装置
450 学習部
451 コスト関数入力部
452 データ抽出部
453 逆強化学習部
454 学習結果出力部
500 記憶装置
600 表示装置