IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝電機サービス株式会社の特許一覧

<>
  • 特許-学習処理装置および学習処理方法 図1
  • 特許-学習処理装置および学習処理方法 図2
  • 特許-学習処理装置および学習処理方法 図3
  • 特許-学習処理装置および学習処理方法 図4
  • 特許-学習処理装置および学習処理方法 図5
  • 特許-学習処理装置および学習処理方法 図6
  • 特許-学習処理装置および学習処理方法 図7
  • 特許-学習処理装置および学習処理方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-29
(45)【発行日】2024-11-07
(54)【発明の名称】学習処理装置および学習処理方法
(51)【国際特許分類】
   B61D 27/00 20060101AFI20241030BHJP
   G05B 23/02 20060101ALI20241030BHJP
   G05B 11/36 20060101ALI20241030BHJP
   B60H 1/22 20060101ALI20241030BHJP
【FI】
B61D27/00 F
G05B23/02 G
G05B11/36 K
B60H1/22 651C
【請求項の数】 14
(21)【出願番号】P 2021077962
(22)【出願日】2021-04-30
(65)【公開番号】P2022171364
(43)【公開日】2022-11-11
【審査請求日】2024-01-16
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】598076591
【氏名又は名称】東芝インフラシステムズ株式会社
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118843
【弁理士】
【氏名又は名称】赤岡 明
(74)【代理人】
【識別番号】100213654
【弁理士】
【氏名又は名称】成瀬 晃樹
(72)【発明者】
【氏名】小熊 信
(72)【発明者】
【氏名】阿邊 優一
(72)【発明者】
【氏名】服部 陽平
(72)【発明者】
【氏名】弓削 晶郎
(72)【発明者】
【氏名】高橋 功
【審査官】長谷井 雅昭
(56)【参考文献】
【文献】特開2019-138542(JP,A)
【文献】特開2019-093969(JP,A)
【文献】特開2019-123364(JP,A)
【文献】特開2020-095616(JP,A)
【文献】米国特許出願公開第2019/0071103(US,A1)
【文献】中国実用新案第204415404(CN,U)
(58)【調査した分野】(Int.Cl.,DB名)
B61D 27/00
G05B 23/02
G05B 11/36
B60H 1/22
(57)【特許請求の範囲】
【請求項1】
車両に搭載される車上装置の乗務員による操作実績データと、前記車上装置の操作の判断に用いられる運行中の前記車両に関する要素データと、を取得するとともに、データ蓄積部に蓄積させるデータ取得部と、
前記操作実績データに含まれる前記車上装置の学習対象の操作と、前記学習対象の操作が実行された過去における前記要素データと、の対応関係に基づいて学習モデルを構築するモデル構築部と、
当日における前記要素データを前記学習モデルに適用することにより、前記車上装置を制御するための制御指令を生成する制御部と、を備える、学習処理装置。
【請求項2】
前記データ取得部は、前記操作実績データと前記要素データとを時刻により関連付けて前記データ蓄積部に蓄積させ、
前記モデル構築部は、前記学習対象の操作と、時刻により前記学習対象の操作と関連付けられた前記要素データと、の対応関係に基づいて前記学習モデルを構築する、請求項1に記載の学習処理装置。
【請求項3】
前記データ取得部は、取得した前記操作実績データと前記要素データとを、間引いて前記データ蓄積部に蓄積させる、請求項1または請求項2に記載の学習処理装置。
【請求項4】
前記データ取得部は、運行中の前記車両の運行状況情報を取得するとともに、前記データ蓄積部に蓄積し、
前記運行状況情報に基づいて、前記データ蓄積部から、前記学習モデルの構築に用いられる前記操作実績データおよび前記要素データを読み出すデータ読出部をさらに備える、請求項1から請求項3のいずれか一項に記載の学習処理装置。
【請求項5】
前記運行状況情報は、ワンマン運用および非営業走行の少なくとも一方に関する情報を含み、
前記データ読出部は、ワンマン運用時および非営業走行時の少なくとも一方を除外して、前記データ蓄積部から、前記学習モデルの構築に用いられる前記操作実績データおよび前記要素データを読み出す、請求項4に記載の学習処理装置。
【請求項6】
前記要素データの値、および、前記車両の所定の動作の少なくとも一方に基づいて、前記データ蓄積部から、前記学習モデルの構築に用いられる前記操作実績データおよび前記要素データを読み出すデータ読出部をさらに備える、請求項1から請求項5のいずれか一項に記載の学習処理装置。
【請求項7】
前記モデル構築部が傾向変動および季節変動の少なくとも一方を考慮した前記学習モデルを構築するように、前記学習モデルの構築に用いられる前記操作実績データおよび前記要素データを抽出するデータ加工部をさらに備える、請求項1から請求項6のいずれか一項に記載の学習処理装置。
【請求項8】
前記モデル構築部は、
複数の機械学習手法により複数の前記学習モデルを構築し、
構築した複数の前記学習モデルを評価し、
評価が最も高い前記学習モデルを、前記制御部により適用される前記学習モデルとする、請求項1から請求項7のいずれか一項に記載の学習処理装置。
【請求項9】
前記制御部は、予め設定された第1所定期間ごとに、前記制御指令を前記車上装置に出力する、請求項1から請求項8のいずれか一項に記載の学習処理装置。
【請求項10】
前記制御部は、前記車両のドアが開いている間、および、前記ドアが閉じてから予め設定された第2所定期間までの間、前記車上装置への前記制御指令の出力を停止する、請求項1から請求項9のいずれか一項に記載の学習処理装置。
【請求項11】
前記学習処理装置は、複数の前記車両を含む編成ごとに少なくとも設けられ、
前記データ取得部は、前記車両の動作に関する操作を前記乗務員から受け付ける車両情報制御装置から、前記操作実績データと前記要素データとを取得し、
前記制御部は、前記車両情報制御装置を間に介して前記車上装置に前記制御指令を出力する、請求項1から請求項10のいずれか一項に記載の学習処理装置。
【請求項12】
前記学習処理装置は、前記車上装置ごと、または、前記車両ごとに設けられ、
前記データ取得部は、前記車両の動作に関する操作を前記乗務員から受け付ける車両情報制御装置を間に介することなく、前記車上装置から前記操作実績データと前記要素データとを取得し、
前記制御部は、前記車両情報制御装置を間に介することなく、前記車上装置に前記制御指令を出力する、請求項1から請求項10のいずれか一項に記載の学習処理装置。
【請求項13】
前記車上装置は、空調装置である、請求項1から請求項12のいずれか一項に記載の学習処理装置。
【請求項14】
車両に搭載される車上装置の乗務員による操作実績データと、前記車上装置の操作の判断に用いられる運行中の前記車両に関する要素データと、を取得するとともに、データ蓄積部に蓄積させ、
前記操作実績データに含まれる前記車上装置の学習対象の操作と、前記学習対象の操作が実行された過去における前記要素データと、の対応関係に基づいて学習モデルを構築し、
当日における前記要素データを前記学習モデルに適用することにより、前記車上装置を制御するための制御指令を生成する、ことを具備する、学習処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明による実施形態は、学習処理装置および学習処理方法に関する。
【背景技術】
【0002】
鉄道運用の乗務員操作の例として、鉄道車両の空調を調整するために、車両用空調機の目標温度を手動補正する事例がある。上記車両用空調機内では、コンプレッサが冷媒を圧縮し、車内外の熱を交換するための冷媒循環機構である冷凍サイクルを構築する。これにより、車内の空気を循環させ、車内温度を上下させる。また、車両用空調機は、車両に搭載された制御装置により制御され、車両内の温度を調整する。上記の制御装置は、例えば温度センサで取得した車内の温度等の計測値に基づき、目標温度を設定する。
【0003】
しかし、実際には、温度センサの計測値が目標温度から大きく離れる等により、乗務員が上記の制御に対して満足しない場合がある。従って、乗務員は、手動で手間をかけて目標温度補正値を随時与える場合がある。すなわち、乗務員の判断および操作を代替することができず、手動操作の手間がかかってしまう場合がある。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第5840309号公報
【文献】特開2019-202727号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
手動操作の手間を抑制することができる学習処理装置および学習処理方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本実施形態による学習処理装置は、データ取得部と、モデル構築部と、制御部と、を備える。データ取得部は、車両に搭載される車上装置の乗務員による操作実績データと、車上装置の操作の判断に用いられる運行中の車両に関する要素データと、を取得するとともに、データ蓄積部に蓄積させる。モデル構築部は、操作実績データに含まれる車上装置の学習対象の操作と、学習対象の操作が実行された過去における要素データと、の対応関係に基づいて学習モデルを構築する。制御部は、当日における要素データを学習モデルに適用することにより、車上装置を制御するための制御指令を生成する。
【図面の簡単な説明】
【0007】
図1】第1実施形態における鉄道車両の全体構成の一例を示すブロック図。
図2】第1実施形態における学習処理装置の構成の一例を示すブロック図。
図3】第1実施形態における学習処理装置の動作の一例を示すフロー図。
図4】第1実施形態におけるデータ読出部によるデータフィルタの一例を示す図。
図5】第1実施形態における学習モデルの構成の一例を示す図。
図6】第1実施形態における機械学習モデルの採用の一例を示す図。
図7】比較例における鉄道車両の全体構成の一例を示すブロック図。
図8】第2実施形態における鉄道車両の全体構成の一例を示すブロック図。
【発明を実施するための形態】
【0008】
以下、図面を参照して本発明に係る実施形態を説明する。本実施形態は、本発明を限定するものではない。図面は模式的または概念的なものであり、各部分の比率などは、必ずしも現実のものと同一とは限らない。明細書と図面において、既出の図面に関して前述したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
【0009】
(第1実施形態)
図1は、第1実施形態における鉄道車両1の全体構成の一例を示すブロック図である。図1は、1両編成の鉄道車両1を示す。しかし、第1実施形態は、1両編成に限られず、複数の鉄道車両1を含む編成にも適用可能である。この場合、図1の車両情報制御装置100は、複数の鉄道車両1を含む編成ごとに少なくとも設けられる。
【0010】
鉄道車両1は、車両情報制御装置100と、空調制御装置101と、空調機102と、応荷重検出部103と、温湿度センサ104と、学習処理装置205と、を備える。なお、空調制御装置101および空調機102は、空調装置105とも呼ばれる場合がある。
【0011】
車両情報制御装置100は、運転台に配置された、乗務員の操作端末である。車両情報制御装置100は、空調装置105に限られず、他の装置(図示せず)と接続され、モータ、ブレーキ装置等の各種データを受け取る。車両情報制御装置100は、各種データを表示し、車両情報制御装置100に接続された装置の操作も受け付ける。
【0012】
また、車両情報制御装置100は、乗車率およびカレンダー情報などの空調制御用データを空調制御装置101に送る。また、車両情報制御装置100は、空調制御装置101の目標温度補正を送る。「目標温度補正」は、空調制御装置101が設定する目標温度を補正するための制御指令である。乗務員は、空調制御装置101が設定する目標温度に満足しない場合、車両情報制御装置100により手動で目標温度補正値を与えることができる。
【0013】
空調制御装置101は、温度センサ及び湿度センサ(図1に示す温湿度センサ104)から温湿度情報を取得し、ハードの空調機102の状態情報も参照しながら、空調機102内のコンプレッサなどに制御指令を行う。空調制御装置101は、例えば温度センサで取得した車内の温度等の計測値に基づき、目標温度を設定する。この目標温度は、上記の目標温度補正によって補正される。また、例えば、空調制御装置101は、温度等の計測値を用いて目標温度から一定範囲内の温度となるようにフィードバック制御する。
【0014】
空調機102は、空調制御装置101の制御指令に基づいて、鉄道車両1の車内を空気調和する。空調機102は、例えば、コンプレッサを有する。空調機102内では、コンプレッサが冷媒を圧縮し、車内外の熱を交換するための冷媒循環機構である冷凍サイクルを構築する。これにより、車内の空気を循環させ、車内温度を上下させる。
【0015】
応荷重検出部103は、例えば、鉄道車両1の乗客数を検出する。この乗客数から、乗車率等の情報を取得することができる。応荷重検出部103は、乗率数を車両情報制御装置100に送る。
【0016】
温湿度センサ104は、鉄道車両1の車内の温度および湿度を検出する。温湿度センサ104は、温湿度情報を空調制御装置101に送る。
【0017】
学習処理装置205は、車両情報制御装置100を用いた乗務員の操作実績に伴う車上データから、乗務員の操作を代替する学習処理モデルを構築する。学習処理装置205は、車両情報制御装置100から車上データを受け取る。「車上データ」は、運行中の鉄道車両1の各種情報を含む。車上データは、操作実績データと、要素データと、を少なくとも含む。「操作実績データ」は、乗務員が車両情報制御装置100を介して車上装置を操作した記録を示すデータである。車上装置は、例えば、空調装置105である。操作実績データは、例えば、目標温度補正である。「要素データ」は、車上装置の操作の判断に用いられる運行中の鉄道車両1に関するデータである。要素データは、乗務員の操作対象が空調装置105(空調制御装置101)である場合、例えば、時刻、乗車率、および車両内の温湿度情報等を含む。
【0018】
また、学習処理装置205は、構築した学習モデルおよび運行中に得られる車上データに基づいて、車両情報制御装置100に制御指示を行う。この制御指示は、乗務員の操作を代替するように、学習処理装置205が生成した目標温度補正の制御指令である。
【0019】
学習処理装置205から制御指示を受け取った車両情報制御装置100は、制御指示に基づいて空調制御装置101に目標温度補正を設定する。これにより、乗務員の操作を代替して、自動で空調装置105(空調制御装置101)の制御を行うことができる。
【0020】
上記の車両情報制御装置100、空調制御装置101および学習処理装置205等の処理は、例えばCPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)またはFPGA(Field-Programmable Gate Array)等の回路を含むハードウェアにより構成される。
【0021】
図2は、第1実施形態における学習処理装置205の構成の一例を示すブロック図である。
【0022】
学習処理装置205は、データ取得部301と、データ蓄積DB(Database)302と、データ読出部303と、データ加工部304と、モデル構築部305と、制御指示部306と、を備える。
【0023】
データ取得部301は、車両情報制御装置100から車上データ(操作実績データおよび要素データ)を逐次取得するとともに、データ蓄積DB302に逐次蓄積(保存)する。
【0024】
なお、乗務員は、手動操作モードと、学習処理装置205による自動操作モードと、を切り替えることができる。操作実績データは、手動操作モードにおいて蓄積される。要素データは、いずれのモードにおいても蓄積される。
【0025】
より詳細には、データ取得部301は、操作実績データと要素データとを時刻により関連付けてデータ蓄積DB302に蓄積させる。また、データ取得部301は、運行中の鉄道車両1の運行状況情報を取得するとともに、データ蓄積DB302に蓄積してもよい。「運行状況情報」は、車上データに含まれ、鉄道車両1の運行状況を示す情報である。運行状況情報は、例えば、ワンマン運用であるか否か、および、回送等の非営業走行であるか否かの少なくとも1つに関する情報等を含む。また、運行状況情報には、鉄道車両1のドアの開閉の情報が含まれていてもよい。
【0026】
データ蓄積DB(データ蓄積部)302は、車上データを格納する。データ蓄積DB302は、例えば、RAM(Random Access Memory)もしくはフラッシュメモリ等の半導体メモリ素子、または、ハードディスク等により実現する。
【0027】
データ読出部303は、データ蓄積DB302から、学習対象データを読み出す。学習対象データは、操作実績データと、そのモデル化に考慮する要素データを含む。また、データ読出部303は、上記データから、ワンマン運用および非営業走行を除外するなど、データをフィルタする。すなわち、データ読出部303は、運行状況情報に基づいて、データ蓄積DB302から、学習モデルの構築に用いられる操作実績データおよび要素データを読み出す。より詳細には、データ読出部303は、ワンマン運用時および非営業走行時の少なくとも一方を除外して、データ蓄積DB302から、学習モデルの構築に用いられる操作実績データおよび要素データを読み出す。ワンマン運用時では、車掌が乗車せず、運転手が車掌を兼ねる。従って、ワンマン運用時では、運転手が空調操作を行う余裕がない場合がある。また、非営業走行時は、鉄道車両1に乗客がほぼいない。ワンマン運用時および非営業走行時のデータを除外することにより、空調操作の実績としてより意味のあるデータを選抜し、データ負荷を削減することができる。なお、データフィルタの詳細については、図4を参照して、後で説明する。
【0028】
なお、データ取得部301は、データ読出部303のデータフィルタにより除外されるデータを、データ蓄積DB302に保存しないようにしてもよい。
【0029】
データ加工部304は、データ読出部303から受け取ったデータを、モデル構築のためのデータセットを学習用と評価用に分割する。データ加工部304は、データ分割部でもある。
【0030】
モデル構築部305は、操作実績データに含まれる空調装置105の学習対象の操作と、学習対象の操作が実行された過去における要素データと、の対応関係に基づいて学習モデルを構築(生成)する。「学習対象の操作」は、例えば、目標温度補正である。より詳細には、モデル構築部305は、学習対象の操作と、時刻により学習対象の操作と関連付けられた要素データと、の対応関係に基づいて学習モデルを構築する。
【0031】
また、モデル構築部305は、複数の機械学習を試行し、最も適切な手法を学習処理モデルとして採用する。すなわち、モデル構築部305は、構築した複数の学習モデルを評価し、評価が最も高い学習モデルを、制御指示部306により適用される学習モデルとする。
【0032】
制御指示部(制御部)306は、学習モデルに基づいて、制御指示を行う。制御指示部306は、データ取得部301から操作代替用データを受け取り、学習モデルに適用する。操作代替用データは、乗務員の操作代替を行う当日に取得された要素データである。制御指示部306は、当日における要素データを学習モデルに適用することにより、空調装置105を制御するための制御指令を生成する。制御指示部306は、例えば、車両情報制御装置100を間に介して空調制御装置101(空調装置105)に制御指令を出力する。
【0033】
次に、学習処理装置205の処理フローについて説明する。
【0034】
図3は、第1実施形態における学習処理装置205の動作の一例を示すフロー図である。
【0035】
まず、データ取得部301は、車両情報制御装置100から車上データを取得する(S201)。また、データ取得部301は、取得した車上データをデータ蓄積DB302に保存する。ここで、車両情報制御装置100は1秒未満の刻みのサンプリングで時系列データを管理しているが、データ取得部301は、さらにダウンサンプリングして、例えば15秒刻みなどの任意指定刻みで保存することも可能とする。すなわち、データ取得部301は、取得した車上データ(操作実績データおよび要素データ)を、間引いてデータ蓄積DB302に蓄積させてもよい。
【0036】
次に、データ読出部303は、操作対象となる目標温度補正値(分類モデルの目的変数Y)を読み出す(S202)。第1実施形態の具体例では、例えば式(1)のモデル式のYとなる操作対象の目標温度補正値に対して、車内温度、外気温度、乗車率、時間帯、湿度を判断要素データ群Xiとする。
【数1】
【0037】
次に、データ読出部303は、目標温度補正の判断基準となる判断要素データ(分類モデルの説明変数群Xi)を読み出す(S203)。判断要素データ(要素データ)として、任意のデータが選定されてもよいし、目標温度補正値に対して、相関係数が一定閾値以上のデータが選定されてもよい。
【0038】
次に、データ読出部303は、データフィルタ処理を行うことにより、データ蓄積DB302からデータを抽出する(S204)。例えば、データ読出部303がデータを読み出す際、ワンマン運用時(車掌が乗車せず、運転手が車掌を兼ねる運用時)を読み出さず、非営業走行(列番未設定)データを読み出さず、駅停車後ドア閉後に空間が大きく変わった状況のデータを読み出すなどにより、学習対象とするデータを絞り処理負荷を削減することができる。
【0039】
図4は、第1実施形態におけるデータ読出部303によるデータフィルタの一例を示す図である。図4に示す時系列データには、例えば、年月日時、外気温度、乗車率、ワンマン操作の有無が含まれている。
【0040】
図4に示すように、ワンマン運用時のデータ抽出については、ワンマンスイッチ信号などの機器信号(運行状況情報)によりデータフィルタすることができる。ワンマン操作の有無を切り替えるための切替スイッチは、例えば、運転手が操作できるように、車両情報制御装置100に配置される。この場合、データ読出部303は、ワンマン操作でない場合の時系列データがフィルタリングされて読み出される。これにより、運転手と車掌の二人で相対的にきめ細かい条件で操作していた条件のデータで、後のステップS209で説明するようにモデル構築することが可能となる。
【0041】
また、データ読出部303は、要素データの値、および、鉄道車両1の所定の動作の少なくとも一方に基づいて、データ蓄積DB302から、学習モデルの構築に用いられる操作実績データおよび要素データを読み出してもよい。すなわち、データ読出部303は、例えば、要素データの値によってフィルタしてもよい。データ読出部303は、例えば、鉄道車両1が駅に停車後、ドアが閉じた後に車内の空間の温度等が大きく変わった状況のデータを読み出すフィルタを適用する。ドアが開いている間、鉄道車両1の内外で空気が入れ替わりやすく、車内温度等が不安定になりやすい。車内温度等が不安定になりやすい場合を除外することにより、空調操作の実績としてより意味のあるデータを選抜し、データ負荷を削減することができる。
【0042】
次に、データ加工部304は、データ読み出し手段が出力したデータに対して、例えば直近数日の短期的なトレンドデータおよび、昨年同季節時期数カ月分の周期性を考慮したデータの両者を取得し、モデル構築のためのデータに加工する(S205、S206)。すなわち、データ加工部304は、モデル構築部305が傾向変動および季節変動の少なくとも一方を考慮した学習モデルを構築するように、学習モデルの構築に用いられる操作実績データおよび要素データを抽出する。傾向変動は、例えば、当日から過去の所定の日数の間における時系列データの値の変動を示す。所定の日数は、例えば、2日~3日である。データ加工部304は、季節変動として、例えば、当日が夏である場合、1年前および2年間の夏におけるデータを抽出する。上記の短期トレンドデータ及び周期性を考慮したデータは、いずれか一方でもよいし、任意期の期間を指定できるものとする。
【0043】
次に、データ加工部304は、例えば、モデル評価用の直近3日分のデータと、モデル学習用の直近3日間以外のデータに分割する(S207)。すなわち、データ加工部304は、学習モデルの構築に用いられる操作実績データおよび要素データを、学習モデルを構築するための学習データと、構築した学習モデルを評価するための評価データと、に分割する。
【0044】
次に、モデル構築部305は、試行する機械学習手法の数だけ、ステップS209~S212を実行する(S208)。モデル構築部305は、複数の教師有の機械学習手法により分類モデルを構築し、操作対象の分類モデルの構築結果において、最も優れたモデルを学習処理モデルとして採用する(S209~S212)。機械学習には汎用的な手法として、決定木、k近傍法、ランダムフォレスト、サポートベクターマシンおよびディープラーニングなどがあり、一般にどのような状況でもいつも最適な手法は存在しない。そのため、モデル構築部305は、学習データに対して、あらかじめ定めた指標のうち最もスコアのよい方法を学習処理モデルとして採用する。
【0045】
図5は、第1実施形態における学習モデルの構成の一例を示す図である。図5は、決定木のモデルを示す。
【0046】
図5に示すように、外気温度および乗車率などの判断要素データを、上から条件ごとに分岐していくと、適切な目標温度補正値が得られる。図5に示す例では、当日の要素データ中の外気温度(℃)、車内温度(℃)、乗車率(割(十分率))および時刻(時)に基づいて、0℃補正および-2.0℃補正のいずれか一方の温度補正が選択される。なお、0℃補正は、温度補正を行わないことを示す。
【0047】
図6は、第1実施形態における機械学習モデルの採用の一例を示す図である。図6は、機械学習の決定木、k近傍法、ランダムフォレストの3手法を同一の学習データでモデル化し、評価データと照合したときの正解率を比較した例を示す。
【0048】
図6に示す例では、決定木、k近傍法およびランダムフォレストにより構築された学習モデルの正解率は、それぞれ75%、81%および79%である。従って、k近傍法で得たモデルが、もっとも評価データに対して正解率が高い。モデル構築部305は、k近傍法で得たモデルを学習処理モデルとして採用する。なお、上記3手法は一例であり、手法は任意の機械学習手法を追加および削減してよい。指標についても分類モデルの評価としては、正解率、適合率、再現率およびF値などがあり、任意の指標を選択可能とする。
【0049】
次に、制御指示部306は、モデル構築部305にて得られた学習処理モデルに基づき、車両情報制御装置100に、目標温度補正値を指示する(S213)。この際、例えば図5に示した決定木を常時適用しようとした場合、補正値0℃と補正値-2.0℃を頻繁に交互に指定してハンチングする可能性がある。ハンチングは、機器の故障につながる可能性がある。そのため、制御指示部306は、あらかじめ決めた定周期(例えば15分など)、または、ドア閉後15秒後に車内空間および乗車人員が落ち着いたタイミングのデータで制御指示を行う。すなわち、制御指示部306は、予め設定された第1所定期間ごとに、制御指令を空調装置105に出力する。また、制御指示部306は、鉄道車両1のドアが開いている間、および、ドアが閉じてから予め設定された第2所定期間までの間、空調装置105への制御指令の出力を停止する。これにより、車内空間が不安定な場合に学習処理装置205の自動制御の実行数を減らすことができ、目標温度変化が不安定になることを抑制することができる。
【0050】
また、図3の処理フローは、各車両個別に適用してもよいし、各車両のデータを合算し、編成全体に対して適用してもよい。
【0051】
以上のように、第1実施形態によれば、データ取得部301は、操作実績データと、要素データと、を取得するとともに、データ蓄積DB302に蓄積する。モデル構築部305は、学習対象の操作と、学習対象の操作が実行された過去における要素データと、の対応関係に基づいて学習モデルを構築する。制御指示部306は、当日における要素データに学習モデルを適用することにより、空調装置105(空調制御装置101)を制御するための制御指令を生成する。これにより、目標温度補正等の空調装置105の操作に関する乗務員の判断および操作を、学習モデルで代替することができる。
【0052】
図7は、比較例における鉄道車両1の全体構成の一例を示すブロック図である。図7に示す比較例では、学習処理装置205が設けられない。
【0053】
図7に示す例では、空調制御装置101は、温度等の計測値を用いて目標温度から一定範囲内の温度となるようにフィードバック制御する。また、乗客の荷重を検知する応荷重検出部から取得する乗車率や湿度が一定の閾値以上の場合には、目標温度を自動補正する機能を備えることもある。しかし、実際には、乗務員が上記自動補正機能に対して満足しない場合、手動で手間をかけて目標温度補正値を随時与える場合がある。乗務員は、上記自動補正機能と同じように、車内温度や湿度、乗車率のような要素も意識するほか、ラッシュ時間帯等の運用情報も考慮して手動操作していると考えられる。また、乗務員は、路線ごと、または編成ごとの運用に合わせて目標温度をしばしば手動補正操作している。
【0054】
これに対して、第1実施形態では、乗務員の手動補正の操作データと共に、外気温度、車内温度、乗車率等の判断要素データを蓄積することにより、どのような場合に人間系が空調操作するかを含めたデータを蓄積することができる。また、手動補正の操作データを教師データとする機械学習により、乗務員の操作を代替することができる学習モデルを構築することができる。この結果、乗務員の手動操作の手間を抑制することができる。
【0055】
また、最近では、鉄道の車両情報制御装置が管理する大量の車上データを地上側サーバに蓄積し、車上データを分析可能な環境が整いつつある。これにより、地上側にダウンロードしたデータを分析の上、機械学習を適用し、様々な実績データ同士の関係性を定式化、すなわちモデル化することも可能となる。従って、例えば、図2に示すデータ蓄積DB302は、車上に限られず、地上側に設けられていてもよい。仮に、上記地上側サーバが確保できない場合、図1に示すように、学習処理装置205は、車上側でデータの蓄積およびモデル化を行えばよい。この場合、データ取得部301は、上記のように、データ蓄積DB302に蓄積するデータを間引きすることが好ましい。
【0056】
なお、鉄道車両1は、ドアの開閉情報等の情報を検出する検出部をさらに備えてもよい。この場合、検出部の検出結果は、車上データに含まれてデータ蓄積DB302に蓄積される。
【0057】
また、空調制御装置101の乗務員操作は、目標温度補正に限定されない。例えば、ラインフローファン(鉄道車両内用サーキュレータ)、換気扇または扇風機の強弱などの、空調機102に関する他の乗務員操作についても適用することができる。また、乗務員の操作対象は、空調装置105に限られず、他の車上装置であってもよい。
【0058】
また、図1を参照して説明したように、第1実施形態は、複数の鉄道車両1による編成に適用可能である。第1実施形態における学習処理装置205は、例えば、車両情報制御装置100に付帯する。従って、学習処理装置205は、車両情報制御装置100と同様に、複数の鉄道車両1を含む編成ごとに少なくとも設けられる。この場合、図1に示す学習処理装置205は、複数の鉄道車両1の個別の車上データを含む幹線データを、車両情報制御装置100から取得する。これにより、少ない装置数で複数の鉄道車両1の空調装置105の操作を代替することができる。
【0059】
また、学習処理装置205は、車両情報制御装置100の内部に含まれていてもよい。
【0060】
(第2実施形態)
図8は、第2実施形態における鉄道車両1の全体構成の一例を示すブロック図である。第2実施形態は、学習処理装置205が車両情報制御装置100に代えて空調制御装置101とデータおよび信号の送受信を行う点で、第1実施形態とは異なっている。
【0061】
車両情報制御装置100は、車上データを空調制御装置101に送る。
【0062】
空調制御装置101は、車上データを学習処理装置205に送る。
【0063】
学習処理装置205は、例えば、空調装置105(空調制御装置101)に付帯する。従って、学習処理装置205は、空調装置105ごとに設けられる。なお、学習処理装置205は、鉄道車両1ごとに設けられてもよい。学習処理装置205は、車上データを空調制御装置101から受け取り、目標温度補正を空調制御装置101に送る。
【0064】
より詳細には、データ取得部301は、鉄道車両1の動作に関する操作を乗務員から受け付ける車両情報制御装置100を間に介することなく、空調装置105(空調制御装置101)から操作実績データと要素データとを取得する。制御指示部306は、車両情報制御装置100を間に介することなく、空調装置105(空調制御装置101)に制御指令を出力する。これにより、複数の鉄道車両1に対して個別に学習モデルの構築および操作代替をすることができる。例えば、空調装置105または鉄道車両1のメーカが異なる場合、メーカごとに操作傾向が異なる可能性がある。また、例えば、弱冷房車は、通常の車両とは操作傾向が異なる可能性がある。また、例えば、複数の編成を連結して1つの編成とする場合、新しい編成と古い編成との間でインターフェースの不都合が発生する可能性がある。また、例えば、車両情報制御装置100と学習処理装置205との間でメーカが異なる場合も、インターフェースの不都合が発生する可能性がある。これらのような場合、車両ごと、または、空調装置105ごとに学習モデルを構築することがより好ましい。
【0065】
第2実施形態における学習処理装置205のその他の構成は、第1実施形態による学習処理装置205の対応する構成と同様であるため、その詳細な説明を省略する。第2実施形態における学習処理装置205は、第1実施形態と同様の効果を得ることができる。
【0066】
なお、学習処理装置205は、空調制御装置101の内部に含まれていてもよい。
【0067】
本実施形態による学習処理装置205および学習処理方法の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、学習処理装置205および学習処理方法の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。また、学習処理装置205および学習処理方法の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0068】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0069】
1 鉄道車両、100 車両情報制御装置、101 空調制御装置、102 空調機、103 応荷重検出部、104 温湿度センサ、205 学習処理装置、301 データ取得部、302 データ蓄積DB、303 データ読出部、304 データ加工部、305 モデル構築部、306 制御指示部
図1
図2
図3
図4
図5
図6
図7
図8