(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-29
(45)【発行日】2022-09-06
(54)【発明の名称】荷役車用運転者認識システムおよび当該認識システムを利用した最適動作モード出力システム
(51)【国際特許分類】
G10L 15/20 20060101AFI20220830BHJP
G10L 15/00 20130101ALI20220830BHJP
G10L 17/00 20130101ALI20220830BHJP
G10L 15/16 20060101ALI20220830BHJP
G10L 25/66 20130101ALI20220830BHJP
【FI】
G10L15/20 370D
G10L15/00 200J
G10L17/00 200C
G10L15/16
G10L25/66
(21)【出願番号】P 2020200407
(22)【出願日】2020-12-02
【審査請求日】2021-03-31
(73)【特許権者】
【識別番号】000232807
【氏名又は名称】三菱ロジスネクスト株式会社
(74)【代理人】
【識別番号】110000475
【氏名又は名称】特許業務法人みのり特許事務所
(72)【発明者】
【氏名】甲斐 絢介
【審査官】堀 洋介
(56)【参考文献】
【文献】特開2009-145755(JP,A)
【文献】特開平04-062599(JP,A)
【文献】レオ チーシャン 他,”既知の工場環境音を用いた深層学習に基づく工作機械雑音除去の検討”,日本音響学会 2019年 秋季研究発表会講演論文集CD-ROM [CD-ROM],2019年09月06日,829-830
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00-17/26
B66F 9/00-9/24
B63B 25/00-25/28
B60P 1/00-1/64
(57)【特許請求の範囲】
【請求項1】
荷役車の運転者の声を収音して第1音声信号を出力するマイクと、
荷役装置の動作音の音声信号が含まれた前記第1音声信号が入力されると、前記第1音声信号から前記動作音の音声信号を削除する第1学習済みニューラルネットワークを有し、前記第1音声信号から前記動作音の音声信号を削除し、第2音声信号として出力する動作音削除部と、
前記荷役車に乗車する可能性のある複数の運転者の声紋情報を予め記憶している声紋情報記憶部と、
前記第2音声信号と、前記声紋情報とに基づいて、マイクに声を収音された前記運転者がいずれの運転者であるかを認識する運転者認識部と、を備え
、
前記第1学習済みニューラルネットワークは、荷役対象の荷の重量に応じて変化する前記動作音に対応して前記動作音を削除するよう、荷の重量ごとの教師データを用いて学習させられている
ことを特徴とする荷役車用運転者認識システム。
【請求項2】
前記荷役装置は、マストと、前記マストに沿って昇降させられるリフトブラケットと、前記リフトブラケットに連結されたフォークと、を有し、
前記動作音には、前記リフトブラケットの昇降に係る音、前記フォークが荷に干渉する音、前記荷役装置の動力源の音のいずれかまたは全てが含まれる
ことを特徴とする請求項
1に記載の荷役車用運転者認識システム。
【請求項3】
請求項1
または2に記載の荷役車用運転者認識システムと、
前記運転者の声の音声信号が含まれた音声信号が入力されると当該運転者の音声信号を抽出するように、運転者ごとに当該運転者の声の音声信号が含まれた音声信号から当該運転者の声の音声信号を抽出するよう予め機械学習させられた第2学習済みニューラルネットワークを有し、前記第2音声信号から運転者認識部によって認識された前記運転者の声の音声信号を抽出し、第3音声信号として出力する運転者声抽出部と、
前記運転者の音声信号が入力されると当該運転者の体調を判定する第3学習済みニューラルネットワークを有し、前記第3音声信号から前記運転者の体調を判定して出力する体調判定部と、
前記複数の運転者の技能レベルを記憶している技能レベル記憶部と、
前記荷役車の複数の動作モードを記憶している動作モード記憶部と、
前記運転者の体調と、当該運転者に対応する技能レベルとに基づいて、前記複数の動作モードから当該運転者に最適な動作モードを出力する第4学習済みニューラルネットワークを有し、前記第4学習済みニューラルネットワークが出力した動作モードを前記運転者に最適な動作モードとして出力する最適モード出力部と、を備える
ことを特徴とする最適動作モード出力システム。
【請求項4】
前記荷役車の作業状況を認識する作業状況認識部をさらに備え、
前記第4学習済みニューラルネットワークは、さらに、作業状況に基づいて、最適な動作モードを出力する
ことを特徴とする請求項
3に記載の最適動作モード出力システム。
【請求項5】
前記運転者の所定の音声パターンの音声信号が入力されると、前記荷役車の動作モードを当該音声パターンの音声信号に基づいて出力された動作モードに変更する動作モード変更部をさらに備える
ことを特徴とする請求項
4に記載の最適動作モード出力システム。
【発明の詳細な説明】
【技術分野】
【0001】
荷役車用運転者認識システムおよび当該認識システムを利用した荷役車用最適動作モード出力システムに関する。
【背景技術】
【0002】
近年、作業の効率性、安全性、快適性等の観点から、荷役車を運転する運転者ごとに最適な荷役車を決定する決定装置が知られている。例えば、特許文献1に開示の決定装置は、評価部と、荷役車決定部と、を備えている。この評価部は、荷役作業の評価と、運転者、荷役車、荷役作業の組合せとの相関関係を機械学習した学習済みモデルを用いて、運転者の荷役作業の評価を決定する。そして、荷役車決定部は、当該評価に基づき、運転者に使用させる荷役車を決定する。
【0003】
上記決定装置では、認識システムによって運転者の認識をする必要がある。従来、車両用の認識システムを利用したシステムとして、例えば、特許文献2に開示の配車システムがある。この配車システムでは、車両の使用権限を有する者を「適格者」としており、この適格者が予め記憶部に登録されている。そして、この配車システムは、待機場所にいる人を撮影手段によって撮像し適格者か否かを判定する。また、特許文献2には、声紋による認識システムを利用した運行管理システムが開示されている。この運行管理システムは、マイクから入力された運転者の声に対して声紋認証処理し、声紋情報を取得する。そして、このシステムでは、この声紋情報と、運転者音声データベースに登録された声紋情報とを比較し、運転者の認識および運転者の健康状態の判定をする。
【0004】
ところで、荷役車を運転する運転者は、管理オペレータと会話しながら、荷役を行うことがあり、この会話に使用されるマイクを利用して運転者の認識および運転者の健康状態が管理されれば、脈拍を測る装置といった他の生体認識装置を荷役車に設ける必要がないので好ましい。しなしながら、荷役車は、一般車両と異なり、閉鎖空間を有する運転室を有さない車両が多く、運転者の声は、荷役車の荷役装置に関する動作音によって減衰させられることがある。したがって、特許文献2のように、運転者の声紋を利用する運転者認識システムの場合、荷役装置に関する動作音によって運転者の認識が妨げられることがある。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2020-030539号公報
【文献】特開2019-008464号公報
【文献】特開2016-201014号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、本発明の解決しようとする課題は、荷役装置の動作音によって運転者の認識が妨げられることを防止することができる荷役車用運転者認識システムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る荷役車用運転者認識システムは、
荷役車の運転者の声を収音して第1音声信号を出力マイクと、
荷役装置の動作音の音声信号が含まれた第1音声信号が入力されると、第1音声信号から動作音の音声信号を削除する第1学習済みニューラルネットワークを有し、第1音声信号から動作音の音声信号を削除し、第2音声信号として出力する動作音削除部と、
荷役車に乗車する可能性のある複数の運転者の声紋情報を予め記憶している声紋情報記憶部と、
第2音声信号と、声紋情報とに基づいて、マイクに声を収音された運転者がいずれの運転者であるかを認識する運転者認識部と、を備える、ことを特徴とする。
【0008】
上記荷役車用運転者認識システムは、好ましくは、
第1学習済みニューラルネットワークが、荷役対象の荷の重量に応じて変化する動作音に対応して動作音を削除するよう学習させられている。
【0009】
上記荷役車用運転者認識システムは、好ましくは、
荷役装置が、マストと、マストに沿って昇降させられるリフトブラケットと、リフトブラケットに連結されたフォークと、を有し、
動作音には、リフトブラケットの昇降に係る音、フォークが荷に干渉する音、荷役装置の動力源の音のいずれかまたは全てが含まれる。
【0010】
本発明に係る、上記運転者認識システムを利用した最適動作モード出力システムは、
運転者の声の音声信号が含まれた音声信号が入力されると当該運転者の音声信号を抽出するように、運転者ごとに当該運転者の声の音声信号が含まれた音声信号から当該運転者の声の音声信号を抽出するよう予め機械学習させられた第2学習済みニューラルネットワークを有し、第2音声信号から運転者認識部によって認識された運転者の声の音声信号を抽出し、第3音声信号として出力する運転者声抽出部と、
運転者の音声信号が入力されると当該運転者の体調を判定する第3学習済みニューラルネットワークを有し、第3音声信号から運転者の体調を判定して出力する体調判定部と、
複数の運転者の技能レベルを記憶している技能レベル記憶部と、
荷役車の複数の動作モードを記憶している動作モード記憶部と、
運転者の体調と、当該運転者に対応する技能レベルとに基づいて、複数の動作モードから当該運転者に最適な動作モードを出力する第4学習済みニューラルネットワークを有し、第4学習済みニューラルネットワークが出力した動作モードを運転者に最適な動作モードとして出力する最適モード出力部と、を備える、ことを特徴とする。
【0011】
上記最適動作モード出力システムは、好ましくは、
荷役車の作業状況を認識する作業状況認識部をさらに備え、
第4学習済みニューラルネットワークが、さらに、作業状況に基づいて、最適な動作モードを出力する。
【0012】
上記最適動作モード出力システムは、好ましくは、
運転者の所定の音声パターンの音声信号が入力されると、荷役車の動作モードを当該音声パターンの音声信号に基づいて出力された動作モードに変更する動作モード変更部をさらに備える。
【発明の効果】
【0013】
本発明の荷役車用運転者認識システムは、荷役装置の動作音によって運転者の認識を妨げられることを防止することができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の最適動作モード出力システムを備えた荷役車を示す側面図である。
【
図2】
図1に示された最適動作モード出力システムの機能ブロック図である。
【
図3】
図2に示された技能レベル記憶部が記憶している技能レベルの一例を示す表である。
【
図4】
図2に示された動作モード記憶部が記憶している動作モードの一例を示す表である。
【発明を実施するための形態】
【0015】
添付図を参照しつつ、本発明の荷役車用運転者認識システムおよび当該認識システムを利用した最適動作モード出力システムの一実施形態について説明する。図中の両矢印Xは前後方向を示し、両矢印Yは左右方向を示し、両矢印Zは、上下方向を示している。
【0016】
図1に示すように、本実施形態に係る荷役車Fは、フォークリフトであって、最適動作モード出力システム1と、前後の車輪3と、車輪3上に設けられた車体4と、車体4の前方に設けられた荷役装置5と、を備えている。なお、本実施形態に係る荷役車Fは、本発明に係る荷役車の単なる一例であって、本発明に係る荷役車は、これに限定されない。
【0017】
荷役装置5は、左右一対のマスト50と、リフトブラケット51と、左右一対のフォーク52と、リフトシリンダ53と、左右一対のリーチレグ54と、左右のキャリッジ55と、リーチシリンダ(図示略)と、を有する。
【0018】
左右のマスト50は、アウタマストとインナマストとをそれぞれ有し、インナマストは、リフトシリンダ53によって昇降させられる。リフトブラケット51は、インナマストに連結されており、左右のフォーク52は、リフトブラケット51に連結される。リフトブラケット51は、リフトシリンダ53によってインナマストに沿って昇降させられる。左右のリーチレグ54は、車体4の前方に延在しており、左右のマスト50は、アウタマストの下部に設けられたキャリッジ55を介してリーチレグ54に連結されている。リーチシリンダは、車体4とマスト50との間に設けられ、マスト50をリーチレグ54に沿って前後に移動させる。荷役車Fは、マスト50を前後に移動させ、フォーク52をリフトブラケット51を介して昇降させることにより、荷Wが載置されるパレットPをすくい上げたり着地させたりする。
【0019】
荷役車Fは、さらに、左右一対の支柱6と、ルーフ7と、を有する。左右の支柱6は、車体4の上面前側の左右にそれぞれ立設され、ルーフ7は、支柱6の上部から後方に向かって水平に延在している。
【0020】
図1および
図2に示すように、本実施形態に係る最適動作モード出力システム1は、マイク10と、制御部11と、を有する。
図2に示すように、制御部11は、動作音削除部110と、声紋情報記憶部111と、運転者認識部112と、を有する。
図2に示すように、マイク10と、動作音削除部110と、声紋情報記憶部111と、運転者認識部112と、を備えたシステムが本発明の荷役車用運転者認識システムに相当する。
【0021】
マイク10は、制御部11と通信可能であって、運転者Dが装着するヘルメットHに連結されている。マイク10は、運転者Dの声を収音して第1音声信号を生成し動作音削除部110に出力する。なお、マイク10は、単なる一例であって、本発明に係るマイク10は、例えば、支柱6やルーフ7に設けられていてもよい。
【0022】
動作音削除部110は、第1学習済みニューラルネットワーク(以下、「第1NN」という)を有する。第1NNは、動作音の音声信号が含まれている音声信号が入力されると、入力された音声信号から荷役装置5の動作音(以下、単に「動作音」ということがある)の音声信号を削除するよう予め機械学習させられている。第1NNは、ディープラーニングによって動作音の音声信号を含む音声信号から動作音の音声信号を削除するよう畳み込みニューラルネットワークによって機械学習させられていてもよい。また、第1NNは、畳み込みニューラルネットワークのうち、例えば、Dilated Convolutional Neural Networkを利用して機械学習させられていてもよい。Dilated Convolutional Neural Networkについては、例えば、(https://arxiv.org/abs/1512.07108)から参照することができる。当該学習は、例えば、荷役車Fが利用される施設内の環境音と荷役装置5の動作音とが含まれる音を利用してもよい。また、第1NNは、荷役対象の荷Wの重量に応じて変化する動作音に対応して動作音を削除するよう、荷Wの重量ごとの教師データを含めて機械学習させられていてもよい。また、動作音には、リフトブラケット51の昇降に係る音、フォーク52が荷Wに干渉する音、荷役装置5の動力源の音のいずれかまたは全てが含まれ、第1NNは、好ましくは、当該動作音に係る音声信号を削除するよう学習させられている。動作音削除部110は、入力された第1音声信号から動作音の音声信号を削除し、第2音声信号として運転者認識部112に出力する。
【0023】
声紋情報記憶部111は、荷役車Fに乗車する可能性のある複数の運転者の声紋情報を予め記憶している。当該声紋情報は、好ましくは、荷役車Fに乗車する可能性のある運転者の所定の音声パターンの発話音声情報である。この所定の音声パターンについては、後で説明する。
【0024】
運転者認識部112は、入力された第2音声と、声紋情報記憶部111に記憶されている声紋情報とを照合し、マイク10に声を収音された運転者Dがいずれの運転者であるかを認識する。運転者認識部112は、例えば、膨大な量の音声情報とディープラーニングとを用いて、入力された声紋の特徴量を認識することができるよう予め機械学習させられてもよい。運転者認識部112による照合方式は、「テキスト依存方式」による方が認識の精度および速度の観点から好ましいが、これに限定されない。
【0025】
本発明に係る荷役車用運転者認識システムは、マイク10によって収音され生成された音声信号から荷役装置5の動作音の音声信号を第1NNによって適切に削除されていることにより、荷役装置5の動作音によって運転者Dの認識を妨げられることを防止することができる。
【0026】
図2に示すように、制御部11は、さらに、運転者声抽出部113と、体調判定部114と、技能レベル記憶部115と、作業状況認識部116と、動作モード記憶部117と、最適モード出力部118と、動作モード変更部119と、を備えている。
【0027】
運転者声抽出部113は、第2学習済みニューラルネットワーク(以下、「第2NN」という)を有する。第2NNは、運転者の音声信号が含まれた音声信号が入力されると当該運転者の音声信号を抽出するよう運転者ごとに当該運転者の声を教師データとして予め機械学習させられている。より詳しくは、運転者声抽出部113は、単に音声信号から運転者の声の音声信号を抽出するように機械学習されているのではなく、運転者ごとに当該運転者の声の音声信号が含まれた音声信号から当該運転者の声の音声信号を抽出するように機械学習されている。これにより、第2NNは、音声信号からより適切に運転者Dの声の音声信号を抽出することができる。運転者声抽出部113は、第2音声信号から荷役車用運転者認識システムによって認識された運転者Dの声の音声信号を抽出し、抽出した音声信号を第3音声信号として体調判定部114および動作モード変更部119に出力する。
【0028】
体調判定部114は、第3学習済みニューラルネットワーク(以下、「第3NN」という)を有する。第3NNは、ディープラーニングによって運転者の音声信号が入力されると当該運転者の体調を判定するよう予め機械学習させられている。第3NNは、本実施形態では、体調を眠気、疲労度、ストレスの3項目をそれぞれA、BおよびCの3段階で判定する。眠気、疲労度、ストレスの3項目は、単なる一例であって、第3NNは、これら3項目のうちのいずれか、もしくは他の項目を追加して体調を判定するよう予め機械学習されてもよい。体調判定部114は、第3音声信号から第3NNによって運転者Dの体調を判定し、最適モード出力部118に判定結果を出力する。
【0029】
技能レベル記憶部115は、複数の運転者の技能レベルを記憶している。
図3の表に示すように、技能レベルは、負荷ありまたは負荷なしの状態における荷役車Fの前方走行、後方走行および荷役装置5の昇降動作、前後動作ごとに項目分けされている。技能レベル記憶部115は、運転者ごとに各項目の技能レベルを記憶している。負荷ありとは、荷役車Fが荷Wを積んでいるときであり、負荷なしとは、荷役車Fが荷Wを積んでいないときを示している。技能レベルの項目は、単なる一例であって、他の項目が追加されてもよい。例えば、技能レベルの項目には、パレットPが床に置かれている場合にフォーク52をパレットPのフォーク差し込み孔に差し込む技能レベルと、パレットPが高所に置かれている場合にフォーク52をパレットPのフォーク差し込み孔に差し込む技能レベルとを含んでいてもよい。
【0030】
作業状況認識部116は、荷役車Fが荷Wを積んでいるか否か、または荷役車Fが前方方向に進んでいるのか、後方に進んでいるのかもしくは停止しているのかといった荷役車Fの作業状況を認識する。作業状況認識部116は、認識した荷役車Fの作業状況を最適モード出力部118に出力する。
【0031】
図4に示すように、動作モード記憶部117は、荷役車Fの複数の動作モードM1、M2、M3…Mnを記憶している。
図4に示すように、動作モード記憶部117は、負荷ありまたは負荷なしの状態における荷役車Fの走行速度および荷役装置5の動作速度を加速度、最高速度ごとに、かつ動作モードごとに記憶している。各動作モードは、上級者、中級者、初級者ごとに、規定されてもよいし、運転者ごとに規定されてもよい。
【0032】
最適モード出力部118は、第4学習済みニューラルネットワーク(以下、「第4NN」という)を有する。第4NNは、運転者の体調と、当該運転者に対応する技能レベルと、荷役車Fの作業状況とに基づいて、複数の動作モードから当該運転者に最適な動作モードを出力するよう予め機械学習させられている。運転者に最適な動作モードとは、荷役作業の効率性、荷役作業の安全性の観点から最適とされる動作モードのことである。第4NNは、例えば、ディープラーニングによって荷役車Fの作業状況ごとに、運転者の体調と、運転者の技能レベルと、荷役作業の効率と、荷役作業の事故率との相関関係を予め機械学習させられている。最適モード出力部118は、第4NNが出力した動作モードを運転者Dに最適な動作モードとして動作モード変更部119に出力する。
【0033】
動作モード変更部119は、運転者Dの所定の音声パターンの音声信号が入力されると、荷役車Fの動作モードを当該音声パターンの音声信号に基づいて出力された動作モードに変更する。運転者Dの所定の音声パターンとは、例えば、「最適モード変更」といった音声パターンや、「上昇最適」、「下降最適」または「走行最適」といった音声パターンでもよい。動作モード変更部119は、運転者Dによって「最適モード変更」といった音声パターンが発生され、運転者声抽出部113によって第3音声信号のうちの「最適モード変更」の音声信号が入力されると、動作モード記憶部117に記憶されている動作モードを参照して最適モード出力部118から入力された最適な動作モードに荷役車Fの動作モードを変更する。
【0034】
本実施形態における最適動作モード出力システム1では、運転者Dの技能レベルに基づいて単に最適な動作モードを出力するのではなく、運転者Dの体調にも基づいて、運転者Dに最適な動作モードを出力する。しかも、運転者声抽出部113が抽出した運転者Dの声の音声信号は、動作音の音声信号および他の音声信号が除かれ、体調を判定するのに適した音声信号であるので、最適動作モード出力システム1は、運転者Dの体調を適切に判定することができる。さらに、本実施形態における最適動作モード出力システム1では、運転者Dは、荷役車Fの動作モードを、所定の音声パターンを発するだけで任意のタイミングで作業状況に応じた運転者Dにとって最適な動作モードに変更することができる。
【0035】
以上、本発明に係る荷役車用運転者認識システムおよび当該荷役車用運転者認識システムを利用した最適動作モード出力システムの一実施形態について説明してきたが、本発明の荷役車用運転者認識システムおよび最適動作モード出力システムは、上記実施形態に限定されるものではない。本発明の荷役車用運転者認識システムおよび最適動作モード出力システムは、例えば、以下の変形例によって実施されてもよい。
【0036】
・マイク10は、骨伝導式のマイクであって、運転者Dの頭部または首元の振動を感知するマイクでもよい。荷役車Fの動作音は、骨伝導式のマイクであっても、運転者Dの音声に混ざることがあるので、第1NNは、骨伝導式のマイクに対しても有用である。
【0037】
・荷役車Fは、モニタをさらに備え、最適モード出力部118は、運転者Dに最適な動作モードをモニタに表示してもよい。この場合、運転者Dは、モニタに表示された動作モードを参照して動作モードの変更を許可するか否かを決定することができる。また、この場合、動作モード変更部119は、運転者Dが動作モードの変更の許可を入力する許可入力部を有し、許可入力部が入力されたときのみ、荷役車Fの動作モードを変更するようにしてもよい。
【符号の説明】
【0038】
F 荷役車
D 運転者
H ヘルメット
W 荷
P パレット
1 最適動作モード出力システム
10 マイク
11 制御部
110 動作音削除部
111 声紋情報記憶部
112 運転者認識部
113 運転者声抽出部
114 体調判定部
115 技能レベル記憶部
116 作業状況認識部
117 動作モード記憶部
118 最適モード出力部
119 動作モード変更部
3 車輪
4 車体
5 荷役装置
50 マスト
51 リフトブラケット
52 フォーク
53 リフトシリンダ
54 リーチレグ
55 キャリッジ
6 支柱
7 ルーフ