(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024144274
(43)【公開日】2024-10-11
(54)【発明の名称】フォークリフト状態の検出装置及び方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20241003BHJP
G06V 10/82 20220101ALI20241003BHJP
B66F 9/24 20060101ALI20241003BHJP
【FI】
G06T7/00 350C
G06V10/82
B66F9/24 Z
B66F9/24 L
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2024046477
(22)【出願日】2024-03-22
(31)【優先権主張番号】202310333162.6
(32)【優先日】2023-03-30
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】王 方俊
(72)【発明者】
【氏名】深町 侑加
【テーマコード(参考)】
3F333
5L096
【Fターム(参考)】
3F333AA02
3F333AB13
3F333AE02
3F333BA02
3F333BB02
3F333DB10
3F333FA36
3F333FD11
3F333FE04
3F333FE05
5L096CA02
5L096DA02
5L096FA59
5L096FA62
5L096FA66
5L096HA11
5L096KA04
(57)【要約】
【課題】本発明の実施例は、フォークリフト状態の検出装置及び方法を提供する。
【解決手段】該方法は、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得するステップと、該ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力するステップであって、該オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、ステップと、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
フォークリフト状態の検出装置であって、
フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得する取得部と、
前記ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力する検出部であって、前記オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、検出部と、
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定する第1の決定部と、を含む、装置。
【請求項2】
前記オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含み、
前記第1のモデルは、前記ビデオの画像に基づいて第1の検出結果を出力し、前記第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含み、
前記第2のモデルは、前記第1の検出結果に基づいて第2の検出結果を出力し、前記第2の検出結果は、フォークリフト積載領域の状態を含む、請求項1に記載の装置。
【請求項3】
前記フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのマストの検出結果を含み、
前記第1の決定部は、前記ビデオの連続的なフレーム間の2つのマスト間の領域の面積の変化に基づいて、フォークリフトのマストが内側に移動するか、それとも外側に移動するかを決定する、請求項1に記載の装置。
【請求項4】
前記フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのバックレスト領域の検出結果を含み、
前記第1の決定部は、前記ビデオの連続的なフレーム間のバックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化に基づいて、フォークリフトのマストが上昇するか、それとも下降するかを決定する、請求項1に記載の装置。
【請求項5】
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定する第2の決定部、をさらに含む、請求項1に記載の装置。
【請求項6】
前記第2の決定部は、画像全体のサイズに対する人物の検出枠のサイズの比率に基づいて、前記人物がフォークリフトの周囲の人であるか、それとも運転者であるかを決定する、請求項5に記載の装置。
【請求項7】
前記オブジェクト検出モデルは、Yoloxネットワークに基づくオブジェクト検出モデルである、請求項1に記載の装置。
【請求項8】
請求項1に記載の装置を含む電子機器。
【請求項9】
フォークリフト状態の検出方法であって、
フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得するステップと、
前記ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力するステップであって、前記オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、ステップと、
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップと、を含む、方法。
【請求項10】
前記オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含み、
前記第1のモデルは、前記ビデオの画像に基づいて第1の検出結果を出力し、前記第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含み、
前記第2のモデルは、前記第1の検出結果に基づいて第2の検出結果を出力し、前記第2の検出結果は、フォークリフト積載領域の状態を含む、請求項9に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報技術の分野に関する。
【背景技術】
【0002】
産業化と倉庫技術の急速な発展に伴い、フォークリフトは専門家が操作する搬送ツールとして広く使用されている。インテリジェントな交通監視システムなどのインテリジェントなビデオ監視は、現実の世界で広く使用されている。現在、インテリジェントなビデオ監視は、フォークリフトの監視にも使用されている。
【0003】
フォークリフトの積載状態の判断には、現在、輝度法が一般的に採用されている。この方法は、フォーク(fork)領域の平均輝度値を計算し、平均輝度値が所定の閾値未満である場合、フォークに荷物が積載されていると判断し、該平均輝度値が所定の閾値よりも大きい場合、フォークに荷物が積載されていないと判断する。
【0004】
フォークリフトの動作の判断には、現在、オプティカルフロー法が採用されている。この方法は、複数の連続的なフレームからオプティカルフローベクトルに垂直に面する画素を抽出する。そして、これらの画素のオプティカルフローベクトルの中央値を計算する。該値が所定の閾値よりも大きい場合、フォークが操作されていると判断し、該値が所定の閾値よりも小さい場合、フォークが操作されていないと判断する。
【0005】
なお、上述した背景技術の説明は、本発明の技術案を明確、完全に理解させるための説明であり、当業者を理解させるために記述されているものである。これらの技術案は、単なる本発明の背景技術部分として説明されたものであり、当業者により周知されたものではない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、フォークリフトの積載状態を判断するための従来の輝度法では、画像の照明環境が一定ではないため、フォークリフトが屋内と屋外を移動する際に、誤判定が発生する場合が多い。フォークリフトの操作を判断するためのオプティカルフロー法では、フォークが操作されていなくても、物体がバックレストの移動範囲内で移動する場合にも誤判定されてしまう。例えば、床に模様があり、フォークリフトが該模様の上を動作する場合、誤判定されてしまう。また、該方法は、操作の種類を分類することができない。
【0007】
上記の問題の少なくとも1つを解決するために、本発明の実施例は、オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる、フォークリフト状態の検出装置及び方法を提供する。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【課題を解決するための手段】
【0008】
本発明の実施例の第1の態様では、フォークリフト状態の検出装置であって、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得する取得部と、前記ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力する検出部であって、前記オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、検出部と、前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定する第1の決定部と、を含む、装置を提供する。
【0009】
本発明の実施例の第2の態様では、本発明の実施例の第1の態様に記載の装置を含む電子機器を提供する。
【0010】
本発明の実施例の第3の態様では、フォークリフト状態の検出方法であって、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得するステップと、前記ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力するステップであって、前記オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、ステップと、前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップと、を含む、方法を提供する。
【0011】
本発明の実施例の有利な効果の1つは以下の通りである。オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【0012】
本発明の特定の実施形態は、後述の説明及び図面に示すように、詳細に開示され、本発明の原理を採用されることが可能な方式を示している。なお、本発明の実施例は、範囲上には限定されるものではない。本発明の実施例は、添付されている特許請求の範囲の主旨及び内容の範囲内、各種の改変、修正、及び均等的なものが含まれる。
【0013】
ある1つの実施形態に説明及び又は示されている特徴は、同一又は類似の方式で1つ又は多くの他の実施形態に使用されてもよく、他の実施形態における特徴と組み合わせてもよく、他の実施形態における特徴を代替してもよい。
【0014】
なお、用語「含む/有する」は、本文に使用される際に、特徴、要素、ステップ又は構成要件の存在を意味し、1つ又は複数の他の特徴、要素、ステップ又は構成要件の存在又は追加を排除するものではない。
【図面の簡単な説明】
【0015】
ここで含まれる図面は、本発明の実施例を理解させるためのものであり、本明細書の一部を構成し、本発明の実施例を例示するためのものであり、文言の記載と合わせて本発明の原理を説明する。なお、ここに説明される図面は、単なる本発明の実施例を説明するためのものであり、当業者にとって、これらの図面に基づいて他の図面を容易に得ることができる。
【
図1】本発明の実施例1に係るフォークリフト状態の検出装置の1つの概略図である。
【
図2】本発明の実施例1に係るフォークリフトの1つの立体構造の概略図である。
【
図3】本発明の実施例1に係るビデオのオブジェクト検出結果の1つの概略図である。
【
図4】本発明の実施例1に係るビデオのオブジェクト検出結果のもう1つの概略図である。
【
図5】本発明の実施例1に係るビデオのオブジェクト検出結果のもう1つの概略図である。
【
図6】本発明の実施例2に係る電子機器の1つの概略図である。
【
図7】本発明の実施例2に係る電子機器のシステム構成の1つの概略的なブロック図である。
【
図8】本発明の実施例3に係るフォークリフト状態の検出方法の1つの概略図である。
【発明を実施するための形態】
【0016】
本発明の上記及びその他の特徴は、図面及び下記の説明により理解できるものである。明細書及び図面では、本発明の特定の実施形態、即ち本発明の原則に従う一部の実施形態を表すものを公開している。なお、本発明は説明される実施形態に限定されず、本発明は、特許請求の範囲内の全ての修正、変更されたもの、及び均等なものを含む。
【0017】
<実施例1>
本発明の実施例は、フォークリフト状態の検出装置を提供する。
図1は、本発明の実施例1に係るフォークリフト状態の検出装置の1つの概略図である。
【0018】
図1に示すように、フォークリフト状態の検出装置100は、以下の各部を含む。
【0019】
取得部101は、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得する。
【0020】
検出部102は、該ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力する。該オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む。
【0021】
第1の決定部103は、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定する。
【0022】
このように、オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【0023】
幾つかの態様では、フォークリフトは、様々な規格のフォークリフトであってもよく、運転席、マスト(mast)、バックレスト(backrest)、フォーク(fork)などの主要部分を備える。
【0024】
幾つかの態様では、フォークリフト状態は、フォークリフト積載領域の状態、即ち積載状態、及び動作状態、即ちフォークリフトがどのような動作を行っているかを含む。
【0025】
図2は、本発明の実施例1に係るフォークリフトの1つの立体構造の概略図である。
図2に示すように、フォークリフト10は、運転席11、左右のマスト12、バックレスト13及びフォーク14などの部分を備える。
【0026】
取得部101は、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得する。例えば、
図2に示すように、フォークリフト10の頂部、例えば運転席11の上方には、運転者及びフォークリフトの主要部を含むビデオを下方へ撮影するカメラ装置15が設けられている。
【0027】
例えば、カメラ装置15は、魚眼カメラである。このように、より広い範囲のビデオを撮影することができる。
【0028】
図2に示すように、フォークリフト10の運転席11の上方に設置されたカメラ装置15により、下方へビデオの画面20が撮影される。
【0029】
検出部102は、該ビデオに基づいて検出を行う。具体的には、該ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力する。該オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む。言い換えれば、検出部102は、オブジェクト検出モデルを含み、該オブジェクト検出モデルを用いて検出を行う。
【0030】
幾つかの態様では、オブジェクト検出モデルは、Yoloxネットワークなどの様々なタイプのオブジェクト検出ネットワークを含んでもよい。
【0031】
幾つかの態様では、該オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含む。該第1のモデルは、該ビデオの画像に基づいて第1の検出結果を出力し、該第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含む。該第2のモデルは、該第1の検出結果に基づいて第2の検出結果を出力し、該第2の検出結果は、フォークリフト積載領域の状態を含む。
【0032】
例えば、第1の検出結果は、マスト(mast)、人(person)、ハンドル(handle)及びステアリング(steering)の検出結果を含む。これらの検出結果は、例えば検出枠の形式で表される。また、検出結果は、対応する信頼度を含んでもよく、信頼度は、例えば百分率で表される。
【0033】
例えば、第2の検出結果は、フォークリフト積載領域の状態が空き(empty)又は積載(stack)であることを含む。
【0034】
このように、カスケード接続された2つのモデルによりオブジェクト検出モデルを構築することで、高精度なオブジェクト検出結果を取得することができる。
【0035】
幾つかの態様では、第1のモデルと第2のモデルとは同一の構造を有し、例えば、第1のモデルと第2のモデルとは、Yoloxネットワークに基づくオブジェクト検出モデルである。
【0036】
検出部102がオブジェクト検出モデルによりオブジェクト検出結果を取得した後、第1の決定部103は、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定する。
【0037】
幾つかの態様では、フォークリフトの動作状態は、フォークリフトのマストが内側又は外側に移動すること、フォークリフトのマストが上昇し、又は下降することを含む。該所定の判定ルールの具体的な内容は、決定する必要のあるフォークリフトの動作状態の種類に応じて決定されてもよい。
【0038】
幾つかの態様では、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのマストの検出結果を含む。第1の決定部103は、該ビデオの連続的なフレーム間の2つのマスト間の領域の面積の変化に基づいて、フォークリフトのマストが内側に移動する(reach in)か、それとも外側に移動する(reach out)かを決定する。このように、マスト間の領域の面積の変化により、マストの動作状態を簡単かつ正確に検出することができる。
【0039】
例えば、該所定の判定ルールは、連続的なフレーム間の2つのマスト間の領域の面積の増加率が所定の第1の閾値を超えている場合、フォークリフトのマストが内側に移動すると判断し、連続的なフレーム間の2つのマスト間の領域の面積の減少率が所定の第1の閾値を超えている場合、フォークリフトのマストが外側に移動すると判断することを含む。
【0040】
図3は、本発明の実施例1に係るビデオのオブジェクト検出結果の1つの概略図である。
図3に示すように、オブジェクト検出結果は、マスト(mast)領域の検出枠及びその信頼度(96.7%)、積載領域の検出枠、その検出結果である「空き(empty)」及び対応する信頼度(96.5%)、人物(person)の検出枠及びその信頼度(95.5%)、ステアリング(steering)の検出枠及びその信頼度(88.3%)を含む。ここで、連続的なフレーム間のマスト(mast)領域21の面積の変化に基づいて、マストの動作状態を決定する。
【0041】
例えば、ビデオの連続的な10個のフレームの画像に基づいて、2つのマストの間の領域の面積の変化率を決定し、変化率に対して線形フィッティングを行い、傾きが所定の第1の閾値を超えているか否かに応じて、フォークリフトのマストが動作を行っているか否か、例えば外側又は内側に移動しているかを判定する。
【0042】
幾つかの態様では、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのバックレスト領域の検出結果を含む。第1の決定部103は、該ビデオの連続的なフレーム間のバックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化に基づいて、フォークリフトのマストが上昇するか、それとも下降するかを決定する。このように、バックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化により、マストの上昇又は下降の動作を簡単かつ正確に検出することができる。
【0043】
例えば、該所定の判定ルールは、連続的なフレーム間のバックレスト領域の中心と画像の中心との距離が所定の第2の閾値を超えて増加した場合、フォークリフトのマストが上昇していると決定し、連続的なフレーム間のバックレスト領域の中心と画像の中心との距離が所定の第2の閾値を超えて減少した場合、フォークリフトのマストが下降していると決定することを含む。
【0044】
図4は、本発明の実施例1に係るビデオのオブジェクト検出結果のもう1つの概略図である。
図4に示すように、(a)はフレーム番号がn‐10のビデオフレームを表し、d1は該ビデオフレームにおけるバックレスト(backrest)領域22の中心と画像の中心との距離を表し、(b)はフレーム番号がnのビデオフレームを表し、d2は該ビデオフレームにおけるバックレスト(backrest)領域22の中心と画像の中心との距離を表し、d2‐d1が所定の第2の閾値を超えている場合、フォークリフトのマストが上昇していると決定する。
【0045】
幾つかの態様では、
図1に示すように、フォークリフト状態の検出装置100は、以下の各部をさらに含む。
【0046】
第2の決定部104は、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定する。
【0047】
幾つかの態様では、第2の決定部104は、オプションの構成要素である。
【0048】
幾つかの態様では、第2の決定部104は、画像全体のサイズに対する人物の検出枠のサイズの比率に基づいて、該人物がフォークリフトの周囲の人であるか、それとも運転者であるかを決定する。このように、関係者の属性を簡単かつ正確に検出することができる。
【0049】
例えば、該所定の判定ルールは、画像全体のサイズに対する人物の検出枠のサイズの比率が所定の第3の閾値以上である場合、該人物が運転者であると決定し、画像全体のサイズに対する人物の検出枠のサイズの比率が所定の第3の閾値よりも小さい場合、該人物がフォークリフトの周囲の人であると決定する。
【0050】
図5は、本発明の実施例1に係るビデオのオブジェクト検出結果のもう1つの概略図である。
図5に示すように、オブジェクト検出結果は、人物(person)の2つの検出枠及びその信頼度(95.1%と88.7%)、ステアリング(steering)の検出枠及びその信頼度(94.1%)、ハンドル(handle)の2つの検出枠及びその信頼度(92.7%と75.7%)、積載領域の検出枠、その検出結果である積載(stack)及び対応する信頼度(91.1%)を含む。ここで、画像全体のサイズに対応する人物の検出枠23のサイズの比率はr1であり、画像全体のサイズに対する人物の検出枠24のサイズの比率はr2である。例えば、r1は0.014であり、r2は0.165である。例えば、第3の閾値が0.1であると仮定すると、r1は第3の閾値よりも小さく、r2は第3の閾値よりも大きく、検出枠23における人物はフォークリフトの周囲の人であり、検出枠24における人物は運転者である。
【0051】
本実施例によれば、オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【0052】
<実施例2>
本発明の実施例は、電子機器をさらに提供する。
図6は、本発明の実施例2に係る電子機器の1つの概略図である。
図6に示すように、電子機器600は、フォークリフト状態の検出装置601を含み、フォークリフト状態の検出装置601の構成及び機能は実施例1に係るフォークリフト状態の検出装置100と同様であり、ここでその説明を省略する。
【0053】
図7は、本発明の実施例2に係る電子機器のシステム構成の1つの概略的なブロック図である。
図7に示すように、電子機器700は、プロセッサ701及びメモリ702を含んでもよく、メモリ702はプロセッサ701に接続される。該図は単なる例示的なものであり、電気通信機能又は他の機能を実現するように、他の種類の構成を用いて、該構成を補充又は代替してもよい。
【0054】
幾つかの態様では、プロセッサ701は、中央処理装置(CPU)及びグラフィックス処理装置(GPU)のうちの少なくとも1つを含む。
【0055】
図7に示すように、電子機器700は、入力部703、ディスプレイ704及び電源705をさらに含んでもよい。
【0056】
1つの態様では、実施例1に係るフォークリフト状態の検出装置の機能はプロセッサ701に統合されてもよい。ここで、プロセッサ701は、フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得するステップと、該ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力するステップであって、該オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、ステップと、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップと、を実行するように構成されてもよい。
【0057】
例えば、該オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含み、該第1のモデルは、該ビデオの画像に基づいて第1の検出結果を出力し、該第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含み、該第2のモデルは、該第1の検出結果に基づいて第2の検出結果を出力し、該第2の検出結果は、フォークリフト積載領域の状態を含む。
【0058】
例えば、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのマストの検出結果を含み、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、該ビデオの連続的なフレーム間の2つのマスト間の領域の面積の変化に基づいて、フォークリフトのマストが内側に移動するか、それとも外側に移動するかを決定するステップ、を含む。
【0059】
例えば、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのバックレスト領域の検出結果を含み、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、該ビデオの連続的なフレーム間のバックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化に基づいて、フォークリフトのマストが上昇するか、それとも下降するかを決定するステップ、を含む。
【0060】
例えば、プロセッサ701は、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定するステップ、をさらに実行するように構成される。
【0061】
例えば、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定するステップは、画像全体のサイズに対する人物の検出枠のサイズの比率に基づいて、該人物がフォークリフトの周囲の人であるか、それとも運転者であるかを決定するステップ、を含む。
【0062】
例えば、該オブジェクト検出モデルは、Yoloxネットワークに基づくオブジェクト検出モデルである。
【0063】
もう1つの態様では、実施例1に係るフォークリフト状態の検出装置はプロセッサ701とそれぞれ配置されてもよく、例えば、該フォークリフト状態の検出装置はプロセッサ701に接続されたチップであり、プロセッサ701の制御により該フォークリフト状態の検出装置の機能を実現するように構成されてもよい。
【0064】
本発明の実施例の1つの態様では、電子機器700は、
図7に示されている全ての構成部を含まなくてもよい。
【0065】
図7に示すように、プロセッサ701は、コントローラ又は操作制御部とも称され、マイクロプロセッサ又は他の処理装置及び/又は論理装置を含んでもよく、プロセッサ701は入力を受け付け、電子機器700の各部の操作を制御する。
【0066】
メモリ702は、例えばバッファ、フラッシュメモリ、ハードディスク、移動可能な媒体、発揮性メモリ、不発揮性メモリ、又は他の適切な装置の1つ又は複数であってもよい。また、プロセッサ701は、メモリ702に記憶されたプログラムを実行し、情報の記憶又は処理などを実現してもよい。他の部材は従来技術に類似するため、ここでその説明が省略される。電子機器700の各部は、本発明の範囲から逸脱することなく、専用のハードウェア、ファームウェア、ソフトウェア又はその組み合わせによって実現されてもよい。
【0067】
本実施例によれば、オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【0068】
<実施例3>
本発明の実施例は、実施例1のフォークリフト状態の検出装置に対応するフォークリフト状態の検出方法をさらに提供する。
図8は、本発明の実施例3に係るフォークリフト状態の検出方法の1つの概略図である。
図8に示すように、該方法は以下のステップを含む。
【0069】
ステップ801:フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得する。
【0070】
ステップ802:該ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力する。該オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む。
【0071】
ステップ803:該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定する。
【0072】
幾つかの態様では、該オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含み、該第1のモデルは、該ビデオの画像に基づいて第1の検出結果を出力し、該第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含み、該第2のモデルは、該第1の検出結果に基づいて第2の検出結果を出力し、該第2の検出結果は、フォークリフト積載領域の状態を含む。
【0073】
幾つかの態様では、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのマストの検出結果を含み、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、該ビデオの連続的なフレーム間の2つのマスト間の領域の面積の変化に基づいて、フォークリフトのマストが内側に移動するか、それとも外側に移動するかを決定するステップ、を含む。
【0074】
幾つかの態様では、該フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのバックレスト領域の検出結果を含み、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、該ビデオの連続的なフレーム間のバックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化に基づいて、フォークリフトのマストが上昇するか、それとも下降するかを決定するステップ、を含む。
【0075】
幾つかの態様では、
図8に示すように、該方法は、以下のステップをさらに含む。
【0076】
ステップ804:該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定する。
【0077】
このステップ804は、オプションのステップである。
【0078】
例えば、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定するステップは、画像全体のサイズに対する人物の検出枠のサイズの比率に基づいて、該人物がフォークリフトの周囲の人であるか、それとも運転者であるかを決定するステップ、を含む。
【0079】
幾つかの態様では、該オブジェクト検出モデルは、Yoloxネットワークに基づくオブジェクト検出モデルである。
【0080】
本実施例では、上記の各ステップの具体的な実現方法は、実施例1における記載と同様であり、ここで重複する部分について説明を省略する。
【0081】
本実施例によれば、オブジェクト検出モデルにより、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含むオブジェクト検出結果を取得することができると共に、該オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定することができる。該方法は、フォークリフトの使用環境の影響や制限を受けることがなく、フォークリフトの積載状態及び動作状態の検知結果を正確に取得することができる。
【0082】
本発明の実施例は、フォークリフト状態の検出装置又は電子機器においてプログラムを実行する際に、コンピュータに、該フォークリフト状態の検出装置又は電子機器において上記実施例3に記載のフォークリフト状態の検出方法を実行させる、コンピュータ読み取り可能なプログラムをさらに提供する。
【0083】
本発明の実施例は、コンピュータに、フォークリフト状態の検出装置又は電子機器において上記実施例3に記載のフォークリフト状態の検出方法を実行させるためのコンピュータ読み取り可能なプログラムが記憶された記憶媒体をさらに提供する。
【0084】
本発明の実施例を参照しながら説明したフォークリフト状態の検出装置又は電子機器において実行されているフォークリフト状態の検出方法は、ハードウェア、プロセッサにより実行されるソフトウェアモジュール、又は両者の組み合わせで実施されてもよい。例えば、
図1に示す機能的ブロック図における1つ若しくは複数、又は機能的ブロック図の1つ若しくは複数の組み合わせは、コンピュータプログラムフローの各ソフトウェアモジュールに対応してもよいし、各ハードウェアモジュールに対応してもよい。これらのソフトウェアモジュールは、
図8に示す各ステップにそれぞれ対応してもよい。これらのハードウェアモジュールは、例えばフィールド・プログラマブル・ゲートアレイ(FPGA)を用いてこれらのソフトウェアモジュールをハードウェア化して実現されてもよい。
【0085】
ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、モバイルハードディスク、CD-ROM又は当業者にとって既知の任意の他の形の記憶媒体に位置してもよい。プロセッサが記憶媒体から情報を読み取ったり、記憶媒体に情報を書き込むように該記憶媒体をプロセッサに接続してもよいし、記憶媒体がプロセッサの構成部であってもよい。プロセッサ及び記憶媒体はASICに位置する。該ソフトウェアモジュールは移動端末のメモリに記憶されてもよいし、移動端末に挿入されたメモリカードに記憶されてもよい。例えば、電子機器が比較的に大きい容量のMEGA-SIMカード又は大容量のフラッシュメモリ装置を用いる場合、該ソフトウェアモジュールは該MEGA-SIMカード又は大容量のフラッシュメモリ装置に記憶されてもよい。
【0086】
図1に記載されている1つ以上の機能ブロック及び/又は機能ブロックの1つ以上の組合せは、本願に記載されている機能を実行するための汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ(FPGA)又は他のプログラマブル論理デバイス、ディスクリートゲート又はトランジスタ論理装置、ディスクリートハードウェアコンポーネント、又はそれらの任意の適切な組み合わせで実現されてもよい。
図1に記載されている1つ以上の機能ブロック及び/又は機能ブロックの1つ以上の組合せは、例えば、コンピューティング機器の組み合わせ、例えばDSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサの組み合わせ、DSP通信と組み合わせた1つ又は複数のマイクロプロセッサ又は他の任意の構成で実現されてもよい。
【0087】
以上は具体的な実施形態を参照しながら本発明を説明しているが、上記の説明は、例示的なものに過ぎず、本発明の保護の範囲を限定するものではない。本発明の趣旨及び原理を離脱しない限り、本発明に対して各種の変形及び変更を行ってもよく、これらの変形及び変更も本発明の範囲に属する。
【0088】
また、上述の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
フォークリフト状態の検出方法であって、
フォークリフトの頂部に設置されたカメラ装置により下方へ撮影されたビデオを取得するステップと、
前記ビデオの画像をオブジェクト検出モデルに入力し、オブジェクト検出結果を出力するステップであって、前記オブジェクト検出結果は、フォークリフト積載領域の状態と、フォークリフトの少なくとも1つの部材及び人物の検出結果とを含む、ステップと、
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップと、を含む、方法。
(付記2)
前記オブジェクト検出モデルは、カスケード接続された第1のモデル及び第2のモデルを含み、
前記第1のモデルは、前記ビデオの画像に基づいて第1の検出結果を出力し、前記第1の検出結果は、フォークリフトの少なくとも1つの部材及び人物の検出結果を含み、
前記第2のモデルは、前記第1の検出結果に基づいて第2の検出結果を出力し、前記第2の検出結果は、フォークリフト積載領域の状態を含む、付記1に記載の方法。
(付記3)
前記フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのマストの検出結果を含み、
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、
前記ビデオの連続的なフレーム間の2つのマスト間の領域の面積の変化に基づいて、フォークリフトのマストが内側に移動するか、それとも外側に移動するかを決定するステップ、を含む、付記1に記載の方法。
(付記4)
前記フォークリフトの少なくとも1つの部材の検出結果は、フォークリフトのバックレスト領域の検出結果を含み、
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの動作状態を決定するステップは、
前記ビデオの連続的なフレーム間のバックレスト領域の中心と画像の中心との距離の変化又はバックレスト領域の中心と画像の下端との距離の変化に基づいて、フォークリフトのマストが上昇するか、それとも下降するかを決定するステップ、を含む、付記1に記載の方法。
(付記5)
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定するステップ、をさらに含む、付記1に記載の方法。
(付記6)
前記オブジェクト検出結果及び所定の判定ルールに従って、フォークリフトの周囲の人を決定するステップは、
画像全体のサイズに対する人物の検出枠のサイズの比率に基づいて、前記人物がフォークリフトの周囲の人であるか、それとも運転者であるかを決定するステップ、を含む、付記5に記載の方法。
(付記7)
前記オブジェクト検出モデルは、Yoloxネットワークに基づくオブジェクト検出モデルである、付記1に記載の方法。
(付記8)
コンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサにより実行される際に、付記1乃至7の何れかに記載の方法を実現する、記憶媒体。