(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-30
(45)【発行日】2024-10-08
(54)【発明の名称】ラベル付け情報決定方法および装置
(51)【国際特許分類】
G06V 10/764 20220101AFI20241001BHJP
G06V 10/762 20220101ALI20241001BHJP
【FI】
G06V10/764
G06V10/762
(21)【出願番号】P 2023504425
(86)(22)【出願日】2020-07-21
(86)【国際出願番号】 CN2020103205
(87)【国際公開番号】W WO2022016355
(87)【国際公開日】2022-01-27
【審査請求日】2023-03-20
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133569
【氏名又は名称】野村 進
(72)【発明者】
【氏名】王 旭▲東▼
(72)【発明者】
【氏名】▲劉▼ 新春
(72)【発明者】
【氏名】晋 周南
【審査官】菊池 伸郎
(56)【参考文献】
【文献】中国特許出願公開第109858476(CN,A)
【文献】特開2019-016249(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-7/90
G06V 10/00-40/70
G06F 16/583
(57)【特許請求の範囲】
【請求項1】
検出モデルセットを得るステップであって、前記検出モデルセットが少なくとも2つの検出モデルを含み、前記検出モデルセット内の前記少なくとも2つの検出モデルが同じ検出カテゴリに対応する、ステップと、
第1のラベル付け情報セットを得るために、前記検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるステップ
であって、前記ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含み、前記第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み、前記第1のラベル付け情報は、前記第1の検出物のラベル付け情報に対応し、前記第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含む、ステップと、
前記第1の検出物に対応する少なくとも1つの第1のクラスタを生成するために、前記第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするステップと、
前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に基づいて、前記第1のクラスタに対応する前記第1の検出物の第2の位置情報を生成するステップと、
前記第1のクラスタに含まれる前記第1のラベル付け情報の第1の数量を決定するステップと、
前記第1の数量が既定の数量閾値以上である場合に、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1のカテゴリ情報が、前記第1のクラスタに対応する前記第1の検出物の第2のカテゴリ情報であると決定するステップと、
前記第2の位置情報と前記第2のカテゴリ情報とを含む第2のラベル付け情報を生成するステップと
を含む、ラベル付け情報決定方法。
【請求項2】
検出モデルセットを得るステップであって、前記検出モデルセットが少なくとも2つの検出モデルを含み、前記検出モデルセット内の前記少なくとも2つの検出モデルが同じ検出カテゴリに対応する、ステップと、
第1のラベル付け情報セットを得るために、前記検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるステップであって、前記ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含み、前記第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み、前記第1のラベル付け情報は、前記第1の検出物のラベル付け情報に対応し、前記第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含む、ステップと、
前記第1の検出物に対応する少なくとも1つの第1のクラスタを生成するために、前記第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするステップと、
前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に基づいて、前記第1のクラスタに対応する前記第1の検出物の第2の位置情報を生成するステップと、
前記第1のクラスタに含まれる前記第1のラベル付け情報の第1の数量を決定するステップと、
前記第1の数量が既定の数量閾値未満である場合に、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1のカテゴリ情報に関連付けられた第1の分類モデルを得るステップと、
前記第1の分類モデルと、前記第1のクラスタに対応する前記第1の検出物の前記第2の位置情報とに基づいて、前記第1のクラスタに対応する前記第1の検出物の第2のカテゴリ情報を決定するステップと、
前記第2の位置情報と前記第2のカテゴリ情報とを含む第2のラベル付け情報を生成するステップと
を含む、ラベル付け情報決定方法。
【請求項3】
前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に基づいて、前記第1のクラスタに対応する前記第1の検出物の前記第2の位置情報を生成する前記ステップは、
前記第1のクラスタに対応する前記第1の検出物の前記第2の位置情報を生成するために、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に対して平均値計算を実行するステップを含む、請求項
1または2に記載の方法。
【請求項4】
少なくとも1つの第1のクラスタを生成するために、前記第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングする前記ステップは、
前記第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得るステップと、
前記少なくとも1つの第1のクラスタを生成するために、前記矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、前記第1のラベル付け情報セット内の同一カテゴリの前記第1のラベル付け情報をクラスタリングするステップとを含む、請求項
1から3のいずれか一項に記載の方法。
【請求項5】
前記検出モデルセットは予め設定される、請求項1から
4のいずれか一項に記載の方法。
【請求項6】
前記方法は、分類モデルセットを得るステップであって、前記分類モデルセットが少なくとも2つの分類モデルを含み、前記分類モデルセット内の前記少なくとも2つの分類モデルが同じ検出カテゴリに対応し、前記少なくとも2つの分類モデルが前記第1の分類モデルを含む、ステップをさらに含む、請求項
2に記載の方法。
【請求項7】
検出モデルセットを得るように構成された取得モジュールであって、前記検出モデルセットが少なくとも2つの検出モデルを含み、前記検出モデルセット内の前記少なくとも2つの検出モデルが同じ検出カテゴリに対応する、取得モジュールと、
第1のラベル付け情報セットを得るために、前記検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるように構成された処理モジュール
であって、前記ラベル付けされるべき画像は少なくとも1つの第1の検出物を含み、前記第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み、前記第1のラベル付け情報は、前記第1の検出物のラベル付け情報に対応し、前記第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含み、
前記第1の検出物に対応する少なくとも1つの第1のクラスタを生成するために、前記第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングし、
前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に基づいて、前記第1のクラスタに対応する前記第1の検出物の第2の位置情報を生成し、
前記第1のクラスタに含まれる前記第1のラベル付け情報の第1の数量を決定し、
前記第1の数量が既定の数量閾値以上である場合に、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1のカテゴリ情報が、前記第1のクラスタに対応する前記第1の検出物の第2のカテゴリ情報であると決定し、
前記第2の位置情報と前記第2のカテゴリ情報とを含む第2のラベル付け情報を生成するように構成される、処理モジュールと
を含む、ラベル付け情報決定装置。
【請求項8】
検出モデルセットを得るように構成された取得モジュールであって、前記検出モデルセットが少なくとも2つの検出モデルを含み、前記検出モデルセット内の前記少なくとも2つの検出モデルが同じ検出カテゴリに対応する、取得モジュールと、
第1のラベル付け情報セットを得るために、前記検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるように構成された処理モジュールであって、前記ラベル付けされるべき画像は少なくとも1つの第1の検出物を含み、前記第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み、前記第1のラベル付け情報は、前記第1の検出物のラベル付け情報に対応し、前記第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含み、
前記第1の検出物に対応する少なくとも1つの第1のクラスタを生成するために、前記第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングし、
前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に基づいて、前記第1のクラスタに対応する前記第1の検出物の第2の位置情報を生成し、
前記第1のクラスタに含まれる前記第1のラベル付け情報の第1の数量を決定し、
前記第1の数量が既定の数量閾値未満である場合に、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1のカテゴリ情報に関連付けられた第1の分類モデルを得て、
前記第1の分類モデルと、前記第1のクラスタに対応する前記第1の検出物の前記第2の位置情報とに基づいて、前記第1のクラスタに対応する前記第1の検出物の第2のカテゴリ情報を決定し、
前記第2の位置情報と前記第2のカテゴリ情報とを含む第2のラベル付け情報を生成するように構成される、処理モジュールと
を含む、ラベル付け情報決定装置。
【請求項9】
前記処理モジュールは、具体的には、
前記第1のクラスタに対応する前記第1の検出物の前記第2の位置情報を生成するために、前記第1のクラスタに含まれる前記第1のラベル付け情報内の前記第1の位置情報に対して平均値計算を実行するように構成される、請求項
7または8に記載の装置。
【請求項10】
前記処理モジュールは、具体的には、
前記第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得、かつ
前記少なくとも1つの第1のクラスタを生成するために、前記矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、前記第1のラベル付け情報セット内の同一カテゴリの前記第1のラベル付け情報をクラスタリングするように構成される、請求項
7から9のいずれか一項に記載の装置。
【請求項11】
前記検出モデルセットは予め設定される、請求項
7から10のいずれか一項に記載の装置。
【請求項12】
前記取得モジュールは、分類モデルセットを得、前記分類モデルセットが少なくとも2つの分類モデルを含み、前記分類モデルセット内の前記少なくとも2つの分類モデルが同じ検出カテゴリに対応し、前記少なくとも2つの分類モデルが前記第1の分類モデルを含むようにさらに構成される、請求項
8に記載の装置。
【請求項13】
少なくとも1つのプロセッサと、少なくとも1つのトランシーバと、少なくとも1つのメモリとを含む装置であって、
前記少なくとも1つのトランシーバは、信号を受信するように、または信号を送信するように構成され、前記少なくとも1つのプロセッサは、前記少なくとも1つのメモリに保管されたコンピュータプログラムまたは命令を実行するように構成され、前記コンピュータプログラムまたは前記命令が実行されると、前記装置は、請求項1から
6のいずれか一項に記載の方法を実施することが可能になる、装置。
【請求項14】
コンピュータプログラムまたは命令を含むコンピュータ記憶媒体であって、前記コンピュータプログラムまたは前記命令が実行されると、請求項1から
6のいずれか一項に記載の方法が実行される、コンピュータ記憶媒体。
【請求項15】
コンピュータプログラム
であって、前記コンピュータプログラム
がコンピュータ上で実行すると、前記コンピュータは、請求項1から
6のいずれか一項に記載の方法を実施することが可能になる、コンピュータプログラム
。
【請求項16】
少なくとも1つのプロセッサを含むチップシステムであって、前記少なくとも1つのプロセッサは、少なくとも1つのメモリに結合され、前記少なくとも1つのメモリに保管されたコンピュータプログラムまたは命令を実行するように構成され、前記コンピュータプログラムまたは前記命令が実行されると、請求項1から
6のいずれか一項に記載の方法が実行される、チップシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、自動運転技術の分野に関し、特に、ラベル付け情報決定方法および装置に関する。
【背景技術】
【0002】
自律運転の分野では、通常、車両が位置する走行環境の画像の中で車両や歩行者などの様々な検出物にラベルを付ける必要がある。
【0003】
従来の技術では、通常、矩形のバウンディングボックスを使用して画像内で検出物がラベル付けされる、すなわち、矩形のバウンディングボックスを使用して画像内で検出物がラベル付けされる。具体的に述べると、検出物のラベル付け情報を得るために、検出モデルを使用して画像内の検出物にラベル付けでき、ラベル付け情報に基づく矩形のバウンディングボックスを使用して画像内で検出物がラベル付けされる。しかしながら、既存の検出モデルを使用して画像内の検出物がラベル付けされた後に、得られるラベル付け情報の精度は比較的低い。その後、検出物にラベルを付けるために使用される矩形のバウンディングボックスがラベル付け情報に基づいて決定されると、決定された矩形のバウンディングボックスと、検出物の実際の位置に対応する矩形のバウンディングボックスとの間に比較的大きな誤差がある。
【発明の概要】
【0004】
本出願は、ラベル付け情報の比較的低い精度を解決するために、ラベル付け情報決定方法および装置を提供する。
【課題を解決するための手段】
【0005】
第1の態様によると、本出願は、ラベル付け情報決定方法を提供する。本方法は、検出モデルセットを得るステップであって、検出モデルセットが少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルが同じ検出カテゴリに対応する、ステップと、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるステップとを含む。
【0006】
この実装では、検出モデルセットが最初に得られる。検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。次に、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像がラベル付けされる。換言すると、この実装でラベル付け情報が決定されるときには、ラベル付けされるべき画像が、単一の検出モデルを使用してラベル付けされるのではなく、複数の検出モデルを使用してラベル付けされる。複数の検出モデルは、複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。複数の検出モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな検出モデルを得ることができる。このように、検出精度はより高く、より正確なラベル付け情報を得ることができる。複数の検出モデルが同じ検出カテゴリに対応する場合は、同じ検出物について複数のラベル付け情報を得ることができ、複数のラベル付け情報に基づいて後ほど決定される実際のラベル付け情報もより正確である。したがって、本実装の方法を用いることによって、より高精度なラベル付け情報を得ることができる。その後、検出物にラベルを付けるために使用される矩形のバウンディングボックスがラベル付け情報に基づいて決定されるときには、得られる矩形のバウンディングボックスと実際の位置に対応する矩形のバウンディングボックスとの間の誤差が画素レベルで大幅に低減され、基本的に無視できる。したがって、適用性は良好である。
【0007】
第1の態様を参照し、第1の態様の第1の可能な実装において、ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含み、第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み、第1のラベル付け情報は、第1の検出物のラベル付け情報に対応し、第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含み、本方法は、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするステップであって、第1のクラスタが、第1の検出物に対応する、ステップと、第1のクラスタに含まれる少なくとも1つの第1のラベル付け情報に基づいて、第1のクラスタに対応する第1の検出物の第2のラベル付け情報を生成するステップであって、第2のラベル付け情報が、第2の位置情報と第2のカテゴリ情報とを含む、ステップとを含む。
【0008】
この実装において、少なくとも1つのクラスタは、同じ検出カテゴリの第1のラベル付け情報をクラスタリングし、かつ統合することによって得られる。それぞれのクラスタについて、複数の第1のラベル付け情報に含まれる第1の位置情報と第1のカテゴリ情報とに基づいて、対応する第1の検出物の第2のラベル付け情報が決定され得る。得られる第2のラベル付け情報は、複数の第1の位置情報と第1のカテゴリ情報とを統合したものである。したがって、精度はより高い。第2のラベル付け情報に基づいて後ほど生成される矩形のバウンディングボックスと、実際の位置と実際のカテゴリとに対応する矩形のバウンディングボックスとの間の誤差は、より小さく、基本的にゼロの誤差に近い。したがって、適用性はより良好である。
【0009】
第1の態様を参照し、第1の態様の第2の可能な実装において、第1のクラスタに含まれる少なくとも1つの第1のラベル付け情報に基づいて、第1のクラスタに対応する第1の検出物の第2のラベル付け情報を生成するステップは、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成するステップと、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成するステップとを含む。
【0010】
この実装において、対応する第1の検出物の第2の位置情報は、複数の第1の位置情報に基づいて決定され得、対応する第1の検出物の第2のカテゴリ情報は、複数の第1のカテゴリ情報に基づいて決定され得る。それぞれの検出物について、それぞれの検出物に対応する第2の位置情報は、複数の第1の位置情報を統合したものであり、それぞれの検出物に対応する第2のカテゴリ情報は、複数の第1のカテゴリ情報を統合したものである。したがって、精度はより高い。
【0011】
第1の態様を参照し、第1の態様の第3の可能な実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成するステップは、第1のクラスタに対応する第1の検出物の第2の位置情報を生成するために、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に対して平均値計算を実行するステップを含む。
【0012】
この実装において、それぞれの第1の検出物の第2の位置情報は、複数の第1の位置情報に対して平均値計算を実行することによって得られ、その結果、第1の検出物の位置情報はより正確である。
【0013】
第1の態様を参照し、第1の態様の第4の可能な実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成するステップは、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定するステップと、第1の数量が既定の数量閾値以上である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報が、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報であると決定するステップとを含む。
【0014】
この実装では、それぞれのクラスタに含まれる第1のラベル付け情報の数量が、既定の数量閾値と比較されて、クラスタに対応する第1のカテゴリ情報が正確であるかどうかが決定される。第1のラベル付け情報の数量が既定の数量閾値より大きい場合は、第1のカテゴリ情報が比較的正確で信頼できると考えられる。第1のカテゴリ情報は、クラスタに対応する第1の検出物の第2のカテゴリ情報として決定され得、その結果、第1の検出物のカテゴリ情報はより正確で信頼でき、精度はより高い。
【0015】
第1の態様を参照し、第1の態様の第5の可能な実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成するステップは、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定するステップと、第1の数量が既定の数量閾値未満である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルを得、第1の分類モデルと、第1のクラスタに対応する第1の検出物の第2の位置情報とに基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を決定するステップとを含む。
【0016】
この実装では、それぞれのクラスタに含まれる第1のラベル付け情報の数量が、既定の数量閾値と比較されて、クラスタに対応する第1のカテゴリ情報が正確であるかどうかが決定される。第1のラベル付け情報の数量が既定の数量閾値以下である場合は、クラスタに対応する第1のカテゴリ情報が不正確であると考えられる。第1のクラスタに対応する第1の検出物のカテゴリ情報は、分類モデルを使用して再決定されるので、第1の検出物のカテゴリ情報はより正確で信頼でき、精度はより高い。
【0017】
第1の態様を参照し、第1の態様の第6の可能な実装において、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするステップは、第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得るステップと、少なくとも1つの第1のクラスタを生成するために、矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするステップとを含む。
【0018】
この実装では、同一カテゴリの第1のラベル付け情報がクラスタリングされるときに、クラスタリングの距離尺度として矩形のバウンディングボックスのインターセクション・オーバー・ユニオンが使用される。このように、クラスタリング処理は、比較的高い精度と比較的良好な適用性とを有する。
【0019】
第1の態様を参照して、第1の態様の第7の可能な実装において、検出モデルセットは予め設定される。
【0020】
この実装では、検出モデルセットが端末デバイスで予め設定され、検出モデルセットは端末デバイスから直接得られる。したがって、検出モデルセットを得るプロセスはより単純である。
【0021】
第1の態様を参照し、第1の態様の第8の可能な実装において、本方法は、分類モデルセットを得るステップをさらに含む。分類モデルセットは少なくとも2つの分類モデルを含み、分類モデルセット内の少なくとも2つの分類モデルは同じ検出カテゴリに対応し、少なくとも2つの分類モデルは第1の分類モデルを含む。
【0022】
この実装において、分類モデルセットは少なくとも2つの分類モデルを含み、少なくとも2つの分類モデルは同じ検出カテゴリに対応する。換言すると、分類モデルセットは複数の分類モデルを含み、複数の分類モデルは複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。分類処理を行うために分類モデルセットが使用され、複数の分類モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな分類モデルを得ることができる。このように、分類処理の精度はより高く、より正確な分類結果を得ることができる。複数の分類モデルが同じ検出カテゴリに対応する場合は、同じ検出物について、複数の分類処理結果を得ることができ、複数の分類処理結果に基づいて後ほど決定される実際の分類結果もより正確であり、適用性はより良好である。
【0023】
第2の態様によると、本出願は、ラベル付け情報決定装置を提供する。本装置は、検出モデルセットを得るように構成された取得モジュールであって、検出モデルセットが少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルが同じ検出カテゴリに対応する、取得モジュールと、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるように構成された処理モジュールとを含む。
【0024】
この実装の装置は、最初に検出モデルセットを得ることができる。検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。次に、本装置は、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像にラベルを付ける。換言すると、本装置がラベル付け情報を決定するように構成される場合は、ラベル付けされるべき画像が、単一の検出モデルを使用してラベル付けされるのではなく、複数の検出モデルを使用してラベル付けされる。複数の検出モデルは、複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。複数の検出モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな検出モデルを得ることができる。このように、検出精度はより高く、より正確なラベル付け情報を得ることができる。複数の検出モデルが同じ検出カテゴリに対応する場合は、同じ検出物について複数のラベル付け情報を得ることができ、複数のラベル付け情報に基づいて後ほど決定される実際のラベル付け情報もより正確である。したがって、本装置を使用することによって、より高精度なラベル付け情報を得ることができる。その後、検出物にラベルを付けるために使用される矩形のバウンディングボックスがラベル付け情報に基づいて決定されるときには、得られる矩形のバウンディングボックスと実際の位置に対応する矩形のバウンディングボックスとの間の誤差が画素レベルで大幅に低減され、基本的に無視できる。したがって、適用性は良好である。
【0025】
第2の態様を参照し、第2の態様の第1の可能な実装において、ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含む。第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含む。第1のラベル付け情報は、第1の検出物のラベル付け情報に対応する。第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含む。処理モジュールは、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングし、第1のクラスタが、第1の検出物に対応し、かつ第1のクラスタに含まれる少なくとも1つの第1のラベル付け情報に基づいて、第1のクラスタに対応する第1の検出物の第2のラベル付け情報を生成し、第2のラベル付け情報が、第2の位置情報と第2のカテゴリ情報とを含むようにさらに構成される。
【0026】
この実装の装置は、少なくとも1つのクラスタを得るために、同じ検出カテゴリの第1のラベル付け情報をクラスタリングし、かつ統合することができる。それぞれのクラスタについて、本装置は、複数の第1のラベル付け情報に含まれる第1の位置情報と第1のカテゴリ情報とに基づいて、対応する第1の検出物の第2のラベル付け情報を決定できる。得られる第2のラベル付け情報は、複数の第1の位置情報と第1のカテゴリ情報とを統合したものである。したがって、精度はより高い。第2のラベル付け情報に基づいて後ほど生成される矩形のバウンディングボックスと、実際の位置と実際のカテゴリとに対応する矩形のバウンディングボックスとの間の誤差は、より小さく、基本的にゼロの誤差に近い。したがって、適用性はより良好である。
【0027】
第2の態様を参照し、第2の態様の第2の可能な実装において、処理モジュールは、具体的には、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成し、かつ第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成するように構成される。
【0028】
この実装の装置は、複数の第1の位置情報に基づいて対応する第1の検出物の第2の位置情報を決定し、複数の第1のカテゴリ情報に基づいて対応する第1の検出物の第2のカテゴリ情報を決定することができる。それぞれの検出物について、それぞれの検出物に対応する第2の位置情報は、複数の第1の位置情報を統合したものであり、それぞれの検出物に対応する第2のカテゴリ情報は、複数の第1のカテゴリ情報を統合したものである。したがって、精度はより高い。
【0029】
第2の態様を参照し、第2の態様の第3の可能な実装において、処理モジュールは、具体的には、第1のクラスタに対応する第1の検出物の第2の位置情報を生成するために、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に対して平均値計算を実行するように構成される。
【0030】
この実装の装置を使用することによって得られるそれぞれの第1の検出物の第2の位置情報は、複数の第1の位置情報に対して平均値計算を実行することによって得られ、その結果、第1の検出物の位置情報はより正確である。
【0031】
第2の態様を参照し、第2の態様の第4の可能な実装において、処理モジュールは、具体的には、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、かつ第1の数量が既定の数量閾値以上である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報が、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報であると決定するように構成される。
【0032】
この実装の装置は、それぞれのクラスタに含まれる第1のラベル付け情報の数量を既定の数量閾値と比較することによって、クラスタに対応する第1のカテゴリ情報が正確であるかどうかを決定できる。第1のラベル付け情報の数量が既定の数量閾値より大きい場合は、第1のカテゴリ情報が比較的正確で信頼できると考えられる。第1のカテゴリ情報は、クラスタに対応する第1の検出物の第2のカテゴリ情報として決定され得、その結果、第1の検出物のカテゴリ情報はより正確で信頼でき、精度はより高い。
【0033】
第2の態様を参照し、第2の態様の第5の可能な実装において、処理モジュールは、具体的には、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、第1の数量が既定の数量閾値未満である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルを得、かつ第1の分類モデルと、第1のクラスタに対応する第1の検出物の第2の位置情報とに基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を決定するように構成される。
【0034】
この実装の装置は、それぞれのクラスタに含まれる第1のラベル付け情報の数量を既定の数量閾値と比較することによって、クラスタに対応する第1のカテゴリ情報が正確であるかどうかを決定できる。第1のラベル付け情報の数量が既定の数量閾値以下である場合は、クラスタに対応する第1のカテゴリ情報が不正確であると考えられる。第1のクラスタに対応する第1の検出物のカテゴリ情報は、分類モデルを使用して再決定されるので、第1の検出物のカテゴリ情報はより正確で信頼でき、精度はより高い。
【0035】
第2の態様を参照し、第2の態様の第6の可能な実装において、処理モジュールは、具体的には、第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得、かつ少なくとも1つの第1のクラスタを生成するために、矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするように構成される。
【0036】
この実装の装置は、同一カテゴリの第1のラベル付け情報をクラスタリングするときに、クラスタリングの距離尺度として矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを使用する。このように、クラスタリング処理は、比較的高い精度と比較的良好な適用性とを有する。
【0037】
第2の態様を参照して、第2の態様の第7の可能な実装において、検出モデルセットは予め設定される。
【0038】
検出モデルセットは、この実装の装置で予め設定される。検出モデルセットを得るときには、検出モデルセットを直接読み取ることができる。したがって、検出モデルセットを得るプロセスはより単純である。
【0039】
第2の態様を参照し、第2の態様の第8の可能な実装において、取得モジュールは、分類モデルセットを得るようにさらに構成される。分類モデルセットは少なくとも2つの分類モデルを含み、分類モデルセット内の少なくとも2つの分類モデルは同じ検出カテゴリに対応し、少なくとも2つの分類モデルは第1の分類モデルを含む。
【0040】
この実装の装置が使用される場合、分類モデルセットは少なくとも2つの分類モデルを含み、少なくとも2つの分類モデルは同じ検出カテゴリに対応する。換言すると、分類モデルセットは複数の分類モデルを含み、複数の分類モデルは複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。分類処理を行うために分類モデルセットが使用され、複数の分類モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな分類モデルを得ることができる。このように、分類処理の精度はより高く、より正確な分類結果を得ることができる。複数の分類モデルが同じ検出カテゴリに対応する場合は、同じ検出物について、複数の分類処理結果を得ることができ、複数の分類処理結果に基づいて後ほど決定される実際の分類結果もより正確であり、適用性はより良好である。
【0041】
第3の態様によると、本出願の一実施形態は装置を提供する。本装置は、少なくとも1つのプロセッサを含み、少なくとも1つのプロセッサが少なくとも1つのメモリ内のコンピュータプログラムまたは命令を実行すると、第1の態様による方法が実行される。
【0042】
第4の態様によると、本出願の一実施形態は装置を提供する。本装置は、少なくとも1つのプロセッサと、少なくとも1つのメモリとを含む。少なくとも1つのメモリは、コンピュータプログラムまたは命令を保管するように構成される。少なくとも1つのプロセッサは、少なくとも1つのメモリに保管されたコンピュータプログラムまたは命令を実行するように構成され、その結果、本装置は、第1の態様による対応する方法を実行することが可能になる。
【0043】
第5の態様によると、本出願の一実施形態は装置を提供する。本装置は、少なくとも1つのプロセッサと、少なくとも1つのメモリと、少なくとも1つのトランシーバとを含む。少なくとも1つのトランシーバは、信号を受信するように、または信号を送信するように構成され、少なくとも1つのメモリは、コンピュータプログラムまたは命令を保管するように構成され、少なくとも1つのプロセッサは、第1の態様による方法を実行するために、少なくとも1つのメモリからコンピュータプログラムまたは命令を呼び出すように構成される。
【0044】
第6の態様によると、本出願の一実施形態は装置を提供する。本装置は、少なくとも1つのプロセッサと、少なくとも1つのインターフェイス回路とを含む。少なくとも1つのインターフェイス回路は、コンピュータプログラムまたは命令を受信し、かつコンピュータプログラムまたは命令を少なくとも1つのプロセッサへ送信するように構成され、少なくとも1つのプロセッサは、第1の態様による対応する方法を実行するために、コンピュータプログラムまたは命令を実行する。
【0045】
第7の態様によると、本出願の一実施形態はコンピュータ記憶媒体を提供する。本コンピュータ記憶媒体は、コンピュータプログラムまたは命令を保管するように構成され、コンピュータプログラムまたは命令が実行されると、第1の態様による方法が実施される。
【0046】
第8の態様によると、本出願の一実施形態は、コンピュータプログラムまたは命令を含むコンピュータプログラム製品を提供する。コンピュータプログラムまたは命令が実行されると、第1の態様による方法が実施される。
【0047】
第9の態様によると、本出願の一実施形態は端末デバイスを提供する。端末デバイスは、輸送車両またはインテリジェントデバイスであってよく、無人航空機、無人輸送車両、自動車、またはロボットなどを含む。輸送車両またはインテリジェントデバイスは、ラベル付け情報決定装置および/または装置を含む。
【0048】
ラベル付け情報の精度が比較的低いという問題を解決するために、本出願は、ラベル付け情報決定方法および装置を提供する。本方法では、検出モデルセットが最初に得られる。検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。次に、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像がラベル付けされる。換言すると、本方法を用いてラベル付け情報が決定される場合は、ラベル付けされるべき画像が、単一の検出モデルを使用してラベル付けされるのではなく、複数の検出モデルを使用してラベル付けされる。複数の検出モデルは、複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。複数の検出モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな検出モデルを得ることができる。このように、検出精度はより高く、より正確なラベル付け情報を得ることができる。複数の検出モデルが同じ検出カテゴリに対応する場合は、同じ検出物について複数のラベル付け情報を得ることができ、複数のラベル付け情報に基づいて後ほど決定される実際のラベル付け情報もより正確である。したがって、本方法を用いることによって、より高精度なラベル付け情報を得ることができる。その後、検出物にラベルを付けるために使用される矩形のバウンディングボックスがラベル付け情報に基づいて決定されるときには、得られる矩形のバウンディングボックスと実際の位置に対応する矩形のバウンディングボックスとの間の誤差が画素レベルで大幅に低減され、基本的に無視できる。したがって、適用性は良好である。
【図面の簡単な説明】
【0049】
【
図2】本出願によるラベル付け情報決定方法の一実装の概略フローチャートである。
【
図3】本出願によるラベル付け情報決定装置の一実装の構造のブロック図である。
【
図4】本出願によるチップシステムの一実装の構造のブロック図である。
【発明を実施するための形態】
【0050】
以下、添付の図面を参照しながら本出願の技術的解決策を説明する。
【0051】
本出願の説明では、特に明記しない限り、「/」は「または」を意味する。例えば、A/Bは、AまたはBを表すことができる。本明細書における「および/または」という用語は、関連する対象を記述するために関連関係のみを記述するものであり、3つの関係が存在し得ることを表す。例えば、Aおよび/またはBは、以下の3つの場合を、すなわち、Aのみが存在する場合と、AとBの両方が存在する場合と、Bのみが存在する場合とを、表すことができる。加えて、「少なくとも1つ」は1つ以上を意味し、「複数の」は2つ以上を意味する。「第1」および「第2」などの用語は、数量や実行順序を限定するものではなく、「第1」または「第2」などの用語は、明確な違いを示すものではない。
【0052】
本出願で、「例」または「例えば」などの語が、例、例証、または説明を与えることを表すために使用されていることに注意されたい。本出願で「例」または「例えば」として説明されている実施形態または設計方式は、別の実施形態または設計方式より好ましいものとして、またはより多くの利点を有するものとして、説明されるべきではない。厳密には、「例」または「例えば」などの語の使用は、関連する概念を特定の方式で提示することを意図している。
【0053】
本出願の技術的解決策の理解を容易にするため、以下では、本出願で提供される技術的解決策の適用シナリオの一例を最初に説明する。
【0054】
自律運転の分野では、通常、車両が位置する走行環境の画像の中で様々な検出物にラベルを付ける必要がある。例えば、検出物は、自動車および/または歩行者を含み得る。
【0055】
現在一般的に運用されているラベル付け方法では、通常、車両が位置する走行環境の画像に検出モデルを使用してラベル付けしてラベル付け情報を得、次いで、ラベル付け情報に基づく矩形のバウンディングボックスを使用して画像内で検出物にラベル付けする。例えば、
図1に示されているように、
図1に示されている画像内の検出物である自動車(car)は、矩形のバウンディングボックスを使用してラベル付けされている。
【0056】
しかしながら、既存の検出モデルを使用して画像内の検出物がラベル付けされた後に、得られるラベル付け情報の精度は比較的低く、画像に表示される矩形のバウンディングボックスと検出物の実際の位置に対応する矩形のバウンディングボックスとの間には比較的大きな誤差がある。いくつかの適用シナリオでは、誤差が数十画素にもなる可能性があり、その結果、適用性が悪くなる。
【0057】
例えば、
図1に示されている画像において、矩形のバウンディングボックス1は、ラベル付け情報に基づいて決定される矩形のバウンディングボックスであり、矩形のバウンディングボックス2は、自動車の実際の位置に対応する矩形のバウンディングボックスである。
図1に示されているように、矩形のバウンディングボックス1と矩形のバウンディングボックス2との間には、比較的大きな誤差がある。
【0058】
前述の技術的問題を解決するため、本出願の実施形態は以下の技術的解決策を提供する。技術的解決策の具体的な内容については、以下の説明を参照されたい。
【0059】
本出願の技術的解決策は、端末デバイスに適用され得る。本出願の端末デバイスは、固定式または移動式であり得る。端末デバイスは、コンピュータネットワークにおけるネットワークの最も外側の周辺部にあって、データを入力し、かつ処理結果を出力または表示するように主に構成された、通信端末、車載デバイス、モバイルデバイス、ユーザ端末、無線通信デバイス、携帯端末、ユーザエージェント、サービスデバイス、またはユーザ機器(user equipment、UE)などを含むデバイスであり得、または前述のデバイスのいずれか1つにインストールされた、もしくは前述のデバイスのいずれか1つで実行する、ソフトウェアクライアントまたはアプリケーションなどであり得る。例えば、端末デバイスは、タブレットデバイス、無線通信機能を有するハンドヘルドデバイス、計算デバイス、無人航空機、無人輸送車両、または車両内通信モジュールなどであり得る。
【0060】
以下では、本出願で提供されるラベル付け情報決定方法の一実装を説明する。
【0061】
図2は、本出願によるラベル付け情報決定方法の一実装の概略フローチャートである。本方法は、以下のステップを含み得る。
【0062】
ステップS101:検出モデルセットを得る。
【0063】
検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。
【0064】
ラベル付けされるべき画像の中の検出物がラベル付けされる前に、ラベル付けされる必要がある検出物は、1つ以上の検出カテゴリに分類され得る。例えば、検出カテゴリは、歩行者(pedestrian)、自動車(car)、路面電車(tram)、およびオートバイ(motorcycle)のうちの少なくともいずれか1つを含み得る。あるいは、検出カテゴリは別のカテゴリであってもよい。これは本書で限定されない。
【0065】
可能な一実装において、検出モデルセットに含まれる検出モデルは、モデルトレーニングによって生成され得る。例えば、
任意に選べることとして、ただ1つの検出カテゴリの検出物がラベル付けされる必要がある場合は、その検出カテゴリについて、異なる検出効果を有する少なくとも2つの検出モデルがトレーニングによって生成され得る。可能な一実装において、異なる検出効果を有する少なくとも2つの検出モデルは、異なる検出アルゴリズムに従ってトレーニングすることによって得ることができる。換言すると、1つの検出モデルは1つの検出アルゴリズムに対応し、異なる検出モデルは異なる検出アルゴリズムに対応する。別の可能な一実装において、異なる検出効果を有する少なくとも2つの検出モデルは、代わりに、同じ検出アルゴリズムに従ってトレーニングすることによって得ることができる。しかしながら、異なる検出モデルがトレーニングされる場合、検出アルゴリズムに対応するトレーニングパラメータは異なる。このように、検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセットに含まれるすべての検出モデルは同じ検出カテゴリに対応する。換言すると、検出モデルセットに含まれるすべての検出モデルは、同じ検出カテゴリの検出物を検出するために使用される。
【0066】
例えば、検出アルゴリズムは、より高速な領域ベース畳み込みニューラルネットワーク(faster region-based convolutional neural network、Faster-RCNN)、グリッド領域ベース畳み込みニューラルネットワーク(grid region-based convolutional neural network、Grid-RCNN)、またはユー・オンリー・ルック・ワンス(you only look once、YOLO)ネットワークなどのうちの少なくともいずれか1つを含み得る。
【0067】
例えば、いくつかの適用シナリオでは、歩行者にラベルを付ける必要がある。この場合、歩行者検出カテゴリについて、歩行者にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、検出モデルセットは、2つの検出モデルを、すなわち、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、およびGrid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデルを、含む。
【0068】
任意に選べることとして、2つ以上の検出カテゴリの検出物にラベルを付ける必要がある場合は、それぞれの検出カテゴリについて、異なる検出効果を有する少なくとも2つの検出モデルがトレーニングによって生成され得る。検出モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。このように、検出モデルセットは、複数の検出モデルを含む。検出モデルセットに含まれる複数の検出モデルは、検出カテゴリに基づいて2つ以上の検出カテゴリに分類され得る。それぞれの検出カテゴリは、異なる検出効果を有する少なくとも2つの検出モデルに対応し、当該検出カテゴリの検出物にラベルを付けるために使用される。検出モデルが得られるときに使用される検出アルゴリズムについては、列挙された前述の検出アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別のアルゴリズムが選択されてもよい。これは本出願で限定されない。
【0069】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、検出モデルセットは、4つの検出モデルを、すなわち、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、Grid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、Faster-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデル、およびGrid-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデルを、含む。
【0070】
任意に選べることとして、2つ以上の検出カテゴリの検出物にラベルを付ける必要がある場合は、それらの検出カテゴリのうちの少なくともいずれか1つについて、異なる検出効果を有する少なくとも2つの検出モデルがトレーニングによって生成され得る。残りの検出カテゴリの各々については、1つの検出モデルがトレーニングによって生成される。検出モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。この実装において、検出モデルセットは複数の検出モデルを含み、検出モデルセットに含まれる複数の検出モデルは、検出カテゴリに基づいて分類され、1つの検出モデルに対応する検出カテゴリと、異なる検出効果を有する少なくとも2つの検出モデルに対応する検出カテゴリとを含む2つ以上の検出カテゴリに分類され得る。検出モデルが得られるときに使用される検出アルゴリズムについては、列挙された前述の検出アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別のアルゴリズムが選択されてもよい。これは本出願で限定されない。
【0071】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される検出モデルは、YOLOに基づくトレーニングによって生成され得る。この適用シナリオでは、検出モデルセットは、3つの検出モデルを、すなわち、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、Grid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、およびYOLOに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデルを、含む。
【0072】
任意に選べることとして、複数の検出カテゴリの各々について、異なる検出効果を有する少なくとも2つの検出モデルがトレーニングによって生成され得る。換言すると、複数の検出カテゴリの各々は、少なくとも2つの検出モデルに対応する。複数の検出カテゴリの数量は、実際の適用シナリオでラベル付けされる必要がある検出カテゴリの数量より多くてよい。検出モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。このように、検出モデルセットは複数の検出モデルを含み、検出モデルセットに含まれる複数の検出モデルは、検出カテゴリに基づいて分類され、複数の検出カテゴリに分類され得る。複数の検出カテゴリの数量は、実際の適用シナリオでラベル付けされる必要がある検出カテゴリの数量より多い。それぞれの検出カテゴリは、異なる検出効果を有する少なくとも2つの検出モデルに対応し、当該検出カテゴリの検出物にラベルを付けるために使用される。検出モデルが得られるときに使用される検出アルゴリズムについては、列挙された前述の検出アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別のアルゴリズムが選択されてもよい。これは本出願で限定されない。
【0073】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される検出モデルは、Faster-RCNNとGrid-RCNNとに基づく別々のトレーニングによって生成され得、路面電車にラベルを付けるために使用される検出モデルは、Faster-RCNNとYOLOとに基づく別々のトレーニングによって生成され得、オートバイにラベルを付けるために使用される検出モデルは、YOLOとGrid-RCNNとに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、検出モデルセットは、8つの検出モデルを、すなわち、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、Grid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデル、Faster-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデル、Grid-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデル、Faster-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される検出モデル、YOLOに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される検出モデル、YOLOに基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される検出モデル、およびGrid-RCNNに基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される検出モデルを、含む。
【0074】
それぞれの検出カテゴリに対応する検出モデルがトレーニングによって生成されるときに、異なる検出カテゴリが、異なる検出アルゴリズムに対応し得ること、または同じ検出アルゴリズムに対応し得ることに注意されたい。これは本出願で限定されない。
【0075】
モデルトレーニング方式では、現在の適用シナリオの要件に従って、現在の適用シナリオの要件をよりよく満たす検出モデルセットが生成され得る。検出モデルセットを使用してラベル付けされるべき画像がラベル付けされた後に、得られるラベル付け結果はより正確であり、より良好な適用性を有する。
【0076】
可能な一実装において、トレーニングによって生成される検出モデルを含む検出モデルセットはさらに、システム内で予め設定されてよい。ステップS101が実行されるときには、予め設定された検出モデルセットがシステムから直接得られる。この実装において、検出モデルセットを得るプロセスはより単純である。
【0077】
ステップS102:第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像にラベルを付ける。
【0078】
検出モデルセットが得られた後には、検出モデルセット内の各検出モデルを使用してラベル付けされるべき画像がラベル付けされ、検出モデルセットに含まれるすべての検出モデルがラベル付けされるべき画像にラベル付けした後に得られるラベル付け結果は、第1のラベル付け情報セットを形成する。
【0079】
第1のラベル付け情報セットは空であり得る。換言すると、第1のラベル付け情報セット内に要素は存在しない。これは、ラベル付けされるべき画像が、検出モデルセットに含まれる検出モデルに対応する検出カテゴリの検出物を含んでいないことを意味する。
【0080】
例えば、検出モデルセットは、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデルと、Grid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデルとを含む。検出モデルセットを使用してラベル付けされるべき画像がラベル付けされた後に、得られる第1のラベル付け情報セットが空である場合、それはラベル付けされるべき画像の中に歩行者が存在しないことを意味する。
【0081】
別の一例として、検出モデルセットは、Faster-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデルと、Grid-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される検出モデルと、Faster-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデルと、Grid-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される検出モデルとを含む。検出モデルセットを使用してラベル付けされるべき画像がラベル付けされた後に、得られる第1のラベル付け情報セットが空である場合、それはラベル付けされるべき画像の中に歩行者または自動車が存在しないことを意味する。
【0082】
第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含み得、ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含み、第1のラベル付け情報は、第1の検出物のラベル付け情報に対応する。換言すると、第1のラベル付け情報セットに含まれる第1のラベル付け情報は、ラベル付けされるべき画像の中の第1の検出物のラベル付け情報である。
【0083】
第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含む。第1の位置情報は、第1のラベル付け情報に対応する矩形のバウンディングボックスの位置情報である。矩形のバウンディングボックスは、第1の位置情報に基づいてラベル付けされるべき画像の中で決定され得る。矩形のバウンディングボックスを使用して、ラベル付けされるべき画像の中の第1のラベル付け情報に対応する第1の検出物にラベルを付けることができる。第1のカテゴリ情報は、第1のラベル付け情報に対応する第1の検出物の検出カテゴリを指示するために使用される。
【0084】
可能な一実装において、第1の位置情報は、以下の情報を、すなわち、第1の頂点の座標情報と第2の頂点の座標情報とを、含み得る。第1の頂点と第2の頂点は、第1の位置情報に対応する矩形のバウンディングボックスの同じ対角線上に位置する。可能な一実装において、第1の位置情報は、以下の情報を、すなわち、第1の位置情報に対応する矩形のバウンディングボックスの中心点の座標情報、ならびに矩形のバウンディングボックスの長さおよび幅情報を、含み得る。加えて、第1の位置情報は、代わりに、第1の位置情報に対応する矩形のバウンディングボックスを決定するために使用され得る他の情報であってもよい。これは本出願で限定されない。
【0085】
第1のラベル付け情報セットが得られた後には、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報がクラスタリングされ得る。1つの第1のクラスタは、1つの第1の検出物に対応する。第1のクラスタに対応する第1の検出物の第2のラベル付け情報は、それぞれの第1のクラスタに含まれる第1のラベル付け情報に基づいて生成され得る。第2のラベル付け情報に基づいて決定される矩形のバウンディングボックスと、第1の検出物の実際の位置に対応する矩形のバウンディングボックスとの間に誤差はなく、または誤差は画素レベル未満である。したがって、特定の適用シナリオでは、第1の検出物の実際のラベル付け情報として第2のラベル付け情報が決定され得る。第1の検出物は、第2のラベル付け情報に基づく矩形のバウンディングボックスを使用することによって、ラベル付けされるべき画像の中でラベル付けされ得る。
【0086】
第2のラベル付け情報は、第2の位置情報と第2のカテゴリ情報とを含む。第2の位置情報は、第2のラベル付け情報に対応する矩形のバウンディングボックスの位置情報である。第2のラベル付け情報に対応する矩形のバウンディングボックスは、第2の位置情報に基づいてラベル付けされるべき画像の中で決定され得る。第2のカテゴリ情報は、第2のラベル付け情報に対応する第1の検出物の検出カテゴリを指示するために使用される。第2の位置情報の具体的な内容については、第1の位置情報を参照されたい。ここでは詳細を再度説明しない。
【0087】
可能な一実装において、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングすることは、以下の方式で実施され得る。第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得、少なくとも1つの第1のクラスタを生成するために、矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングする。
【0088】
第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンは、2つの矩形のバウンディングボックスのユニオンセットの面積に対する2つの矩形のバウンディングボックスのインターセクションセットの面積の比である。第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報が矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいてクラスタリングされる場合は、複数のクラスタリング方式が、例えば、密度ベースのクラスタリング方式またはスペクトルクラスタリング方式が、使用され得る。これは本出願で限定されない。
【0089】
加えて、少なくとも1つの第1のクラスタを生成するために第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするプロセスで使用される距離尺度は、矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに限定されず、代わりに、別の距離尺度が、例えば、矩形のバウンディングボックスの中心点間の距離が、すなわち2つの矩形のバウンディングボックスの中心間の距離が、選択されてもよい。
【0090】
可能な一実装において、それぞれの第1のクラスタに含まれる第1のラベル付け情報に基づいて、第1のクラスタに対応する第1の検出物の第2のラベル付け情報を生成することは、以下の方式で実施され得る。第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成し、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成する。
【0091】
可能な一実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成することは、以下の方式で実施され得る。第1のクラスタに対応する第1の検出物の第2の位置情報を生成するために、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に対して平均値計算を実行する。
【0092】
可能な一実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成することは、代わりに、以下の方式で実施され得る。第1のクラスタに対応する第1の検出物の第2の位置情報を生成するために、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に対して加重平均値計算を実行する。
【0093】
可能な一実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成することは、以下の方式で実施され得る。第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、第1の数量が既定の数量閾値以上である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報が、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報であると決定する。
【0094】
既定の数量閾値は、適用シナリオの要件に従って設定されてよい。特定の適用シナリオがラベル付け結果の精度に関して比較的高い要求を有する場合は、既定の数量閾値は比較的大きい値に設定されてよい。例えば、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリに対応する検出モデルの数量がAである場合は、既定の数量閾値はA-1に設定されてよく、Aは正の整数である。特定の適用シナリオがラベル付け結果の精度に関して比較的低い要求を有する場合は、既定の数量閾値は比較的小さい値に設定されてよい。例えば、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリに対応する検出モデルの数量がAである場合は、既定の数量閾値はA-2またはA-3に設定されてよく、Aは正の整数である。
【0095】
可能な一実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成することは、代わりに、以下の方式で実施され得る。第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、第1の数量が既定の数量閾値未満である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルを得、第1の分類モデルと、第1のクラスタに対応する第1の検出物の第2の位置情報とに基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を決定する。既定の数量閾値については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。
【0096】
可能な一実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルが得られる前には、最初に分類モデルセットが得られる。分類モデルセットは少なくとも2つの分類モデルを含み、分類モデルセット内の少なくとも2つの分類モデルは同じ検出カテゴリに対応する。分類モデルセットに含まれる少なくとも2つの分類モデルは、第1の分類モデルを含む。
【0097】
可能な一実装において、分類モデルセットに含まれる分類モデルは、モデルトレーニングによって生成され得る。例えば、
任意に選べることとして、ただ1つの検出カテゴリの検出物がラベル付けされる必要がある場合は、その検出カテゴリについて、異なる分類効果を有する少なくとも2つの分類モデルがトレーニングによって生成され得る。可能な一実装において、異なる分類効果を有する少なくとも2つの分類モデルは、異なる分類アルゴリズムに従ってトレーニングすることによって得ることができる。換言すると、1つの分類モデルは1つの分類アルゴリズムに対応し、異なる分類モデルは異なる分類アルゴリズムに対応する。別の可能な一実装において、異なる分類効果を有する少なくとも2つの分類モデルは、代わりに、同じ分類アルゴリズムに従ってトレーニングすることによって得ることができる。しかしながら、異なる分類モデルがトレーニングされる場合、分類アルゴリズムに対応するトレーニングパラメータは異なる。このように、分類モデルセットは少なくとも2つの分類モデルを含み、分類モデルセットに含まれるすべての分類モデルは同じ検出カテゴリに対応する。換言すると、分類モデルセットに含まれるすべての分類モデルは、同じ検出カテゴリの検出物にラベルを付けるために使用される。この実装において、それぞれの第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルは、第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルであり得る。
【0098】
例えば、分類アルゴリズムは、カスケード領域ベース畳み込みニューラルネットワーク(cascade region-based convolutional neural network、Cascade-RCNN)、変形可能畳み込みニューラルネットワークv2(deformable convnets v2、DCNv2)、またはエフィシエントネットワーク(Efficientnet)などのうちの少なくともいずれか1つを含み得る。
【0099】
例えば、いくつかの適用シナリオでは、歩行者にラベルを付ける必要がある。この場合、歩行者検出カテゴリについて、歩行者にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、分類モデルセットは、2つの分類モデルを、すなわち、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、およびDCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルを、含む。この適用シナリオにおいて、それぞれの第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルとを含む。
【0100】
任意に選べることとして、2つ以上の検出カテゴリの検出物にラベルを付ける必要がある場合は、それぞれの検出カテゴリについて、異なる分類効果を有する少なくとも2つの分類モデルがトレーニングによって生成され得る。分類モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。このように、分類モデルセットは、複数の分類モデルを含む。分類モデルセットに含まれる複数の分類モデルは、検出カテゴリに基づいて分類され得、2つ以上の検出カテゴリに分類され得る。それぞれの検出カテゴリは、異なる分類効果を有する少なくとも2つの分類モデルに対応し、当該検出カテゴリの検出物にラベルを付けるために使用される。分類モデルが得られるときに使用される分類アルゴリズムについては、列挙された前述の分類アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別の分類アルゴリズムが選択されてもよい。これは本出願で限定されない。この実装において、それぞれの第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルは、第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルのみを含み得、または第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルを含むだけでなく、分類モデルセット内の別の検出カテゴリに対応する分類モデルも含み得る。これは本出願で限定されない。
【0101】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、分類モデルセットは、4つの分類モデルを、すなわち、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、およびDCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルを、含む。この適用シナリオで、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが歩行者である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルのみを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルとを含み得る。同様に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが自動車である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルとを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルのみを含み得る。
【0102】
任意に選べることとして、2つ以上の検出カテゴリの検出物にラベルを付ける必要がある場合は、それらの検出カテゴリのうちの少なくともいずれか1つについて、異なる分類効果を有する少なくとも2つの分類モデルがトレーニングによって生成され得る。残りの検出カテゴリの各々については、1つの分類モデルがトレーニングによって生成される。分類モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。この実装において、分類モデルセットは複数の分類モデルを含む。分類モデルセットに含まれる複数の分類モデルは、検出カテゴリに基づいて分類され得、2つ以上の検出カテゴリに分類され得る。1つの分類モデルに対応する検出カテゴリが存在し得、異なる分類効果を有する少なくとも2つの分類モデルに対応する検出カテゴリも存在し得る。分類モデルが得られるときに使用される分類アルゴリズムについては、列挙された前述の分類アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別の分類アルゴリズムが選択されてもよい。これは本出願で限定されない。この実装において、それぞれの第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルは、第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルのみを含み得、または第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルを含むだけでなく、分類モデルセット内の別の検出カテゴリに対応する分類モデルも含み得る。これは本出願で限定されない。
【0103】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される分類モデルは、Efficientnetに基づくトレーニングによって生成され得る。この適用シナリオでは、分類モデルセットは、3つの分類モデルを、すなわち、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、およびEfficientnetに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルを、含む。この適用シナリオで、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが歩行者である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルのみを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、Efficientnetに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルとを含み得る。同様に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが自動車である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Efficientnetに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルとを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Efficientnetに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルのみを含み得る。
【0104】
任意に選べることとして、複数の検出カテゴリの各々について、異なる分類効果を有する少なくとも2つの分類モデルがトレーニングによって生成され得る。換言すると、複数の検出カテゴリの各々は、少なくとも2つの分類モデルに対応する。複数の検出カテゴリの数量は、実際の適用シナリオでラベル付けされる必要がある検出カテゴリの数量より多くてよい。分類モデルを得る方式については、前述の実施形態を参照されたい。ここでは詳細を再度説明しない。このように、分類モデルセットは複数の分類モデルを含み、分類モデルセットに含まれる複数の分類モデルは、検出カテゴリに基づいて分類され、複数の検出カテゴリに分類され得る。複数の検出カテゴリの数量は、実際の適用シナリオでラベル付けされる必要がある検出カテゴリの数量より多い。それぞれの検出カテゴリは、異なる分類効果を有する少なくとも2つの分類モデルに対応し、当該検出カテゴリの検出物にラベルを付けるために使用される。分類モデルが得られるときに使用される分類アルゴリズムについては、列挙された前述の分類アルゴリズムを参照されたい。あるいは、実際の適用シナリオの要件に従って検出物のラベル付けに適用され得る別の分類アルゴリズムが選択されてもよい。これは本出願で限定されない。この実装において、それぞれの第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルは、第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルのみを含み得、または第1のカテゴリ情報によって指示される検出カテゴリに対応する分類モデルを含むだけでなく、分類モデルセット内の別の検出カテゴリに対応する分類モデルも含み得る。これは本出願で限定されない。
【0105】
例えば、いくつかの適用シナリオで、歩行者と自動車にラベルを付ける必要がある場合には、歩行者にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得、自動車にラベルを付けるために使用される分類モデルは、Cascade-RCNNとDCNv2とに基づく別々のトレーニングによって生成され得、路面電車にラベルを付けるために使用される分類モデルは、Cascade-RCNNとEfficientnetとに基づく別々のトレーニングによって生成され得、オートバイにラベルを付けるために使用される分類モデルは、DCNv2とEfficientnetとに基づく別々のトレーニングによって生成され得る。この適用シナリオでは、分類モデルセットは、8つの分類モデルを、すなわち、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデル、およびEfficientnetに基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデルを、含む。この適用シナリオで、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが歩行者である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデルのみを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、および/または、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、および、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、および/または、DCNv2に基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデル、および、Efficientnetに基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデルを含み得る。第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが自動車である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルのみを含み得る。あるいは、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデル、Cascade-RCNNに基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、DCNv2に基づくトレーニングによって生成されて、歩行者にラベルを付けるために使用される分類モデル、および/またはCascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、および、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデル、および/または、DCNv2に基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデル、および、Efficientnetに基づくトレーニングによって生成されて、オートバイにラベルを付けるために使用される分類モデルを含み得る。
【0106】
それぞれの検出カテゴリに対応する分類モデルがトレーニングによって生成されるときに、異なる検出カテゴリが、異なる分類アルゴリズムに対応し得ること、または同じ分類アルゴリズムに対応し得ることに注意されたい。これは本出願で限定されない。
【0107】
加えて、本出願で分類モデルをトレーニングするために使用される分類アルゴリズムは、検出モデルをトレーニングするために使用される検出アルゴリズムと同じであってよく、または異なっていてもよい。これも本出願で限定されない。
【0108】
本出願の分類モデルは、バイナリ分類モデルであってよく、またはマルチクラス分類モデルであってもよい。これも本出願で限定されない。
【0109】
可能な一実装において、トレーニングされた分類モデルを含む分類モデルセットと、検出カテゴリと第1の分類モデルとの対応関係の両方は、システム内で予め設定されてよい。第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルが得られるときには、第1のカテゴリ情報によって指示される検出カテゴリに対応する第1の分類モデルがシステムから得られる。この実装において、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルを得るプロセスは、より単純である。
【0110】
可能な一実装において、第1の分類モデルと、第1のクラスタに対応する第1の検出物の第2の位置情報とに基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を決定することは、以下の方式で実施され得る。複数の分類ラベル付け結果を得るために、第1のクラスタに対応する第1の検出物の第2の位置情報を、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられたそれぞれの第1の分類モデルに入力し、複数の分類ラベル付け結果が異なる場合に(例えば、一部の分類認識結果が是であり、一部の分類認識結果が否である)、第1の検出物の第2のカテゴリ情報を得るために、複数の分類ラベル付け結果を票決し、または、複数の分類認識結果が同じである場合に(例えば、すべてが是である、またはすべてが否である)、第1の検出物の第2のカテゴリ情報が空であると決定し、第1のクラスタに対応する第1のラベル付け情報を削除する。この場合、第2の位置情報によって指示される位置には、第1の検出物が存在しないと考えられる。
【0111】
例えば、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが自動車である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルと、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルとを含む。第1のクラスタに対応する第1の検出物の第2の位置情報が、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が自動車に属するということである。第2の位置情報が、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が自動車に属するということである。第2の位置情報が、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が路面電車に属さないということである。第2の位置情報が、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が路面電車に属するということである。4つの分類ラベル付け結果についての票決により、得られる第1の検出物の第2のカテゴリ情報は自動車である。この場合、第2の位置情報によって指示される位置には自動車が存在すると考えられる。
【0112】
別の一例として、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報によって指示される検出カテゴリが自動車である場合、第1のカテゴリ情報に関連付けられた第1の分類モデルは、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルと、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルと、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルとを含む。第1のクラスタに対応する第1の検出物の第2の位置情報が、Cascade-RCNNに基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が自動車に属するということである。第2の位置情報が、DCNv2に基づくトレーニングによって生成されて、自動車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が自動車に属するということである。第2の位置情報が、Cascade-RCNNに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が路面電車に属するということである。第2の位置情報が、Efficientnetに基づくトレーニングによって生成されて、路面電車にラベルを付けるために使用される分類モデルに入力された後に、得られる分類ラベル付け結果は、検出物が路面電車に属するということである。この場合、第1の検出物の第2のカテゴリ情報は空であり、第2の位置情報によって指示される位置には自動車が存在しないと決定される。
【0113】
複数の分類ラベル付け結果が得られた後には、第1の検出物の第2のカテゴリ情報を得るために、複数の分類ラベル付け結果が別の方式でさらに処理されてよいことに注意されたい。これは本出願で限定されない。
【0114】
本出願で提供されるラベル付け情報決定方法では、最初に検出モデルセットが得られる。検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。次に、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像がラベル付けされる。換言すると、本方法を用いてラベル付け情報が決定される場合は、ラベル付けされるべき画像が、単一の検出モデルを使用してラベル付けされるのではなく、複数の検出モデルを使用してラベル付けされる。複数の検出モデルは、複数の検出カテゴリに対応し得、または同じ検出カテゴリに対応し得る。複数の検出モデルが複数の検出カテゴリに対応する場合は、それぞれの検出カテゴリの検出物にとってよりフレンドリーな検出モデルを得ることができる。このように、検出精度はより高く、より正確なラベル付け情報を得ることができる。複数の検出モデルが同じ検出カテゴリに対応する場合は、同じ検出物について複数のラベル付け情報を得ることができ、複数のラベル付け情報に基づいて後ほど決定される実際のラベル付け情報もより正確である。したがって、本方法を用いることによって、より高精度なラベル付け情報を得ることができる。その後、検出物にラベルを付けるために使用される矩形のバウンディングボックスがラベル付け情報に基づいて決定されるときには、得られる矩形のバウンディングボックスと実際の位置に対応する矩形のバウンディングボックスとの間の誤差が画素レベルで大幅に低減され、基本的に無視できる。したがって、適用性は良好である。
【0115】
本明細書で説明されている方法の実施形態は、独立した解決策であってよく、または内部ロジックに基づいて組み合わされてもよい。これらの解決策はすべて、本出願の保護範囲内にある。
【0116】
前述の方法の実施形態で、端末デバイスによって実施される方法と作業が、代わりに、端末デバイス内で使用できるコンポーネント(例えば、チップまたは回路)によって実施され得ることは理解されよう。
【0117】
上記では主に、ネットワークエレメントの相互作用の観点から本出願の実施形態で提供される解決策を説明している。前述の機能を実施するために、端末デバイスなどのネットワークエレメントの各々が、各機能を実行するための対応するハードウェア構造および/またはソフトウェアモジュールを含むことは理解されよう。当業者は、本明細書で開示されている実施形態で説明されている例のユニットおよびアルゴリズムステップを参照して、本出願が、ハードウェアの形態で、またはハードウェアとコンピュータソフトウェアとの組み合わせで、実装され得ることに容易く気付くはずである。機能がハードウェアによって実行されるか、またはコンピュータソフトウェアによって駆動されるハードウェアによって実行されるかは、技術的解決策の具体的な用途と設計上の制約しだいで決まる。当業者は、具体的な用途ごとに様々な方法を用いて説明されている機能を実装できるが、その実装が本出願の範囲を超えると考えるべきではない。
【0118】
本出願の実施形態において、端末デバイスは、前述の方法の例に基づいて機能モジュールに分割され得る。例えば、それぞれの機能モジュールが、対応する機能に基づく分割によって得られてよく、または2つ以上の機能が1つの処理モジュールに統合されてもよい。統合モジュールは、ハードウェアの形態で実装されてよく、またはソフトウェア機能モジュールの形態で実装されてもよい。本出願の実施形態において、モジュールの分割が一例であり、論理的な機能分割にすぎないことに注意されたい。実際の実装では、別の分割方式が使用されてもよい。以下では、各機能モジュールが、対応する各機能に基づく分割によって得られる一例を説明に用いる。
【0119】
上記では、本出願の実施形態で提供される方法が、
図2を参照して詳しく説明されている。以下では、
図3および
図4を参照して本出願の実施形態で提供される装置を詳しく説明する。装置の実施形態の説明が、方法の実施形態の説明に対応していることを理解されたい。したがって、詳しく説明されていない内容については、前述の方法の実施形態を参照されたい。簡潔にするため、ここでは詳細を再度説明しない。
【0120】
図3は、本出願によるラベル付け情報決定装置の一実装の構造のブロック図である。ラベル付け情報決定装置は、端末デバイスであってよく、例えば、自律運転およびインテリジェントコックピットの分野におけるヘッドユニットまたは携帯電話機であってよい。あるいは、ラベル付け情報決定装置は、端末デバイス内のチップまたは素子であってもよい。あるいは、ラベル付け情報決定装置は、別の製品形態であってもよい。以下では、
図3を用いて論理的な機能の観点からラベル付け情報決定装置を説明する。
【0121】
図3に示されているように、装置300は、取得モジュール301と処理モジュール302とを含み得る。装置300は、
図2に示されている方法の実施形態で端末デバイスによって実行される動作を実行するように構成されてよい。
【0122】
例えば、取得モジュール301は、検出モデルセットを得るように構成されてよい。検出モデルセットは少なくとも2つの検出モデルを含み、検出モデルセット内の少なくとも2つの検出モデルは同じ検出カテゴリに対応する。処理モジュール302は、第1のラベル付け情報セットを得るために、検出モデルセットを使用してラベル付けされるべき画像にラベルを付けるように構成されてよい。
【0123】
任意に選べることとして、ラベル付けされるべき画像は、少なくとも1つの第1の検出物を含む。第1のラベル付け情報セットは、少なくとも1つの第1のラベル付け情報を含む。第1のラベル付け情報は、第1の検出物のラベル付け情報に対応する。第1のラベル付け情報は、第1の位置情報と第1のカテゴリ情報とを含む。処理モジュール302は、少なくとも1つの第1のクラスタを生成するために、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングし、第1のクラスタが、第1の検出物に対応する、かつ第1のクラスタに含まれる少なくとも1つの第1のラベル付け情報に基づいて、第1のクラスタに対応する第1の検出物の第2のラベル付け情報を生成し、第2のラベル付け情報が、第2の位置情報と第2のカテゴリ情報とを含むようにさらに構成される。
【0124】
任意に選べることとして、処理モジュール302は、具体的には、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に基づいて、第1のクラスタに対応する第1の検出物の第2の位置情報を生成し、かつ第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を生成するように構成される。
【0125】
任意に選べることとして、処理モジュール302は、具体的には、第1のクラスタに対応する第1の検出物の第2の位置情報を生成するために、第1のクラスタに含まれる第1のラベル付け情報内の第1の位置情報に対して平均値計算を実行するように構成される。
【0126】
任意に選べることとして、処理モジュール302は、具体的には、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、かつ第1の数量が既定の数量閾値以上である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報が、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報であると決定するように構成される。
【0127】
任意に選べることとして、処理モジュール302は、具体的には、第1のクラスタに含まれる第1のラベル付け情報の第1の数量を決定し、第1の数量が既定の数量閾値未満である場合に、第1のクラスタに含まれる第1のラベル付け情報内の第1のカテゴリ情報に関連付けられた第1の分類モデルを得、かつ第1の分類モデルと、第1のクラスタに対応する第1の検出物の第2の位置情報とに基づいて、第1のクラスタに対応する第1の検出物の第2のカテゴリ情報を決定するように構成される。少なくとも1つのリソースパラメータは、チャネル占有情報、変調・符号化方式情報、リソース周期性情報、およびリソース持続時間情報のうちの少なくともいずれか1つを含む。
【0128】
任意に選べることとして、処理モジュール302は、具体的には、第1のラベル付け情報セット内の同一カテゴリのいずれか2つの第1のラベル付け情報に対応する矩形のバウンディングボックスのインターセクション・オーバー・ユニオンを得、かつ少なくとも1つの第1のクラスタを生成するために、矩形のバウンディングボックスのインターセクション・オーバー・ユニオンに基づいて、第1のラベル付け情報セット内の同一カテゴリの第1のラベル付け情報をクラスタリングするように構成される。
【0129】
任意に選べることとして、検出モデルセットは予め設定される。
【0130】
任意に選べることとして、取得モジュール301は、分類モデルセットを得るようにさらに構成される。分類モデルセットは少なくとも2つの分類モデルを含み、分類モデルセット内の少なくとも2つの分類モデルは同じ検出カテゴリに対応し、少なくとも2つの分類モデルは第1の分類モデルを含む。
【0131】
任意に選べることとして、実際の適用シナリオの要件に従って置き換えを容易にするために、検出モデルと分類モデルの両方は、取得モジュール301の外部に別々に配置されてよい。取得モジュール301の機能は、置き換え中に影響を受けない。
【0132】
換言すると、装置300は、本出願の実施形態による
図2に示されている方法で端末デバイスによって実行されるステップまたは手順を実施できる。装置300は、
図2に示されている方法で端末デバイスによって実行される方法を実行するように構成されたモジュールを含み得る。加えて、装置300内のモジュールならびに前述の他の作業および/または機能は、
図2に示されている方法で対応するステップを実施するために別々に使用される。例えば、装置300内の取得モジュール301は、
図2に示されている方法でステップS101を実行するように構成されてよく、処理モジュール302は、
図2に示されている方法でステップS102を実行するように構成されてよい。
【0133】
モジュールが前述の対応するステップを実行する具体的なプロセスが、前述の方法の実施形態で詳しく説明されていることを理解されたい。簡潔にするため、ここでは詳細を再度説明しない。
【0134】
本出願の一実施形態は、少なくとも1つのプロセッサと通信インターフェイスとを含む処理装置をさらに提供する。通信インターフェイスは、少なくとも1つのプロセッサのために情報入力および/または情報出力を提供するように構成され、少なくとも1つのプロセッサは、前述の方法の実施形態の方法を実行するように構成される。
【0135】
処理装置がチップシステムであってよいことを理解されたい。例えば、
図4は、本出願によるチップシステムの一実装の構造のブロック図である。
図4に示されているチップシステムは、汎用プロセッサであってよく、または専用プロセッサであってもよい。チップシステム400は、少なくとも1つのプロセッサ401を含む。少なくとも1つのプロセッサ401は、
図2に示されている技術的解決策を実行する際に
図3に示されている装置を支援するように構成されてよい。
【0136】
任意に選べることとして、チップシステム400は、トランシーバ402をさらに含み得る。トランシーバ402は、プロセッサ401によって制御され、
図2に示されている技術的解決策を実行する際に
図3に示されている装置を支援するように構成される。任意に選べることとして、
図4に示されているチップシステム400は、記憶媒体403をさらに含み得る。具体的に述べると、トランシーバ402は、通信インターフェイスと置き換えられてよく、通信インターフェイスは、少なくとも1つのプロセッサのために情報入力および/または情報出力を提供する。
【0137】
図4に示されているチップシステム400が、以下の回路またはコンポーネント、すなわち、1つ以上のフィールドプログラマブルゲートアレイ(field programmable gate array、FPGA)、プログラマブル論理デバイス(programmable logic device、PLD)、特定用途向け集積回路(application specific integrated circuit、ASIC)、またはシステムオンチップ(system on chip、SoC)、中央処理装置(central processor unit、CPU)、ネットワークプロセッサ(network processor、NP)、デジタル信号プロセッサ(digital signal processor、DSP)、マイクロコントローラユニット(micro controller unit、MCU)、コントローラ、ステートマシン、ゲートロジック、個別のハードウェアコンポーネント、任意の他の適切な回路、または本出願で説明されている様々な機能を実行できる回路の任意の組み合わせを使用して実装され得ることに注意されたい。
【0138】
実施過程では、プロセッサ内のハードウェア集積論理回路を使用することによって、またはソフトウェアの形態の命令を使用することによって、前述の方法のステップが完遂され得る。本出願の実施形態を参照して開示されている方法のステップは、ハードウェアプロセッサによって直接実行されてよく、またはプロセッサ内のハードウェアとソフトウェアモジュールとの組み合わせを使用して実行されてもよい。ソフトウェアモジュールは、当技術の成熟した記憶媒体に、例えば、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能読み取り専用メモリ、電気的消去可能プログラム可能メモリ、またはレジスタに、配置されてよい。記憶媒体はメモリ内に配置され、プロセッサはメモリ内の情報を読み取り、プロセッサのハードウェアと共同して前述の方法のステップを完遂する。繰り返しを避けるため、ここでは詳細を再度説明しない。
【0139】
本出願の実施形態のプロセッサが、集積回路チップであってよく、信号処理能力を有することに注意されたい。実施過程では、プロセッサ内のハードウェア集積論理回路を使用することによって、またはソフトウェアの形態の命令を使用することによって、前述の方法の実施形態のステップが実施され得る。プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは別のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理デバイス、またはディスクリートハードウェアコンポーネントであってよい。これは、本出願の実施形態で開示されている方法、ステップ、および論理ブロック図を実施または実行できる。汎用プロセッサはマイクロプロセッサであってよく、またはプロセッサは任意の従来のプロセッサなどであってもよい。本出願の実施形態を参照して開示されている方法のステップは、ハードウェア復号プロセッサによって直接実行されてよく、またはハードウェアと復号プロセッサ内のソフトウェアモジュールとの組み合わせを使用して実行されてもよい。ソフトウェアモジュールは、当技術の成熟した記憶媒体に、例えば、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能読み取り専用メモリ、電気的消去可能プログラム可能メモリ、またはレジスタに、配置されてよい。記憶媒体はメモリ内に配置され、プロセッサはメモリ内の情報を読み取り、プロセッサのハードウェアと共同して前述の方法のステップを完遂する。
【0140】
本出願の実施形態のメモリが、揮発性メモリまたは不揮発性メモリであってよく、または揮発性メモリおよび不揮発性メモリを含み得ることは理解されよう。不揮発性メモリは、読み取り専用メモリ(read-only memory、ROM)、プログラム可能読み取り専用メモリ(programmable ROM、PROM)、消去可能プログラム可能読み取り専用メモリ(erasable PROM、EPROM)、電気的消去可能プログラム可能読み取り専用メモリ(electrically EPROM、EEPROM)、またはフラッシュメモリであってよい。揮発性メモリは、外部キャッシュとして使用されるランダムアクセスメモリ(random access memory、RAM)であってよい。限定的な説明ではなく例として、多くの形態のRAMが、例えば、スタティックランダムアクセスメモリ(static RAM、SRAM)、ダイナミックランダムアクセスメモリ(dynamic RAM、DRAM)、同期ダイナミックランダムアクセスメモリ(synchronous DRAM、SDRAM)、ダブルデータレート同期ダイナミックランダムアクセスメモリ(double data rate SDRAM、DDR SDRAM)、改良型同期ダイナミックランダムアクセスメモリ(enhanced SDRAM、ESDRAM)、シンクリンクダイナミックランダムアクセスメモリ(synchlink DRAM、SLDRAM)、およびダイレクトラムバスランダムアクセスメモリ(direct rambus RAM、DR RAM)が、使用されてよい。本明細書で説明されているシステムおよび方法のメモリが、これらのメモリと、別の適切なタイプの任意のメモリとを含むが、これらに限定されないことに注意されたい。
【0141】
本出願の実施形態で提供される方法によると、本出願の一実施形態は、コンピュータプログラム製品をさらに提供する。このコンピュータプログラム製品は、コンピュータプログラムまたは命令を含む。コンピュータプログラムまたは命令がコンピュータ上で実行されると、コンピュータは
図1に示されている実施形態による方法を実行することが可能になる。
【0142】
本出願の実施形態で提供される方法によると、本出願の一実施形態は、コンピュータ記憶媒体をさらに提供する。このコンピュータ記憶媒体は、コンピュータプログラムまたは命令を保管する。コンピュータプログラムまたは命令がコンピュータ上で実行されると、コンピュータは
図1に示されている実施形態による方法を実行することが可能になる。
【0143】
本出願の実施形態で提供される方法によると、本出願の一実施形態は、端末デバイスをさらに提供する。この端末デバイスは、輸送車両またはインテリジェントデバイスであり、無人航空機、無人輸送車両、自動車、またはロボットなどを含む。輸送車両またはインテリジェントデバイスは、前述のラベル付け情報決定装置を含む。
【0144】
前述の実施形態の全部または一部は、ソフトウェア、ハードウェア、ファームウェア、またはこれらの任意の組み合わせを使用することによって実装されてよい。ソフトウェアを使用して実施形態を実装する場合は、実施形態の全部または一部がコンピュータプログラム製品の形態で実装されてよい。このコンピュータプログラム製品は、1つ以上のコンピュータプログラムまたは命令を含む。コンピュータプログラムまたは命令がコンピュータに読み込まれて実行されると、本出願の実施形態による手順または機能がすべてまたは部分的に生成される。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、または別のプログラム可能な装置であってよい。コンピュータプログラムまたは命令は、コンピュータ可読記憶媒体に保管されてよく、または或る1つのコンピュータ可読記憶媒体から別のコンピュータ可読記憶媒体へ送信されてもよい。例えば、コンピュータプログラムまたは命令は、或るウェブサイト、コンピュータ、サーバ、またはデータセンタから、別のウェブサイト、コンピュータ、サーバ、またはデータセンタへ有線方式(例えば、同軸ケーブル、光ファイバ、またはデジタル加入者回線(digital subscriber line、DSL))で、または無線方式(例えば、赤外線、無線、またはマイクロ波)で、送信されてよい。コンピュータ可読記憶媒体は、コンピュータによってアクセス可能な任意の使用可能な媒体、または1つ以上の使用可能な媒体を統合したデータ記憶装置、例えばサーバまたはデータセンタであってよい。使用可能な媒体は、磁気媒体(例えば、フロッピーディスク、ハードディスクドライブ、または磁気テープ)、光学媒体(例えば、高密度デジタルビデオディスク(digital video disc、DVD))、または半導体媒体(例えば、ソリッドステートドライブ(solid state disc、SSD))などであってよい。
【0145】
前述の装置の実施形態の端末デバイスは、方法の実施形態の端末デバイスに対応している。対応するモジュールまたはユニットは、対応するステップを実行する。例えば、通信モジュール(トランシーバ)は、方法の実施形態の受信ステップまたは送信ステップを実行し、処理モジュール(プロセッサ)は、送信ステップおよび受信ステップ以外の別のステップを実行できる。具体的なモジュールの機能については、対応する方法の実施形態を参照されたい。1つ以上のプロセッサが存在し得る。
【0146】
本明細書で使用されている「コンポーネント」、「モジュール」、および「システム」などの用語は、コンピュータ関連のエンティティ、ハードウェア、ファームウェア、ハードウェアとソフトウェアとの組み合わせ、ソフトウェア、または実行されているソフトウェアを示すために使用されている。例えば、コンポーネントは、プロセッサ上で実行するプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行スレッド、プログラム、および/またはコンピュータであってよいが、これらに限定されない。図を使用して示されているように、計算デバイスと計算デバイス上で実行するアプリケーションの両方は、コンポーネントであり得る。プロセスおよび/または実行スレッドの中に1つ以上のコンポーネントが存在し得、コンポーネントは、1つのコンピュータ上に配置されてよく、および/または2つ以上のコンピュータに分散されてもよい。加えて、これらのコンポーネントは、様々なデータ構造を保管する様々なコンピュータ可読媒体から実行され得る。例えば、コンポーネントは、ローカルおよび/またはリモートプロセスを使用して、例えば、1つ以上のデータパケット(例えば、ローカルシステムで、分散システムで、および/または信号を使用して他のシステムとやり取りするインターネットなどのネットワークを介して、別のコンポーネントとやり取りする2つのコンポーネントからのデータ)を有する信号に従って通信できる。
【0147】
当業者は、本明細書で開示されている実施形態で説明されている例示的な論理ブロック(illustrative logical block)およびステップ(step)と組み合わせて、電子ハードウェアまたはコンピュータソフトウェアと電子ハードウェアとの組み合わせによって実施され得ることに気付くことができる。機能がハードウェアによって実行されるかソフトウェアによって実行されるかは、技術的解決策の具体的な用途と設計上の制約しだいで決まる。当業者は、具体的な用途ごとに様々な方法を用いて説明されている機能を実装できるが、その実装が本出願の範囲を超えると考えるべきではない。
【0148】
説明を簡便にするため、前述のシステム、装置、およびモジュールの詳しい作業プロセスについては、前述の方法の実施形態の対応するプロセスを参照するべきであり、ここでは詳細が再度説明されないことは、当業者によって明確に理解されよう。
【0149】
本出願で提供されるいくつかの実施形態において、開示されているシステム、装置、および方法が他の方式で実施され得ることを理解されたい。例えば、説明されている装置の実施形態は一例にすぎない。例えば、モジュールへの分割は論理的な機能分割にすぎず、実際の実装では他の分割であってもよい。例えば、複数のモジュールまたはコンポーネントが組み合わされ、または別のシステムに統合されてよく、またはいくつかの機能は無視されてもよく、または実行されなくてもよい。加えて、表示または論述されている相互結合または直接結合または通信接続は、いくつかのインターフェイスを使用して実装されてよい。装置またはユニット間の間接結合または通信接続は、電子的な形態、機械的な形態、または別の形態で実装されてよい。
【0150】
別々の部分として説明されているモジュールは、物理的に別々であってもなくてよく、モジュールとして表示されている部分は、物理的なユニットであってもなくてよく、1箇所に配置されてよく、または複数のネットワークユニットに分散されてもよい。実施形態の解決策の目的を達成するため、実際の要件に従ってユニットの一部または全部が選択されてよい。
【0151】
加えて、本出願の実施形態の機能モジュールは、1つの処理ユニットに統合されてよく、モジュールの各々は、物理的に単独で存在してよく、または2つ以上のモジュールが1つのユニットに統合される。
【0152】
機能がソフトウェア機能ユニットの形態で実装され、独立した製品として販売または使用される場合、機能はコンピュータ可読記憶媒体に保管されてよい。このような理解に基づくと、本出願の技術的解決策は本質的に、従来の技術に寄与する部分は、または技術的解決策のいくつかは、ソフトウェア製品の形態で実装されてよい。コンピュータソフトウェア製品は、記憶媒体に保管され、本出願の実施形態の方法のステップの全部または一部を実行することをコンピュータデバイス(パーソナルコンピュータ、サーバ、またはネットワークデバイスなどであってよい)に命令するいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、読み取り専用メモリ(read-only memory、ROM)、ランダムアクセスメモリ(random access memory、RAM)、磁気ディスク、または光ディスクといった、プログラムコードを保管できる任意の媒体を含む。
【0153】
本出願の実施形態で提供されるラベル付け情報決定装置、端末デバイス、コンピュータ記憶媒体、コンピュータプログラム製品、およびチップシステムはいずれも、上記の方法を実行するように構成される。したがって、達成され得る有利な効果については、上記の方法に対応する有利な効果を参照されたい。ここでは詳細を再度説明しない。
【0154】
本出願の実施形態において、ステップの実行順序が、ステップの機能および内部ロジックに基づいて決定されるべきであり、ステップの順序番号が実行順序を意味せず、実施形態の実施過程を制限しないことを理解されたい。
【0155】
本明細書のすべての部分は、漸進的に説明されている。実施形態の同じまたは類似の部分については、相互参照を行うことができる。それぞれの実施形態は、他の実施形態との相違点に着目している。特に、ラベル付け情報決定装置、端末デバイス、コンピュータ記憶媒体、コンピュータプログラム製品、およびチップシステムの実施形態は、基本的に方法の実施形態と同様であり、したがって簡潔に説明されている。関連する部分については、方法の実施形態の説明を参照されたい。
【0156】
本出願のいくつかの好ましい実施形態を説明してきたが、当業者は、基本的な発明概念を知ると、これらの実施形態に変更および修正を加えることができる。したがって、以下の特許請求の範囲は、好ましい実施形態ならびに本出願の範囲内に含まれるすべての変更および修正を包含すると解釈されることを意図している。
【0157】
本出願の前述の実装は、本出願の保護範囲を限定することを意図するものではない。
【符号の説明】
【0158】
300 装置
301 取得モジュール
302 処理モジュール
400 チップシステム
401 プロセッサ
402 トランシーバ
403 記憶媒体