(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
H04N 19/115 20140101AFI20240910BHJP
H04N 19/167 20140101ALI20240910BHJP
H04N 19/17 20140101ALI20240910BHJP
H04N 19/85 20140101ALI20240910BHJP
【FI】
H04N19/115
H04N19/167
H04N19/17
H04N19/85
(21)【出願番号】P 2023501712
(86)(22)【出願日】2021-02-24
(86)【国際出願番号】 JP2021006866
(87)【国際公開番号】W WO2022180683
(87)【国際公開日】2022-09-01
【審査請求日】2023-08-14
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】逸身 勇人
(72)【発明者】
【氏名】二瓶 浩一
(72)【発明者】
【氏名】岩井 孝法
(72)【発明者】
【氏名】篠原 悠介
(72)【発明者】
【氏名】バイエ フロリアン
(72)【発明者】
【氏名】ヴィタル チャルヴィ
【審査官】山▲崎▼ 雄介
(56)【参考文献】
【文献】特開2016-046707(JP,A)
【文献】特開2019-083491(JP,A)
【文献】米国特許出願公開第2019/0075302(US,A1)
【文献】特開2020-083309(JP,A)
【文献】SHIOHARA, Yusuke et al.,Video Compression Estimating Recognition Accuracy for Remote Site Object Detection,2020 International Wireless Communications and Mobile Computing (IWCMC),IEEE,2020年07月27日,pp. 285-290,<URL: https://ieeexplore.ieee.org/document/9148347>,<DOI: 10.1109/IWCMC48107.2020.9148347>
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段と、
前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段と、
前記置換後のデータを参照することによって評価値を導出する評価手段と、
を備え
、
前記評価手段は、前記置換後のデータを入力した移動体のコントローラからの出力を参照して、前記評価値を導出する
ことを特徴とする情報処理装置。
【請求項2】
前記推定手段は、自己注意モジュールを用いて前記重要度を推定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記評価値を参照して、前記推定手段を学習させる学習手段を更に備え、
前記評価値は、前記出力から導出された報酬値を含み、前記学習手段は、前記報酬値が大きくなるように前記推定手段を学習させる
ことを特徴とする請求項
1に記載の情報処理装置。
【請求項4】
前記評価値を参照して、前記推定手段を学習させる学習手段を更に備え、
前記評価値は、前記出力から導出されたロス値であり、前記学習手段は、前記ロス値が小さくなるように前記推定手段を学習させる
ことを特徴とする請求項
1に記載の情報処理装置。
【請求項5】
画像データ及び点群データの少なくとも何れかを含む入力データを取得すること、
前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定することであって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定すること、
前記置換後のデータを入力した移動体のコントローラからの出力を参照して、評価値を導出すること
を含むことを特徴とする情報処理方法。
【請求項6】
コンピュータを、
画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、
前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段、
前記置換後のデータを入力した移動体のコントローラからの出力を参照して、評価値を導出する評価手段、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
画像処理の一技術として、画像に含まれる領域毎に画像の品質を異ならせることによって、符号化データのデータ量を削減する技術が知られている。例えば、特許文献1には、撮像装置によって撮像された画像のうち、第1部分領域の解像度を維持しつつ、第1部分領域以外の解像度を低くすることが開示されている。
このような技術では、重要度の高い領域の品質を低下させずに、重要度の低い領域の品質を低下させることが試みられる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の技術では、何れの領域の品質を高く設定し、何れの領域の品質を低下させるのか、換言すれば、品質を高く保つ重要領域と、品質を低下させる非重要領域とをどのように推定すればよいのかという点において改善の余地がある。
【0005】
本発明の一態様は、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することである。
【課題を解決するための手段】
【0006】
(削除)
【0007】
本発明の一側面に係る情報処理装置は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段と、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段と、を備える。
【0008】
(削除)
【0009】
本発明の一側面に係る情報処理方法は、画像データ及び点群データの少なくとも何れかを含む入力データを取得すること、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定することであって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定すること、を含む。
【0010】
(削除)
【0011】
本発明の一側面に係るプログラムは、コンピュータを、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定する推定手段、として機能させるためのプログラムである。
【発明の効果】
【0012】
本発明の一態様によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の例示的実施形態1に係る情報処理装置の構成を示すブロック図である。
【
図2】本発明の例示的実施形態1に係る情報処理装置が実行する情報処理方法の流れを示すフローチャートである。
【
図3】本発明の例示的実施形態1に係る他の情報処理装置の構成を示すブロック図である。
【
図4】本発明の例示的実施形態1に係る他の情報処理装置が実行する情報処理方法の流れを示すフローチャートである。
【
図5】本発明の例示的実施形態2に係る情報処理装置を含む情報処理システムの構成を示すブロック図である。
【
図6A】本発明の例示的実施形態2に係る情報処理装置が取得する映像データの一例である。
【
図6B】
図6Aに示す映像データの重要度を評価した結果の一例である。
【
図6C】
図6Bに示す映像データの重要度に応じて映像データの一部の領域をノイズに置換した図である。
【
図7A】本発明の例示的実施形態2に係る情報処理装置が取得する映像データの一例である。
【
図7B】
図7Aに示す映像データの重要度を評価した結果の一例である。
【
図7C】
図7Bに示す映像データの重要度に応じて映像データの一部の領域を量子化誤差の大きな画像に置換した図である。
【
図8】本発明の例示的実施形態2に係る情報処理装置が処理する点群データの一例を示す図である。
【
図9】本発明の例示的実施形態2に係る情報処理装置が実行する、データの重要度を推定する方法を学習する学習方法の流れの一例を示すフローチャートである。
【
図10】
図9に示すシミュレーション評価ステップのフローチャートである。
【
図11】
図9に示すシミュレーション評価ステップの他の例のフローチャートである。
【
図12】例示的実施形態2に係る情報処理システムの構成を示すブロック図である。
【
図13】本発明の例示的実施形態3に係る情報処理装置が実行する、データの重要度を推定する方法を学習する学習方法の流れの一例を示すフローチャートである。
【
図14】
図13に示すロス評価ステップのフローチャートである。
【
図15】
図13に示すロス評価ステップの他の例のフローチャートである。
【
図16】本発明の例示的実施形態4に係る情報処理装置が実行する、データに含まれる領域の重要度を推定する方法を学習する学習方法の流れの一例を示すフローチャートである。
【
図17】
図16に示すシミュレーション評価ステップのフローチャートである。
【
図18】本発明の例示的実施形態5に係る画像処理システムの構成を示すブロック図である。
【
図19】本発明の例示的実施形態5に係る画像処理方法の流れを示すフロー図である。
【
図20A】本発明の例示的実施形態5に係る処理方法のステップS102bで取得された画像の一例を示す図である。
【
図20B】本発明の例示的実施形態5に係るステップS104bにおいて推定した重要度の一例を示す模式図である。
【
図20C】本発明の例示的実施形態5に係るステップS105bにおいて推定した予備的品質パラメータを示す模式図である。
【
図21A】本発明の例示的実施形態5に係る処理方法のフローS106bの処理例1を示すフローチャートである。
【
図21B】本発明の例示的実施形態5に係る処理方法のフローS106bの処理例1による品質パラメータを示す模式図である。
【
図22】ソフトウェアによって情報処理装置及び画像処理装置を実現するための構成図である。
【発明を実施するための形態】
【0014】
〔例示的実施形態1〕
本発明の第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。本例示的実施形態に係る情報処理装置1は、画像データ及び点群データの少なくとも何れかを含む入力データに含まれる領域の一部を、重要度に応じて代替データに置換する方法を学習する装置である。
【0015】
(情報処理装置1の構成)
本例示的実施形態1に係る情報処理装置1の構成について、
図1を参照して説明する。
図1は、情報処理装置1の構成を示すブロック図である。
図1に示すように、情報処理装置1は、取得部10、推定部11、置換部12、評価部13、及び学習部14を備える。なお、取得部10は、請求の範囲に記載した取得手段の一実施形態である。推定部11は、請求の範囲に記載した推定手段の一実施形態である。置換部12は、請求の範囲に記載した置換手段の一実施形態である。評価部13は、請求の範囲に記載した評価手段の一実施形態である。学習部14は、請求の範囲に記載した学習手段の一実施形態である。
【0016】
情報処理装置1は、一例として、自動運転車、ロボット、又はドローン等の移動体を視点として取得された画像データ又は点群データを処理するために用いることができる。より具体的には、情報処理装置1は、移動体に搭載された撮像装置又は測距装置等により取得された画像データ又は点群データを処理するために用いることができる。
以下、情報処理装置1が備える各構成について説明する。
【0017】
取得部10は、例えば、画像データ及び点群データの少なくとも何れかを含む入力データを取得する。取得部10が取得する入力データは、例えば、カメラ等によって撮像された画像データ、又は3次元Lidar(Light Detection And Ranging)等の測距装置により測定された点群データである。画像データは、静止画像データでもよく、動画像データでもよい。つまり、データは単独のデータでもよく、連続的に取得された複数のデータでもよい。取得部10がカメラ、又は3次元Lidar等から画像データ又は点群データを取得する方法は限定されない。一例として、取得部10は、有線通信、無線通信又はこれらの組み合わせを用いてこれらのデータを取得することができる。
【0018】
推定部11は、入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する。本実施形態において、重要度とは、当該領域に、入力データの利用目的を達成するために必要な情報がどの程度含まれているかを示す指標である。
【0019】
一例として、入力データが、自動車等の移動体の運行を遠隔で監視又は操作するための、当該移動体から撮影された映像である場合を考える。移動体とは、人が乗るものに限らず、ドローン等のように無人で物品を搬送する装置も含まれる。その場合、移動体が進行する道路の交通情報が含まれる領域、あるいは移動体の進行方向の周囲にある人又は物体等が含まれる領域等は、移動体の運行を安全に監視又は操作する、という目的を達成するために重要度が高いと考えられる。重要度の指標は、一例として、後述の評価部によって導出される評価値が挙げられる。
【0020】
推定部11は、一例として、ニューラルネットワークアルゴリズム、又は遺伝的アルゴリズム等の各種のアルゴリズムを用いてもよい。推定部11は、一例として、自己注意(Self-Attention)モジュールを含んでもよい。
【0021】
置換部12は、入力データに含まれる複数の領域のうちの少なくとも何れかを、重要度に応じて、代替データに置換することによって、置換後のデータを生成する。本実施形態において、代替データとは、入力データに比べて符号化した際のデータ量が小さいデータである。
【0022】
代替データとしては、一例として、ガウシアンノイズ等のノイズデータ、又は、置換前の画像に比べて量子化パラメータ(QP:Quantum Parameter)を大きく設定した(量子化誤差を大きくした)画像データ等が挙げられる。
【0023】
評価部13は、置換後のデータを参照することによって評価値を導出する。本実施形態において、評価値とは、置換後のデータを参照した場合、例えば、置換後のデータを利用した場合に、入力データの利用目的がどの程度達成されるかを示す指標である。
【0024】
一例として、置換後のデータをコントローラに入力し、運転シミュレーションを実行した場合に与えられる報酬値を評価値としてもよい。また、置換する前の入力データと、置換後のデータとをコントローラに入力し、それぞれの出力値の差分を評価値としてもよい。
【0025】
学習部14は、評価値を参照して、推定部11を学習させる。本実施形態において、学習するとは、推定部による重要度の推定の際に用いられる各種のパラメータを、より高い評価値が得られるように更新することである。
【0026】
一例として、代替データに置換する領域又は領域の組み合わせを変えて、コントローラに入力して与えられる報酬値が大きくなるように、推定部による推定に用いられる各種のパラメータを調整して更新してもよい。あるいは、置換する前後のデータをコントローラに入力した場合の出力の差分が小さくなるように、推定部による推定に用いられる各種のパラメータを調整して更新してもよい。
【0027】
なお、
図1に示す実施形態では、取得部10、推定部11、置換部12、評価部13、及び学習部14が1つの情報処理装置1に組み込まれているように記載しているが、これらは必ずしも1つの情報処理装置に組み込まれる必要はない。例えば、取得部10、推定部11、置換部12、評価部13、及び学習部14の全部又は一部が別々に配置されていてもよい。そして、これらが有線通信又は無線通信で接続されていてもよい。また、取得部10、推定部11、置換部12、評価部13、及び学習部14の全部又は一部がクラウド上にあってもよい。この点は、以下に示す装置構成についても同様である。
【0028】
(情報処理装置1による効果)
以上のように、本例示的実施形態に係る情報処理装置1は、入力データに含まれる領域の各々について重要度を推定し、重要度に応じて代替データに置換したデータを参照して評価値を導出し、評価値を参照して推定部を学習させる、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置1によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができるという効果が得られる。
【0029】
(情報処理方法S1の流れ)
次に、本例示的実施形態に係る情報処理方法(学習方法)S1の流れについて、
図2を参照して説明する。
図2は、情報処理装置1が実行する情報処理方法S1の流れを示すフローチャートである。
図2に示すように、情報処理方法S1は、以下のステップを含む。まず、ステップS10において、入力データを取得する。具体的には、取得部10は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する。一例として、取得部10は、カメラから静止画又は動画の画像データを入力データとして取得することができる。また、取得部10は、3次元Lidarから点群データを入力データとして取得してもよい。取得部10がカメラ、又は3次元Lidar等から画像データ又は点群データを取得する方法は限定されない。一例として、取得部10は、有線通信、無線通信又はこれらの組み合わせを用いてこれらのデータを取得することができる。
【0030】
次に、ステップS11において、重要度を推定する。具体的には、推定部11は、入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する。一例として、推定部11は、ニューラルネットワークアルゴリズム、遺伝的アルゴリズム等のアルゴリズムを用いることができる。
【0031】
次に、ステップS12において、代替データに置換する。具体的には、置換部12は、入力データに含まれる複数の領域のうちの少なくとも何れかを、重要度に応じて、代替データに置換することによって、置換後のデータを生成する。一例として置換部12は、ガウシアンノイズ等のノイズデータ、又は、置換前の画像に比べて量子化パラメータを大きく設定した画像データ等に置換することができる。
【0032】
次に、ステップS13において、評価値を導出する。具体的には、評価部13は、置換後のデータを参照することによって評価値を導出する。一例として、評価部13は、置換後のデータをコントローラに入力して得られる報酬値、又は置換する前後のデータをコントローラに入力した場合の出力値の差分を、評価値として導出することができる。
【0033】
次に、ステップS14において、推定部11を学習させる。具体的には、学習部14は、評価値を参照して、推定部11を学習させる。一例として、学習部14は、報酬値が大きくなるように、又は差分が小さくなるように、推定部を学習させることができる。
【0034】
(情報処理方法S1の効果)
以上のように、本例示的実施形態に係る情報処理方法S1は、画像データ及び点群データの少なくとも何れかを含む入力データを取得し、入力データが示すフレームに含まれる複数の領域の各々について重要度を推定し、入力データに含まれる複数の領域のうちの少なくとも何れかを、重要度に応じて、代替データに置換することによって、置換後のデータを生成し、置換後のデータを参照することによって評価値を導出し、評価値を参照して、推定部11を学習させる、という構成が採用されている。このため、本例示的実施形態に係る情報処理方法S1によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができるという効果が得られる。
【0035】
(情報処理装置2の構成)
次に、本例示的実施形態1に係る情報処理装置2の構成について、
図3を参照して説明する。
図3は、情報処理装置2の構成を示すブロック図である。
図3に示すように、情報処理装置2は、取得部20、及び推定部21を備える。なお、取得部20は、請求の範囲に記載した取得手段の一実施形態である。推定部21は、請求の範囲に記載した推定手段の一実施形態である。
【0036】
取得部20は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する。つまり、取得部20は、前述の情報処理装置1の取得部10と同じ構成でもよく、取得部20が取得する入力データは、取得部10が取得する入力データと同様でもよい。
【0037】
推定部21は、取得部20によって取得された入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する。推定部21は、入力データに含まれる複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習されている。つまり、推定部21は、前述の情報処理装置1の学習部14によって学習された推定部11を用いることができる。
【0038】
(情報処理装置2の効果)
以上のように、本例示的実施形態に係る情報処理装置2は、取得部20、及び推定部21を備える、という構成が採用されている。そして、取得部20は、画像データ及び点群データの少なくとも何れかを含む入力データを取得し、推定部21は、取得部20によって取得された入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する。このため、本例示的実施形態に係る情報処理装置2によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができるという効果が得られる。
【0039】
(情報処理方法S2の流れ)
次に、本例示的実施形態1に係る情報処理方法(推定方法)S2の流れについて、
図4を参照して説明する。
図4は、情報処理装置2が実行する情報処理方法S2の流れを示すフローチャートである。
図4に示すように、情報処理方法S2は、以下のステップを含む。
【0040】
まず、ステップS20において、入力データを取得する。具体的には、取得部20は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する。
【0041】
次に、ステップS21において、重要度を推定する。具体的には、推定部21は、入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する。なお、推定部21は、情報処理装置1によって、入力データに含まれる複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習されていてもよい。
【0042】
(情報処理方法S2の効果)
以上のように、本例示的実施形態に係る情報処理方法S2は、画像データ及び点群データの少なくとも何れかを含む入力データを取得し、入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置2によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができるという効果が得られる。
【0043】
〔例示的実施形態2〕
本発明の第2の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、その説明を適宜省略する。
【0044】
(情報処理装置3の構成)
本例示的実施形態2で説明する情報処理装置3は、自動運転車に搭載されたビデオカメラによって撮像された映像(動画像)の重要度を評価する装置である。自動運転車は、ビデオカメラで撮像された映像に基づいて、自動運転コントローラによって自動運転される、移動体の一例である。ビデオカメラで撮像された映像は、運転監視センターにも監視映像として送信され、監視者によってモニターで監視される。監視者は、モニターに表示された監視映像を見て、異常がないことを確認し、万一異常が生じた場合、又は異常が生じそうな場合に、自動運転車を自ら遠隔操作する等の処置を適宜行う。このようにすることで、移動体の運行を安全に監視又は操作することができる。
【0045】
監視映像は、インターネットを含む無線通信ネットワークを介して運転監視センターに送信される。しかし、インターネット等の無線通信ネットワークは、近年ますます需要が増大しており、通信可用帯域に十分な余裕がない。自動運転中の監視映像の送信データ容量が大きいと、通信状態の悪化等によって通信可用帯域が低下した場合に、監視映像の乱れが発生し、十分な監視ができなくなる虞がある。そのため、必要最小限のデータ容量の監視映像を送信することにより、そのような虞を減少させることが好ましい。
【0046】
情報処理装置3は、運転監視センターに送信する映像(監視映像)のデータ量を低減するために、映像中の重要な領域と重要ではない非重要領域とを学習する学習装置である。なお、本実施形態における重要な領域とは、自動運転車の安全な運行を確保するために監視する必要性が高い領域を指す。また、非重要領域とは、重要領域よりも重要度が低い領域を指す。
【0047】
(情報処理システム300)
以下、例示的実施形態2に係る情報処理システム300の構成について説明する。
図5は、情報処理装置3を含む情報処理システム300の構成を示すブロック図である。
図5に示すように、情報処理システム300は、情報処理装置3と移動体40とを含む。情報処理装置3は、制御部30、通信部36、出力部37、及びメモリ38を備える。移動体40は、撮像部(ビデオカメラ)41と送信部42とを備える。ビデオカメラ41は、移動体40に搭載された車載カメラであり、送信部42は、ビデオカメラ41が撮像した映像を情報処理装置3に、例えば無線通信により送信する。
【0048】
制御部30は、取得部31、推定部32、置換部33、評価部34、及び学習部35を備える。これらについては後述する。
【0049】
通信部36は、送信部42から送信された映像データを受信する。通信部36は、映像データを無線通信又は有線通信で受信してもよい。
【0050】
出力部37は、取得したデータ、置換されたデータ、推定部32に設定された各種パラメータ、推定部32が推定した重要度に関する情報、又は評価値等の、情報処理装置3の内部で生成されたデータの少なくとも一部を出力する。出力されたデータは、表示装置等に表示されてもよく、外部へ送信されてもよい。
【0051】
メモリ38は、制御部30によって参照される各種プログラム、各種データ等を一時的又は非一時的に記憶する。
【0052】
次に、制御部30に含まれる構成要素について説明する。制御部30の取得部31、推定部32、置換部33、評価部34、及び学習部35は、情報処理装置1の取得部10、推定部11、置換部12、評価部13、及び学習部14と同等の機能を有する。
【0053】
取得部31は、ビデオカメラ41から映像データを取得する。
図6Aの6001は、取得部31がビデオカメラ41から取得した映像の1フレームである。フレーム6001には、前方を走行する車71、道路72、センターライン73、歩道74,75、歩道75の隣にある畑76、背景77、空78等が映っている。
【0054】
推定部32は、1フレームの画像6001中の領域の重要度(監視する必要性)を推定する。
図6Bに示す6002は、推定部32が重要度を推定したヒートマップである。実際のヒートマップは、色によって重要度が示されるが、ヒートマップ6002では、便宜上重要度を濃淡の度合いで示しており、濃い領域ほど重要度が高い。ヒートマップ6002の領域81には、車71、センターライン73を含む道路72、歩道75、歩道の隣の畑76等が含まれており、重要度が高い領域であることがわかる。また、領域82には、走行車線側の歩道74、背景77の一部等が含まれており、重要度が高い領域であることがわかる。逆に、領域83は車が走行していない道路と空であり、領域81,82に比べて、相対的に重要度が低い領域であることがわかる。
【0055】
推定部32は、一例として、自己注意(self attention)モジュールを用いて重要度を推定する。自己注意モジュールは、それ自身の途中の計算結果に注意し、それから読み込むデータを決定するアルゴリズムを有する公知のモジュールである。自己注意モジュールで生成される関数には、重み付けのためのパラメータが含まれている。なお、推定部32を学習させる方法については後述する。
【0056】
置換部33は、画像6001中の重要度が低い領域のデータを、代替データに置換する。具体的には、置換部33は、重要度が小さい順に選択した領域であって、フレームにおいて所定の割合を有する1又は複数の領域を代替データに置換する。代替データは、元のデータに比べて、データ量(データサイズ)を小さくしたデータである。
図6Cに示す置換後の画像6003は、重要度が低いヒートマップ6002の領域83を、ノイズデータに置換した領域92を含んでいる。ノイズデータは、元の画像データに比べてデータサイズが小さい。領域91は、重要性が高い領域であるため、ノイズデータには置換されていない領域である。
【0057】
置換部33は、重要度が低い領域のデータを、ノイズ以外のデータ、例えば量子化誤差の大きい画像データに置換してもよい。つまり、置換部33が用いる代替データは、ノイズ、及び量子化誤差の大きい画像データの少なくとも何れかを含むデータである。
図7Aから
図7Cは、画像の重要度が低い領域のデータを、量子化パラメータを大きく設定することにより、量子化誤差の大きい画像データに置換する方法を示す図である。
図7Aの画像7001と
図7Bのヒートマップ7002は、
図6Aの画像6001と
図6Bのヒートマップ6002と同じである。
図7Cに示す画像7003は、重要度が低い領域83を、量子化誤差の大きい画像データに置換した画像である。量子化パラメータを大きく設定することにより、データサイズを小さくすることができる。
【0058】
評価部34は、置換後の画像6003又は画像7003を用いた場合の評価値を導出する。具体的には、評価部34は、例えば置換後の画像を入力した移動体のコントローラからの出力を参照して、評価値を導出する。置換後の画像6003又は画像7003は、一部がノイズ又は量子化誤差の大きな画像となっている。このような置換後の画像において、自動運転車の安全な走行に影響を与えない場合は、その置換後の画像に対しては高い評価値が与えられる。評価部34の具体例については後述する。
【0059】
学習部35は、評価部34によって導出された評価値を参照して、推定部32を学習させる。学習部35の具体例については後述する。
【0060】
また、取得部31が取得するデータは動画像データではなく、静止画像データでもよい。また、画像データではなく、例えば、3次元Lidar等により取得された点群データでもよい。点群データとは、3次元Lidarは、赤外線、レーザ等を照射し、物体の各点からの反射波を受信して、各点までの方向と距離を導出する測距装置である。点群データとは、このような測距装置によって取得された物体の各点の方向と距離を示すデータの集合データである。
【0061】
図8に、情報処理装置3が処理可能な、点群データによる画像の一例を示す。
図8は、3次元Lidarによって取得された点群データを画像化した図である。点群データに対しても、画像と同様に領域ごとの重要度を推定することが可能である。点群データの場合、置換部33は、重要度が低い領域の点データにノイズを加える。
【0062】
以上説明した情報処理装置3においては、取得部31が取得する画像データは、ビデオカメラ41から取得した動画像データとした。しかし、取得部31が取得する画像データはこれに限らず、例えば、シミュレーションコンピュータで作成した、車載カメラからの映像を模擬した仮想的なシミュレーション画像であってもよい。
【0063】
(情報処理装置3の効果)
以上のように、本例示的実施形態2に係る情報処理装置3においては、制御部30、通信部36、出力部37、及びメモリ38を備える構成が採用されている。このため、本例示的実施形態に係る情報処理装置3によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、入力されたデータ、置換されたデータ、設定された各種パラメータ、又は評価値等の情報処理装置3の内部で生成されたデータの少なくとも一部を出力し、確認することができるという効果が得られる。
【0064】
(学習方法の具体例)
次に、自己注意モジュールを含む推定部32を学習させる方法S3について、図面を参照して説明する。
図9は、推定部32を学習させる学習方法(情報処理方法)S3の流れの一例を示すフローチャートである。学習方法S3は、自動運転シミュレーションに用いる模擬映像を用いて学習する方法である。
【0065】
まず、制御部30は、ステップS30において、自己注意モジュールのデータを初期化する。
【0066】
次に、ステップS31において、制御部30は、自己注意モジュールのパラメータを取得する。最初のシミュレーション時に取得するパラメータは、ユーザが任意に設定して入力したパラメータである。
【0067】
次に、ステップS32において、評価部34は、シミュレーションを実行して、その評価を行う。本実施形態においては、実行されるシミュレーションは自動運転のシミュレーションであり、制御部30は、その結果から報酬値を導出する。シミュレーション評価の詳細な流れについては、図面を代えて後述する。
【0068】
次に、ステップS33において、評価部34は、平均報酬を計算する。平均報酬とは、後述するシミュレーション評価で所定の回数だけ繰り返し導出される、評価値としての報酬値の平均値である。具体的には、シミュレーション評価においては、後述のように、一連のシミュレーションステップが所定の回数だけ繰り返し行われる。その際に、1回ごとのシミュレーションステップで導出された報酬値が累積されていく。そして、最終的な報酬値の累積値を所定の回数で除した値が報酬値の平均値である。
【0069】
次に、ステップS34において、制御部30は、自己注意モジュールのパラメータを更新する。具体的には、学習部35は、ステップS33で導出された報酬値の大きさに基づいて、より報酬値が大きくなるようにパラメータを更新する。具体的には、学習部35は、報酬値の平均値の大きさに基づいて、より報酬値の平均値が大きくなるようにパラメータを更新する。
【0070】
次に、ステップS35において、制御部30は、所定の試行回数のシミュレーション評価を実行したか否かを判定する。ステップS35において、所定の試行回数のシミュレーション評価が実行されたと判定された場合(ステップS35:YES)は、学習フローを終了する。一方、所定の試行回数のシミュレーション評価が実行されていないと判定された場合(ステップS35:NO)は、ステップS31に戻る。ステップS31において、制御部30は、ステップS34で更新されたパラメータを取得する。
【0071】
次に、ステップS32のシミュレーション評価ステップの詳細な流れについて、図面を参照して説明する。
図10は、シミュレーション評価方法S4のフローチャートである。本実施形態においては、シミュレーション評価は自動運転シミュレータを用いて行う。自動運転シミュレータは、車載カメラで取得された映像を模擬した映像に基づいて、自動運転コントローラが実行する自動運転をコンピュータ上で模擬する装置である。自動運転シミュレータは、例えばオープンソースのCARLAを用いることができる。
【0072】
まず、ステップS40において、制御部30は、自動運転シミュレータのデータを初期化する。
【0073】
次に、ステップS41において、制御部30は、自動運転シミュレータから入力データを取得する。具体的には、取得部31が自動運転シミュレータから模擬映像データを入力データとして取得し、推定部32に送信する。
【0074】
次に、ステップS42において、制御部30は、取得した入力データの重要度を推定する。具体的には、推定部32は、映像データのフレームデータを複数の領域に分割し、自己注意モジュールを用いて領域ごとの重要度を推定する。
【0075】
次に、ステップS43において、制御部30は、重要度の小さい順に、所定割合の領域を代替データに置換する。具体的には、例えば所定割合が40%に設定されているとする。この場合、置換部33は、重要度が小さい領域から順に選択していき、選択した領域の合計のデータサイズ(又は領域の画像面積)が全体の40%以上になったところで選択を停止する。そして、置換部33は、選択された領域をすべて代替データに置換する。
【0076】
次に、ステップS44において、制御部30は、置換した画像を自動運転コントローラに入力して、自動運転コントローラが出力する制御コマンドを取得する。
【0077】
次に、ステップS45において、評価部34は、制御コマンドを自動運転シミュレータに入力して報酬を取得し、報酬の累積値に加算する。報酬の累積とは、例えばn(nは2以上の整数)回目のシミュレーションステップの報酬値を、1からn-1回目までのシミュレーションステップの報酬値の総和に加えることをいう。即ち、n回目までの報酬値の累積値は、n回目の報酬値を、1からn-1回目までの報酬値の総和に加えることによって算出される。
【0078】
制御コマンドを入力した自動運転シミュレータの運転結果が、安全な運行であった場合は、高い報酬値が与えられる。逆に、自動運転シミュレータの運転結果が、安全が危惧される運行であった場合は、低い報酬値が与えられる。安全な運行であったかどうかは、事故の有無を中心に考慮されてもよい。
【0079】
次に、ステップS46において、制御部30は、シミュレーションステップがすべて終了したか否かを判定する。つまり、自動運転シミュレータが保有する模擬映像をすべて置換処理してコントローラに入力したか否かを判定する。ステップS46において、すべて終了した、又は事故が発生したと判定された場合(ステップS46:YES)は、ステップS47に移行する。ステップS46において、すべて終了していないと判定された場合(ステップS46:NO)は、ステップS41に戻る。
【0080】
ステップS47において、制御部30は、所定のシミュレーション回数を終了したか否かを判定する。所定の回数とは、例えば、平均報酬を計算するために十分な回数である。ステップS47において、所定のシミュレーション回数を終了した(ステップS47:YES)と判定された場合は、シミュレーション評価ステップを終了し、
図9のステップS33に移行する。ステップS47において、所定のシミュレーション回数を終了していない(ステップS47:NO)と判定された場合は、ステップS40に戻る。
【0081】
(学習方法の変形例1)
図10に示すシミュレーション評価フローに代えて、次のようなシミュレーション評価フローを用いてもよい。即ち、
図10を用いて説明したシミュレーション評価方法S4では、代替データに置換する割合を所定の値に固定していた。しかし、置換割合を一定値に固定すると、学習された重要度推定方法が極端化する場合がある。具体的には、重要度推定結果が2極化してしまう場合がある。その場合は、置換割合を複数設定してシミュレーション評価し、それらの結果を平均化することが好ましい。以下にその方法を説明する。
【0082】
図11は、シミュレーション評価ステップの変形例であるシミュレーション評価方法S5の詳細なフローチャートである。このシミュレーション評価では、置換割合を予め複数設定しておく。例えば、置換割合を、10%、30%、40%の3通り設定しておき、各置換割合でシミュレーションする回数を定めておく。例えば、置換割合10%を2回、30%を2回、40%を2回等である。置換部33は、互いに異なる複数の所定の割合の各々について、置換後のデータを生成する。そして、評価部34は、置換部33が生成した置換後の各データについて予備的評価値を導出し、予備的評価値の平均をとることによって評価値を導出する。予備的評価値は、1つの置換割合で評価した評価値である。そして、すべての置換割合で導出された予備的評価値の平均をとって最終的な評価値とする。なお、「予備的評価値」との表現は、最終的に導出する「評価値」との区別を明確化するために導入したものであり、「予備的」との文言は、本例示的実施形態を限定するものではない。
【0083】
以上の前提で、ステップS50からステップS57までは、
図10のフローチャートのステップS40からステップS47までと同じである。異なる点は、ステップS57で諾(YES)と判定された場合に、ステップS58に移行する点である。ステップS58において、推定部32は、所定割合ごとのシミュレーションがすべて終了したか否かを判定する。ステップS58において、すべて終了した(ステップS58:YES)と判定された場合は、シミュレーション評価ステップを終了して、
図9のステップS33に移行する。ステップS58において、すべて終了はしていない(ステップS58:NO)と判定された場合は、ステップS50に戻る。そして、終了していない所定の割合を設定してシミュレーションステップを繰り返す。以上の学習方法S3、S4、S5により、推定部32は、データの領域の重要度を推定する方法を学習することができる。
【0084】
(情報処理システム400)
次に、例示的実施形態2に係る情報処理システム400の構成について説明する。
図12は、情報処理装置4を含む情報処理システム400の構成を示すブロック図である。
図12に示すように、情報処理システム400は、情報処理装置4と移動体60とを含む。情報処理装置4は、入力データが示すフレームに含まれる領域の各々について重要度を推定する装置である。
【0085】
情報処理装置4は、制御部50、通信部53、出力部54、及びメモリ55を備える。移動体60は、撮像部(ビデオカメラ)61と送信部62とを備える。通信部53、メモリ55、ビデオカメラ61、及び送信部62は、情報処理システム300で説明した、通信部36、メモリ38、ビデオカメラ41、及び送信部42と同様の機能を有するので、説明は省略する。
【0086】
制御部50は、取得部51と推定部52とを備える。取得部51は、通信部53を介して、対象となる画像を取得する。推定部52は、取得部51が取得した画像の領域の重要度を推定する。推定部52は、前述の情報処理システム300によって学習された推定部32を用いることができる。
【0087】
情報処理装置4は、推定部52によって推定された重要度を示す重要度情報を、出力部54から出力する。重要度情報は、取得した画像データ、推定部52に設定された各種パラメータ、推定部52が推定した重要度に関する情報等の、情報処理装置4の内部で生成されたデータの少なくとも一部である。出力部54からの出力は、対象画像に含まれる複数の領域の各々に重要度が示された画像の形式であってもよいし、複数の領域を互いに区別するための領域特定情報と当該領域の重要度の組のセットであってもよい。出力されたデータは、表示装置等に表示されてもよく、外部へ送信されてもよい。
【0088】
情報処理装置4が事項する情報処理方法(推定方法)は、実施形態1で説明した情報処理方法(推定方法)S2と同様であるので、ここでの説明は省略する。
【0089】
以上の例示的実施形態2に係る情報処理システム300及び情報処理方法S3、S4、S5により、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。また、例示的実施形態2に係る情報処理システム400により、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。具体的には、移動体に搭載されたビデオカメラから撮像された映像に含まれる領域ごとの重要度を推定することができる。
【0090】
〔例示的実施形態3〕
次に、本発明の例示的実施形態3について、図面を参照して詳細に説明する。例示的実施形態3に係る情報処理装置4は、例示的実施形態2にて説明した情報処理装置3と同じ構成であるため、情報処理装置4の構成についての説明は省略する。以下の説明では、情報処理装置4の構成要素は情報処理装置3の構成要素と同じ符号を用いて説明する。
【0091】
本実施形態に係る情報処理装置4においては、評価部34は、入力データを更に参照することによって評価値を導出する。評価部34は、入力データを所定のコントローラに入力した場合の当該コントローラの出力と、置換後のデータを所定のコントローラに入力した場合の当該コントローラの出力とを参照することによって、評価値を導出する。具体的には、評価部34は、入力データを所定のコントローラに入力した場合の当該コントローラの出力と、置換後のデータを所定のコントローラに入力した場合の当該コントローラの出力との差分として評価値を導出する。そして、学習部35は、当該評価値が小さくなるように、推定部32を学習させる。
【0092】
(学習方法の具体例)
情報処理装置4の推定部32が学習する学習方法の具体例について、図面を参照して説明する。
図13は、例示的実施形態3に係る情報処理装置4が実行する、データに含まれる領域の重要度を推定する方法を学習する学習する学習方法(情報処理方法)S6の流れの一例を示すフローチャートである。
【0093】
まず、制御部30は、ステップS60において、自己注意モジュールのデータを初期化する。
【0094】
次に、ステップS61において、制御部30は、自己注意モジュールのパラメータを取得する。最初のシミュレーション時に取得するパラメータは、ユーザが任意に設定して入力したパラメータである。
【0095】
次に、ステップS62において、制御部30は、シミュレーションを実行して、学習データに対するロス評価を行う。実行されるシミュレーションは、自動運転のシミュレーションであり、評価部34は、その結果からロス値を導出する。つまり、評価値は、コントローラの出力から導出されたロス値である。ロス評価の詳細な流れについては、図面を代えて後述する。
【0096】
次に、ステップS63において、制御部30は、自己注意モジュールのパラメータを更新する。具体的には、学習部35は、累積したロス値が小さくなるように、自己注意モジュールのパラメータを更新する。つまり、学習部35は、ロス値が小さくなるように推定部32を学習させる。
【0097】
次に、ステップS64において、制御部30は、所定の試行回数のシミュレーション評価を実行したか否かを判定する。ステップS64において、所定の試行回数のシミュレーション評価が実行されたと判定された場合(ステップS64:YES)は、学習フローを終了する。一方、所定の試行回数のシミュレーション評価が実行されていないと判定された場合(ステップS64:NO)は、ステップS61に戻る。ステップS61において、推定部32は、ステップS63で更新されたパラメータを取得する。
【0098】
次に、ステップS62のロス評価ステップの詳細な流れについて、図面を参照して説明する。
図14は、ロス評価方法S7のフローチャートである。ロス評価は、自動運転シミュレータを用いて行う。
【0099】
まず、ステップS70において、制御部30は、自動運転シミュレータのデータを初期化する。
【0100】
次に、ステップS71において、制御部30は、学習データから入力データを取得する。具体的には、推定部32は、取得部31を介して、例えば、学習データとしての車載カメラの模擬映像から選択されたフレームデータを入力データとして取得する。
【0101】
次に、ステップS72において、制御部30は、取得した入力データの重要度を推定する。具体的には、推定部は、フレームデータを複数の領域に分割し、自己注意モジュールを用いて領域ごとの重要度を推定する。
【0102】
次に、ステップS73において、制御部30は、重要度の小さい順に、所定割合の領域を代替データに置換する。具体的には、例えば所定割合が40%に設定されているとする。この場合、置換部33は、重要度が小さい領域から順に選択していき、選択した領域の合計のデータサイズ(又は領域の画像面積)が全体の40%以上になったところで選択を停止する。そして、選択された領域をすべて代替データに置換する。
【0103】
次に、ステップS74において、評価部34は、置換した画像を自動運転コントローラに入力して、自動運転コントローラが出力する制御コマンドAを取得する。
【0104】
次に、ステップS75において、評価部34は、元の画像(置換する前の画像)を自動運転コントローラに入力して、自動運転コントローラが出力する制御コマンドBを取得する。
【0105】
次に、ステップS76において、評価部34は、制御コマンドAと制御コマンドBとから、ロス値を計算し、ロス値の累積値に加算する。ロス値の累積とは、例えばn(nは2以上の整数)個目の入力データを用いた場合のロス値を、1からn-1個目までの入力データを用いた場合のロス値の総和に加えることをいう。即ち、n回目までのロス値の累積値は、n回目のロス値を、1からn-1回目までのロス値の総和に加えることによって算出される。
【0106】
次に、ステップS77において、制御部30は、学習データがすべて終了したか否かを判定する。つまり、模擬映像から選択されたフレームデータをすべて置換処理してコントローラに入力したか否かを判定する。ステップS77において、学習データがすべて終了したと判定された場合(ステップS77:YES)は、フローはロス評価を終了して、
図13のステップS63に移行する。ステップS77において、学習データがすべて終了していないと判定された場合(ステップS77:NO)は、フローはステップS71に戻る。
【0107】
(ステップS74からステップS76までの具体例)
本実施形態を限定するものではないが、ステップS74からステップS76までの具体例について説明する。自動運転コントローラに画像を入力した場合に出力される制御コマンドとしては、例えば、スロットルの開度コマンド(加速コマンド)、ブレーキ強度コマンド(減速コマンド)、ステアリングコマンド(方向転換コマンド)の3種類がある。この場合、置換前の画像を入力した場合の制御コマンドとして、加速コマンドが0.0、減速コマンドが1.0、方向転換コマンドが0.0だったとする。そして、置換後の画像を入力した場合の制御コマンドとして、加速コマンドが0.5、減速コマンドが0.0、方向転換コマンドが-0.1だったとする。この場合、評価部34は、ロス値として、例えば平均自乗和を用いることができる。つまり、
ロス値=((0.5-0.0)2+(0.0-1.0)2+(-0.1-0.0)2)/3
=0.42
と評価することができる(上記の式において記号「/」は割り算を表す)。
【0108】
(学習方法の変形例2)
図14に示すロス評価フローに代えて、次のようなロス評価フローを用いてもよい。即ち、
図14を用いて説明したロス評価方法S7は、代替データに置換する割合を所定の値に固定していた。しかし、例示的実施形態2の学習方法の変形例1で説明した理由により、置換割合を複数設定してロス評価し、それらの結果を平均化することが好ましい。以下にその方法を説明する。
【0109】
図15は、シミュレーション評価ステップの変形例であるロス評価方法S8の詳細なフローチャートである。このロス評価では、置換割合を予め複数設定する。例えば、置換割合を、10%、30%、40%の3通り設定しておく。そして、各置換割合でシミュレーションする回数を定めておく。例えば、置換割合10%を2回、30%を2回、40%を2回等である。置換部33は、互いに異なる複数の所定の割合の各々について、置換後のデータを生成する。そして、評価部34は、置換部33が生成した置換後の各データについて予備的ロス値を導出し、予備的ロス値の平均をとることによって評価値を導出する。予備的ロス値は、1つの置換割合で評価したロス値である。そして、すべての置換割合で導出された予備的ロス値の平均をとって最終的な評価値とする。
【0110】
以上の前提で、ステップS80からステップS87までは、
図14のフローチャートのステップS70からステップS77までと同じである。異なる点は、ステップS87で諾(YES)と判定された場合に、フローはステップS88に移行する点である。ステップS88において、制御部30は、所定割合ごとのシミュレーションがすべて終了したか否かを判定する。ステップS88において、すべて終了した(ステップS88:YES)と判定された場合は、ロス評価ステップを終了して、フローは
図13のステップS63に移行する。ステップS88において、すべて終了していない(ステップS88:NO)と判定された場合は、フローはステップS80に戻る。そして、終了していない所定の割合を設定してシミュレーションステップを繰り返す。以上の学習方法S6、S7、S8により、推定部32は、データに含まれる領域の重要度を推定する方法を学習することができる。
【0111】
以上の例示的実施形態3に係る情報処理装置4及び情報処理方法S6、S7、S8により、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0112】
〔例示的実施形態4〕
次に、本発明の例示的実施形態4について、図面を参照して詳細に説明する。例示的実施形態4に係る情報処理装置5は、例示的実施形態2にて説明した情報処理装置3と同じ構成であるため、情報処理装置5の構成についての説明は省略する。以下の説明では、情報処理装置5の構成要素は情報処理装置3の構成要素と同じ符号を用いて説明する。
【0113】
本実施形態に係る情報処理装置5においては、評価部34は、置換後のデータのデータサイズを更に参照して評価値を導出する。そして、学習部35は、置換後のデータのデータサイズが小さくなるように、推定部32を学習させる。報酬又はロス値等によって学習させた推定部32が推定した、重要度が低い領域をノイズ等に置換した場合でも、必ずしもデータサイズが減少しない場合がある。例えば、変化が少ない空などは、ノイズ化してもデータサイズの減少に貢献しない場合がある。重要度が低い領域をノイズ化するのは、データサイズを削減するためであったので、これでは目的を達成することができない。そこで、置換後のデータサイズを考慮して推定部32に推定方法を学習させることが好ましい場合がある。
【0114】
(学習方法の具体例)
情報処理装置5の推定部32が学習する学習方法の具体例について、図面を参照して説明する。
図16は、例示的実施形態4に係る情報処理装置5が実行する、データの重要度推定方法を学習させる学習方法(情報処理方法)S9の流れの一例を示すフローチャートである。
【0115】
まず、制御部30は、ステップS90において、自己注意モジュールのデータを初期化する。
【0116】
次に、ステップS91において、制御部30は、自己注意モジュールのパラメータを取得する。最初のシミュレーション時に取得するパラメータは、ユーザが任意に設定して入力したパラメータである。
【0117】
次に、ステップS92において、制御部30は、シミュレーションを実行して、その評価を行う。本実施形態においては、実行されるシミュレーションは自動運転のシミュレーションであり、制御部30は、その結果から報酬値とデータサイズを導出する。シミュレーション評価の詳細な流れについては、図面を代えて後述する。
【0118】
次に、ステップS93において、評価部34は、平均報酬と平均データサイズを計算する。平均報酬は例示的実施形態2で説明したとおりである。データサイズとは、置換後のデータサイズである。平均データサイズは、複数回のシミュレーション評価で得られたデータサイズを平均化したものである。この場合、平均報酬をRa、平均データサイズをVa、所定係数をα(α>0)とすると、評価値は、
Ra-αVa
で表される。つまり、平均データサイズが小さいほど、評価値は大きくなる。ここで、所定係数の具体的な値は、本例示的実施形態を限定するものではないが、一例として、平均報酬の取り得る範囲、平均データサイズの取り得る範囲、及び、望ましい符号化データサイズ等に応じて適宜設定しておくことができる。
【0119】
次に、ステップS94において、制御部30は、自己注意モジュールのパラメータを更新する。具体的には、学習部35は、平均報酬と平均データサイズからステップS93で導出された評価値の大きさに基づいて、より評価値が大きくなるようにパラメータを更新する。
【0120】
次に、ステップS95において、制御部30は、所定の試行回数のシミュレーション評価を実行したか否かを判定する。ステップS95において、所定の試行回数のシミュレーション評価が実行されたと判定された場合(ステップS95:YES)は、学習フローを終了する。一方、所定の試行回数のシミュレーション評価が実行されていないと判定された場合(ステップS95:NO)は、ステップS91に戻る。ステップS91において、制御部30は、ステップS94で更新されたパラメータを取得する。
【0121】
次に、ステップS92のシミュレーション評価ステップの詳細な流れについて、図面を参照して説明する。
図17は、シミュレーション評価方法S10のフローチャートである。本実施形態においては、シミュレーション評価は自動運転シミュレータを用いて行う。
【0122】
まず、ステップS101において、制御部30は、自動運転シミュレータのデータを初期化する。
【0123】
次に、ステップS102において、制御部30は、自動運転シミュレータから入力データを取得する。具体的には、取得部31が自動運転シミュレータから模擬映像データを入力データとして取得し、推定部32に送信する。
【0124】
次に、ステップS103において、制御部30は、取得した入力データの領域の重要度を推定する。具体的には、推定部32は、映像データのフレームデータを複数の領域に分割し、自己注意モジュールを用いて領域ごとの重要度を推定する。
【0125】
次に、ステップS104において、制御部30は、重要度の小さい順に、所定割合の領域を代替データに置換する。そして、選択された領域をすべて代替データに置換する。そして、置換後の画像データを符号化する。
【0126】
次に、ステップS105において、制御部30は、符号化したデータを復号化する。つまり、置換後の画像データに戻す。
【0127】
次に、ステップS106において、制御部30は、復号化した画像データを自動運転コントローラに入力し、制御コマンドを取得する。
【0128】
次に、ステップS107において、制御部30は、制御コマンドを自動運転シミュレータに入力して報酬を取得し、報酬の累積値に加算する。報酬の累積については、例示的実施形態1で説明したとおりである。
【0129】
次に、ステップS108において、制御部30は、シミュレーションステップがすべて終了したか否かを判定する。つまり、自動運転シミュレータが保有する模擬映像をすべて置換処理してコントローラに入力したか否かを判定する。ステップS108において、すべて終了した、又は事故が発生したと判定された場合(ステップS108:YES)は、ステップS109に移行する。ステップS108において、すべて終了していないと判定された場合(ステップS108:NO)は、ステップS103に戻る。
【0130】
ステップS109において、制御部30は、符号化後のデータサイズを取得する。具体的には、評価部34は、ステップS104で符号化した、置換後の画像データの符号化後のデータサイズを取得する。
【0131】
ステップS110において、制御部30は、所定のシミュレーション回数を終了したか否かを判定する。所定の回数とは、例えば、平均報酬と符号化後の平均データサイズを計算するために十分な回数である。ステップS110において、所定のシミュレーション回数を終了した(ステップS110:YES)と判定された場合は、シミュレーション評価ステップを終了し、
図16のステップS93に移行する。ステップS110において、所定のシミュレーション回数を終了していない(ステップS110:NO)と判定された場合は、ステップS102に戻る。
【0132】
以上の例示的実施形態4に係る情報処理装置5及び情報処理方法S9、S10により、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0133】
〔例示的実施形態5〕
次に、本発明の例示的実施形態5について、図面を参照して詳細に説明する。本例示的実施形態は、画像表示システムの例示的実施形態の一形態である。本例示的実施形態に係る画像表示システム10bは、取得した画像に含まれる複数の領域の各々について重要度と品質パラメータを推定した後、これらの推定された重要度と品質パラメータを参照して、品質パラメータを決定する。決定した品質パラメータを用いて符号化された符号化データを伝送し、表示部で表示するシステムである。
【0134】
(画像表示システムの構成)
例示的実施形態5に係る画像表示システム10bの構成について、
図18を参照して説明する。
図18は、画像表示システム10bの構成を示すブロック図である。
図18に示すように、画像表示システム10bは、画像処理装置100b、表示装置200bおよび移動体300bとを備える。
【0135】
一例として、画像表示システム10bは、自動運転車、ロボット、ドローンなどの移動体の遠隔管制に用いることができる。このような遠隔管制においては、例えば、移動体に設けられたカメラによって撮像された画像を、画像処理装置100bによって処理し、処理後の画像を運転監視センターなどの遠隔地に送信する。この送信された画像を当該遠隔地に配置された表示装置200bが受信し、表示部206bによって画像を表示する。これにより、移動体が適切に運行できているかを当該遠隔地から人が監視することができる。
【0136】
なお、表示部206bには、画像を表示する液晶表示パネル等を用いることができるがこれに限られるものではない。
【0137】
以下、画像表示システム10bが備える画像処理装置100bと表示装置200bについて説明する。
【0138】
(移動体の説明)
例示的実施形態5においては、移動体300bを図示して説明に加えている。
図18に示すように、移動体300bは撮像部302bと通信部304bとを備える。以下それぞれについて説明する。
【0139】
撮像部302bは、一例としてカメラなどの撮像装置などであってよい。撮像部302bは、静止画像を取得するものであってもよいし、動画像を取得するものであってもよい。撮像部302bは、移動体300bの進行方向(前方)の画角が含まれる画像を取得することが好ましいが、これは本例示的実施形態を限定するものではない。一例として、撮像部302bは、移動体300bの進行方向とは反対側(後方)の画角が含まれる画像を取得してもよいし、移動体の進行方向に垂直な方向(側方)の画角が含まれる画像を取得してもよい。
【0140】
通信部304bは、撮像部302bで取得された画像を画像処理装置100bに伝送する。通信部304bは、一例として、アンテナを備え、無線通信を用いて符号化データを送信する構成とすることができるが、これは本実施形態を限定するものではなく、有線通信を用いてもよいし、無線通信と有線通信との組み合わせを用いてもよい。
【0141】
(画像処理装置の構成)
画像処理装置100bは、
図18に示すように、取得部102bと、重要度推定部104bと、品質パラメータ推定部105bと、品質パラメータ決定部106bと、符号化部108bと、送信部110bとを備えている。以下それぞれについて説明する。
【0142】
(取得部)
取得部102bは、画像を取得する。取得部102bが取得する画像は、移動体300bから撮像された画像である。取得部102bによる具体的な処理例については後述する。
【0143】
(重要度推定部)
重要度推定部104bは、取得部102bが取得した画像に含まれる複数の領域の各々について重要度を推定する。本例示的実施形態に係る重要度推定部104bは、例示的実施形態1及び2において説明した推定部11、21及び推定部、32、52と同様の構成を有しており、一例として以下の学習プロセスによって学習された推論モデルを用いて構成することができる。
【0144】
(置換ステップ)
取得部102bが取得した学習用画像に含まれる複数の領域のうちの少なくとも何れかを、当該重要度推定部104bが推定した重要度に応じて、代替データに置換することによって、置換後のデータを生成する。
【0145】
(評価ステップ)
前記置換後のデータを参照することによって評価値を導出する。ここで、当該評価ステップでは、取得部102bが取得した置換前の学習用画像を更に参照する構成としてもよい。
【0146】
(学習ステップ)
前記評価値を参照して、当該重要度推定部104bを学習させる。ここで、重要度推定部104bの学習は、重要度推定部104bとして機能する推論モデルが有する各種のパラメータを、前記評価値に応じて更新することによって行うことができる。なお、重要度推定部104bによる具体的な処理例については後述する。
【0147】
(品質パラメータ推定部)
品質パラメータ推定部105bは、取得部102bが取得した画像に含まれる複数の領域の各々についての予備的品質パラメータを推定する。また、一例として、品質パラメータ推定部105は、画像を符号化した場合の符号化効率が向上するように予備的品質パラメータを推定する。一例として、品質パラメータの決定に先立つ予備的品質パラメータの推定は、H265等の動画像符号化技術を用いて行うことができるが、これは本例示的実施形態を限定するものではない。
【0148】
また、本例示的実施形態において、「予備的品質パラメータ」との表現は、後述する品質パラメータ決定部106bが決定する「品質パラメータ」との文言上の混乱を招来しないように形式的に導入したものである。「予備的」との文言が、動画像符号化技術において何らの実体的限定を表すものではない。
【0149】
本例示的実施形態において、「予備的品質パラメータ」は一例として「品質パラメータ」と同様に、対象画像に対して適用される量子化処理の粗さを指定するための量子化パラメータ(QP:Quantum Parameter)を挙げることができる。
【0150】
また、品質パラメータ推定部105bによって参照される「複数の領域」は、重要度推定部104bが参照する「複数の領域」と同じである必要はない。一例として、品質パラメータ推定部105bによって参照される「複数の領域」は、動画像符号化技術において生成又は参照される「符号化ユニット」や「マクロブロック」等と呼ばれる領域であってもよい。一方、重要度推定部104bによって参照される「複数の領域」は、一例として、Self-Attentionアルゴリズムによって生成又は参照される個々の注目領域であってもよい。
【0151】
品質パラメータ推定部105bによる具体的な処理については、参照する図面を代えて後述する。
【0152】
(品質パラメータ決定部)
品質パラメータ決定部106bは、重要度と推定された予備的品質パラメータとを参照して複数の領域の各々についての品質パラメータを決定する。本例示的実施形態に係る品質パラメータ決定部106bは、重要度だけでなく予備的品質パラメータも参照して品質パラメータを決定する。一例として、品質パラメータ決定部106bは、重要度推定部104が推定した重要度および品質パラメータ推定部が推定した予備的品質パラメータと正の相関を有するように品質パラメータを設定することができる。すなわち、品質パラメータ決定部106bは、重要度推定部104bが推定した重要度が高い程、当該領域の画像品質が高くなるように、品質パラメータを設定することができる。
【0153】
なお、上述したように、一般には、品質パラメータ推定部105bによって参照される「複数の領域」と、重要度推定部104bが参照する「複数の領域」とが同じではない場合が生じ得る。換言すれば、品質パラメータ推定部105bが予備的品質パラメータを付与する複数の領域(例えば、領域R1a、領域R2a、領域R3a、・・・)の各々が、重要度推定部104bが重要度を付与した複数の領域(例えば、領域R1b、領域R2b、領域R3b)の各々と完全には重複しない場合が生じ得る。
【0154】
このような場合、品質パラメータ決定部106bは、品質パラメータ推定部105bが予備的品質パラメータを付与した領域の品質パラメータを、当該領域に含まれるか又は重複する何れかの領域であって、重要度推定部104bが重要度を付与した領域を参照して決定する構成とすることができる。
【0155】
一例として、品質パラメータ推定部105bが予備的品質パラメータを付与した領域R1aに、重要度推定部104bが重要度を付与した複数の領域R1b及び領域R2bが含まれているか、又は重複している場合、品質パラメータ決定部106bは、領域R1b及び領域R2bに付された少なくとも何れかの重要度を参照して、領域R1aの品質パラメータを決定する構成とすることができる。
【0156】
(符号化部)
符号化部108bは、品質パラメータ決定部106bが決定した品質パラメータを用いて対象画像を符号化することによって、符号化データを生成する。
【0157】
(送信部)
送信部110bは、符号化部108bが生成した符号化データを送信する。
【0158】
送信部110bは、一例として、アンテナを備え、無線通信を用いて符号化データを送信する構成とすることができるが、これは本実施形態を限定するものではなく、有線通信を用いてもよいし、無線通信と有線通信との組み合わせを用いてもよい。
【0159】
(表示装置の構成)
表示装置200bは、受信部202bと、復号部204bと、表示部206bとを備えている。
【0160】
なお、受信部202bは、請求の範囲に記載した受信手段の一実施形態である。表示部206bは、請求の範囲に記載した表示手段の一実施形態である。
【0161】
受信部202bは、送信部110bから送信された符号化データを受信する。
【0162】
復号部204bは、受信部202bが受信した符号化データを復号して画像データに変換する。
【0163】
復号部204bによる具体的な復号アルゴリズムは本例示的実施形態を限定するものではないが、当該復号アルゴリズムは、符号化部108bによる符号化アルゴリズムに対応するアルゴリズムを採用することが好ましい。また、復号部204bは、複数の領域の各々に関する復号処理を、当該領域に対して品質パラメータ決定部106bが決定した品質パラメータであって符号化データに含まれる品質パラメータを参照して行う構成を採用することができる。
【0164】
これにより、復号部204bによる復号後の画像の品質が、品質パラメータ決定部106bが決定した品質パラメータに準じたものとなる。
【0165】
表示部206bは、復号部204bが復号した画像を表示する。
【0166】
(画像表示システムの効果)
以上のように構成された画像表示システム10bによれば、画像処理装置100bは移動体から撮像した対象画像に含まれる複数の領域の各々について、重要度に応じた符号化処理の粗さを指定することができる。このため、移動体から撮像し、符号化された画像データは好適に削減されており、伝送負荷を好適に抑制できる。
【0167】
以下、
図19~
図21を用いて例示的実施形態5に係る画像表示システム10bにおける表示方法の流れを説明する。
(画像表示システムにおける表示方法の説明)
図19は、例示的実施形態5に係る画像表示システム10bにおける表示方法の流れを示すフロー図であり、画像処理装置100bにおける処理の流れを示すフローチャートS100bと、表示装置200bにおける処理の流れを示すフローチャートS200bとを示している。
図19に示すように、例示的実施形態5に係る画像処理装置100bにおける処理の流れを示すフローチャートS100bは、ステップS102b~S110bを含んでいる。
【0168】
また、例示的実施形態5に係る表示装置200bにおける処理の流れを示すフローチャートS200bは、ステップS202b、S204bおよびS206bを含んでいる。
【0169】
図20A乃至
図20Cは例示的実施形態5に係る画像表示システム10bにおける表示方法の具体例を説明する図であり、これらの図面が示している画像および模式図は互いに対応関係を有している。
図20Aに示す画像702は、ステップS102bにおいて取得部102bが取得した移動体から撮像した画像の一例を示している。
図20Bとして示す模式
図704は、ステップS104bにおいて重要度推定部104bが複数の領域の各々について推定した重要度を示している。
図20Cとして示す模式
図706は、ステップS105bにおいて品質パラメータ推定部105bが複数の領域の各々について推定した予備的品質パラメータを示している。これらの図面を参照して説明する例示的な処理の流れについては後述する。
【0170】
図21A及び
図21Bは、例示的実施形態5に係る画像表示システム10bにおける表示方法のステップS106bの処理例を示すものである。
図21Aとして示したフローチャートS1060aは、
図19に示したステップS106bにおける品質パラメータの決定の処理例の流れを示している。
図21Bとして示した模式
図802は、
図21Cとして示した模式
図706における複数の領域の各々についてステップS106bにおける処理例によって決定した品質パラメータを示している。
【0171】
以下、
図19~
図21を用いて例示的実施形態5に係る画像表示システム10bにおける表示方法の流れを説明する。
【0172】
(画像処理装置における処理の流れの説明)
(ステップS102b)
ステップS102bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、取得部102bは撮影された画像を取得する。本例示的実施形態に係る取得部102bは、例示的実施形態1において説明した取得部10の構成と同様であるのですでに記載した説明は省略する。
【0173】
本ステップS102bで取得された画像の一例を
図20Aに画像702として示す。この画像702は移動体300bの撮像部302で撮像された画像であり、移動体300bはこの具体例の場合、走行中の車両である。画像702は移動体300b(走行中の車両)の進行方向(前方)の画角が含まれる静止画像であり、その中央部付近には前方に走行している先行車両が撮像されている。
【0174】
(ステップS104b)
ステップS104bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、重要度推定部104bは、画像に含まれる複数の領域の各々について重要度を推定する。本ステップに係る重要度推定部104bの処理は、画像表示システム10bにおいて説明した処理と同様の処理を含むので、すでに記載した説明は省略する。
【0175】
本ステップS104bにおいて、重要度推定部104bが推定した重要度の一例を
図20Bの模式
図704として示す。重要度推定部104bは、ステップS102bで取得された画像702を、一例として
図20Bの模式
図704に示すように、6列4行の24の領域に分割して、この24の領域各々について重要度を推定する。
【0176】
また、この重要度の推定処理において、重要度推定部104bは、ステップS102bで取得された画像702に含まれる複数の領域のそれぞれを、重要度に応じて、重要領域(IR)及び非重要領域(NIR)の何れかに分類する。
【0177】
一例として、重要度推定部104bは、
図20Bで示した模式
図704に示すように、画像702の24の領域を、先行車両が撮像されている付近の6つの重要領域(IR)と、それ以外の非重要領域(NIR)とに分類する。
【0178】
重要度推定部104bは、最も重要度が高い領域(先行車両の撮像が含まれている領域)に対して最も高い値の重要度(この模式
図704では3つの領域に示された0.9)を付与する。同様に重要度推定部104bは、重要度が比較的高いと推定した領域(先行車両の撮像が含まれている周囲の領域)に、比較的高い重要度(この模式
図704では他の3つの領域で示された0.5および0.6)を付与している。
【0179】
さらに重要度推定部104bは、重要度が最も低いと推定した領域(模式
図704の上部1行の領域)に最も低い値の重要度(模式
図704では0.1)を付与している。それ以外の非重要領域(NIR)において重要度推定部104bは重要度が低いと推定し、その対象領域のうち重要領域(IR)から離れた領域に低い値の重要度(模式
図704では0.2)を付与している。また、重要度推定部104bは、重要度が相対的に低いと推定した重要領域(IR)に隣接した領域に対し相対的に低い値の重要度(模式
図704では0.3)を付与している。
【0180】
(ステップS105b)
ステップS105bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、品質パラメータ推定部105bは、画像に含まれる複数の領域の各々についての予備的品質パラメータを推定する。ここで、品質パラメータ推定部105bは、一例として、画像を符号化した場合の符号化効率が向上するように予備的品質パラメータを推定する。本例示的実施形態に係る品質パラメータ推定部105bは、例示的実施形態5の画像処理装置100bの構成において説明した品質パラメータ推定部105bの処理と同様であるのですでに記載した説明は省略する。
【0181】
本ステップS105bにおいて、品質パラメータ推定部105bが推定した予備的品質パラメータの一例を
図20Cにおいて模式
図706として示している。品質パラメータ推定部105bは、ステップS102bで取得された画像702を、
図20Cの模式
図706に示すように、一例として、6列4行の24の領域に分割して、この24個の領域各々について予備的品質パラメータを推定する。ここで、
図20A乃至
図20Cに示した具体例においては、品質パラメータ推定部105bによって参照される「複数の領域」と、重要度推定部104bが参照する「複数の領域」とは、同じ6列4行の24の領域に同様に分割されている例を示しているが、これは本例示的実施形態を限定するものではなく、上述したように、一般には、両者の「複数の領域」は互いに異なり得る。
【0182】
なお、
図20Cの模式
図706に示す例では、より小さい品質パラメータが付与された領域の方が、より大きい品質パラメータが付与された領域よりも品質が高い。即ち、模式
図706においては、40で示される品質パラメータが付与された領域の品質が最も低品質であり、10で示される品質パラメータが付与された領域の品質が最も高品質である。
【0183】
(ステップS106b)
ステップS106bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、品質パラメータ決定部106bは、重要度推定部104bが推定した重要度と品質パラメータ推定部105bが推定した予備的品質パラメータとを参照して複数の領域の各々についての品質パラメータを決定する。
【0184】
本例示的実施形態では、ステップS106bについて具体例を挙げて説明する。
【0185】
(ステップS106bの処理例)
図21Aは、ステップS106bの処理例(この処理例を符号S1060aを付す場合もある)を示すフローチャートおよび模式
図802である。以下、
図21Aを使って処理例S1060aをさらに詳しく説明する。
【0186】
(ステップS1061a)
本ステップS1061aは、複数の領域に関するループ処理の始端である。当該ループ処理では、対象画像に含まれる複数の領域の各々が、所定の順序で順次処理対象となる。
【0187】
(ステップS1062a)
続いて、ステップS1062aにおいて、品質パラメータ決定部106bは、対象領域の重要度が閾値以上かどうかを判断する。ここで対象領域とは、品質パラメータ推定部105bが推定した予備的品質パラメータの複数の領域のうち、処理対象である領域のことを指している。対象領域の重要度が閾値以上である場合(判断ステップのYESに該当)、品質パラメータ決定部106bは、当該対象領域に対して何らの処理も行わずに次の処理に進む。即ち、重要度が閾値以上である対象領域においては、予備的品質パラメータがそのまま品質パラメータとして決定される。一方で、対象領域の重要度が閾値以上でない場合(換言すれは、閾値より低い値である場合)(判断ステップのNOに該当)、ステップS1063aに進む。
【0188】
なお、上記閾値の具体的な値は、本例示的実施形態を限定するものではないが、一例として望ましい符号化データ量に応じて予め定めておくことができる。
【0189】
図21Bとして示す模式
図802は、
図20Cの模式
図706に示した各領域において、本処理例によってどのように品質パラメータが決定されたかを表している。
図21Bの模式
図802に示すように、重要領域(IR)では、
図20Cの模式
図706に示した予備的品質パラメータがそのまま品質パラメータに設定される。即ち、重要度が閾値以上である対象領域(重要領域IR)においては、予備的品質パラメータがそのまま品質パラメータとして決定されている。
【0190】
(ステップS1063a)
ステップS1063aでは、品質パラメータ決定部106bは、対象領域を低画質化するように品質パラメータを決定する。即ち、重要度が閾値より低い対象領域においては、当該対象領域に付与された予備的品質パラメータの値よりも大きい値を有する品質パラメータを当該対象領域に付与する。
【0191】
一例として、品質パラメータ決定部106bは、
図21Bの模式
図802に示すように、非重要領域(NIR)に含まれる各領域に対して、
図20Cの模式
図706に示した予備的品質パラメータよりも大きな値を有する品質パラメータを付与する。
【0192】
(ステップS1065a)
本ステップS1065aは、複数の領域に関するループ処理の終端である。
【0193】
ここで、ステップS106bに続くステップについて
図19に戻って説明する。
【0194】
(ステップS108b)
ステップS108bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、符号化部108bは、品質パラメータ決定部106bが決定した品質パラメータを用いて画像を符号化して符号化データとする。
【0195】
(ステップS110b)
ステップS110bにおいて、例示的実施形態5に係る画像処理装置100bにおける処理では、送信部110bが、符号化部108が符号化した符号化データを送信する。本ステップにおける送信部110bの処理は、例示的実施形態3の画像処理装置100bの構成において説明した送信部110b処理と同じであるためここでは詳細な説明を省略する。
【0196】
(表示装置における処理の流れの説明)
以下、表示装置200bにおける処理の流れをステップごとに説明する。
【0197】
(ステップS202b)
ステップS202bにおいて、例示的実施形態5に係る表示装置200bにおける処理では、受信部202bが、送信部110bから送信された符号化データを受信する。本ステップにおける受信部202bの処理は、例示的実施形態3の表示装置200bにおいて説明した処理と同様であるので、ここでは詳細な説明を省略する。
【0198】
(ステップS204b)
ステップS204bにおいて、例示的実施形態5に係る表示装置200bにおける処理では、復号部204bは、受信部202bが受信した符号化データを復号して画像データに変換する。
【0199】
(ステップS206b)
ステップS206bにおいて、例示的実施形態5に係る表示装置200bにおける処理では、表示部206bは、復号部204bから得られた画像データに基づき画像を表示する。
【0200】
(画像表示システムの表示方法の効果)
以上のように画像表示システム10bの表示方法によれば、移動体から撮像した対象画像に含まれる複数の領域の各々について、重要度に応じた符号化処理の粗さを指定することができる。特に、例示的実施形態5の処理例S1060aにおいては、移動体から撮像し、符号化された画像データは好適に削減されている。したがって、画像表示システム10bの表示方法によれば伝送負荷を好適に抑制できる。また、例示的実施形態5の処理例S1060bにおいては、移動体から撮像し、符号化された画像データは好適に削減して伝送負荷を好適に抑制できるとともに、重要な領域の画像を高品質で表示することができる。
【0201】
〔ソフトウェアによる実現例〕
情報処理装置1,2,3,4,5及び画像処理装置100bの一部又は全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
【0202】
後者の場合、情報処理装置1,2,3,4,5及び画像処理装置100bは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例(以下、コンピュータCと記載する)を
図22に示す。コンピュータCは、少なくとも1つのプロセッサC1と、少なくとも1つのメモリC2と、を備えている。メモリC2には、コンピュータCを情報処理装置1,2,3,4,5及び画像処理装置100bとして動作させるためのプログラムPが記録されている。コンピュータCにおいて、プロセッサC1は、プログラムPをメモリC2から読み取って実行することにより、情報処理装置1,2,3,4,5及び画像処理装置100bの各機能が実現される。
【0203】
プロセッサC1としては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリC2としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又は、これらの組み合わせなどを用いることができる。
【0204】
なお、コンピュータCは、プログラムPを実行時に展開したり、各種データを一時的に記憶したりするためのRAM(Random Access Memory)を更に備えていてもよい。また、コンピュータCは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータCは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。
【0205】
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
【0206】
〔付記事項1〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
【0207】
〔付記事項2〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
【0208】
態様1に係る情報処理装置は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段と、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段と、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを、前記重要度に応じて、代替データに置換することによって、置換後のデータを生成する置換手段と、前記置換後のデータを参照することによって評価値を導出する評価手段と、前記評価値を参照して、前記推定手段を学習させる学習手段とを備えている。
【0209】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0210】
態様2に係る情報処理装置においては、態様1の構成に加えて、前記評価手段は、前記入力データを更に参照することによって評価値を導出するという構成が採用されている。
【0211】
上記の構成によれば、置換後のデータだけでなく、入力後のデータも参照して重要領域と非重要領域とを推定する学習をさせることができる。
【0212】
態様3に係る情報処理装置においては、態様2の構成に加えて、前記評価手段は、前記入力データを所定のコントローラに入力した場合の当該コントローラの出力と、前記置換後のデータを前記所定のコントローラに入力した場合の当該コントローラの出力とを参照することによって、前記評価値を導出するという構成が採用されている。
【0213】
上記の構成によれば、所定のコントローラの出力を参照して、重要領域と非重要領域とを推定する学習をさせることができる。
【0214】
態様4に係る情報処理装置においては、態様3の構成に加えて、前記評価手段は、前記入力データを所定のコントローラに入力した場合の当該コントローラの出力と、前記置換後のデータを前記所定のコントローラに入力した場合の当該コントローラの出力との差分として前記評価値を導出し、前記学習手段は、前記評価値が小さくなるように、前記推定手段を学習させるという構成が採用されている。
【0215】
上記の構成によれば、所定のコントローラからの出力の差分に基づいて重要領域と非重要領域とを推定する学習をさせることができる。
【0216】
態様5に係る情報処理装置においては、態様1から4のいずれか1つの構成に加えて、前記置換手段は、重要度が小さい順に選択した領域であって、前記フレームにおいて所定の割合を有する1又は複数の前記領域を前記代替データに置換するという構成が採用されている。
【0217】
上記の構成によれば、所定の割合を置換したデータを用いることによって、重要領域と非重要領域とを推定する学習をさせることができる。
【0218】
態様6に係る情報処理装置においては、態様5の構成に加えて、前記置換手段は、互いに異なる複数の所定の割合の各々について、前記置換後のデータを生成し、前記評価手段は、前記置換手段が生成した置換後の各データについて予備的評価値を導出し、前記予備的評価値の平均をとることによって前記評価値を導出するという構成が採用されている。
【0219】
上記の構成によれば、複数の所定の割合を置換したデータを用いることによって、重要領域と非重要領域とを推定する学習をさせることができる。
【0220】
態様7に係る情報処理装置においては、態様1から6のいずれか1つの構成に加えて、前記評価手段は、前記置換後のデータのデータサイズを更に参照して前記評価値を導出するという構成が採用されている。
【0221】
上記の構成によれば、データサイズを考慮して重要領域と非重要領域とを推定する学習をさせることができる。
【0222】
態様8に係る情報処理装置においては、態様7の構成に加えて、前記学習手段は、前記置換後のデータのデータサイズが小さくなるように、前記推定手段を学習させるという構成が採用されている。
【0223】
上記の構成によれば、データサイズが小さくなるように重要領域と非重要領域とを推定する学習をさせることができる。
【0224】
態様9に係る情報処理装置においては、態様1から8のいずれか1つの構成に加えて、前記置換手段が用いる前記代替データは、ノイズ、及び量子化誤差の大きい画像データの少なくとも何れかを含むデータであるという構成が採用されている。
【0225】
上記の構成によれば、データサイズが小さくなるように重要領域と非重要領域とを推定する学習をさせることができる。
【0226】
態様10に係る情報処理装置においては、態様1から9のいずれか1つの構成に加えて、前記推定手段は、自己注意モジュールを用いて前記重要度を推定するという構成が採用されている。
【0227】
上記の構成によれば、自己注意モジュールを用いて重要領域と非重要領域とを推定する学習をさせることができる。
【0228】
態様11に係る情報処理装置においては、態様1から10のいずれか1つの構成に加えて、前記評価手段は、前記置換後のデータを入力した移動体のコントローラからの出力を参照して、前記評価値を導出するという構成が採用されている。
【0229】
上記の構成によれば、移動体のコントローラを用いて重要領域と非重要領域とを推定する学習をさせることができる。
【0230】
態様12に係る情報処理装置においては、態様11の構成に加えて、前記評価値は、前記出力から導出された報酬値を含み、前記学習手段は、前記報酬値が大きくなるように前記推定手段を学習させるという構成が採用されている。
【0231】
上記の構成によれば、コントローラの出力値から導出される報酬値が大きくなるように推定手段を学習させることができる。
【0232】
態様13に係る情報処理装置においては、態様11の構成に加えて、前記評価値は、前記出力から導出されたロス値であり、前記学習手段は、前記ロス値が小さくなるように前記推定手段を学習させるという構成が採用されている。
【0233】
上記の構成によれば、ロス値を用いて推定手段を学習させることができる。
【0234】
態様14に係る情報処理装置は、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段と、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段と、を備えている。
【0235】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0236】
態様15に係る情報処理方法は、画像データ及び点群データの少なくとも何れかを含む入力データを取得すること、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定すること、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを、前記重要度に応じて、代替データに置換することによって、置換後のデータを生成すること、前記置換後のデータを参照することによって評価値を導出すること、及び前記評価値を参照して、推定手段を学習させること、を含む。
【0237】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0238】
態様16に係る情報処理方法においては、画像データ及び点群データの少なくとも何れかを含む入力データを取得すること、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定することであって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定すること、を含む。
【0239】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0240】
態様17に係る記録媒体は、コンピュータを、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを、前記重要度に応じて、代替データに置換することによって、置換後のデータを生成する置換手段、前記置換後のデータを参照することによって評価値を導出する評価手段、及び前記評価値を参照して、前記推定手段を学習させる学習手段、として機能させるためのプログラムを記録した、コンピュータ読み取り可能な非一時的記録媒体である。
【0241】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0242】
態様18に係る記録媒体は、コンピュータを、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定する推定手段、として機能させるためのプログラムを記録した、コンピュータ読み取り可能な非一時的記録媒体である。
【0243】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0244】
態様19に係るプログラムは、コンピュータを、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを、前記重要度に応じて、代替データに置換することによって、置換後のデータを生成する置換手段、前記置換後のデータを参照することによって評価値を導出する評価手段、及び前記評価値を参照して、前記推定手段を学習させる学習手段、として機能させるためのプログラムである。
【0245】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0246】
態様20に係るプログラムは、コンピュータを、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得手段、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定手段であって、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを重要度に応じて代替データに置換することによって得られた置換後のデータを参照して学習された推定手段を用いて重要度を推定する推定手段、として機能させるためのプログラムである。
【0247】
上記の構成によれば、画像における重要領域と非重要領域とを好適に推定することのできる技術を提供することができる。
【0248】
〔付記事項3〕
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。
【0249】
少なくとも1つのプロセッサを備え、前記プロセッサは、画像データ及び点群データの少なくとも何れかを含む入力データを取得する取得処理と、前記入力データが示すフレームに含まれる複数の領域の各々について重要度を推定する推定処理と、前記入力データに含まれる前記複数の領域のうちの少なくとも何れかを、前記重要度に応じて、代替データに置換することによって、置換後のデータを生成する生成処理と、前記置換後のデータを参照することによって評価値を導出する導出処理と、前記評価値を参照して、推定手段を学習させる学習処理とを実行する情報処理装置。
なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記推定処理と、前記生成処理と、前記導出処理と、前記学習処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。
【符号の説明】
【0250】
1,2,3,4,5・・・情報処理装置
10,20,31,51・・・取得部
11,21,32,52・・・推定部
12,33・・・置換部
13,34・・・評価部
14,35・・・学習部
30,50・・・制御部
36,53・・・通信部
37,54・・・出力部
38,55・・・メモリ
41,61・・・撮像部
42,62・・・送信部
300、400・・・情報処理システム