(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-09-03
(45)【発行日】2024-09-11
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240904BHJP
G06T 7/80 20170101ALI20240904BHJP
【FI】
G06T7/00 350C
G06T7/80
(21)【出願番号】P 2024118626
(22)【出願日】2024-07-24
【審査請求日】2024-07-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】515237795
【氏名又は名称】アキュイティー株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(72)【発明者】
【氏名】小山 侑馬
【審査官】藤原 敬利
(56)【参考文献】
【文献】国際公開第2023/062992(WO,A1)
【文献】米国特許出願公開第2020/0043197(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06T 1/00- 7/90
G06V 10/00-20/90
H04N 23/00-23/959
(57)【特許請求の範囲】
【請求項1】
撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得する取得部と、
(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルを記憶する記憶部と、
前記算出対象画像データを前記学習済みモデルに入力し、前記算出対象画像データに対応するパラメータを出力させる推論部と、
を有する情報処理装置。
【請求項2】
前記第1のニューラルネットワークは、トランスフォーマー型のエンコーダーを有し、
前記第2のニューラルネットワークは、CNN(Convolutional Neural Network)型のエンコーダーを有する、
請求項1に記載の情報処理装置。
【請求項3】
前記取得部は、同一の撮像装置が撮像した複数の算出対象画像データを取得するとともに、補正対象の画像データである補正対象画像データを取得し、
前記推論部は、前記複数の算出対象画像データそれぞれを前記学習済みモデルに入力し、前記複数の算出対象画像データそれぞれに対応するパラメータを出力させ、
前記情報処理装置は、前記複数の算出対象画像データそれぞれに対応するパラメータの平均値に基づいて、前記補正対象画像データを補正する補正部をさらに有する、
請求項1に記載の情報処理装置。
【請求項4】
前記取得部は、
(1)前記算出対象画像データと、撮像装置を識別するための撮像装置識別情報であって、前記算出対象画像データを撮像した撮像装置の前記撮像装置識別情報と、を関連付けて取得するとともに、
(2)補正対象の画像データである補正対象画像データと、前記補正対象画像データを撮像した撮像装置の撮像装置識別情報と、を関連付けて取得し、
前記推論部は、前記算出対象画像データを撮像した撮像装置の撮像装置識別情報と、前記撮像装置識別情報に関連付けられた前記算出対象画像データに基づいて出力されたパラメータと、を関連付けたパラメータテーブルを記憶部に記憶させ、
前記情報処理装置は、前記補正対象画像データを撮像した撮像装置の撮像装置識別情報に前記パラメータテーブルにおいて対応する撮像装置識別情報に関連付けられたパラメータに基づいて、前記補正対象画像データを補正する補正部をさらに有する、
請求項1に記載の情報処理装置。
【請求項5】
前記撮像装置の光学系のパラメータは、当該光学系の歪係数と焦点距離とを含み、
前記補正部は、前記撮像装置の光学系に起因する前記補正対象画像データの歪みを補正する、
請求項3又は4に記載の情報処理装置。
【請求項6】
コンピュータが実行する、
撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得するステップと、
(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルに前記算出対象画像データを入力し、前記算出対象画像データに対応するパラメータを出力させるステップと、
を有する情報処理方法。
【請求項7】
コンピュータに、
撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得するステップと、
(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルに前記算出対象画像データを入力し、前記算出対象画像データに対応するパラメータを出力させるステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
Deep Learningを用いてカメラの光学系のパラメータを推論する技術が知られている(例えば、非特許文献1を参照)。
【先行技術文献】
【非特許文献】
【0003】
【文献】Oleksandr Bogdan, Viktor Eckstein, Francois Rameau and Jean-Charles Bazin.2018.DeepCalib: A Deep Learning Approach for Automatic IntrinsicCalibration of Wide Field-of-View Cameras. In Proceedings of CVMP ’18: European Conference on Visual Media Production, London, United Kingdom, December 13-14, 2018 (CVMP ’18), 10 pages, <URL https://doi.org/10.1145/3278471.3278479>
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来技術においては入力される画像によってはパラメータの推論精度が出せないことがあり、カメラの光学系のパラメータの推論には精度向上の余地がある。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、カメラの光学系のパラメータを推論する精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様にかかる情報処理装置においては、撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得する取得部と、(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルを記憶する記憶部と、前記算出対象画像データを前記学習済みモデルに入力し、前記算出対象画像データに対応するパラメータを出力させる推論部と、を有する。
【0007】
前記第1のニューラルネットワークは、トランスフォーマー型のエンコーダーを有し、前記第2のニューラルネットワークは、CNN(Convolutional Neural Network)型のエンコーダーを有するよう構成されてもよい。
【0008】
前記取得部は、同一の撮像装置が撮像した複数の算出対象画像データを取得するとともに、補正対象の画像データである補正対象画像データを取得し、前記推論部は、前記複数の算出対象画像データそれぞれを前記学習済みモデルに入力し、前記複数の算出対象画像データそれぞれに対応するパラメータを出力させ、前記情報処理装置は、前記複数の算出対象画像データそれぞれに対応するパラメータの平均値に基づいて、前記補正対象画像データを補正する補正部をさらに有するよう構成されてもよい。
【0009】
前記取得部は、(1)前記算出対象画像データと、撮像装置を識別するための撮像装置識別情報であって、前記算出対象画像データを撮像した撮像装置の前記撮像装置識別情報と、を関連付けて取得するとともに、(2)補正対象の画像データである補正対象画像データと、前記補正対象画像データを撮像した撮像装置の撮像装置識別情報と、を関連付けて取得し、前記推論部は、前記算出対象画像データを撮像した撮像装置の撮像装置識別情報と、前記撮像装置識別情報に関連付けられた前記算出対象画像データに基づいて出力されたパラメータと、を関連付けたパラメータテーブルを記憶部に記憶させ、前記情報処理装置は、前記補正対象画像データを撮像した撮像装置の撮像装置識別情報に前記パラメータテーブルにおいて対応する撮像装置識別情報に関連付けられたパラメータに基づいて、前記補正対象画像データを補正する補正部をさらに有するよう構成されてもよい。
【0010】
前記撮像装置の光学系のパラメータは、当該光学系の歪係数と焦点距離とを含み、前記補正部は、前記撮像装置の光学系に起因する前記補正対象画像データの歪みを補正してもよい。
本発明の第2の態様の情報処理方法においては、コンピュータが実行する、撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得するステップと、(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルに前記算出対象画像データを入力し、前記算出対象画像データに対応するパラメータを出力させるステップと、を有する。
【0011】
本発明の第3の態様のプログラムにおいては、コンピュータに、撮像装置が撮像した画像データであって、前記撮像装置の光学系のパラメータを算出する対象の画像データである算出対象画像データを取得するステップと、(1)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークと、(2)前記算出対象画像データを入力として、前記算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークであって、前記第1のニューラルネットワークと異なる前記第2のニューラルネットワークと、(3)前記第1の特徴量及び前記第2の特徴量を入力として、前記算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである出力ネットワークと、を有する学習済みモデルに前記算出対象画像データを入力し、前記算出対象画像データに対応するパラメータを出力させるステップと、を実行させる。
【発明の効果】
【0012】
本発明によれば、カメラの光学系のパラメータを推論する精度を向上させることができる。
【図面の簡単な説明】
【0013】
【
図1】実施形態にかかる情報処理システムSの概要を説明するための図である。
【
図2】学習済みモデルMの構造を説明するための図である。
【
図3】学習済みモデルMの構造を説明するための図である。
【
図4】情報処理装置1の構成を示すブロック図である。
【
図5】記憶部12が記憶するパラメータテーブルのデータ構造の一例を示す図である。
【
図6】情報処理装置1における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0014】
[情報処理システムSの概要]
図1は、実施形態にかかる情報処理システムSの概要を説明するための図である。情報処理システムSは、画像を撮像した撮像装置の光学系のパラメータを推論するためのシステムである。情報処理システムSは、情報処理装置1及び情報端末2を有する。
【0015】
情報処理装置1は、画像データを撮像した撮像装置の光学系のパラメータを推論するための装置である。一例として、情報処理装置1は画像の歪みに関するパラメータを推論する。情報処理装置1は、推論したパラメータに基づいて画像を補正する。情報処理装置1は、画像データが入力されると、画像を撮像した撮像装置の光学系のパラメータを出力する学習済みモデルを記憶する。学習済みモデルが推論する撮像装置の光学系のパラメータは、一例として、歪係数と焦点距離である。学習済みモデルが推論の対象とする撮像装置のパラメータは、例えば光学中心やせん断係数であってもよい。
【0016】
情報端末2は、情報処理システムSを利用するユーザが使用する端末である。情報端末2は、情報処理装置1に学習又は推論用の画像データを入力する。また、情報端末2は、情報処理装置1に学習又は推論を行う指示をする。情報端末2は、情報処理装置1が補正した画像データを取得し、取得した画像データを表示する。
【0017】
情報処理装置1は、学習用画像データを取得する。学習用画像データは、学習済みモデルを学習させるための画像データである。
図2を参照して学習済みモデルMの構造を説明する。
【0018】
学習済みモデルMは、第1のニューラルネットワークNAと、第2のニューラルネットワークNBと、出力ネットワークNCと、を有する。第1のニューラルネットワークNAは、算出対象画像データを入力として、算出対象画像データが示す画像の特徴量である第1の特徴量を出力する。第2のニューラルネットワークNBは、算出対象画像データを入力として、算出対象画像データが示す画像の特徴量である第2の特徴量を出力する。
【0019】
第1のニューラルネットワークNAと第2のニューラルネットワークNBとは異なる構造を有する。具体的には、第1のニューラルネットワークNAは、トランスフォーマー(Transformer)型のエンコーダーを有し、第2のニューラルネットワークNBは、CNN(Convolutional Neural Network)型のエンコーダーを有する。一例として、第1のニューラルネットワークNAは、既知のConvFormerであり、第2のニューラルネットワークNBは、既知のConvNeXt-V2であってもよい。
【0020】
異なる構造を有する複数のニューラルネットワークそれぞれが特徴量を抽出することにより、画像データにおける様々な特徴を捉えることが可能になり、パラメータの推論精度が向上することが期待される。また、注意機構(Attention Mechanism)を有するトランスフォーマー型のエンコーダーを一方のニューラルネットワークに採用して特徴量を抽出することで、画像において離れた位置における情報に基づいてパラメータを推論できるようになり、その結果、パラメータの推論精度が向上することが期待される。
【0021】
出力ネットワークNCは、第1の特徴量及び第2の特徴量を入力として、算出対象画像データを撮像した撮像装置の光学系のパラメータを出力するニューラルネットワークである。一例として、出力ネットワークNCは、第1の特徴量及び第2の特徴量を結合(Concatenate)したベクトルを入力として受付けるよう構成されてもよい。
【0022】
なお、
図2においては、出力ネットワークNCが1つのニューラルネットワークで構成される例を示したが、出力するパラメータが複数である場合、出力ネットワークNCは、出力するパラメータごとにそれぞれ独立したネットワークを有していてもよい。すなわち、学習済みモデルMは、
図3に示すとおり、出力するパラメータ(パラメータA及びパラメータB)それぞれについての出力ネットワーク(NC1及びNC2)を有してもよい。
【0023】
なお、
図2及び
図3においては、出力するパラメータが2種類である例を示したが、これに限られない。すなわち、学習済みモデルMが出力するパラメータは1種類であってもよいし、3種類以上であってもよい。以下では、学習済みモデルMが出力するパラメータが焦点距離と歪係数である例を用いて、情報処理システムSについて説明する。
【0024】
図1に戻り、情報処理システムSの処理の概要を説明する。情報処理装置1は、情報端末2から学習用画像データを取得する(
図1における(1))。学習用画像データは、学習済みモデルMの学習に使用される画像データである。学習用画像データは、学習用画像データを撮像した撮像装置のパラメータと関連付けられている。
【0025】
情報処理装置1は、学習用画像データと、学習用画像データを撮像した撮像装置のパラメータと、を教師データとして学習を実行し、学習済みモデルMを生成する(
図1における(2))。情報処理装置1は、生成した学習済みモデルMを記憶する。
【0026】
情報処理装置1は、情報端末2から算出対象画像データを取得する(
図1における(3))。対象画像データは、撮像装置の光学系のパラメータを算出する対象の撮像装置が撮像した画像データである。情報処理装置1は、算出対象画像データを学習済みモデルMに入力し、パラメータを出力させる(
図1における(4))。情報処理装置1は、後述するように撮像装置が撮像した複数の対象画像データに基づいて画像の補正に用いるパラメータを決定してもよい。
【0027】
情報処理装置1は、情報端末2から補正対象画像データを取得する(
図1における(5))。補正対象画像データは、画像を補正する対象の画像データである。補正対象画像データは、算定対象画像データを撮像した撮像装置と同一の撮像装置に撮像されている。
【0028】
情報処理装置1は、学習済みモデルMが算定対象画像データに基づいて出力したパラメータに基づいて、補正対象画像データを補正する(
図1における(6))。より具体的には、情報処理装置1は、学習済みモデルMが出力した焦点距離と歪係数に基づいて、補正対象画像データの歪みを補正し、補正後画像データを生成する。
【0029】
情報処理装置1は、補正後画像データを出力する(
図1における(7))。一例として、情報処理装置1は、補正後画像データを情報端末2の表示部に表示させる。
【0030】
学習済みモデルMは、複数の構造が異なるニューラルネットワークにより特徴量を抽出することで、異なる観点の特徴量を抽出するように構成されている。このため、光学系のパラメータを推定に異なる観点の特徴量を利用できるので、情報処理システムSは、カメラの光学系のパラメータを推論する精度を向上させることができ、その結果、画像の補正精度を向上させることができる。
【0031】
なお、上記の説明においては、情報処理装置1が情報端末2から画像データを取得する例を説明したがこれに限られない。情報処理装置1は、撮像装置(不図示)から画像データを取得してもよいし、外部装置(不図示)から画像データを取得してもよい。
【0032】
図4は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、推論部132、表示制御部133及び補正部134を有する。
【0033】
通信部11は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。記憶部12は、学習済みモデルMを記憶する。
【0034】
制御部13は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部13は、記憶部12に記憶されたプログラムを実行することにより、取得部131、推論部132、表示制御部133及び補正部134として機能する。
【0035】
取得部131は、算出対象画像データを取得する。取得部131は、情報端末2から算出対象画像データを取得してもよいし、不図示の外部装置から算出対象画像データを取得してもよい。
【0036】
推論部132は、算出対象画像データを学習済みモデルMに入力し、算出対象画像データに対応するパラメータを出力させる。推論部132は、算出対象画像データを学習済みモデルMに入力し、算出対象画像データを撮像した撮像装置の焦点距離と歪係数とを出力させる。一例として、推論部132は、学習済みモデルMが出力した焦点距離と歪係数とを記憶部12に記憶させる。表示制御部133は、学習済みモデルMが出力したパラメータを表示する画面を情報端末2に表示させてもよい。
【0037】
複数の構造が異なるニューラルネットワークにより異なる観点の特徴量を抽出するよう構成された学習済みモデルMを用いて光学系のパラメータを推論するよう情報処理装置1が構成されることで、カメラの光学系のパラメータを推論する精度を向上させることができる。
【0038】
[補正処理]
取得部131は、補正対象画像データを取得する。補正部134は、撮像装置の光学系に起因する補正対象画像データの歪みを補正する。具体的には、補正部134は、学習済みモデルMが出力した焦点距離及び歪係数に基づいて補正対象画像データを補正し、補正後画像データを生成する。撮像装置の焦点距離及び歪み係数に基づいて画像を補正する技術は既知であり、補正部134は、既知のカメラキャリブレーション技術に基づいて補正対象画像データを補正すればよい。表示制御部133は、補正部134が生成した補正後画像データを表示する画面を情報端末2に表示させてもよい。
【0039】
入力する画像データによっては学習済みモデルMが出力するパラメータに誤差が生じる場合がある。そこで、同一の撮像装置が撮像した画像データに基づいて学習済みモデルMが出力したパラメータの平均値に基づいて、画像を補正するよう情報処理装置1が構成されてもよい。撮像装置が同じであれば、推論対象とする光学系のパラメータも同一であることが想定できるからである。
【0040】
取得部131は、同一の撮像装置が撮像した複数の算出対象画像データを取得する。推論部132は、複数の算出対象画像データそれぞれを学習済みモデルMに入力し、複数の算出対象画像データそれぞれに対応するパラメータを出力させる。具体的には、推論部132は、複数の算出対象画像データそれぞれに基づいて学習済みモデルMが出力した焦点距離及び歪係数それぞれの平均値を算出する。
【0041】
補正部134は、複数の算出対象画像データそれぞれに対応するパラメータの平均値に基づいて、補正対象画像データを補正する。具体的には、補正部134は、取得部131が取得した補正対象画像データを、推論部132が算出した焦点距離及び歪係数それぞれの平均値に基づいて補正する。
【0042】
学習済みモデルMが出力するパラメータに異常な値が含まれる場合が想定される。そこで、統計的に異常な値を除去し、パラメータの平均値をとるよう補正部134が構成されてもよい。
【0043】
推論部132は、学習済みモデルMが複数の算出対象画像データに基づいて出力したパラメータの平均値及び標準偏差を算出する。推論部132は、標準偏差が所定の閾値以上又は閾値以下のパラメータを除く、学習済みモデルMが出力したパラメータに基づいて平均値を算出する。
【0044】
学習済みモデルMが出力したパラメータの平均値に基づいて情報処理装置1がこのように構成されることで、光学系のパラメータの推定精度を向上させることができる。
【0045】
同種の部品を使用して同一の工程で製造した撮像装置であっても、部品を組み付ける際にパラメータに誤差が生じ得る。そこで、撮像装置ごとのパラメータを特定し、撮像装置ごとのパラメータに基づいて、それぞれの撮像装置が撮像した画像を補正するよう情報処理装置1が構成されてもよい。
【0046】
取得部131は、算出対象画像データと、算出対象画像データを撮像した撮像装置の撮像装置IDと、を関連付けて取得する。撮像装置IDは、撮像装置を識別するため識別情報である。一例として、撮像装置IDは、算出対象画像データに関連付けられたメタデータに含まれる。
【0047】
推論部132は、取得した算出対象画像データを学習済みモデルMに入力し、パラメータを出力させる。推論部132は、算出対象画像データを撮像した撮像装置の撮像装置IDと、撮像装置IDに関連付けられた算出対象画像データに基づいて出力されたパラメータと、を関連付けたパラメータテーブルを記憶部12に記憶させる。
【0048】
図5は、記憶部12が記憶するパラメータテーブルのデータ構造の一例を示す図である。
図5に示すパラメータテーブルは、少なくとも「撮像装置ID」、「焦点距離」及び「「歪係数」を有する。
【0049】
取得部131は、補正対象画像データと、補正対象画像データを撮像した撮像装置の撮像装置IDと、を関連付けて取得する。一例として、撮像装置IDは、補正対象画像データに関連付けられたメタデータに含まれる。
【0050】
補正部134は、補正対象画像データを撮像した撮像装置の撮像装置IDにパラメータテーブルにおいて対応する撮像装置IDに関連付けられたパラメータに基づいて、補正対象画像データを補正する。補正部134は、記憶部12が記憶するパラメータテーブルを参照し、補正対象画像に関連付けられた撮像装置IDに対応するパラメータを特定する。補正部134は、特定したパラメータに基づいて、補正対象画像データを補正する処理をする。
【0051】
情報処理装置1が補正対象画像データを撮像した撮像装置について算出されたパラメータを用いて画像を補正するよう構成されることで、同種の装置であっても個々に異なるパラメータに基づいて撮像された画像を補正することができる。特に、大量の同種の撮像装置それぞれが撮像した画像を補正する際に、撮像装置ごとのバラつきに起因する画像の歪を補正する精度を向上させることができる。
【0052】
[情報処理装置1における処理の流れ]
図6は、情報処理装置1における処理の流れを示すフローチャートである。
図6に示すフローチャートは、学習済みモデルMの学習が完了し、算出対象画像データを受付けることが可能になった時点から開始している。
【0053】
取得部131は、算出対象画像データを取得する(S01)。推論部132は、算出対象画像データを学習済みモデルMに入力し、算出対象画像データを撮像した撮像装置のパラメータを出力させる(S02)。
【0054】
取得部131は、補正対象画像データを取得する(S03)。補正部134は、補正対象画像データを撮像した撮像装置のパラメータを特定する(S04)。補正部134は、特定したパラメータに基づいて補正対象画像データを補正する(S05)。そして情報処理装置1は処理を終了する。
【0055】
[情報処理装置1による効果]
以上説明したように、複数の構造が異なるニューラルネットワークにより特徴量を抽出するよう構成された学習済みモデルにより光学系のパラメータを推論することにより、情報処理装置1は、カメラの光学系のパラメータを推論する精度を向上させることができる。
【0056】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0057】
1 情報処理装置
2 情報端末
11 通信部
12 記憶部
13 制御部
131 取得部
132 推論部
133 表示制御部
134 補正部
【要約】
【課題】カメラの光学系のパラメータを推論する精度を向上させる。
【解決手段】算出対象画像データを取得する取得部131と、(1)算出対象画像データを入力として、算出対象画像データが示す画像の特徴量である第1の特徴量を出力する第1のニューラルネットワークNAと、(2)算出対象画像データを入力として、算出対象画像データが示す画像の特徴量である第2の特徴量を出力する第2のニューラルネットワークNBと、(3)第1の特徴量及び第2の特徴量を入力として、算出対象画像データを撮像した撮像装置の光学系のパラメータを出力する出力ネットワークNCと、を有する学習済みモデルを記憶する記憶部12と、算出対象画像データを学習済みモデルに入力し、算出対象画像データに対応するパラメータを出力させる推論部132と、を有する情報処理装置1である。
【選択図】
図4