(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-04
(45)【発行日】2023-04-12
(54)【発明の名称】HDRイメージ生成装置および方法
(51)【国際特許分類】
G06T 5/00 20060101AFI20230405BHJP
G06T 7/00 20170101ALI20230405BHJP
【FI】
G06T5/00 740
G06T7/00 350C
(21)【出願番号】P 2022001194
(22)【出願日】2022-01-06
【審査請求日】2022-01-06
(31)【優先権主張番号】10-2021-0001617
(32)【優先日】2021-01-06
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】515131404
【氏名又は名称】アジュ ユニバーシティー インダストリー-アカデミック コーオペレイション ファウンデーション
【氏名又は名称原語表記】AJOU UNIVERSITY INDUSTRY-ACADEMIC COOPERATION FOUNDATION
(74)【代理人】
【識別番号】100137095
【氏名又は名称】江部 武史
(74)【代理人】
【識別番号】100091627
【氏名又は名称】朝比 一夫
(72)【発明者】
【氏名】ミュン フン スンウ
(72)【発明者】
【氏名】ビョン デ リ
【審査官】板垣 有紀
(56)【参考文献】
【文献】森脇 健太 他,GANを用いた単一画像からのハイダイナミックレンジ画像の生成,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM),日本,情報処理学会,2018年10月31日,pp. 1-8
【文献】ENDO, Yuki et al.,Deep reverse tone mapping,2017 ACM Transactions on Graphics,米国,ACM,2017年11月,Vol. 36, No. 6, Article 177,<URL:https://www.researchgate.net/publication/321231998>,[検索日:2023年2月28日]
(58)【調査した分野】(Int.Cl.,DB名)
G06T 5/00
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成するステップと、
第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するステップと、を含み、
前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、
前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、
前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習されるHDRイメージ生成方法。
【請求項2】
前記第1イメージおよび前記第2イメージを生成するステップは、
前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成するステップと、
前記マスクを用いて前記原本イメージをマスキング(Masking)して前記第1イメージを生成するステップと、
前記第1イメージの明るさを反転させて前記第2イメージを生成するステップと、を含む請求項1に記載のHDRイメージ生成方法。
【請求項3】
前記マスクを生成するステップは、下記式1を用いて前記マスクを生成する請求項2に記載のHDRイメージ生成方法。
[式1]
(このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値)
【請求項4】
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定される請求項3に記載のHDRイメージ生成方法。
【請求項5】
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、
前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含む請求項1に記載のHDRイメージ生成方法。
【請求項6】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項1に記載のHDRイメージ生成方法。
【請求項7】
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含む請求項1に記載のHDRイメージ生成方法。
【請求項8】
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1イメージについての第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、
前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2イメージについての第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習される請求項7に記載のHDRイメージ生成方法。
【請求項9】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項7に記載のHDRイメージ生成方法。
【請求項10】
原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成する入力イメージ生成部と、
第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するHDRイメージ生成部と、を含み、
前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、
前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、
前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習されるHDRイメージ生成装置。
【請求項11】
前記入力イメージ生成部は、
前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、前記マスクで前記原本イメージをマスキング(Masking)して前記第1イメージを生成し、前記第1イメージの明るさを反転させて前記第2イメージを生成する請求項10に記載のHDRイメージ生成装置。
【請求項12】
前記入力イメージ生成部は、下記式1を用いて前記マスクを生成する請求項11に記載のHDRイメージ生成装置。
[式1]
(このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値)
【請求項13】
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定される請求項12に記載のHDRイメージ生成装置。
【請求項14】
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、
前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含む請求項10に記載のHDRイメージ生成装置。
【請求項15】
前記第3神経網は、第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項10に記載のHDRイメージ生成装置。
【請求項16】
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含む請求項10に記載のHDRイメージ生成装置。
【請求項17】
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、
前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習される請求項16に記載のHDRイメージ生成装置。
【請求項18】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習される請求項16に記載のHDRイメージ生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
開示される実施形態は、HDRイメージを生成するための技術に関する。
【背景技術】
【0002】
HDR(High Dynamic Range)は、人が目で見ることを最大限に近く再現するためにイメージの最も明るい所から最も暗い所まで明るさの範囲を拡張する技術である。しかし、HDRイメージを生成するためには、HDR専用機器で撮影をしなければならないという限界が存在する。このような限界を克服するために一部においては、単一LDR(Low Dynamic Range)イメージでHDRイメージを具現しようとする試みが多数行われていた。その中で代表的な方法として、同じ場面を互いに異なる露出で撮影し、撮影された複数のLDRイメージを併合してHDRイメージを生成する方法が紹介される。しかし、このような方法は、複雑なパラメータが必要であり、互いに異なる露出で撮影したイメージは、原本イメージの情報の一部が欠落する問題点が存在する。
【0003】
このような問題を解決するために、最近は、ディープラーニング(Deep Learning)を用いてHDRイメージを生成する方法が活発に研究されている。HDRイメージ生成技術の最近の研究動向によると、LDRイメージ1枚をディープラーニングネットワークに入力してHDRイメージを作る方式、ディープラーニングを介して互いに異なる露出値を有するLDRイメージを生成した後、これを併合してHDRを具現する方式、End to End方式でディープラーニングネットワークのみを用いてLDRイメージをHDRイメージとして具現する方式などのディープラーニングを介してLDRイメージをHDRイメージとして生成する方法が脚光を浴びている。
【0004】
しかし、ディープラーニングを用いてHDRイメージを生成する技術も、生成されたHDRイメージの明るさの値の範囲が均一でないという問題を持っている。したがって、ディープラーニングを用いてHDRイメージを生成する技術に関連する従来技術が存在するにもかかわらず、依然として改善された方式のHDRイメージ生成方法が必要となる。
【0005】
しかし、ディープラーニングを用いてHDRイメージを生成する技術も、生成されたHDRイメージの明るさの値の範囲が均一でないという問題を持っている。
【先行技術文献】
【特許文献】
【0006】
【文献】韓国登録特許公報第10-11926490号
【発明の概要】
【発明が解決しようとする課題】
【0007】
開示される実施形態は、HDRイメージを生成するための装置および方法を提供するためのものである。
【課題を解決するための手段】
【0008】
一実施形態によるHDRイメージ生成方法は、原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成するステップと、第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するステップと、を含み、前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習される。
【0009】
前記第1イメージおよび前記第2イメージを生成するステップは、前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成するステップと、前記マスクを用いて前記原本イメージをマスキング(Masking)して前記第1イメージを生成するステップと、前記第1イメージの明るさを反転させて前記第2イメージを生成するステップと、を含み得る。
【0010】
前記マスクを生成するステップは、下記式1を用いて前記マスクを生成し得る。
[式1]
【0011】
【0012】
このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、各ピクセルの明るさの値に基づいて決定されたしきい値である。
【0013】
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定され得る。
【0014】
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
【0015】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
【0016】
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含み得る。
【0017】
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1イメージについての第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2イメージについての第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習され得る。
【0018】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
【0019】
一実施形態によるHDRイメージ生成装置は、原本イメージに含まれた各ピクセルの明るさの値に基づいて前記原本イメージにおいて前記明るさの値が特定値以上の領域を含む第1イメージおよび前記原本イメージにおいて前記特定値以上の領域を除いた残りの領域を含む第2イメージを生成する入力イメージ生成部と、第1神経網、第2神経網および第3神経網を含む事前学習されたモデルを用いて前記第1イメージおよび前記第2イメージから前記原本イメージのダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成するHDRイメージ生成部と、を含み、前記第1神経網は、前記第1イメージに基づいて明るさの値が増加される方向に前記第1イメージの明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され、前記第2神経網は、前記第2イメージに基づいて明るさの値を減少する方向に前記第2イメージの明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され、前記第3神経網は、前記第3イメージおよび前記第4イメージに基づいて前記HDRイメージを生成するように事前学習される。
【0020】
前記入力イメージ生成部は、前記各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、前記マスクで前記原本イメージをマスキング(Masking)して前記第1イメージを生成し、前記第1イメージの明るさを反転させて前記第2イメージを生成し得る。
【0021】
前記入力イメージ生成部は、下記式1を用いて前記マスクを生成し得る。
[式1]
【0022】
【0023】
このとき、P(i、j)は、原本イメージの(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値である。
【0024】
前記しきい値は、前記各ピクセルの明るさの平均値に基づいて設定され得る。
【0025】
前記第1神経網は、前記第1イメージにコンボルーション(Convolution)演算を行い、前記第1イメージについての第1特徴ベクトルを出力する第1コンボルーション層(Convolution Layer)および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み、前記第2神経網は、前記第2イメージにコンボルーション演算を行い、前記第2イメージについての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
【0026】
前記第3神経網は、第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記抽出された第3特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
【0027】
前記事前学習されたモデルは、前記原本イメージについてのサブサンプリング(Sub-Sampling)を行い、前記原本イメージについての特徴ベクトルを生成するように事前学習された第4神経網をさらに含み得る。
【0028】
前記第1神経網は、前記第1イメージについての第1特徴ベクトルを抽出し、前記第1特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第3イメージを生成するように事前学習され、前記第2神経網は、前記第2イメージについての第2特徴ベクトルを抽出し、前記第2特徴ベクトルおよび前記原本イメージについての特徴ベクトルに基づいて前記第4イメージを生成するように事前学習され得る。
【0029】
前記第3神経網は、前記第3イメージおよび前記第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、前記第3特徴ベクトルと前記原本イメージについての特徴ベクトルに基づいて前記HDRイメージを生成するように事前学習され得る。
【発明の効果】
【0030】
開示される実施形態によると、別個に学習された神経網を用いて原本イメージのうち、明るい領域はより明るく、暗い領域はより暗くなるように生成されたイメージに基づいてHDRイメージを生成し得るため、従来技術と比較して明るさの値の範囲が均等に拡張されたHDRイメージを生成し得る。
【図面の簡単な説明】
【0031】
【
図1】一実施形態によるHDRイメージ生成装置を説明するためのブロック図。
【0032】
【
図2】一実施形態による入力イメージ生成部によって第1イメージおよび第2イメージが生成される過程を説明するための図面。
【0033】
【
図3】一実施形態による事前学習されたモデルの構造を説明するための図面。
【0034】
【
図4】一実施形態によるHDRイメージ生成方法を説明するための流れ図(フローチャート)。
【0035】
【
図5】一実施形態によるコンピューティング装置を含むコンピューティング環境を例示して説明するためのブロック図。
【発明を実施するための形態】
【0036】
以下、図面を参照して一実施形態の具体的な実施形態を説明する。以下の詳細な説明は、本明細書における記述された方法、装置および/またはシステムについての包括的な理解を助けるために提供される。しかし、これは例示に過ぎず、本発明はこれに限定されない。
【0037】
一実施形態を説明するにおいて、本発明に係る公知技術についての具体的な説明が一実施形態の要旨を不必要に曖昧にすることができると判断される場合には、その詳細な説明を省略する。そして、後述される用語は、本発明における機能を考慮して定義された用語として、これは使用者、運用者の意図または慣例などによって変わることができる。したがって、その定義は、本明細書の全般にわたる内容に基づいてなされるべきである。詳細な説明で使用される用語は、単に一実施形態を記述するためのものであり、決して限定的ではならない。明確に他に使用されない限り、単数形態の表現は、複数形態の意味を含む。本説明において、「含み」または「備え」のような表現は、ある特性、数字、ステップ、動作、要素、これらの一部または組み合せを示すためのものであり、記述されたもの以外に1つまたはそれ以上の他の特性、数字、ステップ、動作、要素、これらの一部または組み合せの存在または可能性を排除するように解釈されてはならない。
【0038】
図1は、一実施形態によるHDRイメージ生成装置100を説明するためのブロック図である。
【0039】
図1を参照すると、一実施形態によるHDRイメージ生成装置100は、入力イメージ生成部110およびHDRイメージ生成部120を含む。
【0040】
以下の実施形態において、各構成は、以下に記述されたもの以外に異なる機能および能力を有し得、以下に記述されていないもの以外にも追加の構成を含み得る。
【0041】
また、以下の実施形態において、入力イメージ生成部110およびHDRイメージ生成部120は、物理的に区分された1つ以上の装置を用いて具現されるか、または1つ以上のプロセッサまたは1つ以上のプロセッサおよびソフトウェアの結合によって具現でき、図示された例とは異なり、具体的動作において明確に区分されないことがある。
【0042】
入力イメージ生成部110は、原本イメージ201に含まれた各ピクセルの明るさの値に基づいて原本イメージ201において明るさの値が特定値以上の領域を含む第1イメージ203および原本イメージ201において特定値以上の領域を除いた残りの領域を含む第2イメージ205を生成する。
【0043】
図2は、一実施形態による入力イメージ生成部110によって第1イメージ203および第2イメージ205が生成される過程を説明するための図面である。
【0044】
図2を参照すると、一実施形態による入力イメージ生成部110は、原本イメージ201をマスキング(Masking)して第1イメージ203および第2イメージ205を生成し得る。
【0045】
一実施形態によるHDRイメージ生成装置100は、原本イメージ201のうち、明るい領域は第1神経網310に、原本イメージ201のうち、暗い領域は第2神経網320に用い得る。
【0046】
すなわち、HDRイメージ生成装置100は、HDRイメージを生成する前に原本イメージ201のうち、相対的に明るい領域と暗い領域を先決的に区分する必要がある。
【0047】
したがって、一実施形態による入力イメージ生成部110は、
図2のように、原本イメージ201のうち、明るい領域と暗い領域を区分するための方法としてマスキング技法を用い得る。
【0048】
具体的に、一実施形態による入力イメージ生成部110は、原本イメージ201の各ピクセルの明るさの値に基づいてマスク(Mask)を生成し、マスクで原本イメージ201をマスキングして第1イメージ203を生成し、第1イメージ203の明るさを反転させて前記第2イメージ205を生成し得る。
【0049】
但し、一実施形態による入力イメージ生成部110が算出されたマスクを用いて第1イメージ203を生成し得る。
【0050】
これを考慮すると、入力イメージ生成部110は、同じ概念で(1-マスク)で原本イメージ201をマスキングし、原本イメージ201のうち、相対的に暗い領域である第2イメージ205を生成し得る。
【0051】
一実施形態によると、このときのマスクは、下記式1を用いて生成され得る。
[式1]
【0052】
【0053】
このとき、P(i、j)は、原本イメージ201の(i、j)ピクセルに対応する明るさの値、スレショルド(Threshold)は、前記各ピクセルの明るさの値に基づいて決定されたしきい値を示す。
【0054】
一実施形態によると、入力イメージ生成部110は、原本イメージ201の特性を考慮して第1イメージ203および第2イメージ205を生成するために、マスクのしきい値は、原本イメージ201の各ピクセルの明るさの平均値に基づいて設定され得る。
【0055】
具体的に、しきい値は、原本イメージ201の各ピクセルの明るさの平均値と事前設定されたパラメータ値を加えて調節できる。
【0056】
一方、一実施形態による入力イメージ生成部110は、イメージ分割に係る従来技術に比べ、算出されたマスクを用いて柔らかな境界を有する第1イメージ203および第2イメージ205を生成し得る。
【0057】
図3は、一実施形態による事前学習されたモデル300の構造を説明するための図面である。
【0058】
事前学習されたモデル300は、第1神経網310、第2神経網320および第3神経網330を含む。
【0059】
但し、
図3のように、一実施形態による事前学習されたモデル300は、第1神経網310、第2神経網320、第3神経網330および第4神経網340を含み得る。
【0060】
一方、HDRイメージ生成部120は、事前学習されたモデル300を用いてHDRイメージを生成する。
【0061】
具体的に、HDRイメージ生成部120は、第1神経網310、第2神経網320および第3神経網330を含む事前学習されたモデル300を用いて第1イメージ203および第2イメージ205から原本イメージ201のダイナミックレンジ(Dynamic Range)を拡張させたHDR(High Dynamic Range)イメージを生成する。
【0062】
このとき、第1神経網310は、第1イメージ203に基づいて明るさの値が増加される方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習される。
【0063】
第2神経網320は、第2イメージ205に基づいて明るさの値を減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習される。
【0064】
第3神経網330は、第3イメージおよび前記第4イメージに基づいてHDRイメージを生成するように事前学習される。
【0065】
一実施形態によると、第3神経網330は、第3イメージおよび第4イメージを合成した第5イメージから第3特徴ベクトルを抽出し、抽出された第3特徴ベクトルに基づいてHDRイメージを生成するように学習され得る。
【0066】
一実施形態によると、第4神経網340は、原本イメージ201についてのサブサンプリング(Sub-Sampling)を行い、原本イメージ201についての特徴ベクトルを生成するように事前学習され得る。
【0067】
具体的に、第1神経網310は、第1イメージ203についての第1特徴ベクトルを抽出し、第1イメージ203についての第1特徴ベクトルおよび原本イメージ201についての特徴ベクトルに基づいて第3イメージを生成し得る。
【0068】
第2神経網320は、第2イメージ205についての第2特徴ベクトルを抽出し、第2イメージ205についての第2特徴ベクトルおよび原本イメージ201についての特徴ベクトルに基づいて第4イメージを生成するように事前学習され得る。
【0069】
すなわち、第1神経網310および第2神経網320は、原本イメージ201についての特徴ベクトルを考慮して第3イメージおよび第4イメージを生成するように事前学習され得る。
【0070】
これにより、第1神経網310および第2神経網320は、出力された第3イメージおよび第4イメージに原本イメージ201の特性が欠落することを防止できる。
【0071】
また、一実施形態によると、第1神経網310は、第1イメージ203にコンボルーション演算を行い、前記第1イメージ203についての第1特徴ベクトルを出力する第1コンボルーション層および前記第1特徴ベクトルについての最大プーリング(Max Pooling)を行う第1プーリング層(Pooling Layer)を含み得る。
【0072】
一実施形態によると、第2神経網320は、第2イメージ205にコンボルーション演算を行い、前記第2イメージ205についての第2特徴ベクトルを出力する第2コンボルーション層および前記第2特徴ベクトルについての最小プーリング(Min Pooling)を行う第2プーリング層を含み得る。
【0073】
すなわち、第1神経網310は、第1コンボルーション層を介して第1特徴ベクトルを出力し、出力された第1特徴ベクトルの元素値に最大プーリングを行う第1プーリング層によって第1イメージ203の明るさの値が増加する方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習され得る。
【0074】
同様に、第2神経網320は、第2コンボルーション層を介して第2特徴ベクトルを出力し、出力された第2特徴ベクトルの元素値の間に最小プーリングを行う第2プーリング層を介して第2イメージ205の明るさの値が減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習され得る。
【0075】
すなわち、一実施形態によるHDRイメージ生成部120は、従来技術に比べ、明るさの範囲がより広いHDRイメージを生成するために、第1神経網310を介して原本イメージ201のうち、明るい領域の明るさの値が増加される方向に明るさの範囲が拡張された第3イメージと原本イメージ201のうち、暗い領域の明るさの値が減少される方向に明るさの範囲が拡張された第4イメージに基づいてHDRイメージを生成し得る。
【0076】
ここで、第1イメージ203と第2イメージ205の明るさの範囲が拡張されるということは、第1イメージ203の明るい部分はより明るく、第2イメージ205の暗い部分はより暗く変化することを意味し得る。
【0077】
図4は、一実施形態によるHDRイメージ生成方法を説明するための流れ図(フローチャート)である。
【0078】
図4に示された方法は、
図1に示されたHDRイメージ生成装置100によって行われ得る。
【0079】
図4を参照すると、HDRイメージ生成装置100は、原本イメージ201に含まれた各ピクセルの明るさの値に基づいて原本イメージ201において明るさの値が特定値以上の領域を含む第1イメージ203および原本イメージ201において特定値以上の領域を除いた残りの領域を含む第2イメージ205を生成する(ステップ410)。
【0080】
以後、HDRイメージ生成装置100は、第1神経網310、第2神経網320および第3神経網330を含む事前学習されたモデル300を用いて第1イメージ203および第2イメージ205から前記原本イメージ201のダイナミックレンジを拡張させたHDRイメージを生成する(ステップ420)。
【0081】
このとき、第1神経網310は、第1イメージ203に基づいて明るさの値が増加される方向に第1イメージ203の明るさの値の範囲を拡張させた第3イメージを出力するように事前学習される。
【0082】
第2神経網320は、第2イメージ205に基づいて明るさの値を減少する方向に第2イメージ205の明るさの値の範囲を拡張させた第4イメージを出力するように事前学習される。
【0083】
第3神経網330は、第3イメージおよび第4イメージに基づいてHDRイメージを生成するように事前学習される。
【0084】
前記示された
図4においては、前記方法を複数のステップに分けて記載しているが、少なくとも一部のステップは、順序を変えて行われるか、他のステップと結合されて一緒に行われるか、省略されるか、詳細ステップに分けて行われるか、または図示されていない1つ以上のステップが付加されて行われ得る。
【0085】
図5は、一実施形態によると、コンピューティング装置12を含むコンピューティング環境10を例示して説明するためのブロック図である。図示された実施形態において、各コンポーネントは、以下に記述されるものに加えて異なる機能および能力を有し得、以下に記述されないものに加えて追加のコンポーネントを含み得る。
【0086】
図示されたコンピューティング環境10は、コンピューティング装置12を含む。一実施形態において、コンピューティング装置12は、HDRイメージ生成装置100に含まれた1つ以上のコンポーネントであり得る。
【0087】
コンピューティング装置12は、少なくとも1つのプロセッサ14、コンピュータ読み取り可能な格納媒体16および通信バス18を含む。プロセッサ14は、コンピューティング装置12をして前述した例示的な実施形態によって動作させることができる。例えば、プロセッサ14は、コンピュータ読み取り可能な格納媒体16に格納された1つ以上のプログラムを実行し得る。前記1つ以上のプログラムは、1つ以上のコンピュータ実行可能な命令語を含み得、前記コンピュータ実行可能な命令語は、プロセッサ14によって実行される場合、コンピューティング装置12をして例示的な実施形態による動作を実行させるように構成できる。
【0088】
コンピュータ読み取り可能な格納媒体16は、コンピュータ実行可能な命令語ないしプログラムコード、プログラムデータおよび/または他の適した形態の情報を格納するように構成される。コンピュータ読み取り可能な格納媒体16に格納されたプログラム20は、プロセッサ14によって実行可能な命令語の集合を含む。一実施形態において、コンピュータ読み取り可能な格納媒体16は、メモリ(ランダムアクセスメモリのような揮発性メモリ、不揮発性メモリ、またはこれらの適切な組み合せ)、1つ以上の磁気ディスク格納デバイス、光学ディスク格納デバイス、フラッシュメモリデバイス、その他、コンピューティング装置12によってアクセスされ、欲しい情報を格納できる他の形態の格納媒体、またはこれらの適した組み合せであり得る。
【0089】
通信バス18は、プロセッサ14、コンピュータ読み取り可能な格納媒体16を含み、コンピューティング装置12の他の様々なコンポーネントを相互接続する。
【0090】
コンピューティング装置12は、また1つ以上の入出力装置24のためのインターフェースを提供する1つ以上の入出力インターフェース22および1つ以上のネットワーク通信インターフェース26を含み得る。入出力インターフェース22およびネットワーク通信インターフェース26は、通信バス18に接続される。入出力装置24は、入出力インターフェース22を介してコンピューティング装置12の他のコンポーネントに接続され得る。例示的な入出力装置24は、ポインティング装置(マウスまたはトラックパッドなど)、キーボード、タッチ入力装置(タッチパッドまたはタッチスクリーンなど)、音声または音入力装置、様々な種類のセンサー装置および/または撮影装置のような入力装置、および/またはディスプレー装置、プリンター、スピーカーおよび/またはネットワークカードのような出力装置を含み得る。例示的な入出力装置24は、コンピューティング装置12を構成する一コンポーネントとしてコンピューティング装置12の内部に含まれ得、コンピューティング装置12とは区別される別の装置としてコンピューティング装置12と接続され得る。
【0091】
以上、代表的な実施形態により、本発明について具体的に説明したが、本発明が属する技術分野における通常の知識を有する者は、前述した実施形態について本発明の範疇から逸脱しない範囲内で様々な変形が可能であることを理解するであろう。したがって、本発明の権利の範囲は、説明された実施形態に限定されて定められてはならず、後述する特許請求の範囲だけでなく、この特許請求の範囲と均等なものなどによって定められるべきである。
【符号の説明】
【0092】
10:コンピューティング環境
12:コンピューティング装置
14:プロセッサ
16:コンピュータ読み取り可能な格納媒体
18:通信バス
20:プログラム
22:入出力インターフェース
24:入出力装置
26:ネットワーク通信インターフェース
100:HDRイメージ生成装置
110:入力イメージ生成部
120:HDRイメージ生成部
201:原本イメージ
203:第1イメージ
205:第2イメージ
300:事前学習されたモデル
310:第1神経網
320:第2神経網
330:第3神経網
340:第4神経網