(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-28
(45)【発行日】2023-08-07
(54)【発明の名称】抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置
(51)【国際特許分類】
G06T 13/20 20110101AFI20230731BHJP
H04N 5/222 20060101ALI20230731BHJP
【FI】
G06T13/20
H04N5/222
(21)【出願番号】P 2021067008
(22)【出願日】2021-04-12
【審査請求日】2022-10-19
【新規性喪失の例外の表示】特許法第30条第2項適用 (1)ウェブサイトの掲載アドレス https://tech.morikatron.ai/entry/2020/05/13/100000 掲載日 令和2年5月13日 (2)ウェブサイトの掲載アドレス https://tech.morikatron.ai/entry/2020/06/01/100000 掲載日 令和2年5月13日
【早期審査対象出願】
(73)【特許権者】
【識別番号】519174207
【氏名又は名称】モリカトロン株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】銭 起揚
【審査官】粕谷 満成
(56)【参考文献】
【文献】特開平11-120379(JP,A)
【文献】国際公開第2007/069350(WO,A1)
【文献】坂東 幸浩 他,高フレームレート映像信号に対するフレームレートダウンサンプリング方法の検討,映像情報メディア学会技術報告,日本,(社)映像情報メディア学会,2009年02月04日,Vol.33 No.6,pp.13-17
(58)【調査した分野】(Int.Cl.,DB名)
G06T 13/20
H04N 5/222
(57)【特許請求の範囲】
【請求項1】
コンピュータに、
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、
を実行させ
、
前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
抽出プログラム。
【請求項2】
前記複数フレームのうち、いずれか特定のフレームが間引かれたと仮定した場合に、前記特定のフレームに含まれる前記三次元モデルの動きを、前記特定のフレームの前後の少なくともいずれかに基づいて補間する手順と、
前記特定のフレームにおける前記三次元モデルの動きと、補間された前記三次元モデルの動きとの差分に関する前記評価値を算出する手順と、
をさらに実行させる、
請求項1に記載の抽出プログラム。
【請求項3】
前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる特定の点または領域毎に、線形補間または多項式補間を行うことにより、間引かれた前記特定のフレームにおける前記三次元モデルの動きを補間する、
請求項
2に記載の抽出プログラム。
【請求項4】
前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる特定の領域毎に算出したオプティカルフローを用いて、間引かれた前記特定のフレームにおける前記三次元モデルの動きを補間する、
請求項
2に記載の抽出プログラム。
【請求項5】
前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる同色の領域を、前記特定の領域とする、
請求項
3または
4に記載の抽出プログラム。
【請求項6】
前記評価値を算出する手順において、前記三次元モデルの動きと、補間された前記三次元モデルの動きとの差分の平均二乗誤差を前記評価値として算出する、
請求項
3から
5のいずれか一項に記載の抽出プログラム。
【請求項7】
前記評価値を算出する手順において、前記三次元モデルと、補間された前記三次元モデルとの位置、速度、または面積変化について前記差分の前記平均二乗誤差を算出する、
請求項
6に記載の抽出プログラム。
【請求項8】
前記特徴フレームを抽出する手順において、焼きなまし法を用いて、前記評価値が最小となる前記組み合わせを決定する、
請求項
1から
7のいずれか一項に記載の抽出プログラム。
【請求項9】
前記特徴フレームを抽出する手順において、前記三次元モデルに含まれる特定の点または領域毎に、前記複
数フレームにおける最初のフレームから前記特定のフレームまでの間で、フレーム間の前記評価値を累積し、累積した前記評価値が閾値を超えたフレームまたはその1つ前のフレームを
前記特徴フレームとする、
請求項
2から
5のいずれか一項に記載の抽出プログラム。
【請求項10】
コンピュータに、
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
前記フレーム毎の前記動きデータに基づいて
、前記三次元モデルに含まれる特定の点または領域毎に、前記複
数フレームにおける最初のフレームか
ら特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレーム
として抽出する手順と、
を実行させる、抽出プログラム。
【請求項11】
請求項1から1
0のいずれか一項に記載の抽出プログラムにより抽出された前記特徴フレームに基づいて、動画像を生成する手順を前記コンピュータに実行させる、
画像生成プログラム。
【請求項12】
コンピュータが、
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、
を実行
し、
前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
抽出方法。
【請求項13】
コンピュータが、
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
前記フレーム毎の前記動きデータに基づいて
、前記三次元モデルに含まれる特定の点または領域毎に、前記複
数フレームにおける最初のフレームか
ら特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレーム
として抽出する手順と、
を実行する、抽出方法。
【請求項14】
請求項
12または
13に記載の抽出方法により抽出された前記特徴フレームに基づいて、動画像を生成する、
画像生成方法。
【請求項15】
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、
前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する抽出部と、
を備え
、
前記抽出部は、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
抽出装置。
【請求項16】
複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、
前記フレーム毎の前記動きデータに基づいて
、前記三次元モデルに含まれる特定の点または領域毎に、前記複
数フレームにおける最初のフレームか
ら特定のフレームまでの間で、フレーム間の前記動きの変化量を加算し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレーム
として抽出する抽出部と、
を備える、抽出装置。
【請求項17】
請求項
15または
16に記載の抽出装置により抽出された前記特徴フレームに基づいて、動画像を生成する画像生成部を備える、
画像生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置に関する。
【背景技術】
【0002】
一般的に、動画像は、複数の静止画像で構成される。動画像を構成する各静止画像は、フレームと呼ばれる。複数のフレームに、あるオブジェクトの一連の動きが描かれている場合、複数のフレームを時間の経過に伴って切り替えることで、動画像は、オブジェクトの動きを表現することができる。
【0003】
種々の目的で、動画像を構成する複数のフレームのうちの一部を間引いて新たな動画像を生成することが行われている。特許文献1には、仮想空間上に表現された3Dアニメーションのデータ容量を削減するため、一部のフレームを間引く技術が開示されている。特許文献1に開示された技術では、対象のフレームを直前のキーフレームと比較して、アニメーションデータのボーンの速度値が所定値以上変化した場合にそのフレームがキーフレームとして設定され、その速度値が所定値以上変化していない場合にそのフレームが間引かれる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
3Dアニメーションでは、オブジェクトの滑らかな動きを表現することができる。このような3Dアニメーションにおいて、2Dアニメーションのように、メリハリのある動きを表現したいという要望がある。しかしながら、特許文献1に開示された技術は、オブジェクトにメリハリのある動きを与えるために開発されたものではなく、このような要望に十分に応えることができるものではない。
【0006】
本開示は、3Dアニメーションをメリハリのある2Dアニメーション風に変換することができる抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示の抽出プログラムは、コンピュータに、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、を実行させ、前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
【0008】
本開示の抽出プログラムは、コンピュータに、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、を実行させる。
【0009】
本開示の画像生成プログラムは、上記した抽出プログラムにより抽出された前記特徴フレームに基づいて、動画像を生成する手順を前記コンピュータに実行させる。
【0010】
本開示の抽出方法は、コンピュータが、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、を実行し、前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
【0011】
本開示の抽出方法は、コンピュータが、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、を実行する。
【0012】
本開示の画像生成方法は、上記した抽出方法により抽出された前記特徴フレームに基づいて、動画像を生成する。
【0013】
本開示の抽出装置は、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する抽出部と、を備え、前記抽出部は、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
【0014】
本開示の抽出装置は、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する抽出部と、を備える。
【0015】
本開示の画像生成装置は、上記した抽出装置により抽出された前記特徴フレームに基づいて、動画像を生成する画像生成部を備える。
【発明の効果】
【0016】
本開示によれば、3Dアニメーションをメリハリのある2Dアニメーション風に変換することができる。
【図面の簡単な説明】
【0017】
【
図1】画像生成装置の構成について説明するための図
【
図3】画像生成装置の動作について説明するための図
【
図4】
図3のステップS2における特徴フレームの抽出処理の詳細を示す図
【発明を実施するための形態】
【0018】
以下、本開示の各実施の形態について図面を参照して詳細に説明する。ただし、必要以上に詳細な説明、例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明等は省略する場合がある。また、以下の説明および参照される図面は、当業者が本開示を理解するために提供されるものであって、本開示の請求の範囲を限定するためのものではない。
【0019】
<発明に至る経緯>
3次元モデル(以下、3Dモデルと記載する)を用いたアニメーション(以下、3Dアニメーションと記載する)が普及している。3Dアニメーションは、例えば、現実の人物や物体の動きをデジタルに記録してその動きの通りに3Dモデルを動かしたり、特定のフレーム(キーフレーム)における3Dモデルの位置や形状を指定してキーフレーム間を補間したりすることで生成される。
【0020】
一方、2次元平面上に描かれた絵を用いたアニメーション(以下、2Dアニメーションと記載する)も普及している。2Dアニメーションは、例えば、互いに異なる複数枚の絵を、時間の経過に伴って切り替えることで生成される。
【0021】
一般的な2Dアニメーションは、所定時間内に複数枚の絵、例えば1秒間に24枚の絵が、次々と切り替えられることで生成されている。これらの複数枚の絵は、描かれたオブジェクトの動きを表すため、僅かに異なる箇所が存在する。これらの複数枚の絵は全て異なっていてもよいが、あえて全く同じ絵を連続して用いることで動きにメリハリを付けることができる。このような手法は、コマ打ち等と呼ばれる。複数の絵が全て異なる場合、1コマ打ちと呼ばれ、全く同じ絵が2コマ連続して用いられる場合は2コマ打ち、3コマ連続して用いられる場合は3コマ打ちと呼ばれる。作品全体で同じコマ数のコマ打ちが用いられてもよいし、場面に合わせて異なるコマ数のコマ打ちが用いられることもある。
【0022】
ところで、近年では2Dアニメーション作品が製作される際に、コスト低減や表現力向上のため、3Dモデルが利用される場合がある。例えば2Dアニメーションで複数のキャラクターのダンスシーンを表現しようとした場合、それぞれのコマ(フレーム)における複数のキャラクターのポーズを1つ1つ描くには多大な労力とコストが掛かる。一方、キャラクター毎に3Dモデルを作成しておけば、複数のキャラクターの3Dモデルにそれぞれ指定した動きをさせ、指定した視点からこれらのキャラクターを見た場合の3Dアニメーションを作成することで、比較的容易にダンスシーンを表現することができる。このため、例えば複数のオブジェクトが同じような動きをする場面では、あらかじめ3Dアニメーションを作成し、これをもとに2Dアニメーションを作成する手法が有効である。
【0023】
3Dアニメーションは、一般的に、2Dアニメーションと比較して、動きにメリハリはないが、なめらかな動きを表現する(「ぬるぬる動く」等と形容される)ように製作されることが多い。
【0024】
滑らかな動きを表現する3Dアニメーションを元に、動きにメリハリがある2Dアニメーションを製作したいという要望がある。この要望に応える手法として、3Dアニメーションを構成するフレームのうち、3Dモデルの特徴的な動きを表現するフレームのみを抽出してつなげる手法がある。
【0025】
例えば人間が各フレームにおける3Dモデルの動きを見ながら、特徴的な動きを表現するフレームを抽出する場合、多大な労力と時間とが掛かってしまう。このため、特徴的な動きを表現するフレームを抽出する工程を自動化することが要望されている。
【0026】
自動化の手法の1つの例として、3Dアニメーションが有するフレームから時間的に均一にフレームを抽出する方法がある。しかしながら、均一にフレーム抽出を行った場合、抽出されたフレームをつなげたアニメーションは、メリハリがなく、のっぺりとした動きに見えてしまう可能性が高いだけでなく、特徴的な動きを表現する特定のフレームが含まれない場合があるため、違和感がある動きに見えてしまう可能性がある。
【0027】
このような事情に鑑み、以下では、3Dモデルを含む動画像から特徴的な動きを表現するフレームを自動的に抽出し、つなげることで、視覚的に違和感がなく、かつ動きにメリハリがある動画像を生成することができる画像生成装置1について詳細に説明する。
【0028】
<構成>
図1は、本開示の実施の形態に係る画像生成装置1の構成について説明するための図である。
【0029】
図1に示すように、画像生成装置1は、操作部11と、表示部12と、記憶部13と、通信部14と、制御部2と、を備える。制御部2は、取得部21と、抽出部22と、補間部23と、差分算出部24と、画像生成部25と、を備えている。画像生成装置1は、例えばパーソナルコンピュータ(PC)、ワークステーション、タブレット端末等のコンピュータである。なお、画像生成装置1は、本開示の画像生成装置の一例であり、その一部が、本開示の抽出装置の一例である。
【0030】
操作部11は、キーボード、マウス等の入力デバイスである。なお、操作部11は、表示部12に設けられたタッチパネルで構成されてもよい。
【0031】
表示部12は、液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示デバイスである。
【0032】
記憶部13は、画像生成装置1が行う各種処理に必要な情報や、画像生成装置1が生成した情報や、画像生成装置1の外部から取得した情報等を記憶する記憶デバイスである。記憶部13は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等で構成される。
【0033】
通信部14は、有線通信または無線通信により画像生成装置1の外部と通信を行う通信デバイスである。
【0034】
制御部2は、例えばCPU(Central Proccessing Unit)で構成されており、画像生成装置1の各種処理の制御を行う。
【0035】
取得部21は、例えば通信部14を介して、画像生成装置1の外部から処理対象の第1の動画像を取得する。画像生成装置1の外部とは、例えば3Dアニメーションを生成する他のコンピュータである。本実施の形態において、第1の動画像には、少なくとも1つのオブジェクトが含まれている。なお、本実施の形態では、画像生成装置1に第1の動画像が入力され、画像生成装置1は入力された動画像に基づいて新たな動画像(後述する第2の動画像)を生成する例について説明するが、本開示はこれに限定されない。画像生成装置1には、オブジェクトを含む第1の動画像の代わりに、例えば所定の座標系における、フレーム毎のオブジェクトの座標値が入力されてもよい。または、画像生成装置1には、オブジェクトの位置、速度、各部位が画面において占める領域等、オブジェクトの動きを示す各種のパラメータが入力されてもよい。第1の動画像、所定の座標系における、フレーム毎のオブジェクトの座標値、オブジェクトの位置、速度、各部位が画面において占める領域等、オブジェクトの動きを示す各種のパラメータは、本開示の動きデータの一例である。
【0036】
抽出部22は、複数フレームのそれぞれにおけるオブジェクトの動きを評価する評価値(後述の情報量損失を評価する評価値)に基づいて、オブジェクトの動きを特徴づける特徴フレームを抽出する。本実施の形態において、オブジェクトとは、3Dアニメーションに含まれる3Dモデルである。
【0037】
図2Aおよび
図2Bは、特徴フレームについて説明するための図である。
図2Aは、第1の動画像に含まれるフレーム毎のオブジェクトの軌跡を示したものである。
図2Aでは、1フレーム目(frame 1)から9フレーム目(frame 9)までのオブジェクトの位置がそれぞれ示されている。
【0038】
図2Aに示す例では、1フレーム目から9フレーム目にかけて、オブジェクトは山なりの軌跡を描いて移動している。頂点付近(4フレーム目から6フレーム目)では移動速度が遅くなっており、オブジェクトのフレーム間の移動距離が比較的短いが、オブジェクトが下方に進む(6フレーム目から9フレーム目)につれて移動速度が速く、フレーム間の移動距離が比較的長くなっている。
【0039】
図2Bは、
図2Aに示す複数のフレームから抽出部22が抽出した特徴フレームの例を示す図である。
図2Bに示す例では、1フレーム目、4フレーム目、6フレーム目、および9フレーム目が特徴フレームとして抽出されている。
【0040】
図2Bにおいて特徴フレームとして抽出されているフレームは、オブジェクトの動きを効果的に表現することができるフレームである。1フレーム目は、オブジェクトの動きの始点を表すフレームである。9フレーム目は、オブジェクトの動きの終点を表すフレームである。
図2Aに示すように、オブジェクトは、1フレーム目から4フレーム目まで比較的速く、4フレーム目から6フレーム目まで比較的遅く、6フレーム目から9フレーム目まではさらに速く移動している。このため、
図2Bに示す例では、速度が大きく変化する4フレーム目と6フレーム目が残りの特徴フレームとして抽出されている。
【0041】
そのため、
図2Bにおいて抽出されている特徴フレームのみを用いて新たに動画像を生成した場合、新たに生成された動画像におけるオブジェクトの動きは、人の目に違和感なく映るだけでなく、メリハリのある動きに見えることが期待される。
【0042】
なお、
図2Aおよび
図2Bに示す例では、第1の動画像に登場する1つのオブジェクトについて示した。しかしながら、第1の動画像に複数のオブジェクトが登場する場合、抽出部22は、複数のオブジェクト全て、または画像生成装置1の使用者によって選択されたいずれかのオブジェクト全ての動きを特徴づけるように、特徴フレームを抽出すればよい。抽出部22が特徴フレームを抽出する抽出処理の詳細については、後述する。
【0043】
補間部23は、第1の動画像を構成する複数のフレームのうち、いずれか特定のフレームが間引かれたと仮定した場合に、特定のフレームに含まれるオブジェクトの動きを、特定のフレームの前後の少なくともいずれかに基づいて補間する。なお、オブジェクトの動きとは、オブジェクトに含まれる点または領域の、複数のフレームに亘る位置、速度、面積変化、または形状の変化を意味する。また、特定のフレームは1フレームには限られず、2以上のフレームであってもよい。補間部23が、特定フレームにおけるオブジェクトの動きを補間する補間処理の詳細については、後述する。
【0044】
差分算出部24は、間引かれると仮定した特定のフレームにおけるオブジェクトの動きと、補間部23が生成した補間フレームにおける同じオブジェクトの動きとの差分に関する評価値を算出する。この評価値は、特定のフレームを間引いた時の情報量損失を評価するものである。オブジェクトの動きの差分とは、オブジェクトに含まれる点または領域毎の、補間フレームと特定のフレームとの間の位置、速度、面積変化のいずれかの差分である。差分算出部24が評価値を算出する評価値算出処理の詳細については、後述する。
【0045】
画像生成部25は、抽出部22が抽出した特徴フレームに基づいて、第2の動画像を生成する。第2の動画像のフレームレートは、例えば24fpsである。
【0046】
<動作>
次に、画像生成装置1の動作について説明する。
図3は、画像生成装置1の動作について説明するための図である。
【0047】
図3に示すように、取得部21は、通信部14を介して、画像生成装置1の外部から第1の動画像を取得する(ステップS1)。抽出部22は、第1の動画像を構成する複数のフレームの中から、特徴フレームを抽出する(ステップS2)。画像生成部25は、特徴フレームに基づいて、第2の動画像を生成する(ステップS3)。
【0048】
図4は、
図3のステップS2における特徴フレームの抽出処理の詳細を示す図である。抽出処理において、まず、補間部23は、特定のフレームに含まれるオブジェクトの動きを、特定のフレームの前後の少なくともいずれかに基づいて補間する補間処理を行う(ステップS11)。
【0049】
次に、差分算出部24は、あるフレームが間引かれた場合のオブジェクトの動きと、補間部23が生成した補間フレームを考慮した場合のオブジェクトの動きとの差分に関する評価値を算出する評価値算出処理を行う(ステップS12)。評価値算出処理の詳細については、後述する。上述したように、オブジェクトの動きの差分とは、オブジェクトに含まれる点または領域毎の、補間フレームと特定のフレームとの間の位置、速度、加速度、面積変化のいずれかの差分である。
【0050】
そして、抽出部22は、評価値に基づき、特徴フレームを抽出する(ステップS13)。
【0051】
[補間処理]
図5A、
図5B、および
図6は、補間処理について説明するための図である。
図5Aは、第1の動画像に含まれるオブジェクトの一例として、各フレームにおけるキャラクターの関節点を示している。
図5Bは、
図5Aに示す複数の関節点のうち、一例として左足に相当する関節点の動きを示している。言い換えると、
図5Bは、複数のフレームにおいて関節点が移動する軌跡を示している。
【0052】
図5Bには、5つのフレームにおける関節点J1~J5が示されている。関節点J1~J5は、同じ関節点であるが、フレームが進むにつれオブジェクトが動いているため、フレーム毎に異なる位置にある。関節点J1の位置は、1フレーム目における関節点の位置である。関節点J2の位置は、2フレーム目における関節点の位置である。関節点J3の位置は、3フレーム目における関節点の位置である。関節点J4の位置は、4フレーム目における関節点の位置である。関節点J5の位置は、5フレーム目における関節点の位置である。
【0053】
図5Bにおいて、これらの5フレームのうち、2フレーム目と4フレーム目が間引かれると仮定する。この場合、間引かれた結果残るフレームは、1フレーム目、3フレーム目、および5フレーム目である。補間部23は、間引かれたと仮定された2フレーム目および4フレーム目における関節点の位置を、その前後のいずれかのフレームにおける関節点の位置に基づいて推定する。
【0054】
図5Bに破線で示す関節点JB2、JB4の位置は、補間部23により補間されている。
図5Bに示す例では、補間部23は、前後のフレームの関節点を用いて線形補間によって補間された関節点(前後のフレームの関節点を結ぶ線分の中点)の位置を決定している。すなわち、補間された関節点JB2は、関節点J1とJ3とを結ぶ線上に、関節点JB4は、関節点J3とJ5とを結ぶ線上にある。
【0055】
図5Aおよび
図5Bでは、オブジェクトの関節点の位置を補間する例について説明した。
図6では、オブジェクトの一部を構成する領域の位置を補間する例について説明する。
図6に示される領域は、例えばキャラクターがそれぞれ異なる複数の色の領域によって構成されている場合における、1つの色の領域である。
【0056】
図6には、2つのフレームにおける領域A1、A3が示されている。
図6における領域A1、A3の位置は、同じ領域の異なるフレームにおける位置に対応する。
【0057】
図6では、領域A1に対応するフレームを1フレーム目、領域A3に対応するフレームを3フレーム目として、2フレーム目が間引かれたと仮定したときの、間引かれる前の2フレーム目における領域の位置をオプティカルフロー(変位ベクトル)を用いて推定する様子を示している。
図6における矢印は、各領域の一部の画素におけるオプティカルフローを例示している。実際には、領域に含まれる全ての画素についてオプティカルフローが計算される。領域A1からA3への変位に関するオプティカルフローは、例えば既存のオプティカルフロー予測AI等を用いて算出されればよい。
【0058】
図6に破線で示す領域AB2の位置は、1フレーム目から3フレーム目への領域のオプティカルフローに基づいて、2フレーム目が間引かれたと仮定した場合の領域の位置に対応する。領域AB2の位置は、1フレーム目から3フレーム目への領域のオプティカルフローの中間位置に設定される。これにより、2フレーム目が間引かれた場合の、2フレーム目における領域の位置を補間することができる。
【0059】
なお、補間部23による補間の方法はオプティカルフローを用いた方法には限定されず、例えば各フレームにおける領域の位置矢速度を用いた線形補間、または多項式補間が採用されてもよい。また、
図5A,
図5B,および
図6に示す例では、2次元平面上での動きの補間を行っていたが、入力される第1の動画像が3Dアニメーションである場合は、3次元空間内での動きの補間を行い、その後にレンダリングして2次元平面上での関節点または領域の位置や速度を導出してもよい。
【0060】
補間部23は、上述した補間処理を、第1の動画像に含まれる全てのオブジェクト、または、画像生成装置1の使用者が指定したオブジェクト(1または複数)に対して行う。
【0061】
[評価値算出処理]
図7Aおよび
図7Bは、評価値算出処理について説明するための図である。
図7Aは関節点同士の速度に関する評価値を算出する様子を示しており、
図7Bは領域同士のオプティカルフローに関する評価値を算出する様子を示している。
【0062】
図7Aには、5つのフレームにおける関節点J6~J10が示されている。また、
図7Aには、2フレーム目から4フレーム目が間引かれたと仮定した場合の、補間部23によって補間された関節点JB7,JB8,JB9が示されている。
図7Aの各関節点から延びる矢印は、各関節点の速度ベクトル、すなわち各関節点の速度の向きと大きさを示している。
【0063】
図7Aに一例を示すように、差分算出部24は、フレーム毎に、間引かれていない場合の各関節点の速度v
Ti=(v
xti,v
yti)と、7フレーム目から9フレーム目が間引かれたと仮定した場合の各関節点の速度v
i=(v
xi,v
yi)との差分ε
i=(v
xi―v
xti,v
yi―v
yti)を関節点毎に算出する。iはフレームの順番に対応する。そして、差分算出部24は、処理対象のフレームに含まれるオブジェクトの全ての関節点における速度の平均二乗誤差MSEを以下の式により評価値として算出する。なお、間引かれたと仮定したフレーム以外のフレーム(
図7Aの例では、6フレーム目、および10フレーム目)についても差分を算出する理由は、
図7Aの関節点J6における速度ベクトルを示す矢印のように、後のフレームが間引かれたか否かで速度ベクトルが変化するからである。
【数1】
【0064】
一方、
図7Bには、1フレーム目における領域A4、および、3フレーム目における領域A6が示されている。また、
図7Bには、2フレーム目が間引かれたと仮定した場合の、補間部23によって補間された領域AB5が示されている。
【0065】
このような場合、差分算出部24は、処理対象のフレームに含まれるオブジェクトにおける領域の全ての画素におけるオプティカルフローの平均値に基づいて、上記の式により平均二乗誤差MSEを評価値として算出する。オプティカルフローは変位ベクトルであるため、領域内の全画素の平均値を上記の式の速度vTi=(vxti,vyti)に代入すればよい。
【0066】
なお、上述の説明では、差分算出部24は、フレーム毎に、当該フレームが間引かれていない場合と間引かれたと仮定した場合とについて、オブジェクトの関節点の速度、または領域の全画素におけるオプティカルフローの平均の差分を算出している。しかしながら、本開示はこれには限定されず、例えば差分算出部24は、オブジェクトを構成する画素毎に、速度または位置の差分を算出してもよい。また、差分算出部24は、オブジェクトの画素、関節点、または領域の速度または位置だけでなく、例えば加速度、面積変化または形状の変化についての差分を算出してもよい。
【0067】
また、差分算出部24は、オプティカルフローを用いて回転ベクトルを算出し、回転ベクトルの差分と算出するようにしてもよい。さらに、差分算出部24は、領域におけるオプティカルフローの平均の差分とともに、当該領域の面積の差分を算出するようにしてもよい。この際、アースムーバー距離(Earth Mover's Distance)を用いて領域間の形状を考慮した位置差分を算出するようにしてもよい。
【0068】
また、上述の説明では、単に全ての関節点または全ての領域の平均二乗誤差を評価値とする例について説明した。ここで、関節点または領域ごとに重み付けを行い、平均二乗誤差を算出するようにしてもよい。重み付けの例としては、関節点または領域の面積の大きさやコントラスト等に基づいて行うようにすればよい。
【0069】
また、上述の説明では、差分算出部24は、平均二乗誤差を評価値として算出していたが、他の誤差計算方法を採用してもよい。
【0070】
[特徴フレームの抽出]
抽出部22は、差分算出部24が算出した評価値に基づき、第1の動画像を構成する複数のフレームの中から、画像生成装置1の使用者が指定したフレーム数だけ、オブジェクトの動きを特徴づける特徴フレームを抽出する。
【0071】
具体的には、抽出部22は、第1の動画像がN枚のフレームで構成されており、使用者がここからn枚のフレームを抽出すると指定した場合、N枚のうちどのn枚を抽出したときに残りの(N-n)枚のフレーム分の評価値が最小となるか、という組み合わせ最適化問題を解くことにより、特徴フレームを抽出する。
【0072】
抽出部22が組み合わせ最適化問題を解く手法として、例えば焼きなまし法(シミュレーテッド・アニーリング法)や、累積和法等が挙げられる。
【0073】
焼きなまし法は、値が小さくなる方向へ解の探索を進めていくアルゴリズムにおいて、大きな値から小さな値へ次第に変化する温度変数を導入し、温度変数の大きさに応じて値が大きくなる方向へも探索を進めることで、大域的最適解に辿り着くことを可能とするアルゴリズムである。
【0074】
累積和法とは、対象のフレームまでの、オブジェクトの評価値を計算して加算し、加算した評価値が所定のしきい値を超えているか否かによって近似解を求める手法である。すなわち、累積和法では、最初のフレームから対象のフレームまでの、オブジェクトの全ての関節点または全ての領域の評価値を加算し、加算した評価値が所定のしきい値を超えている場合にその対象フレームの1つ前のフレームを特徴フレームに決定する。それ以降は、特徴フレームの次のフレームを対象フレームとし、0から新たに評価値の加算を行う。なお、0から新たに加算を行うのではなく、累積和と閾値との差分値を初期値として、次フレームの評価値を新たに加算するようにしてもよい。所定のしきい値は、抽出される特徴フレームの数が、画像生成装置1の使用者が指定した数となるように設定されればよい。
【0075】
焼きなまし法を採用した場合、時間はかかるが必ず最適解を得られるという利点がある。一方、累積和法を採用した場合、計算時間は早いが、得られる結果が最適解ではなく、近似解である。したがって、求められる第2の動画像の品質によって、焼きなまし法と累積和法のいずれを採用するかが選択可能であってもよい。また、焼きなまし法と累積和法とを併用することにより、処理時間と品質とのバランスを制御できるようにしてもよい。具体的には、累積和法で得られた結果に対して焼きなまし法を行うことで、結果の最適性を向上させるような手法が考えられる。
【0076】
以上のようにして、抽出部22は、画像生成装置1の使用者が指定した数の特徴フレームを抽出する。このようにして抽出した特徴フレームは、
図2Bに示したように、3Dモデルのメリハリのある動きを表現できるフレームである。
【0077】
なお、抽出部22が特徴フレームを抽出する方法については、上述した方法に限定されない。例えば、人工知能(Artificial Intelligence:AI)を用いて、どのようなフレームが特徴フレームにふさわしいかを学習させることにより、特徴フレームを抽出するようにしてもよい。この場合、補間部23による、間引かれると仮定したフレームにおけるオブジェクトの動きの補間や、差分算出部24による評価値の算出は必要ない。具体的には、複数の動画像と、各動画像から抽出された特徴フレームとを教師データとして学習を行わせることにより、新たに入力した第1の動画像から特徴フレームを抽出するAIを作成してもよい。なお、別途評価値を算出し、算出した評価値をAIの報酬信号に用いることにより、学習を行うようにしてもよい。
【0078】
また、間引かれると仮定したフレームにおけるオブジェクトの動きの補間や、差分算出部24による評価値の算出を行わずに、累積和法を用いて特徴フレームの抽出を行うことも可能である。例えば、オプティカルフロー等を用いてフレーム毎の動きの変化量(加速度等)を算出し、その変化量をフレーム毎に加算して、各フレームの重要性を量的に評価することで、特徴フレームを抽出し、特徴フレーム以外のフレームを間引くようにしてもよい。
【0079】
以上、本発明に係る実施の形態について図面を参照して詳述してきたが、上述した画像生成装置1の各機能は、コンピュータプログラムにより実現され得る。
【0080】
画像生成装置1の各機能を実現するコンピュータは、キーボードやマウス、タッチパッド等の入力装置、ディスプレイやスピーカ等の出力装置、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク装置やSSD(Solid State Drive)等の記憶装置、DVD-ROM(Digital Versatile Disk Read Only Memory)やUSB(Universal Serial Bus)メモリ等の記録媒体から情報を読み取る読取装置、ネットワークを介して通信を行うネットワークカード等を備え、各部はバスにより接続される。
【0081】
そして、読取装置は、上記各装置の機能を実現するためのプログラムを記録した記録媒
体からそのプログラムを読み取り、記憶装置に記憶させる。あるいは、ネットワークカードが、ネットワークに接続されたサーバ装置と通信を行い、サーバ装置からダウンロードした上記各装置の機能を実現するためのプログラムを記憶装置に記憶させる。
【0082】
そして、CPUが、記憶装置に記憶されたプログラムをRAMにコピーし、そのプログラムに含まれる命令をRAMから順次読み出して実行することにより、上記各装置の機能が実現される。
【0083】
<作用、効果>
本開示の画像生成装置によれば、複数フレームで構成されており、所定の三次元モデルの動きを表す3Dアニメーションに基づいて、複数フレームのそれぞれにおける三次元モデルの動きを評価する評価値を算出し、動きを特徴付ける特徴フレームを抽出し、特徴フレームを用いて3Dアニメーションの一部のフレームを間引いて第2の動画像を生成する。
【0084】
すなわち、本開示の画像生成装置では、第2の動画像を、オブジェクトの動きを特徴づける特徴フレームを用いて構成するため、動きにメリハリがある、2Dアニメーション風の動画像とすることができる。
【産業上の利用可能性】
【0085】
本開示は、動画像を生成することができる画像生成装置に有用である。
【符号の説明】
【0086】
1 画像生成装置
11 操作部
12 表示部
13 記憶部
14 通信部
2 制御部
21 取得部
22 抽出部
23 補間部
24 差分算出部
25 画像生成部