(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-17
(45)【発行日】2024-12-25
(54)【発明の名称】プログラム、情報処理方法、情報処理装置、及び機械学習モデル生成方法
(51)【国際特許分類】
G06T 3/40 20240101AFI20241218BHJP
G06T 7/00 20170101ALI20241218BHJP
G06T 11/80 20060101ALI20241218BHJP
【FI】
G06T3/40
G06T7/00 350B
G06T11/80 A
(21)【出願番号】P 2020186044
(22)【出願日】2020-11-06
【審査請求日】2023-11-06
(73)【特許権者】
【識別番号】509070463
【氏名又は名称】株式会社コロプラ
(74)【代理人】
【識別番号】110001416
【氏名又は名称】弁理士法人信栄事務所
(72)【発明者】
【氏名】澤木 一晃
【審査官】宮島 潤
(56)【参考文献】
【文献】特開2013-80464(JP,A)
【文献】Mahmut Cakar et al,Creating Cover Photos (Thumbnail) for Movies and TV Series with Convolutional Neural Network,2020 Innovations in Intelligent Systems and Applications Conference (ASYU),米国,IEEE,2020年10月17日,URL,https://ieeexplore.ieee.org/document/9259872
【文献】Perla Sai Raj Kishore et al,User Constrained Thumbnail Generation Using Adaptive Convolutions,ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP),米国,IEEE,2019年05月17日,https://ieeexplore.ieee.org/document/8683761
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00 - 1/40
G06T 3/00 - 5/50
G06T 9/00 - 9/40
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
G06T 11/60 - 13/80
G06T 17/05
G06T 19/00 - 19/20
(57)【特許請求の範囲】
【請求項1】
コンピュータにおいて実行されるプログラムであって、
前記コンピュータには、キー画像、前記キー画像に配置される付加要素、及び前記キー画像のサイズ変更を含む加工に関する加工条件を入力とし、前記キー画像に対して、前記付加要素の配置及びサイズ変更を含む加工を実行することで得られるサムネイル画像を出力するように学習された機械学習モデルが記憶されており、
前記プログラムは、前記コンピュータに、
新たに前記キー画像、
前記付加要素、及び
前記加工条
件を、他の装置または前記コンピュータの記憶部から取得するステップと、
新たに取得された前記キー画像、前記付加要素及び前記加工条件を前記機械学習モデル
に入力して、新たにサムネイル画像を出力するステップと、
を実行させ
、
前記出力するステップは、複数種類のサムネイル画像を出力するステップであり、
前記プログラムは、前記コンピュータに、さらに、
ユーザの選択操作に応じて、前記複数種類のサムネイル画像のうち1以上のサムネイル画像を選択するステップと、
前記取得するステップにおいて取得された前記キー画像、前記付加要素及び前記加工条件と、前記選択するステップにおいて選択された前記サムネイル画像と、を学習データとして再学習を行うことにより、前記機械学習モデルのパラメータを更新するステップと、を実行させる、
プログラム。
【請求項2】
前記取得するステップにおいて取得される前記付加要素として、
前記キー画像に配置されるロゴ画像及びテキストデータのうちの1以上が含まれる、
請求項
1に記載のプログラム。
【請求項3】
前記取得するステップにおいて取得される前記加工条件として、
さらに、前記キー画像における前記付加要素の
配置位置に関する条件、及び前記付加要素の配色に関する条件のうちの1以上が含まれる、
請求項1
又は請求項
2に記載のプログラム。
【請求項4】
前記配色に関する条件として、
前記付加要素の色と、前記キー画像における前記付加要素の配置位置の周辺の色
との組み合わせの可否を規定した第1配色条件が含まれ、
前記付加要素
の色が、前記キー画像における前記付加要素の
配置位置の周囲の色と、前記第1配色条件とに基づいて決定される、
請求項
3に記載のプログラム。
【請求項5】
前記配色に関する条件として、
前記キー画像の
ジャンルに応じた1以上の候補色を規定した第2配色条件が含まれ、
前記付加要素の配色が、
前記ジャンルに応じた1以上の前記候補色の中から決定される、
請求項
3又は請求項
4に記載のプログラム。
【請求項6】
前記取得するステップにおいて取得される前記加工条件として、加工後の画像サイズに関する条件が含まれる、
請求項1から請求項
5のいずれか一項に記載のプログラム。
【請求項7】
前記出力するステップは、
前記キー画像のサイズが前記画像サイズに関する条件を満たすサイズよりも大きい場合、前記画像サイズに関する条件を満たすように、前記キー画像のリサイズ、
及びトリミング
のうちのいずれか1つを実行し、前記キー画像のサイズが前記画像サイズに関する条件を満たすサイズ以下の場合、前記画像サイズに関する条件を満たすように、前記キー画像の前記画像サイズに関する条件を満たすサイズ
の画像への貼り付
けを実行することを含む、
請求項
6に記載のプログラム。
【請求項8】
コンピュータにおいて実行される情報処理方法であって、
前記コンピュータには、キー画像、前記キー画像に配置される付加要素、及び前記キー画像のサイズ変更を含む加工に関する加工条件を入力とし、前記キー画像に対して、前記付加要素の配置及びサイズ変更を含む加工を実行することで得られるサムネイル画像を出力するように学習された機械学習モデルが記憶されており、
前記情報処理方法は、前記コンピュータに、
新たに前記キー画像と、
前記付加要素
、及び
前記加工条件とを
、他の装置または前記コンピュータの記憶部から取得するステップと、
新たに取得された前記キー画像、前記付加要素及び前記加工条件を前記機械学習モデル
に入力して、新たにサムネイル画像を出力するステップと、
を実行さ
せ、
前記出力するステップは、複数種類のサムネイル画像を出力するステップであり、
前記情報処理方法は、前記コンピュータに、さらに、
ユーザの選択操作に応じて、前記複数種類のサムネイル画像のうち1以上のサムネイル画像を選択するステップと、
前記取得するステップにおいて取得された前記キー画像、前記付加要素及び前記加工条件と、前記選択するステップにおいて選択された前記サムネイル画像と、を学習データとして再学習を行うことにより、前記機械学習モデルのパラメータを更新するステップと、を実行させる、
情報処理方法。
【請求項9】
コンピュータにおいて実行される
機械学習モデル生成方法であって、
前記
機械学習モデル生成方法は、前記コンピュータに、
キー画像
、前記キー画像に配置される付加要素
、及び
前記キー画像のサイズ変更を含む加工に関する加工条
件を入力とし、該キー画像に
対して、該付加要素
の配置及びサイズ変更を含む加工
を実行することで得られ
たサムネイル画像を出力とした教師データを用いて機械学習モデルを生成するステップ
と、
新たに前記キー画像、前記付加要素、及び前記加工条件を、他の装置または前記コンピュータの記憶部から取得するステップと、
新たに取得された前記キー画像、前記付加要素及び前記加工条件を前記機械学習モデルに入力して、新たにサムネイル画像を出力するステップと、
を実行させることを含
み、
前記出力するステップは、複数種類のサムネイル画像を出力するステップであり、
前記機械学習モデル生成方法は、前記コンピュータに、さらに、
ユーザの選択操作に応じて、前記複数種類のサムネイル画像のうち1以上のサムネイル画像を選択するステップと、
前記取得するステップにおいて取得された前記キー画像、前記付加要素及び前記加工条件と、前記選択するステップにおいて選択された前記サムネイル画像と、を学習データとして再学習を行うことにより、前記機械学習モデルのパラメータを更新するステップと、を実行させる、
機械学習モデル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、プログラム、情報処理方法、情報処理装置、及び機械学習モデル生成方法に関する。
【背景技術】
【0002】
近年、多種多様な動画配信サービスが出現してきている。これらの動画配信サービスでは、利用者が動画を選択する際の参考として、サムネイルと呼ばれる画像を表示することが一般的である。特許文献1には、コンピュータによって、動画に含まれるシーンの中からサムネイルとして適したシーン(フレーム)を自動で抽出する方法が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、サムネイルには、その動画のタイトル等を示すロゴや、その動画のキャッチコピー等を示すテキスト情報が付加されることが多い。また、サムネイルは、動画配信サービス毎に規定(例えば、画像サイズや、ロゴやテキストの配置ルールなど)が異なることも多い。よって、1の動画を複数の動画配信サービスで提供しようとする場合、それぞれの動画配信サービスの規定に沿って、動画配信サービス毎にサムネイルを作成しなくてはならない。しかし、特許文献1に記載の方法は、動画からサムネイルに適したフレームを抽出するだけのものであり、ロゴ等が付加されたサムネイルを作成可能なものではなかった。また、特許文献1に記載の方法は、動画配信サービス毎の規定を満たすようにサムネイルを作成可能なものでもなかった。
【0005】
近年では、動画配信サービス毎に規定が異なることに加えて、動画配信サービスによっては、1の動画に対して複数の異なるサムネイルを要求することもある。これらの理由から、サムネイル作成者の負担は大きく、サムネイル作成に要するコストも大きくなっている。例えば、サムネイル作成をコンテンツホルダー側で行う場合、動画配信サービスの運営者に動画を提供するために必要なコストが、当該動画を提供することで得られる予想収益を上回ることもあり、当該動画の提供を断念しなくてはならないという状況も生じていた。
【0006】
なお、サムネイル作成に関する負担は、動画配信サービスに限ったことではなく、音楽配信サービスや、インターネット上で提供される他のサービスでも同様である。例えば、EC(Electronic Commerce)サイトにおいても、サイト毎にサムネイルの規定が定められていることが多い。よって、複数のECサイトに自己の商品を展開しようとする場合、サムネイル作成者の負担は大きくなる。
【0007】
本開示の一態様は、サムネイル作成に関する負担を軽減させることが可能なプログラム、情報処理方法、情報処理装置、及び機械学習モデル生成方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示に示す一実施形態によれば、
プロセッサを備えたコンピュータにおいて実行されるプログラムであって、
前記プログラムは、前記プロセッサに、
第1コンテンツに関連する1以上のキー画像、前記キー画像に付加するための1以上の付加要素、及び前記キー画像の加工に関する1以上の加工条件のうちの少なくとも1以上を取得するステップと、
機械学習モデルを用いて、前記キー画像に前記付加要素を付加すること及び前記キー画像を前記加工条件に従って加工することのうちの少なくとも一方を実行することで得られる1以上のサムネイル画像を出力するステップと、
を実行させるプログラム、が提供される。
【発明の効果】
【0009】
本開示に示す一実施形態よれば、サムネイル作成に関する負担を軽減させることが可能である。
【図面の簡単な説明】
【0010】
【
図1】ある実施の形態に従うコンピュータの動作の概要を示す模式図である。
【
図2】ある実施の形態に従うコンピュータの機能的な構成の一例を示すブロック図である。
【
図3】ある実施の形態に従うコンピュータによる処理の一例を示すフローチャートである。
【
図4】ある実施の形態に従うキー画像への付加要素の付加の一例を示す模式図である。
【
図5】ある実施の形態に従う第1配色マスタテーブルの一例である。
【
図6】ある実施の形態に従う第2配色マスタテーブルの一例である。
【
図7】ある実施の形態に従うキー画像のサイズ変更の例を示す模式図である。
【
図8】ある実施の形態に従う機械学習モデルの更新方法の一例を示す模式図である。
【発明を実施するための形態】
【0011】
以下、この技術的思想の実施の形態について図面を参照しながら詳細に説明する。以下の説明では、同一の部品等には同一の符号を付してある。それらの名称及び機能も同じである。したがって、それらについての詳細な説明は繰り返さない。本開示において示される1以上の実施形態において、各実施形態が含む要素を互いに組み合わせることができ、かつ、当該組み合わせられた結果物も本開示が示す実施形態の一部をなすものとする。
【0012】
(動作の概要)
図1は、本実施形態に係るコンピュータ10の動作の概要を示す模式図である。
図1に示すように、コンピュータ10に対して、1以上のキー画像110、並びに、1以上の付加要素120及び/又は1以上の加工条件130を入力すると、コンピュータ10は、コンピュータ10に記憶された学習済みモデル(機械学習モデル)42を用いて、1以上のサムネイル画像150を出力する。これらの動作は、コンピュータ10の制御部(プロセッサ)50によってなされる。
【0013】
コンピュータ10は、携帯型の情報処理装置であってもよいし、設置型の情報処理装置であってもよい。コンピュータ10は、例えば、スマートフォン、ファブレット、タブレット、PC(Personal Computer)、サーバ装置などであり得る。なお、制御部50や学習済みモデル42等のコンピュータ10に含まれる各種構成については、後の段落で詳述する。
【0014】
キー画像110は、第1コンテンツに関連する画像である。ここで、「コンテンツ」とは、例えば、動画配信サービスや音楽配信サービス、ECサイト等のインターネット上で提供される他のサービス(以下、「各種サービス」とも称する)において、サムネイル画像150を伴って各種サービスの利用者に提示され得るもののことをいう。「コンテンツ」の具体例としては、動画や音楽、ECサイトで販売される商品等が挙げられる。
【0015】
「コンテンツ」が動画である場合において、キー画像110は、例えば、動画のワンシーンを静止画とした画像や、宣伝用に撮影された画像であり得る。「コンテンツ」が音楽である場合において、キー画像110は、例えば、ディスクジャケット用に撮影された画像や、アーティストの画像であり得る。「コンテンツ」がECサイトで販売される商品である場合において、キー画像110は、例えば、その商品を撮像した画像であり得る。
【0016】
付加要素120は、キー画像110に付加するための要素である。付加要素120は、例えば、第1コンテンツに関連するロゴ画像及び/又はテキストデータであり得る。加工条件130は、キー画像110の加工に関する条件である。加工条件130は、例えば、キー画像110における付加要素120の付加位置に関する条件、付加要素120の配色に関する条件、及び加工後の画像サイズに関する条件の少なくとも1以上を含み得る。加工条件130は、後述の加工条件テーブル43を参照して取得されてもよい。
【0017】
サムネイル画像150は、キー画像110に付加要素120を付加する、及び/又は、キー画像110を加工条件130に従って加工することで得られる画像である。サムネイル画像150は、例えば、各種サービスにおいて、サムネイルとして利用され得る。
【0018】
(コンピュータの構成)
図2は、本実施形態に係るコンピュータ10の機能的な構成の一例を示すブロック図である。
図2に示すように、コンピュータ10は、通信IF(Interface)20と、入出力IF30と、記憶部(ストレージ、メモリ)40と、制御部50と、を備え、これらが通信バスを介して互いに接続されている。
【0019】
通信IF20は、例えばLAN(Local Area Network)規格など各種の通信規格に対応しており、通信ネットワーク90を介して外部の通信機器とデータを送受信するためのインタフェースとして機能する。
【0020】
入出力IF30は、コンピュータ10への情報の入力を受け付けるとともに、コンピュータ10の外部へ情報を出力するためのインタフェースとして機能する。入出力IF30は、例えば、マウス、キーボード等の情報入力機器の接続を受け付ける部位と、画像等を表示するためのディスプレイ等の情報出力機器の接続を受け付ける部位と、を含む。
【0021】
記憶部40は、制御部50が読み込んで実行するための各種プログラム及びデータを記憶するストレージである。また、記憶部40は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリを含んでおり、制御部50が処理を行う際に一時的に使用するための作業領域を提供する。
【0022】
ある局面において、記憶部40は、プログラム41と、学習済みモデル42と、加工条件テーブル43と、を記憶する。プログラム41は、制御部50に後述の各機能を発揮させるためのプログラムである。
【0023】
学習済みモデル42は、1以上のキー画像110、並びに、1以上の付加要素120及び/又は1以上の加工条件130を入力すると、1以上のサムネイル画像150を出力する機械学習モデルである。学習済みモデル42は、例えば、入力層、中間層、及び出力層を備えたニューラルネットワークに機械学習させることにより生成される。学習済みモデル42は、いわゆるディープラーニングの手法を用いて生成された、複数の中間層を備えたものであることが好ましい。
【0024】
学習済みモデル42は、例えば、ニューラルネットワークに対して、いわゆる教師あり学習の手法を適用することで生成できる。この場合、例えば、所定のコンテンツに関連するキー画像と所定の付加要素及び/又は所定の加工条件とを入力とし、該キー画像に該付加要素を付加する及び/又は該キー画像を該加工条件に従って加工することで得られた所定のサムネイル画像を出力(教師ラベル)とした教師データを用いることができる。すなわち、教師データは、過去に作成された複数のサムネイル画像、及び、該サムネイル画像の元となったキー画像や付加要素等を対応付けたデータであってよい。
【0025】
なお、学習済みモデル42の生成方法は、教師あり学習に限定されるわけではなく、公知の他の手法を用いてもよい。学習済みモデル42は、例えば、いわゆる教師なし学習の手法を適用することで生成してもよい。この場合、例えば、過去に作成された複数のサムネイル画像を訓練データとして用いることができる。教師なし学習としては、例えば、GAN(Generative Adversarial Networks)等の公知の手法を採用できる。
【0026】
記憶部40に記憶された学習済みモデル42は、コンピュータ10によって生成されたモデルでもよいし、プロセッサを備えた他のコンピュータによって生成されたモデルであってもよい。
【0027】
加工条件テーブル43は、加工条件130を規定したテーブルである。加工条件テーブル43は、例えば、後述の第1配色マスタテーブル501や第2配色マスタテーブル601を含み得る。また、加工条件テーブル43は、付加要素120の付加位置に関する条件や、加工後の画像サイズに関する条件を規定したテーブルを含み得る。また、加工条件テーブル43は、各種サービスにおいて要求されているサムネイルの条件を規定したテーブルを含んでいてもよい。
【0028】
制御部50は、記憶部40に記憶されるプログラム41等を読み込んで実行することにより、コンピュータ10の動作を制御する。制御部50は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)等を含んで構成される。
【0029】
制御部50は、プログラム41を実行することにより、取得部51、出力部52、操作入力受付部53、選択部54、及び更新部55としての機能を発揮する。
【0030】
取得部51は、第1コンテンツに関連する1以上のキー画像110と、キー画像110に付加するための1以上の付加要素120及び/又はキー画像110の加工に関する1以上の加工条件130と、を取得する。取得部51は、キー画像110、付加要素120、及び加工条件130のそれぞれを複数種類取得してもよい。
【0031】
ある局面において、取得部51は、加工条件130を外部から取得せずに、加工条件テーブル43を参照して、キー画像110の加工条件130を取得してもよい。また、ある局面において、取得部51は、外部から取得した情報に基づいて、加工条件テーブル43を参照して、キー画像110の加工条件130を取得してもよい。具体的には、取得部51は、各種サービスのうちのいずれか示す情報を外部から取得し、加工条件テーブル43から当該情報が示すサービスに適用される加工条件130を取得してもよい。
【0032】
出力部52は、学習済みモデル42を用いて、キー画像110に付加要素120を付加する、及び/又は、キー画像110を加工条件130に従って加工することで得られる1以上のサムネイル画像150を出力する。
【0033】
出力部50は、1又は複数のキー画像110に基づいて、複数種類のサムネイル画像150をサムネイルの候補として出力することが好ましい。出力部52は、例えば、所定の表示装置にサムネイル画像150を出力してもよいし、記憶部40をサムネイル画像150の出力先としてもよい。
【0034】
操作入力受付部53は、コンピュータ10のユーザによる操作入力を受け付ける。操作入力受付部53は、例えば、マウスやキーボード、タッチスクリーン等の入力装置に対してなされたユーザの操作を判別し、制御部50への指示として受け付ける。
【0035】
選択部54は、操作入力受付部53が受け付けたユーザの操作入力に応じて、出力部52が出力した複数種類のサムネイル画像150のうち、1以上のサムネイル画像150を選択する。
【0036】
更新部55は、取得部51によって取得されたキー画像110、並びに、付加要素120及び/又は加工条件130と、選択部54によって選択されたサムネイル画像150とに基づいて、学習済みモデル42のパラメータを更新する。更新部55によるパラメータの更新については、後の段落で詳述する。
【0037】
(動作処理)
次に、
図3を参照して、コンピュータ10における動作処理について説明する。以下では、第1コンテンツが動画配信サービスで提供される動画である場合を例に挙げて説明をするが、本開示はこれに限定されるものではない。
【0038】
図3は、コンピュータ10による処理の一例を示すフローチャートである。本明細書で説明するフローチャートを構成する各処理の順序は、処理内容に矛盾や不整合が生じない範囲で順不同であり、並列的に実行されてもよい。
【0039】
まず、ステップS10において、制御部50は、キー画像110と、付加要素120及び加工条件130のうちの少なくとも一方と、を取得する。以降では、付加要素120及び加工条件130の両方を取得した場合について説明をする。
【0040】
ステップS10において、キー画像110等は、例えば、ユーザの操作入力等に応じて、コンピュータ10と通信接続された他のコンピュータや、コンピュータ10と接続されたUSBメモリ等の記憶媒体、コンピュータ10の記憶部40等から取得される。
【0041】
次に、ステップS20において、制御部50は、学習済みモデル42を用いて、キー画像110における付加要素120の付加位置を決定する。加工条件130に付加位置に関する条件が含まれている場合、ステップS20では、該条件に従って付加位置が決定される。
【0042】
次に、ステップS30において、制御部50は、学習済みモデル42を用いて、付加要素120の配色やサイズ等を決定する。加工条件130に配色に関する条件が含まれている場合、ステップS30では、該条件に従って配色が決定される。付加要素120がテキストデータである場合等は、ステップS30において、書体の決定をしてもよい。また、ステップS30では、付加要素120に所定の模様を付してもよい。
【0043】
次に、ステップS40において、制御部50は、学習済みモデル42を用いて、キー画像110の画像サイズを変更する。ステップS40において、画像サイズは、予め設定された画像サイズになるように変更してもよいし、加工条件130に含まれる画像サイズに関する条件に従って変更してもよい。画像サイズに関する条件は、一の画像サイズを規定するものでもよいし、許容される画像サイズの範囲を規定するものでもよい。
【0044】
画像サイズの変更方法としては、特に制限はされないが、例えば、拡大や縮小によるリサイズ、画像の不要な部分を取り除くトリミング、画像サイズに関する条件を満たすサイズの所定の画像へキー画像110を貼り付けること等が挙げられる。
【0045】
ステップS20~S40の一連の処理は繰り返し実行され、複数種類のサムネイル画像150が作成される。なお、ステップS20~S40の各処理は、ステップS10において制御部50が取得した内容次第で省略され得る。例えば、ステップS10において付加要素120が取得されていない場合、ステップS20~S30は実行されない。同様に、ステップS10において取得したキー画像110が画像サイズに関する条件を満たしている等の場合、ステップS40の処理は実行されなくてもよい。
【0046】
次に、ステップS50において、制御部50は、ステップS10~S40の処理を経て作成された、ユーザの選択の候補となる複数種類のサムネイル画像150を出力する。
【0047】
次に、ステップS60において、制御部50は、候補として提示された複数種類のサムネイル画像150のうちから1以上のサムネイル画像を、ユーザの選択操作に応じて選択する。
【0048】
次に、ステップS70において、制御部50は、ステップS60における選択結果に基づいて、学習済みモデル42のパラメータを更新し、終了する。ステップS70の処理は、ステップS60が実行される毎に実行されてもよいし、ステップS60が複数回実行されて複数のサムネイル画像が選択された後の所定のタイミングで実行されてもよい。
【0049】
次に、
図4から
図8を用いて、
図3のフローチャートに示された各処理について詳述する。
図4は、ステップS20及びS30の処理についての具体例を示す図であり、キー画像110への付加要素120の付加の一例を示す模式図である。
【0050】
図4の例において、キー画像110は、第1コンテンツの出演者である被写体Mを含む画像である。また、付加要素120は、第1コンテンツのタイトルである「ABCDEF」をロゴ化したロゴ画像である。
【0051】
図4の中央は、ステップS20の処理を示している。制御部50は、学習済みモデル42を用いて、付加要素120を付加する位置Pを決定する。加工条件130として付加位置に関する条件が規定されている場合、該条件に従って位置Pが決定される。
【0052】
付加位置に関する条件としては、特に制限はされず、例えば、付加位置として適切な位置や領域(例えば、被写体Mの背景の位置、被写体Mと付加要素120の重複率が所定の割合以下となる位置、キー画像110における上部又は下部等の所定の領域など)を規定するものであってもよいし、付加位置として不適切な位置や領域(例えば、被写体Mの顔等の特定の部位と重複する位置、被写体Mと付加要素120の重複率が所定の割合以上となる位置、キー画像110における中央部等の所定の領域など)を規定するものであってもよい。
【0053】
図4の右側は、ステップS20及びS30によって加工された加工後のキー画像140を示している。加工後のキー画像140において、付加要素120のサイズは、必要に応じて、位置Pに併せて変更されている。また、加工後のキー画像140において、付加要素120には、学習済みモデル42を用いて決定された配色がなされている。付加要素120への配色は、付加要素120の全ての部位を同一色にするものでもよいし、付加要素120の部位毎(例えば、文字毎)に色を決定するものでもよい。なお、ステップS40の処理がなされない場合、加工後のキー画像140は、サムネイル画像150になる。
【0054】
加工条件130として配色に関する条件が規定されている場合、該条件に従って配色が決定される。配色に関する条件としては、特に制限はされず、例えば、
図5に示すような色の組み合わせの可否を規定したものでもよいし、
図6に示すような第1コンテンツの種類に応じた1以上の候補色を規定したものでもよいし、これらの条件を組み合わせたものでもよい。
【0055】
図5は、本実施形態に係る第1配色マスタテーブル501を示している。第1配色マスタテーブル501は、色の組み合わせの可否を規定したものである。第1配色マスタテーブル501には、付加要素120の配色503と、キー画像110における付加要素120の付加位置の周囲の色502と、の組み合わせの可否が規定されている。
【0056】
第1配色マスタテーブル501において、「〇」は組み合わせ可であり、「×」は組み合わせ不可を示している。
図5の例では、周囲の色502が色ID「001」で示される色である場合、色ID「001~002」で示される色は配色503として選択できず、色ID「003~005」で示される色は配色503として選択できる。例えば、
図4の右側に示されたロゴ画像(付加要素120)における文字「A」の周囲の色502が色ID「001」で示される色である場合、文字「A」の配色503は、色ID「001~002」で示される色とはなりえない。
【0057】
図6は、本実施形態に係る第2配色マスタテーブル601を示している。第2配色マスタテーブル601は、第1コンテンツの種類に応じた1以上の候補色を規定したものである。第2配色マスタテーブル601には、コンテンツの種類602に応じた候補色である付加要素120の配色603が規定されている。なお、コンテンツの種類とは、コンテンツを所定の分類基準に従って分類したものであり、例えば、サスペンス、コメディ、ロマンス等のコンテンツのジャンルである。
【0058】
第2配色マスタテーブル601において、「〇」は選択可であり、「×」は選択不可を示している。
図6の例では、コンテンツの種類602がジャンルID「001」で示されるジャンルである場合、色ID「001~003」で示される色は配色603として選択できるが、色ID「004~005」で示される色は配色603として選択できない。
【0059】
図7は、ステップS40の処理についての具体例を示す図であり、加工後のキー画像140のサイズ変更の例を示す模式図である。
図7の(a)は、加工後のキー画像140を縮小してリサイズすることで、サムネイル画像150aを作成した状態を示している。
【0060】
図7の(b)は、加工後のキー画像140の左端をトリミングしてサムネイル画像150bを作成した状態を示している。
図7の(c)は、画像サイズに関する条件を満たすサイズの所定の画像へ加工後のキー画像140を貼り付けることで、サムネイル画像150cを作成した状態を示している。上記の所定の画像は、サムネイル画像150cと同サイズの画像である。また、上記の所定の画像は、加工後のキー画像140の背景と同一の色や同一のパターンを付された画像である。
【0061】
画像サイズの変更に関し、
図7の(a)~(c)のいずれの手法を採用するかは、加工後のキー画像140のサイズや、画像サイズに関する条件に応じて、学習済みモデル42が判断する。
【0062】
図8は、ステップS70の処理を詳述するための図であり、学習済みモデル42の更新方法の一例を示す模式図である。
図8の例は、ステップS50において3種類のサムネイル画像150d~150fが出力され、ステップS60においてサムネイル画像150dが選択された場合を示している。
【0063】
この場合、ステップS70では、例えば、サムネイル画像150dに基づいて、学習済みモデル42に含まれる入力層、中間層、及び出力層に含まれる各ノード間の重みパラメータを更新し、最適化を行う。最適化の手法は、特に制限はされず、公知の手法を適宜採用できる。なお、
図8の例では、中間層が3層になっているが、中間層の層数はこれに限定されない。
【0064】
以上、本開示に係る実施形態について詳細に説明したが、本発明の趣旨に反しない限り、コンピュータ10の制御部50が実行していた処理の一部を他のコンピュータの制御部が担当してもよく、コンピュータ10の記憶部40に記憶されていると説明したデータの少なくとも一部を他のコンピュータの記憶部に記憶させてもよい。すなわち、本開示に係るプログラムや情報処理方法は、いわゆるサーバークライアント型(クラウド型を含む)のシステムにおいて実行されてもよい。
【0065】
また、上記の実施形態は、本発明の理解を容易にするための例示に過ぎず、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良することができると共に、本発明にはその均等物が含まれることは言うまでもない。
【0066】
[付記事項]
本開示の内容を列記すると以下の通りである。
【0067】
(項目1)
プロセッサを備えたコンピュータにおいて実行されるプログラムであって、
前記プログラムは、前記プロセッサに、
第1コンテンツに関連する1以上のキー画像、前記キー画像に付加するための1以上の付加要素、及び前記キー画像の加工に関する1以上の加工条件のうちの少なくとも1以上を取得するステップと、
機械学習モデルを用いて、前記キー画像に前記付加要素を付加すること及び前記キー画像を前記加工条件に従って加工することのうちの少なくとも一方を実行することで得られる1以上のサムネイル画像を出力するステップと、
を実行させるプログラム。
この構成によれば、サムネイル作成に関する負担を軽減させることが可能にある。
【0068】
(項目2)
前記機械学習モデルは、所定のコンテンツに関連するキー画像と所定の付加要素、所定の加工条件、又は、前記キー画像と前記所定の付加要素と前記所定の加工条件を入力とし、該キー画像に該付加要素を付加すること及び該キー画像を該加工条件に従って加工することのうちの少なくとも一方を実行することで得られた所定のサムネイル画像を出力とした教師データを用いて学習させたものであり、
前記出力するステップは、複数のサムネイル画像を出力するステップであり、
前記プログラムは、前記プロセッサに、さらに、
ユーザの選択操作に応じて、前記複数のサムネイル画像のうち1以上のサムネイル画像を選択するステップと、
前記取得するステップにおいて取得された前記キー画像ならびに前記付加要素及び/又は前記加工条件と、前記選択するステップにおいて選択された前記サムネイル画像とに基づいて、前記機械学習モデルのパラメータを更新するステップと、を実行させる、
項目1に記載のプログラム。
この構成によれば、例えば、ユーザの好み等を機械学習モデルに反映させることができる。結果として、そのユーザが求めるサムネイル画像が出力され易くなる。
【0069】
(項目3)
前記取得するステップにおいて取得される前記付加要素として、前記第1コンテンツに関連するロゴ画像及びテキストデータのうちの1以上が含まれる、
項目1又は項目2に記載のプログラム。
この構成によれば、例えば、キー画像にロゴやテキストを付加したサムネイル画像を簡単に作成することが可能になる。
【0070】
(項目4)
前記取得するステップは、前記キー画像、前記付加要素、及び前記加工条件を取得するステップであり、
前記取得するステップにおいて取得される前記加工条件として、前記キー画像における前記付加要素の付加位置に関する条件、及び前記付加要素の配色に関する条件のうちの1以上が含まれる、
項目1から項目3のいずれか一項に記載のプログラム。
この構成によれば、例えば、付加要素を適切な位置に配置したり、付加要素に適切な配色をしたりすることが容易になる。結果として、種々の規定に沿ったサムネイル画像を得ることが容易になる。
【0071】
(項目5)
前記配色に関する条件として、色の組み合わせの可否を規定した第1配色条件が含まれ、
前記付加要素の配色が、前記キー画像における前記付加要素の付加位置の周囲の色と、前記第1配色条件とに基づいて決定される、
項目4に記載のプログラム。
この構成によれば、例えば、キー画像における付加要素の付加位置の周囲の色と、付加要素の色とが似たような色になってしまい、かつ、サムネイル画像を見る者にとって付加要素が判別しにくい、というような配色がされることを防止できる。また、例えば、付加要素が判別しやすいような配色にすることも可能になる。
【0072】
(項目6)
前記配色に関する条件として、前記第1コンテンツの種類に応じた1以上の候補色を規定した第2配色条件が含まれ、
前記付加要素の配色が、前記第1コンテンツの種類に応じた1以上の前記候補色の中から決定される、
項目4又は項目5に記載のプログラム。
この構成によれば、例えば、付加要素の配色をコンテンツの雰囲気に適したものにすることができる。結果として、例えば、サムネイル画像を見る者にとって違和感のないサムネイル画像を作成することが可能になる。
【0073】
(項目7)
前記取得するステップにおいて取得される前記加工条件として、加工後の画像サイズに関する条件が含まれる、
項目1から項目6のいずれか一項に記載のプログラム。
この構成によれば、例えば、求められている画像サイズに応じたサムネイル画像を作成することが可能になる。
【0074】
(項目8)
前記出力するステップは、前記画像サイズに関する条件を満たすように、前記キー画像のリサイズ、トリミング、及び前記画像サイズに関する条件を満たすサイズの所定の画像への貼り付けのうちのいずれか1以上を実行することを含む、
項目7に記載のプログラム。
この構成によれば、例えば、求められている画像サイズに応じたサムネイル画像を作成することが容易になる。
【0075】
(項目9)
プロセッサを備えたコンピュータにおいて実行される情報処理方法であって、
前記情報処理方法は、前記プロセッサに、
第1コンテンツに関連する1以上のキー画像と、前記キー画像に付加するための1以上の付加要素及び/又は前記キー画像の加工に関する1以上の加工条件とを取得するステップと、
機械学習モデルを用いて、前記キー画像に前記付加要素を付加する及び/又は前記キー画像を前記加工条件に従って加工することで得られる1以上のサムネイル画像を出力するステップと、
を実行させることを含む、情報処理方法。
この構成によれば、サムネイル作成に関する負担を軽減させることが可能である。
【0076】
(項目10)
プロセッサを備えた情報処理装置であって、
前記プロセッサは、
第1コンテンツに関連する1以上のキー画像と、前記キー画像に付加するための1以上の付加要素及び/又は前記キー画像の加工に関する1以上の加工条件とを取得し、
機械学習モデルを用いて、前記キー画像に前記付加要素を付加する及び/又は前記キー画像を前記加工条件に従って加工することで得られる1以上のサムネイル画像を出力する、
情報処理装置。
この構成によれば、サムネイル作成に関する負担を軽減させることが可能である。
【0077】
(項目11)
プロセッサを備えたコンピュータにおいて実行される機械学習モデル生成方法であって、
前記機械学習モデル生成方法は、前記プロセッサに、
所定のコンテンツに関連するキー画像と所定の付加要素及び/又は所定の加工条件とを入力とし、該キー画像に該付加要素を付加する及び/又は該キー画像を該加工条件に従って加工することで得られた所定のサムネイル画像を出力とした教師データを用いて機械学習モデルを生成するステップ
を実行させることを含む、機械学習モデル生成方法。
この構成によれば、サムネイル作成に関する負担の軽減に資する機械学習モデルを生成することが可能である。
【符号の説明】
【0078】
10:コンピュータ、20:通信IF、30:入出力IF、40:記憶部(ストレージ、メモリ)、42:学習済みモデル(機械学習モデル)、50:制御部(プロセッサ)、90:通信ネットワーク、110:キー画像、120:付加要素、130:加工条件、140:加工後のキー画像、150(150a~150f):サムネイル画像