IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 大日本印刷株式会社の特許一覧

特許7540196情報処理装置、情報処理方法およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-19
(45)【発行日】2024-08-27
(54)【発明の名称】情報処理装置、情報処理方法およびプログラム
(51)【国際特許分類】
   G06T 11/60 20060101AFI20240820BHJP
   H04N 1/387 20060101ALI20240820BHJP
   G06F 40/114 20200101ALI20240820BHJP
【FI】
G06T11/60 100A
H04N1/387 110
G06F40/114
【請求項の数】 12
(21)【出願番号】P 2020088433
(22)【出願日】2020-05-20
(65)【公開番号】P2021182347
(43)【公開日】2021-11-25
【審査請求日】2023-03-28
(73)【特許権者】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】田中 隆寛
【審査官】益戸 宏
(56)【参考文献】
【文献】特開2014-130453(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 11/60
H04N 1/387
G06F 40/114
(57)【特許請求の範囲】
【請求項1】
複数のテキストコンテンツと複数の画像コンテンツとを含む複数のコンテンツを取得する取得部と、
取得した前記コンテンツを前記コンテンツ同士の関係性に基づいて複数のコンテンツグループに分割する分割部と、
前記コンテンツグループ毎に、所定の領域にレイアウトするレイアウト部とを備え、
前記分割部は、
前記テキストコンテンツを複数のテキストコンテンツグループに分割する第1分割部と、
前記画像コンテンツを複数の画像コンテンツグループに分割する第2分割部と、
分割した前記テキストコンテンツグループと分割した前記画像コンテンツグループとを組み合わせて前記コンテンツグループを生成する生成部とを備える
情報処理装置。
【請求項2】
前記レイアウト部は、複数の前記コンテンツグループのそれぞれを1ページ毎にレイアウトする
請求項1に記載の情報処理装置。
【請求項3】
前記レイアウト部は、複数の前記コンテンツグループのそれぞれを同一の情報媒体の異なる領域にレイアウトする
請求項1に記載の情報処理装置。
【請求項4】
個々の前記テキストコンテンツグループと、個々の前記画像コンテンツグループとの相関を評価する相関評価部を備え、
前記生成部は、相関の高い前記テキストコンテンツグループと前記画像コンテンツグループとを組み合わせて前記コンテンツグループを生成する
請求項1から請求項3のいずれか一つに記載の情報処理装置。
【請求項5】
前記相関評価部は、前記テキストコンテンツグループに含まれる個々の前記テキストコンテンツと、前記画像コンテンツグループに含まれる個々の前記画像コンテンツとの相関値を算出する相関値算出部を備え、
前記相関評価部は、前記テキストコンテンツと前記画像コンテンツとを総当たりで組み合わせて算出したそれぞれの相関値に基づいて前記テキストコンテンツグループと前記画像コンテンツグループとの相関を評価する
請求項4に記載の情報処理装置。
【請求項6】
前記相関値算出部は、前記画像コンテンツから検出された物体を示す単語が前記テキストコンテンツに出現する出現頻度の合計値に基づいて前記相関値を算出する
請求項5に記載の情報処理装置。
【請求項7】
前記相関値算出部は、前記画像コンテンツから検出された物体を示す単語が前記テキストコンテンツに出現する出現頻度と、前記画像コンテンツから検出された前記物体の数との積の合計値に基づいて前記相関値を算出する
請求項5に記載の情報処理装置。
【請求項8】
前記相関値算出部は、前記画像コンテンツから検出された物体が前記画像コンテンツに占める比率と、前記物体を示す単語が前記テキストコンテンツに出現する出現頻度との積の合計値に基づいて前記相関値を算出する
請求項5に記載の情報処理装置。
【請求項9】
前記相関値算出部は、テキストコンテンツと画像コンテンツとを入力した場合に相関値を出力する学習モデルに、取得したテキストコンテンツと取得した画像コンテンツとを入力して、前記学習モデルから出力された相関値を取得する
請求項5に記載の情報処理装置。
【請求項10】
算出した前記相関値に基づいて前記コンテンツをレイアウトする
請求項5から請求項9のいずれか一つに記載の情報処理装置。
【請求項11】
複数のテキストコンテンツと複数の画像コンテンツとを含む複数のコンテンツを取得し、
取得した前記テキストコンテンツを複数のテキストコンテンツグループに分割し、
取得した前記画像コンテンツを複数の画像コンテンツグループに分割し、
分割した前記テキストコンテンツグループと分割した前記画像コンテンツグループとを組み合わせてコンテンツグループを生成し、
前記コンテンツグループ毎に、所定の領域にレイアウトする
処理をコンピュータ実行する情報処理方法。
【請求項12】
複数のテキストコンテンツと複数の画像コンテンツとを含む複数のコンテンツを取得し、
取得した前記テキストコンテンツを複数のテキストコンテンツグループに分割し、
取得した前記画像コンテンツを複数の画像コンテンツグループに分割し、
分割した前記テキストコンテンツグループと分割した前記画像コンテンツグループとを組み合わせてコンテンツグループを生成し、
前記コンテンツグループ毎に、所定の領域にレイアウトする
処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
画像と、画像に関連づけられたテキストとをページ上にレイアウトする編集装置が提案されている(特許文献1)。画像とテキストとの相関値を算出する学習モデルが提案されている(非特許文献1)
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-282365号公報
【非特許文献】
【0004】
【文献】Ying Zhang and Huchuana Lu, Deep Cross-Modal Projection Learning for Image-Text Matching, Computer Vision ECCV 2018 15th European Conference, Munich, Germany, September 8-14, 2018, Proceedings, Part IP707-723
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の編集装置は、あらかじめ用意された1ページ分の画像およびテキストを受け付けてレイアウトする。一つの側面では、複数ページ分のコンテンツを取得して、グループに分けた後にレイアウトする情報処理装置等を提供することを目的とする。
【課題を解決するための手段】
【0006】
情報処理装置は、複数のテキストコンテンツと複数の画像コンテンツとを含む複数のコンテンツを取得する取得部と、取得した前記コンテンツを前記コンテンツ同士の関係性に基づいて複数のコンテンツグループに分割する分割部と、前記コンテンツグループ毎に、所定の領域にレイアウトするレイアウト部とを備え、前記分割部は、前記テキストコンテンツを複数のテキストコンテンツグループに分割する第1分割部と、前記画像コンテンツを複数の画像コンテンツグループに分割する第2分割部と、分割した前記テキストコンテンツグループと分割した前記画像コンテンツグループとを組み合わせて前記コンテンツグループを生成する生成部とを備える。
【発明の効果】
【0007】
一つの側面では、複数ページ分のコンテンツを取得して、グループに分けた後にレイアウトする情報処理装置等を提供できる。
【図面の簡単な説明】
【0008】
図1】編集支援処理の概要を説明する説明図である。
図2】情報処理装置の構成を説明する説明図である。
図3】ページ配分装置が行なう編集支援処理の概要を説明する説明図である。
図4】ページレイアウト装置が行なう編集支援処理の概要を説明する説明図である。
図5】テキストと画像との相関値を算出する方法を説明する説明図である。
図6】テキストと画像との相関値を算出する方法を説明する説明図である。
図7】テキストグループと画像グループとの相関値を算出する方法を説明する説明図である。
図8】テキストグループと画像グループとの相関値を算出する方法の変形例を説明する説明図である。
図9】情報処理装置が表示する画面の例である。
図10】情報処理装置が表示する画面の例である。
図11】プログラムの処理の流れを説明するフローチャートである。
図12】グループ分けのサブルーチンの処理の流れを説明するフローチャートである。
図13】グループ間対応付けのサブルーチンの処理の流れを説明するフローチャートである。
図14】グループ間相関値算出のサブルーチンの処理の流れを説明するフローチャートである。
図15】プログラムの処理の流れを説明するフローチャートである。
図16】実施の形態2の概要を説明する説明図である。
図17】実施の形態2のプログラムの処理の流れを説明するフローチャートである。
図18】実施の形態3のプログラムの処理の流れを説明するフローチャートである。
図19】実施の形態4のテキストグループと画像グループとの関連付けを説明する説明図である。
図20】実施の形態4のテキストグループと画像グループとの関連付けを説明する説明図である。
図21】実施の形態4のテキストグループと画像グループとの関連付けを説明する説明図である。
図22】実施の形態4のプログラムの処理の流れを説明するフローチャートである。
図23】学習モデルを説明する説明図である。
図24】訓練DBのレコードレイアウトを説明する説明図である。
図25】実施の形態5のプログラムの処理の流れを説明するフローチャートである。
図26】実施の形態6のページ配分装置が行なう編集支援処理の概要を説明する説明図である。
図27】実施の形態6のページレイアウト装置が行なう編集支援処理の概要を説明する説明図である。
図28】実施の形態7の情報処理装置の構成を説明する説明図である。
図29】実施の形態8の情報処理装置の機能ブロック図である。
【発明を実施するための形態】
【0009】
[実施の形態1]
図1は、編集支援処理の概要を説明する説明図である。本実施の形態の編集支援処理は、作成済の複数のコンテンツ30を読者が読みやすい状態に配置する編集作業を支援する。本実施の形態においては、数ページにわたる雑誌の特集記事の編集作業を支援する場合を例にして説明する。なお、編集支援処理の対象は雑誌に限定しない。たとえば、書籍、パンフレット、カタログ、新聞、メニューまたはチラシ等、任意の媒体の編集支援処理を行なってもよい。媒体は、紙媒体であっても、電子書籍等のデジタル型の媒体であってもよい。
【0010】
特集記事の素材であるコンテンツ30は、テキストコンテンツ31と画像コンテンツ36とを含む。画像コンテンツ36は、写真であっても、イラストであっても、動画であってもよい。なお、以下の説明では画像コンテンツ36は静止画である場合を例にして説明する。
【0011】
テキストコンテンツ31の代わりに、音声コンテンツが使用されてもよい。テキストコンテンツ31および画像コンテンツ36には、音声データが関連づけられていてもよい。ページ配分装置11は、コンテンツ30全体を受け付けて、1ページ分または見開きページ1組分のページコンテンツ41に配分する。
【0012】
ページコンテンツ41は、コンテンツグループの例示である。ページ配分装置11は、複数のコンテンツ30を複数のコンテンツグループに分割する分割部の例示である。以下の説明においては、1ページ分と見開きページ1組分との双方を単に1ページ分と記載する場合がある。
【0013】
ページ配分装置11が配分したページコンテンツ41は、テキストコンテンツ31とコンテンツ30とを含む。ページレイアウト装置12は、それぞれのページコンテンツ41を受け付けて、読者が読みやすい状態に配置したページレイアウト306を生成する。ページレイアウト装置12は、ページコンテンツ41を所定の領域にレイアウトするレイアウト部の例示である。
【0014】
編集者は、ページ配分装置11が出力したページコンテンツ41を確認し、必要に応じてページ間でのコンテンツ30の入れ替え等の操作を行なう。さらに編集者は、ページレイアウト装置12が出力したページレイアウト306を確認し、必要に応じてコンテンツ30の配置調整およびコンテンツ30自体の修正等の操作を行なう。以上により、特集記事の編集が完了する。
【0015】
図2は、情報処理装置20の構成を説明する説明図である。情報処理装置20は、ページ配分装置11およびページレイアウト装置12を実現するハードウェアである。ページ配分装置11とページレイアウト装置12とは、同一の情報処理装置20で実現されても、別々の情報処理装置20で実現されてもよい。
【0016】
情報処理装置20は、制御部21、主記憶装置22、補助記憶装置23、通信部24、表示部25、入力部26およびバスを備える。制御部21は、本実施の形態のプログラムを実行する演算制御装置である。制御部21には、一または複数のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、TPU(Tensor Processing Unit)またはマルチコアCPU等が使用される。制御部21は、バスを介して情報処理装置20を構成するハードウェア各部と接続されている。
【0017】
主記憶装置22は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等の記憶装置である。主記憶装置22には、制御部21が行なう処理の途中で必要な情報および制御部21で実行中のプログラムが一時的に保存される。
【0018】
補助記憶装置23は、SRAM、フラッシュメモリ、ハードディスクまたは磁気テープ等の記憶装置である。補助記憶装置23には、制御部21に実行させるプログラムおよびプログラムの実行に必要な各種データが保存される。通信部24は、情報処理装置20とネットワークとの間の通信を行なうインターフェイスである。
【0019】
表示部25は、液晶表示パネルまたは有機EL表示パネル等である。入力部26は、キーボード、タッチパネルおよびマイク等である。表示部25と入力部26とは、積層されてタッチパネルを構成していてもよい。
【0020】
情報処理装置20は、ユーザである編集者が使用する汎用のパソコン、スマートフォン、タブレット、大型計算機、または、大型計算機上で動作する仮想マシンである。情報処理装置20は、分散処理を行なう複数のパソコン、または大型計算機等のハードウェアにより構成されても良い。情報処理装置20は、クラウドコンピューティングシステムまたは量子コンピュータにより構成されても良い。情報処理装置20は、本実施の形態の編集支援処理専用のハードウェアであってもよい。
【0021】
図3は、ページ配分装置11が行なう編集支援処理の概要を説明する説明図である。ページ配分装置11を実現する制御部21は、ネットワークを介して接続されたコンテンツサーバからコンテンツ30を取得する。コンテンツ30は、複数のテキストコンテンツ31および複数の画像コンテンツ36を含む。
【0022】
制御部21は、それぞれのテキストコンテンツ31の特徴量を示す特徴量ベクトルを抽出する(ステップS501)。テキストコンテンツ31の特徴量ベクトルは、たとえばテキストコンテンツ31中の所定の単語の出現頻度に基づいて生成される。テキストコンテンツ31の特徴量ベクトルは、TF-IDF(Term Frequency Inverse Document Frequency)、BoW(Bag of Words)またはDoc2Vec(Document to Vector)等の任意の手法により生成できる。
【0023】
制御部21は、特徴量ベクトルのクラスタリングを行ない、テキストコンテンツ31を複数のテキストグループ32に分類する(ステップS502)。テキストグループ32は、テキストコンテンツ31をグループ分けしたテキストコンテンツグループの例示である。制御部21は、ステップS502により複数のテキストコンテンツ31を複数のテキストグループ32に分割する第1分割部の機能を実現する。
【0024】
クラスタリングには、たとえばk-means法、NN(Nearest Neighbor)法、K-NN(K Nearest Neighbor)法またはウォード法等の任意の手法を使用できる。
【0025】
なお、ステップS502で分類したテキストグループ32に含まれるテキストの合計文字数が所定の文字数を超える場合、制御部21は再度クラスタリングを行なって当該テキストグループ32を分割する。ステップS502で分類したテキストグループ32の数が所定のグループ数を超える場合、制御部21は文字数の少ないテキストグループ32同士を統合する。文字数の少ないテキストグループ32が複数存在する場合、制御部21は再度クラスタリングを行なって統合するテキストグループ32を定めてもよい。
【0026】
制御部21は、それぞれの画像コンテンツ36の特徴量を示す特徴量ベクトルを抽出する(ステップS503)。画像コンテンツ36の特徴量ベクトルは、たとえば画像コンテンツ36を構成する画素の輝度ヒストグラムに基づいて生成される。
【0027】
画像コンテンツ36の特徴量ベクトルは、SIFT(Scale Invariant Feature Transform)特徴量、SURF(Speeded Up Robust Features)特徴量またはHOG(Histograms of Oriented Gradients)特徴量等に基づいて生成されたベクトルであってもよい。
【0028】
画像コンテンツ36の特徴量ベクトルは、VGG16、VGG19またはResNet等の公知の学習モデルに画像コンテンツ36を入力し、学習モデルに含まれるコンボリューション層およびプーリング層からの出力に基づいて生成されたベクトルであってもよい。画像コンテンツ36の特徴量ベクトルは、学習済のオートエンコーダにより生成されてもよい。
【0029】
制御部21は、特徴量ベクトルのクラスタリングを行ない、画像コンテンツ36を複数の画像グループ37に分類する(ステップS504)。画像グループ37は、画像コンテンツ36をグループ分けした画像コンテンツグループの例示である。制御部21は、ステップS504により複数の画像コンテンツ36を複数の画像グループ37に分割する第2分割部の機能を実現する。
【0030】
クラスタリングには、たとえばk-means法、NN法、K-NN法またはウォード法等の任意の手法を使用できる。画像コンテンツ36のクラスタリング(ステップS504)に用いる手法と、テキストコンテンツ31のクラスタリング(ステップS502)に用いる手法とは、同一の手法であっても、異なる手法であってもよい。
【0031】
なお、ステップS504で分類した画像グループ37に含まれる画像の合計サイズが所定のサイズを超える場合、制御部21は再度クラスタリングを行なって当該画像グループ37を分割する。ステップS504で分類した画像グループ37の数が所定のグループ数を超える場合、制御部21は合計サイズの少ない画像グループ37同士を統合する。サイズの小さい画像グループ37が複数存在する場合、制御部21は再度クラスタリングを行なって統合する画像グループ37を定めてもよい。
【0032】
制御部21は、テキストグループ32と画像グループ37との対応付けを行ない(ステップS505)、所定のページ数に対応する数のページコンテンツ41を生成する。テキストグループ32と画像グループ37とを対応付ける方法については、後述する。
【0033】
それぞれのページコンテンツ41は、複数のテキストグループ32または複数の画像グループ37を含んでもよい。1つのページコンテンツ41に含まれるテキストコンテンツ31と画像コンテンツ36とが、1ページ用のコンテンツ30に対応する。以上の処理により、ページ配分装置11は取得したコンテンツ30を所定のページ数に配分する。
【0034】
制御部21は所定のページ数よりも少ない数のページコンテンツ41または多い数のページコンテンツ41を生成してもよい。このようにする場合には、ユーザが所定のページ数に合わせ込む最終調整を行なう。
【0035】
図4は、ページレイアウト装置12が行なう編集支援処理の概要を説明する説明図である。ページレイアウト装置12を実現する制御部21は、ページ配分装置11で配分された1つのページコンテンツ41、すなわち1ページ分のコンテンツ30を取得する。制御部21は、それぞれのテキストコンテンツ31とそれぞれの画像コンテンツ36との相関値を算出する(ステップS511)。相関値はコンテンツ同士の関係性を示す指標の例示である。相関値を算出する方法については、後述する。
【0036】
図4においては、太線で示す「テキストA」と「画像b」との相関値が最も大きく、細線で示す「テキストB」と「画像c」との相関値が2番目に大きく、それ以外の点線で示すテキストコンテンツ31と画像コンテンツ36との組み合わせの相関値は小さい。
【0037】
制御部21は、それぞれの相関値に基づいて相関の高いテキストコンテンツ31と画像コンテンツ36との組み合わせを抽出する。図4に示す例では、制御部21は「テキストA」と「画像b」との相関が高く、それ以外のコンテンツ30間の相関は高くないと評価する。
【0038】
制御部21は「テキストA」と「画像b」とを近接配置するという制約条件のもとに、ページレイアウト306を生成する(ステップS512)。所定のコンテンツ30を所定の制約条件に基づいてレイアウトするアプリケーションソフトウェアは公知であるため、ページレイアウト306を生成する処理の詳細については説明を省略する。以上の処理により、ページレイアウト装置12はページ配分装置11が配分した1ページ分のコンテンツ30を適切にレイアウトする。
【0039】
レイアウト生成時の制約条件は図4に示す例に限定しない。たとえば、「テキストA」と「画像a」との相関値、および、「テキストA」と「画像b」との相関値が同程度に大きい値である場合には、制御部21は「テキストA」と「画像a」と「画像b」との3つのコンテンツ30を近接配置するように制約条件を定める。
【0040】
たとえば、どのテキストコンテンツ31とどの画像コンテンツ36との間の相関値も同程度である場合には、制御部21は特に制約条件を定めずにレイアウトを生成する。
【0041】
なお制御部21は、ステップS511で算出した相関値同士の相対評価により相関の高い組み合わせを判定する。すなわち、制御部21は算出した複数の相関値の中で最も大きい相関値に対応するテキストコンテンツ31と画像コンテンツ36との組み合わせを、最も相関の高い組み合わせであると判定する。
【0042】
制御部21は、相関値が所定の閾値を超える組み合わせを相関の高い組み合わせであると判定しても良い。閾値を用いて判定する場合には、制御部21はすべての組み合わせについて相関値を算出しなくてもよい。制御部21は、所定の閾値を超える相関値を算出した後に、以後の相関値の算出を省略することにより、処理時間を短縮できる。
【0043】
図5および図6は、テキストと画像との相関値を算出する方法を説明する説明図である。図5は、テキストコンテンツ31と、テキストコンテンツ31に含まれるキーワードの出現頻度とを示す。図5の下側のグラフの横軸はテキストコンテンツ31に含まれるキーワードを示し、縦軸はそれぞれのキーワードの出現頻度を示す。
【0044】
図5に示す例においては、あらかじめ「花嫁」、「花婿」、「花」、「椅子」、「夕焼け」、「写真」および「参加者」等のキーワードが設定されている。キーワードは、たとえば特集記事のテーマ、または、掲載される雑誌の想定読者層等に基づいてあらかじめ設定されている。それぞれのキーワードの出現回数を表1に示す。
【0045】
【表1】
【0046】
表1より、キーワードの総出現回数は10回である。(1)式に、それぞれのキーワードの出現頻度を算出する式を示す。
出現頻度=出現回数/総出現回数 ‥‥‥(1)
【0047】
(1)式により算出されたキーワードと出現頻度との関係が、図5の下側のグラフに示されている。
【0048】
キーワードを設定する代わりに、形態素解析等の手法を用いてテキストコンテンツ31から単語を抽出してもよい。たとえば制御部21は、テキストコンテンツ31から名詞を取り出して、キーワードの代わりに使用する。制御部21は、テキストコンテンツ31から取り出した単語を類義語ごとに分類した後に、それぞれの類義語の出現頻度を算出してもよい。
【0049】
図6を用いて、テキストコンテンツ31と画像コンテンツ36との相関値を算出する方法を説明する。図6にはNo.1からNo.3の3つの例を示す。No.1は、第1画像コンテンツ361とテキストコンテンツ31との相関値、No.2は、第2画像コンテンツ362とテキストコンテンツ31との相関値、No.3は第3画像コンテンツ363とテキストコンテンツ31との相関値をそれぞれ示す。
【0050】
画像列には、それぞれの画像コンテンツ36から所定のキーワードに対応する物体を検出した結果を示す。物体の検出は、たとえばR-CNN(Regions with Convolutional Neural Network)、Fast R-CNN、Faster R-CNNまたはMask R-CNN等の手法により行なえる。これらの物体検出手法は公知であるため、詳細については説明を省略する。図6においては、R-CNN等の手法により検出された物体を示すバウンディングボックスが、それぞれの画像コンテンツ36に重畳表示されている。
【0051】
テキストコンテンツ31と画像コンテンツ36との相関値は、画像コンテンツ36から検出されたキーワードがテキストコンテンツ31中に出現する出現頻度の総和により算出する。(2)式に、テキストコンテンツ31と画像コンテンツ36との相関値を算出する式を示す。
【0052】
【数1】
【0053】
具体例を挙げて説明する。No.1に示す第1画像コンテンツ361から、「花嫁」および「花婿」が検出されている。相関値は、テキストコンテンツ31中の「花嫁」の検出頻度である0.3と、「花婿」の検出頻度である0.2との合計値である0.5である。
【0054】
No.2に示す第2画像コンテンツ362から、「椅子」および「花」が検出されている。相関値は、テキストコンテンツ31中の「椅子」の検出頻度である0.1と、「花」の検出頻度である0.1との合計値である0.2である。No.3に示す第3画像コンテンツ363から、「夕焼け」が検出されている。相関値は、テキストコンテンツ31中の「夕焼け」の検出頻度である0.1である。
【0055】
以上の処理により、制御部21は図4のステップS511に記載したテキストコンテンツ31と画像コンテンツ36との間の相関値算出の機能を実現する。
【0056】
[コンテンツ間相関値算出方法の変形例-1]
テキストコンテンツ31と画像コンテンツ36との相関値は、画像コンテンツ36から検出されたキーワードの数と、テキストコンテンツ31中に出現する出現頻度との積の総和により算出してもよい。(3)式に、テキストコンテンツ31と画像コンテンツ36との相関値を算出する式の変形例を示す。
【0057】
【数2】
【0058】
具体例を挙げて説明する。No.2に示す第2画像コンテンツ362から、3個の「椅子」および1個の「花」が検出されている。相関値は、テキストコンテンツ31中の「椅子」の検出頻度である0.1と「椅子」の検出数3との積、および、「花」の検出頻度である0.1と「花」の検出数1との積の合計値である0.4である。
【0059】
[コンテンツ間相関値算出方法の変形例-2]
テキストコンテンツ31と画像コンテンツ36との相関値は、画像コンテンツ36から検出されたキーワードに対応する部分の面積と、テキストコンテンツ31中に出現する出現頻度との積の総和により算出してもよい。(4)式に、テキストコンテンツ31と画像コンテンツ36との相関値を算出する式の変形例を示す。
【0060】
【数3】
【0061】
具体例を挙げて説明する。表2に、図6のNo.1に示す第1画像コンテンツ361中のキーワードに対応するバウンディングボックスの面積を、第1画像コンテンツ361全体の面積に対する比率で示す。
【0062】
【表2】
【0063】
第1画像コンテンツ361から、面積が0.28の「花嫁」および面積が0.29の「花婿」が検出されている。相関値は、「花嫁」の検出頻度である0.3と「花嫁」の面積である0.28との積、および、「花婿」の検出頻度である0.2と「花婿」の面積である0.29との積の合計値である0.142である。
【0064】
同様に表3に、図6のNo.2に示す第2画像コンテンツ362中のキーワードに対応するバウンディングボックスの面積を、第2画像コンテンツ362全体の面積に対する比率で示す。なお、「椅子」の面積は、3個のバウンディングボックスの面積の合計である。
【0065】
【表3】
【0066】
第2画像コンテンツ362から、3個合計の面積が0.08の「椅子」および面積が0.1の「花」が検出されている。相関値は、「椅子」の検出頻度である0.1と「椅子」の面積である0.08との積、および、「花」の検出頻度である0.1と「花」の面積である0.10との積の合計値である0.018である。
【0067】
なお、画像コンテンツ36からの物体検出にMask R-CNN等の物体の領域を検出できる手法を使用する場合には、物体の領域の面積を使用できる。バウンディングボックスの面積を使用する場合よりも高い精度で相関値を算出できる。
【0068】
(1)式から(3)式は、相関値算出式の例示である。相関値算出式は、これらの例示に限定されない。制御部21は、複数の相関値算出式を用いてそれぞれ算出した相関値同士を演算して、テキストコンテンツ31と画像コンテンツ36との相関値を算出してもよい。複数の相関値算出式を用いた総合評価により相関値を算出する情報処理装置20を提供できる。
【0069】
図7は、テキストグループ32と画像グループ37との相関値を算出する方法を説明する説明図である。制御部21は、テキストグループ32に含まれるそれぞれのテキストコンテンツ31と、画像グループ37に含まれるそれぞれの画像コンテンツ36との相関値を算出する。図7において、RAaは「テキストA」と「画像a」との相関値を、RAbは「テキストA」と「画像b」との相関値をそれぞれ示す。
【0070】
テキストグループ32と画像グループ37との相関値は、テキストコンテンツ31と画像コンテンツ36とを総当たりで組み合わせて算出した相関値の平均により算出する。(5)式に、テキストコンテンツ31と画像コンテンツ36との相関値を算出する式を示す。
【0071】
【数4】
Mは、テキストグループに含まれるテキストコンテンツの数である。
Nは、画像グループに含まれる画像コンテンツの数である。
Rijは、i番目のテキストコンテンツとj番目の画像コンテンツとの間の相関値である。
【0072】
図3を使用して説明したステップS505において、制御部21はそれぞれのテキストグループ32と画像グループ37との間の相関値を算出し、相関値の高いテキストグループ32と画像グループ37との組み合わせに基づいてページコンテンツ41を生成する。
【0073】
前述のとおり、それぞれのページコンテンツ41は、複数のテキストグループ32または複数の画像グループ37を含んでもよい。たとえば、一つのテキストグループ32に対して同程度の相関値を有する2つの画像グループ37が存在する場合、制御部21は当該テキストグループ32と、両方の画像グループ37とから1つのページコンテンツ41を生成してもよい。
【0074】
[グループ間相関値算出方法の変形例]
図8は、テキストグループ32と画像グループ37との相関値を算出する方法の変形例を説明する説明図である。制御部21は、テキストグループ32に含まれるテキストコンテンツ31をすべて結合して、1つの結合テキスト33を生成する。制御部21は結合テキスト33と画像グループ37に含まれるそれぞれの画像コンテンツ36との相関値を算出する。
【0075】
図8において、Raは「結合テキスト」と「画像a」との相関値を、Rbは「結合テキスト」と「画像b」との相関値をそれぞれ示す。テキストグループ32と画像グループ37との相関値は、結合テキスト33とそれぞれの画像コンテンツ36とを組み合わせて算出した相関値の平均により算出する。
【0076】
図9は、情報処理装置20が表示する画面の例である。図9を使用して、ページ配分装置11がコンテンツ30を配分した結果を表示する画面の例を説明する。図9に示す画面は、ページコンテンツ欄51、サムネール欄52、ページ欄55、保存ボタン58および終了ボタン59を含む。
【0077】
ページコンテンツ欄51には、ページ配分装置11が配分した1つのページコンテンツ41に含まれるテキストコンテンツ31および画像コンテンツ36が表示されている。ページ配分装置11により、1ページ目のページコンテンツ41にはハンバーガに関するテキストコンテンツ31および画像コンテンツ36が配分されている。
【0078】
サムネール欄52には、他のページコンテンツ41が縮小したサムネールで表示されている。たとえばページ配分装置11は第2ページにはサラダに関するテキストコンテンツ31および画像コンテンツ36を、第3ページにはデザートに関するテキストコンテンツ31および画像コンテンツ36を配分する。
【0079】
ユーザによる操作に基づいて制御部21はページコンテンツ欄51に表示するページを切り替える。ユーザによるテキストコンテンツ31または画像コンテンツ36のドラッグアンドドロップ操作に基づいて、制御部21は指定されたテキストコンテンツ31または画像コンテンツ36を他のページコンテンツ41に移動させる。ユーザによるサムネール欄52のドラッグアンドドロップ操作に基づいて、制御部21はページの順番を入れ替える。
【0080】
制御部21は、ユーザによるページの追加および削除等の操作を受け付けてもよい。図9を使用して説明した画面により、ユーザはコンテンツ30のページ配分を適宜変更できる。関連するコンテンツ30同士が1つのページコンテンツ41に配分されているため、ユーザは速やかにページ間のコンテンツ30の調整を行なえる。
【0081】
ユーザによる保存ボタン58の選択を受け付けた場合、制御部21はユーザの指示を反映したページコンテンツ41を保存する。ユーザによる終了ボタン59の選択を受け付けた場合、制御部21は図9を使用して説明した画面の表示を終了し、それぞれのページコンテンツ41をページレイアウト装置12に入力する。
【0082】
どのページコンテンツ41にも配分されないコンテンツ30が存在する場合、制御部21は、そのようなコンテンツ30を表示する専用の欄を表示してもよい。ページ配分装置11による自動配分に適さないコンテンツ30であっても、ユーザが確認して、適切なページコンテンツ41に配分できる。
【0083】
なお、制御部21は図9を使用して説明した画面を表示せず、ページ配分装置11が配分したページコンテンツ41をページレイアウト装置12に直接入力してもよい。終了ボタン59の選択を受け付けた場合、ページコンテンツ41を保存した後に処理を終了してもよい。ユーザは同一の情報処理装置20または別の情報処理装置20を使用して、保存されたページコンテンツ41をページレイアウト装置12に入力する操作を指示できる。
【0084】
図10は、情報処理装置20が表示する画面の例である。図10を使用して、ページレイアウト装置12がページレイアウト306を生成した結果を表示する画面の例を説明する。図10に示す画面は、レイアウト欄53、サムネール欄54、ページ欄55、採用ボタン57、保存ボタン58および終了ボタン59を含む。
【0085】
レイアウト欄53には、ページレイアウト装置12がページコンテンツ41に基づいて生成したページレイアウト306が表示されている。サムネール欄54には、同一のページコンテンツ41に基づいてページレイアウト装置12が生成した別のページレイアウト306がサムネール表示されている。
【0086】
図10においては、図6を使用して説明したテキストコンテンツ31と、相関値の高い第1画像コンテンツ361とを近接配置するページレイアウト306が複数生成されている。
【0087】
ユーザによる操作に基づいて制御部21はレイアウト欄53に表示するページレイアウト306を切り替える。ユーザは、複数のページレイアウト306を見比べて、採用するページレイアウト306を判断する。採用ボタン57の選択を受け付けた場合、制御部21はレイアウト欄53に表示中のページレイアウト306が採用された旨を記録する。
【0088】
ユーザによる操作に基づいて、制御部21はレイアウト欄53およびサムネール欄54に表示するページを切り替える。ユーザによる保存ボタン58の選択を受け付けた場合、制御部21はユーザにより採用されたページレイアウト306を記録する。ユーザによる終了ボタン59の選択を受け付けた場合、制御部21は図10を使用して説明した画面の表示を終了する。
【0089】
制御部21は、レイアウト欄53に表示したページレイアウト306の編集を受け付けてもよい。たとえばユーザは、コンテンツ30の位置の変更、コンテンツ30の編集、および別のページへのコンテンツ30の移動等の操作を行なえる。ページレイアウト306の編集は、デスクトップパブリッシング用のアプリケーションソフトウェア等で従来から行われているため、説明を省略する。
【0090】
図11は、プログラムの処理の流れを説明するフローチャートである。制御部21は、図11を使用して説明するプログラムにより、ページ配分装置11の機能を実現する。制御部21は、コンテンツ30を取得する(ステップS601)。コンテンツ30には、テキストコンテンツ31および画像コンテンツ36が含まれている。
【0091】
情報処理装置20は、テキストコンテンツ31を入力に用いてグループ分けのサブルーチンを起動する(ステップS602)。グループ分けのサブルーチンは、入力された複数のコンテンツ30をグループに分けるサブルーチンである。ステップS602で起動したグループ分けのサブルーチンは、図3を使用して説明したステップS501およびステップS502の機能を実現する。グループ分けのサブルーチンの処理の流れは後述する。
【0092】
制御部21は、画像コンテンツ36を入力に用いてグループ分けのサブルーチンを起動する(ステップS603)。ステップS603で起動するサブルーチンは、ステップS602で起動するサブルーチンと同一のサブルーチンである。ステップS603で起動したグループ分けのサブルーチンは、図3を使用して説明したステップS503およびステップS504の機能を実現する。
【0093】
制御部21は、グループ間対応付けのサブルーチンを起動する(ステップS604)。グループ間対応付けのサブルーチンは、テキストグループ32と画像グループ37とを対応づけてページコンテンツ41を生成するサブルーチンである。グループ間対応付けのサブルーチンの処理の流れは後述する。
【0094】
制御部21は、ページコンテンツ41を出力する(ステップS605)。たとえば、制御部21は図9を使用して説明した画面を表示装置に出力して、ユーザによる操作を受け付ける。制御部21は補助記憶装置23または外部の大容量記憶装置にページコンテンツ41を出力してもよい。補助記憶装置23または外部の大容量記憶装置に保存されたページコンテンツ41は、ページレイアウト装置12の入力に使用される。
【0095】
図12は、グループ分けのサブルーチンの処理の流れを説明するフローチャートである。グループ分けのサブルーチンは、入力された複数のコンテンツ30をグループに分けるサブルーチンである。なお、1回の起動時にグループ分けのサブルーチンに入力されるコンテンツ30は、テキストコンテンツ31または画像コンテンツ36のいずれか一方である。
【0096】
制御部21は、1つのコンテンツ30を取得する(ステップS611)。制御部21は、取得したコンテンツ30の特徴量ベクトルを生成する(ステップS612)。ステップS611で取得したコンテンツ30がテキストコンテンツ31である場合、制御部21は所定の単語の出現頻度、TF-IDF、BoWまたはDoc2Vec等の手法により特徴量ベクトルを生成する。
【0097】
ステップS611で取得したコンテンツ30が画像コンテンツ36である場合、制御部21は輝度ヒストグラム、SIFT、SURF、HOG、または所定の学習モデルにより特徴量ベクトルを生成する。制御部21はテキストコンテンツ31および画像コンテンツ36それぞれの特徴量ベクトルを生成する手法の選択をユーザから受け付けてもよい。
【0098】
制御部21は、生成した特徴量ベクトルを補助記憶装置23に記憶する(ステップS613)。制御部21は、コンテンツ30の処理を終了したか否かを判定する(ステップS614)。
【0099】
処理を終了していないと判定した場合(ステップS614でNO)、制御部21はステップS611に戻る。処理を終了したと判定した場合(ステップS614でYES)、制御部21はステップS613で記録した特徴量ベクトルのクラスタリングを行なう(ステップS615)。
【0100】
ステップS615のクラスタリングには、k-means法、NN法、K-NN法またはウォード法等の任意の手法を使用できる。k-means法等の非階層型クラスタリング手法を使用する場合には、制御部21は作成するページ数と同数のクラスタを作成する。制御部21は、ユーザによるクラスタリング手法の選択を受け付けてもよい。
【0101】
制御部21は、補助記憶装置23にクラスタリング結果を記録する(ステップS616)。制御部21は処理を終了する。本サブルーチンを用いて複数のテキストコンテンツ31をクラスタリングすることにより、テキストグループ32が生成される。本サブルーチンを用いて複数の画像コンテンツ36をクラスタリングすることにより、画像グループ37が生成される。
【0102】
なお、ステップS615とステップS616との間で、制御部21はクラスタリングにより生成したそれぞれのクラスタのサイズを判定し、所定のサイズよりも大きいクラスタについては再度のクラスタリングを行なって分割してもよい。
【0103】
図13は、グループ間対応付けのサブルーチンの処理の流れを説明するフローチャートである。グループ間対応付けのサブルーチンは、テキストグループ32と画像グループ37とを対応づけてページコンテンツ41を生成するサブルーチンである。
【0104】
制御部21は、1つの画像グループ37を取得する(ステップS621)。制御部21は1つのテキストグループ32を取得する(ステップS622)。制御部21は、グループ間相関値算出のサブルーチンを起動する(ステップS623)。グループ間相関値算出のサブルーチンは、テキストグループ32と画像グループ37との間の相関値を算出するサブルーチンである。グループ間相関値算出のサブルーチンの処理の流れは後述する。
【0105】
制御部21は、テキストグループ32の処理を終了したか否かを判定する(ステップS624)。終了していないと判定した場合(ステップS624でNO)、制御部21はステップS622に戻る。終了したと判定した場合(ステップS624でYES)、制御部21は画像グループ37の処理を終了したか否かを判定する(ステップS625)。
【0106】
終了していないと判定した場合(ステップS625でNO)、制御部21はステップS621に戻る。終了したと判定した場合(ステップS625でYES)、制御部21は相関値が上位であるテキストグループ32と画像グループ37との組み合わせを1組抽出する(ステップS626)。
【0107】
制御部21は、抽出した組み合わせの一方または両方が他のグループと対応付け済であるか否かを判定する(ステップS627)。対応付け済ではないと判定した場合(ステップS627でNO)、制御部21はステップS626で抽出したテキストグループ32と画像グループ37との対応付けを、補助記憶装置23または主記憶装置22に記録する(ステップS628)。
【0108】
対応付け済であると判定した場合(ステップS627でYES)、またはステップS628の終了後、制御部21は所定の閾値よりも相関値が大きいテキストグループ32と画像グループ37との組み合わせの処理を終了したか否かを判定する(ステップS629)。
【0109】
終了してないと判定した場合(ステップS629でNO)、制御部21はステップS626に戻る。終了したと判定した場合(ステップS629でYES)、制御部21は処理を終了する。グループ間対応付けのサブルーチンにより、制御部21はテキストグループ32と画像グループ37とを組み合わせてページコンテンツ41を生成する生成部の機能を実現する。
【0110】
図14は、グループ間相関値算出のサブルーチンの処理の流れを説明するフローチャートである。グループ間相関値算出のサブルーチンは、テキストグループ32と画像グループ37との間の相関値を算出するサブルーチンである。
【0111】
制御部21は、処理中の画像グループ37から1つの画像コンテンツ36を取得する(ステップS631)。制御部21はステップS631で取得した画像コンテンツ36から所定のキーワードに対応する物体を検出する(ステップS632)。物体の検出には、たとえばR-CNN、Fast R-CNN、Faster R-CNNまたはMask R-CNN等の任意の手法を使用できる。
【0112】
制御部21は、処理中のテキストグループ32から1つのテキストコンテンツ31を取得する(ステップS633)。制御部21は、ステップS633で取得したテキストコンテンツ31から所定のキーワードそれぞれの出現頻度を(1)式に基づいて算出する(ステップS634)。
【0113】
制御部21は、ステップS631で取得した画像コンテンツ36とステップS633で取得したテキストコンテンツ31との相関値を(2)式に基づいて算出する(ステップS635)。ステップS635により、制御部21はテキストコンテンツ31と画像コンテンツ36との相関値を算出する相関値算出部の機能を実現する。制御部21は、ステップS635で算出した相関値を補助記憶装置23または主記憶装置22に記録する(ステップS636)。
【0114】
制御部21は、処理中のテキストグループ32に含まれるすべてのテキストコンテンツ31の処理を終了したか否かを判定する(ステップS637)。終了していないと判定した場合(ステップS637でNO)、制御部21はステップS633に戻る。
【0115】
終了したと判定した場合(ステップS637でYES)、制御部21は処理中の画像グループ37に含まれるすべての画像コンテンツ36の処理を終了したか否かを判定する(ステップS638)。終了していないと判定した場合(ステップS638でNO)、制御部21はステップS631に戻る。
【0116】
終了したと判定した場合(ステップS638でYES)、制御部21はテキストグループ32と画像グループ37との間の相関値を算出する(ステップS639)。具体的には、制御部21はステップS636で記録したそれぞれの相関値の平均値を算出する。ステップS639により、制御部21はテキストグループ32と画像グループ37との相関を評価する相関評価部の機能を実現する。制御部21は処理を終了する。
【0117】
図15は、プログラムの処理の流れを説明するフローチャートである。制御部21は、図15を使用して説明するプログラムにより、ページレイアウト装置12の機能を実現する。
【0118】
制御部21は、ページコンテンツ41を取得する(ステップS641)。制御部21は、処理中のページコンテンツ41から1つの画像コンテンツ36を取得する(ステップS642)。制御部21は、ステップS642で取得した画像コンテンツ36から所定のキーワードに対応する物体を検出する(ステップS643)。物体の検出には、たとえばR-CNN、Fast R-CNN、Faster R-CNNまたはMask R-CNN等の任意の手法を使用できる。
【0119】
制御部21は、処理中のページコンテンツ41から1つのテキストコンテンツ31を取得する(ステップS644)。制御部21は、ステップS644で取得したテキストコンテンツ31から所定のキーワードそれぞれの出現頻度を(1)式に基づいて算出する(ステップS645)。
【0120】
制御部21は、ステップS642で取得した画像コンテンツ36とステップS644で取得したテキストコンテンツ31との相関値を(2)式に基づいて算出する(ステップS646)。制御部21は、ステップS635で算出した相関値を補助記憶装置23、主記憶装置22または外部の記憶装置に記録する(ステップS647)。
【0121】
制御部21は、処理中のテキストグループ32に含まれるすべてのテキストコンテンツ31の処理を終了したか否かを判定する(ステップS648)。終了していないと判定した場合(ステップS648でNO)、制御部21はステップS644に戻る。
【0122】
終了したと判定した場合(ステップS648でYES)、制御部21は処理中のページコンテンツ41に含まれるすべての画像コンテンツ36の処理を終了したか否かを判定する(ステップS649)。終了していないと判定した場合(ステップS649でNO)、制御部21はステップS642に戻る。
【0123】
終了したと判定した場合(ステップS649でYES)、制御部21はステップS647で記録した相関値が上位であるテキストコンテンツ31と画像コンテンツ36との組み合わせを抽出する(ステップS650)。
【0124】
具体的には、制御部21はステップS646で算出した複数の相関値を比較して、相対的に高い相関値を示す画像コンテンツ36とテキストコンテンツ31との組み合わせから順に組み合わせを抽出する。制御部21は、たとえば相関値が上位10パーセント等、相対的に高い相関値を示す画像コンテンツ36とテキストコンテンツ31との組み合わせから、組み合わせをランダムに抽出してもよい。制御部21は、所定の閾値を超える相関値を示す画像コンテンツ36とテキストコンテンツ31との組み合わせから、組み合わせをランダムに抽出してもよい。
【0125】
制御部21は、ステップS650で抽出した組み合わせを近接配置する条件でページレイアウト306の案を複数生成する(ステップS651)。所定のコンテンツ30を所定の制約条件に基づいてレイアウトするアプリケーションソフトウェアは公知であるため、ページレイアウト306を生成する処理の詳細については説明を省略する。ステップS651により制御部21は本実施の形態のレイアウト部の機能を実現する。
【0126】
制御部21は、生成したページレイアウト306を出力する(ステップS652)。たとえば、制御部21は図10を使用して説明した画面を表示装置に出力して、ユーザによる操作を受け付ける。制御部21は補助記憶装置23または外部の大容量記憶装置に生成したページレイアウト306を出力してもよい。ユーザは、補助記憶装置23または外部の大容量記憶装置に保存されたページレイアウト306を別の情報処理装置20を使用して閲覧できる。
【0127】
制御部21は、ステップS650で抽出した組み合わせを補助記憶装置23、主記憶装置22または外部の記憶装置に記録してもよい。ユーザは、記録された組み合わせに基づく制約条件を公知のデスクトップパブリケーション用ソフトウェアに入力して、ページレイアウト306を生成できる。
【0128】
制御部21は、ステップS651で生成した複数のページレイアウト306に順位をつけて、高い順位のページレイアウト306を優先的に表示してもよい。たとえば制御部21は、同じ雑誌の過去の特集記事の誌面との類似度の高いページレイアウト306に高い順位をつけることにより、雑誌のスタイルに沿ったページレイアウト306を表示できる。類似度は、たとえば過去の記事に基づいて学習した学習モデルにより判定できる。
【0129】
本実施の形態によると、複数ページ分のコンテンツ30を取得して、ページごとに振り分ける情報処理装置を提供できる。それぞれのページコンテンツ41に、相関値の高いテキストコンテンツ31および画像コンテンツ36を配分することにより、ユーザが多量のコンテンツ30をまとめて処理する手間を省力化する情報処理装置を提供できる。
【0130】
本実施の形態によると、1ページ分のページコンテンツ41を取得して、関連性の高いコンテンツ30同士を近接配置したページレイアウト306を出力する情報処理装置20を提供できる。テキストコンテンツ31と、テキストコンテンツ31との相関値が高い画像コンテンツ36とが自動的に近接配置されるため、ユーザが修正する手間を省力化する情報処理装置20を提供できる。
【0131】
本実施の形態によると、ページ配分装置11による処理とページレイアウト装置12による処理とを連続的に行なう情報処理装置20を提供できる。たとえば雑誌の特集記事用のコンテンツ30を執筆者から受け取ってから、編集が完了した原稿を印刷所に渡すまでの所要期間の短縮を支援する情報処理装置20を提供できる。
【0132】
本実施の形態によると、ページ配分装置11による処理の終了後に、図9を使用して説明した画面を用いてユーザがページコンテンツ41を修正できる情報処理装置20を提供できる。
【0133】
本実施の形態によると、1つのページコンテンツ41に基づいて複数のページレイアウト306の案をユーザに提示する情報処理装置20を提供できる。ユーザは、好ましいページレイアウト306を選択して、適宜編集を行なえる。
【0134】
[実施の形態2]
本実施の形態は、複数のページレイアウト306を生成した後に、相関値の高いコンテンツ30同士が近接配置されたページレイアウト306を選択する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0135】
図16は、実施の形態2の概要を説明する説明図である。図16は、ページレイアウト装置12が生成したページレイアウト306の例を示す。図6を使用して説明したテキストコンテンツ31と、相関値の高い第1画像コンテンツ361との距離をLで示す。
【0136】
図16は、テキストコンテンツ31が配置された領域の重心と、第1画像コンテンツ361の重心とにより、距離Lを定義する例を示す。距離Lは、テキストコンテンツ31が配置された領域と、第1画像コンテンツ361の縁との間の最短距離により定義してもよい。
【0137】
本実施の形態においては、制御部21はページレイアウト306に含まれるコンテンツ30を適宜配置した複数のページレイアウト306を生成した後に、相関値の高いテキストコンテンツ31と画像コンテンツ36との間の距離Lが小さいページレイアウト306を抽出して表示する。
【0138】
図17は、実施の形態2のプログラムの処理の流れを説明するフローチャートである。図17のプログラムは、図15を使用して説明したプログラムの代わりに実行されるプログラムである。ステップS641からステップS650までの処理の流れは、図15を使用して説明したプログラムの処理の流れと同一であるため、説明を省略する。
【0139】
制御部21は、ステップS641で取得したページコンテンツ41を配置したページレイアウト306の案を複数生成する(ステップS661)。制御部21は、ステップS661で生成したそれぞれのページレイアウト306について、制御部21は、ステップS650で抽出したテキストコンテンツ31と画像コンテンツ36との間の距離Lを算出する(ステップS662)。
【0140】
制御部21は、ステップS661で生成した複数のページレイアウト306のうち、ステップS662で算出した距離Lが短いページレイアウト306を抽出する(ステップS663)。具体的には制御部21は、距離Lが所定の閾値よりも短いページレイアウト306を抽出する。制御部21は、距離Lが短い方から所定の数のページレイアウト306を抽出してもよい。
【0141】
制御部21は、抽出したページレイアウト306を出力する(ステップS664)。たとえば、制御部21は図10を使用して説明した画面を表示装置に出力して、ユーザによる操作を受け付ける。制御部21は補助記憶装置23または外部の大容量記憶装置に生成したページレイアウト306を出力してもよい。ユーザは、補助記憶装置23または外部の大容量記憶装置に保存されたページレイアウト306を別の情報処理装置20を使用して閲覧できる。
【0142】
本実施の形態によると、多様なページレイアウト306を出力可能な情報処理装置20を実現できる。
【0143】
制御部21は、ステップS641からステップS650までの処理と、ステップS661との処理とは並列処理により独立して実行してもよい。並列処理を行なうことにより、ページコンテンツ41を入力してからページレイアウト306が表示されるまでの待ち時間が短い情報処理装置20を提供できる。
【0144】
[実施の形態3]
本実施の形態は、コンテンツ30同士の相関値および距離に基づいてページレイアウト306を選択する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0145】
表4に、ページレイアウト306の選択基準の例を示す。行方向は、ページコンテンツ41の中で比較的相関値が高いテキストコンテンツ31と画像コンテンツ36との相関値の大きさを3段階で示す。列方向は、当該テキストコンテンツ31と画像コンテンツ36との間の距離Lを3段階で示す。
【0146】
【表4】
【0147】
「採用」は、ページレイアウト306を採用する、すなわち図10を使用して説明した画面を介してユーザに提示することを意味する。「不採用」はページレイアウト306を採用しない、すなわちユーザに提示しないことを意味する。
【0148】
ページコンテンツ41の中で比較的相関値が高いテキストコンテンツ31と画像コンテンツ36との相関値が「高」である場合、制御部21は、テキストコンテンツ31と画像コンテンツ36との間の距離Lが「短い」場合のみ「採用」であると判定する。比較的相関値が高いテキストコンテンツ31と画像コンテンツ36との相関値が「中」である場合、制御部21は、テキストコンテンツ31と画像コンテンツ36との間の距離Lが「短い」場合および「中程度」である場合に「採用」であると判定する。
【0149】
ページコンテンツ41の中で比較的相関値が高いテキストコンテンツ31と画像コンテンツ36との相関値が「低」である場合、制御部21は、テキストコンテンツ31と画像コンテンツ36との間の距離Lにかかわらす「採用」であると判定する。
【0150】
図16を使用して、さらに具体的に説明する。前述のとおり、ページコンテンツ41の中で、テキストコンテンツ31と第1画像コンテンツ361との組み合わせの相関値が高い。このテキストコンテンツ31と第1画像コンテンツ361との間の相関値の「高」、「中」、「低」の別、および、距離Lの「短い」、「中程度」、「長い」の別に基づいて、「採用」または「不採用」が判定される。
【0151】
以上により、相関値が高いテキストコンテンツ31と画像コンテンツ36との間の距離Lは短く、相関値が中程度以下のテキストコンテンツ31と画像コンテンツ36との間の距離Lは離れていても許容する情報処理装置20を提供できる。
【0152】
なお、表1は例示でありこれに限定するものではない。たとえば相関値および距離Lは3段階に限定しない。2段階または4段階以上に区切ってもよい。
【0153】
[選択基準の変形例]
表5に、ページレイアウト306の選択基準の変形例を示す。行方向は、ページコンテンツ41の中で比較的相関値が高いテキストコンテンツ31と画像コンテンツ36との相関値の大きさを3段階で示す。列方向は、当該テキストコンテンツ31と画像コンテンツ36との間の距離Lを3段階で示す。
【0154】
【表5】
【0155】
本変形例によると、相関値が相対的に低いテキストコンテンツ31と画像コンテンツ36との間の距離Lが短いページレイアウト306を「不採用」と判定する情報処理装置20を提供できる。相関値がそれほど高くない組み合わせが近接配置されることによる読者の混乱を避けたページレイアウト306を提示できる。
【0156】
図18は、実施の形態3のプログラムの処理の流れを説明するフローチャートである。図18のプログラムは、図15を使用して説明したプログラムの代わりに実行されるプログラムである。ステップS641からステップS662までの処理の流れは、図17を使用して説明したプログラムの処理の流れと同一であるため、説明を省略する。
【0157】
制御部21は、ステップS661で生成した複数のページレイアウト306のそれぞれの採否を、表4または表5に基づいて判定する(ステップS671)。具体的には制御部21は、ステップS650で抽出した相関値上位の組み合わせに対応する相関値を行方向に、ステップS662で算出した距離Lを縦方向に使用して表4または表5に基づいて「採用」または「不採用」を判定する。ステップS671により、制御部21はページレイアウト306の評価を判定する判定部の機能を実現する。
【0158】
制御部21は、「採用」であると判定したページレイアウト306を出力する(ステップS672)。たとえば、制御部21は図10を使用して説明した画面を表示装置に出力して、ユーザによる操作を受け付ける。制御部21は補助記憶装置23または外部の大容量記憶装置に生成したページレイアウト306を出力してもよい。ユーザは、補助記憶装置23または外部の大容量記憶装置に保存されたページレイアウト306を別の情報処理装置20を使用して閲覧できる。
【0159】
本実施の形態によると、ステップS650で抽出した相関値上位の組み合わせの相関値に基づいて、テキストコンテンツ31と画像コンテンツ36との間の距離Lの許容範囲を定める情報処理装置20を提供できる。
【0160】
[実施の形態4]
本実施の形態は、ページ数よりも多くのページコンテンツ41が生成された場合に、一部のページコンテンツ41を統合する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0161】
図19から図21は、実施の形態4のテキストグループ32と画像グループ37との関連付けを説明する説明図である。図19は、ページ配分装置11から出力された第1ページコンテンツ411から第4ページコンテンツ414までの4個のページコンテンツ41を模式的に示す。それぞれのページコンテンツ41は、テキストグループ32と画像グループ37とを含む。
【0162】
制御部21は、それぞれのページコンテンツ41のサイズが所定のサイズより大きいか否かを判定する。ページコンテンツ41のサイズは、テキストグループ32に含まれるテキストコンテンツ31の文字数および画像グループ37に含まれる画像コンテンツ36の画素数に基づいて算出される。以下の説明では第4ページコンテンツ414のサイズが所定のサイズより大きいと制御部21が判定した場合を例にして説明する。
【0163】
図20は、ページコンテンツ41間の相関値を算出した状況を模式的に示す。図20においては、所定のサイズよりも大きいと判定された第4ページコンテンツ414は、相関値の算出対象から除かれている。R12は、第1ページコンテンツ411と第2ページコンテンツ412との間の相関値を示す。R13は、第1ページコンテンツ411と第3ページコンテンツ413との間の相関値を示す。R23は、第2ページコンテンツ412と第3ページコンテンツ413との間の相関値を示す。太線で示すR12が最も大きく、細線で示すR13が2番目に大きく、点線で示すR23が最も小さい。
【0164】
制御部21は、破線で示すように第1ページコンテンツ411と第2ページコンテンツ412とを統合する。以上により4ページ分のページコンテンツ41から3ページ分のページコンテンツ41が生成される。
【0165】
図21を使用して、ページコンテンツ41同士の相関値を算出する方法の概要を説明する。制御部21は、テキストグループ32同士の相関値Rtextを算出する。具体的を挙げて説明する。制御部21は第1ページコンテンツ411に含まれるそれぞれのテキストコンテンツ31から抽出した特徴量ベクトルにより第1テキスト特徴量ベクトル群を生成する。同様に制御部21は、第2ページコンテンツ412に含まれるそれぞれのテキストコンテンツ31から抽出した特徴量ベクトルにより第2テキスト特徴量ベクトル群を生成する。
【0166】
制御部21は、第1テキスト特徴量ベクトル群と第2テキスト特徴量ベクトル群との距離の逆数に基づいて、両者の相関値Rtextを算出する。二つのテキスト特徴量ベクトル群間の距離は、たとえばユークリッド距離、チェビシェフ距離またはミンコフスキー距離等の、任意の手法により算出できる。
【0167】
制御部21は第1ページコンテンツ411に含まれるそれぞれの画像コンテンツ36から抽出した特徴量ベクトルにより第1画像特徴量ベクトル群を生成する。同様に制御部21は、第2ページコンテンツ412に含まれるそれぞれの画像コンテンツ36から抽出した特徴量ベクトルにより第2画像特徴量ベクトル群を生成する。
【0168】
制御部21は、第1画像特徴量ベクトル群と第2画像特徴量ベクトル群との距離の逆数に基づいて、両者の相関値Rimageを算出する。二つの画像特徴量ベクトル群間の距離は、たとえばユークリッド距離、チェビシェフ距離またはミンコフスキー距離等の、任意の手法により算出できる。
【0169】
制御部21は、テキストグループ32同士の相関値Rtextと、画像グループ37同士の相関値Rimageとに基づいて、第1ページコンテンツ411と第2ページコンテンツ412との間の相関値R12を算出する。相関値R12は、たとえばRtextとRimageとの平均値である。相関値R12は、RtextとRimageとの和であってもよい。相関値R12は、(6)式に基づいて算出されてもよい。
相関値R12=k・Rtext + Rimage ‥‥‥(6)
【0170】
図22は、実施の形態4のプログラムの処理の流れを説明するフローチャートである。図22のプログラムは、生成されたページコンテンツ41の一部を結合して、所定の数のページコンテンツ41を生成するプログラムである。図22のプログラムは、図11を使用して説明したプログラムが予定のページ数よりも多数のページコンテンツ41が生成された場合に実行される。
【0171】
制御部21は、ページ配分装置11により生成されたすべてのページコンテンツ41を結合候補に登録する(ステップS701)。制御部21は、結合候補に登録されたページコンテンツ41から1つのページコンテンツ41を抽出する(ステップS702)。制御部21は、ステップS702で抽出したページコンテンツ41のサイズが1ページ分の適正なサイズであるか否かを判定する(ステップS703)。
【0172】
適正なサイズであると判定した場合(ステップS703でYES)、制御部21は処理中のページコンテンツ41を結合候補から削除する(ステップS704)。適正なサイズではないと判定した場合(ステップS703でNO)、制御部21は処理中のページコンテンツ41のサイズが大きすぎるか否かを判定する(ステップS705)。
【0173】
大きすぎると判定した場合(ステップS705でYES)、制御部21は図11を使用して説明したプログラムを使用して処理中のページコンテンツ41を分割する(ステップS706)。制御部21は、結合候補を更新する(ステップS707)。具体的には制御部21は、処理中のページコンテンツ41を結合候補から削除し、分割後のページコンテンツ41を結合候補に登録する。
【0174】
大きすぎないと判定した場合(ステップS705でNO)、またはステップS704の終了後、制御部21は結合候補の処理を終了したか否かを判定する(ステップS708)。終了していないと判定した場合(ステップS708でNO)、制御部21はステップS702に戻る。
【0175】
終了したと判定した場合(ステップS708でYES)、制御部21は結合候補に含まれるページコンテンツ41から抽出した2つのページコンテンツ41間の相関値をそれぞれ算出する(ステップS709)。ページコンテンツ41間の相関値の算出方法は図21を使用して説明したため、詳細なフローチャートは省略する。
【0176】
制御部21は、相関値が高いページコンテンツ41の組み合わせを抽出する(ステップS710)。制御部21は、ステップS710で抽出した組み合わせのページコンテンツ41の合計サイズが1ページ分の適正なサイズであるか否かを判定する(ステップS711)。
【0177】
適正なサイズであると判定した場合(ステップS711でYES)、制御部21は抽出したページコンテンツ41を結合して1つのページコンテンツ41を生成する(ステップS712)。制御部21は、抽出したページコンテンツ41を結合候補から削除する(ステップS713)。
【0178】
適正なサイズではないと判定した場合(ステップS711でNO)、制御部21は処理中のページコンテンツ41の合計サイズが大きすぎるか否かを判定する(ステップS714)。大きすぎないと判定した場合(ステップS714でNO)、制御部21は抽出したページコンテンツ41を結合して1つのページコンテンツ41を生成する(ステップS715)。
【0179】
制御部21は、結合候補を更新する(ステップS716)。具体的には制御部21は、ステップS710で抽出したページコンテンツ41を結合候補から削除し、ステップS715で結合後のページコンテンツ41を結合候補に登録する。
【0180】
大きいと判定した場合(ステップS714でYES)、ステップS713の終了後、または、ステップS716の終了後、制御部21は処理を終了するか否かを判定する(ステップS717)。たとえばページコンテンツ41が所定のページ数と同数になった場合、または、結合候補に登録されたページコンテンツ41の処理をすべて終了した場合に、制御部21は処理を終了すると判定する。
【0181】
処理を終了しないと判定した場合(ステップS717でNO)、制御部21はステップS710に戻る。処理を終了すると判定した場合(ステップS717でYES)、制御部21は処理を終了する。
【0182】
本実施の形態によると、ページコンテンツ41を自動的に結合する情報処理装置20を提供できる。
【0183】
[実施の形態5]
本実施の形態は、学習モデル45を用いてテキストコンテンツ31と画像コンテンツ36との相関値を算出する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0184】
図23は、学習モデル45を説明する説明図である。学習モデル45は、テキストコンテンツ31と画像コンテンツ36との入力を受け付けて、両者の相関値を出力する。学習モデル45は、たとえば非特許文献1に開示されたモデルを使用できるが、これに限定するものではない。
【0185】
本実施の形態の制御部21は、図14を使用して説明したフローチャートのステップS635および図15を使用して説明したフローチャートのステップS646において、画像コンテンツ36とテキストコンテンツ31とを学習モデル45に入力し、出力される相関値を取得する。
【0186】
図24は、訓練DB(Database)のレコードレイアウトを説明する説明図である。訓練DBは、学習モデル45の訓練に使用する訓練データを記録したDBである。訓練DBは、テキストフィールド、画像フィールドおよび相関値フィールドを有する。
【0187】
テキストフィールドには、テキストコンテンツ31が記録されている。画像フィールドには画像コンテンツ36が記録されている。相関値フィールドには、たとえば実施の形態1で説明した方法により算出したテキストコンテンツ31と画像コンテンツ36との相関値が記録されている。訓練DBは、1組の訓練データについて1つのレコードを有する。
【0188】
図25は、実施の形態5のプログラムの処理の流れを説明するフローチャートである。図25のプログラムは、学習モデル45の訓練に使用される。情報処理装置20を用いて学習モデル45の機械学習を行なう場合を例にして説明する。
【0189】
図25のプログラムは情報処理装置20とは別のハードウェアで実行され、機械学習が完了した学習モデル45がネットワークを介して補助記憶装置23に複写されてもよい。一つのハードウェアで学習させた学習モデル45を、複数の情報処理装置20で使用できる。
【0190】
図25のプログラムの実行に先立ち、たとえば非特許文献1の図1に開示された、双方向LSTM(Long short-term memory)とCNN(Convolutional Neural Network)とを含む未学習のモデルが準備されている。図25のプログラムにより、準備されたモデルの各パラメータが調整されて、機械学習が行なわれる。
【0191】
情報処理装置20の制御部21は、訓練DBから1エポックの訓練に使用する訓練レコードを取得する(ステップS811)。制御部21は、モデルの一方の入力層にテキストコンテンツ31が、他方の入力層に画像コンテンツ36が入力された場合に、出力層層から相関値が出力されるように、モデルのパラメータを調整する(ステップS812)。
【0192】
制御部21は、処理を終了するか否かを判定する(ステップS813)。たとえば、制御部21は所定のエポック数の学習を終了した場合に、処理を終了すると判定する。制御部21は、訓練DBからテストデータを取得して機械学習中のモデルに入力し、所定の精度の出力が得られた場合に処理を終了すると判定してもよい。
【0193】
処理を終了しないと判定した場合(ステップS813でNO)、制御部21はステップS811に戻る。処理を終了すると判定した場合(ステップS813でYES)、制御部21は学習済のモデルのパラメータを補助記憶装置23に記録する(ステップS814)。その後、制御部21は処理を終了する。以上の処理により、学習済のモデルが生成される。
【0194】
本実施の形態によると、機械学習により生成した学習モデル45を使用する情報処理装置20を提供できる。
【0195】
学習モデル45は、画像コンテンツ36の入力を受け付けて、画像コンテンツ36を文章で説明するテキストを出力するモデルであってもよい。このような学習モデル45を用いて画像コンテンツ36をテキストに変換できる。その後、公知であるテキストデータ同士の相関算出手法を用いて、画像コンテンツ36とテキストコンテンツ31との相関値を算出できる。
【0196】
制御部21は、学習モデル45を用いて算出した相関値と、実施の形態1の(1)式から(3)式で説明した相関値算出式を用いて算出した相関値とを演算して、テキストコンテンツ31と画像コンテンツ36との相関値を算出してもよい。複数の相関値算出手法を用いた総合評価により相関値を算出する情報処理装置20を提供できる。
【0197】
[実施の形態6]
本実施の形態は、任意の種類のコンテンツの配置を支援する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0198】
図26は、実施の形態6のページ配分装置が行なう編集支援処理の概要を説明する説明図である。ページ配分装置11を実現する制御部21は、ネットワークを介して接続されたコンテンツサーバから複数のコンテンツ30を取得する。コンテンツ30は、たとえばテキストコンテンツ31、または画像コンテンツ36である。コンテンツ30は、複数の種類であっても、1つの種類であっても良い。
【0199】
制御部21は、様々な種類のコンテンツ30を同一種類のコンテンツ30に変換する(ステップS521)。たとえばそれぞれのコンテンツをテキストコンテンツ31に変換する場合を例にして説明する。
【0200】
コンテンツ30が画像コンテンツ36、動画コンテンツまたは音声コンテンツ等である場合、制御部21はそれぞれのコンテンツ30を説明するテキストを出力する学習モデル45を用いてテキストコンテンツ31に変換する。コンテンツ30が長いテキストコンテンツ31である場合、制御部21は長いテキストを要約する学習モデル45を用いて所定の長さのテキストコンテンツ31に変換する。以上により、制御部21はそれぞれのコンテンツ30の形式を揃える。
【0201】
なお、制御部21はそれぞれのコンテンツ30を画像コンテンツ36または音声コンテンツ等の、任意の形式に変換してもよい。以下の説明ではステップS521により変換されたコンテンツ30を変換コンテンツ39と記載する。
【0202】
制御部21は、ステップS521で変換したそれぞれの変換コンテンツ39の特徴量を示す特徴量ベクトルを抽出する(ステップS522)。制御部21は、特徴量ベクトルのクラスタリングを行ない、変換コンテンツ39を複数のクラスタに分類する(ステップS523)。
【0203】
制御部21は、それぞれの変換コンテンツ39を元のコンテンツ30に復元する(ステップS524)。以上により制御部21は入力されたコンテンツ30から複数のページコンテンツ41を生成する。
【0204】
図27は、実施の形態6のページレイアウト装置12が行なう編集支援処理の概要を説明する説明図である。ページレイアウト装置12を実現する制御部21は、ページ配分装置11で配分された1つのページコンテンツ41、すなわち1ページ分のコンテンツ30を取得する。制御部21は、それぞれのコンテンツ30同士の相関値を算出する(ステップS531)。
【0205】
具体的には、制御部21はそれぞれのコンテンツ30に対応する変換コンテンツ39同士の相関値を算出する。ページコンテンツ41に含まれるコンテンツ30が1種類のみである場合には、制御部21は変換コンテンツ39を使用せずコンテンツ30同士の相関値を算出してもよい。
【0206】
制御部21は、算出した相関値同士の相対評価または絶対評価に基づいて相関の高いコンテンツ30同士の組み合わせを抽出する。図27においては、太線で示す「コンテンツC」と「コンテンツD」との相関値が最も大きく、細線で示す「コンテンツA」と「コンテンツB」との相関値が2番目に大きく、それ以外の点線で示すコンテンツ30同士の組み合わせの相関値は小さい。
【0207】
制御部21は「コンテンツC」と「コンテンツD」とを近接配置するという制約条件のもとに、ページレイアウト306を生成する(ステップS532)。以上の処理により、ページレイアウト装置12はページ配分装置11が配分した1ページ分のコンテンツ30を適切にレイアウトする。
【0208】
本実施の形態によると、任意の種類のコンテンツの配置を支援する情報処理装置20を提供できる。
【0209】
[実施の形態7]
図28は、実施の形態7の情報処理装置20の構成を説明する説明図である。本実施の形態は、汎用のコンピュータ90と、プログラム97とを組み合わせて動作させることにより、本実施の形態の情報処理装置20を実現する形態に関する。実施の形態1と共通する部分については、説明を省略する。
【0210】
コンピュータ90は、制御部21、主記憶装置22、補助記憶装置23、通信部24、表示部25、入力部26、読取部29およびバスを備える。コンピュータ90は、汎用のパーソナルコンピュータ、タブレット、スマートフォンまたはサーバコンピュータ等の情報機器である。
【0211】
プログラム97は、可搬型記録媒体96に記録されている。制御部21は、読取部29を介してプログラム97を読み込み、補助記憶装置23に保存する。また制御部21は、コンピュータ90内に実装されたフラッシュメモリ等の半導体メモリ98に記憶されたプログラム97を読出してもよい。さらに、制御部21は、通信部24および図示しないネットワークを介して接続される図示しない他のサーバコンピュータからプログラム97をダウンロードして補助記憶装置23に保存してもよい。
【0212】
プログラム97は、コンピュータ90の制御プログラムとしてインストールされ、主記憶装置22にロードして実行される。これにより、コンピュータ90は上述した情報処理装置20として機能する。
【0213】
コンピュータ90は、汎用のパソコン、タブレット、スマートフォン、大型計算機、大型計算機上で動作する仮想マシン、クラウドコンピューティングシステム、または、量子コンピュータである。コンピュータ90は、分散処理を行なう複数のパソコン等であってもよい。
【0214】
[実施の形態8]
図29は、実施の形態8の情報処理装置20の機能ブロック図である。情報処理装置20は、取得部81と、分割部82と、レイアウト部85とを備える。取得部81は、複数のコンテンツ30を取得する。分割部82は、取得したコンテンツ30をコンテンツ30同士の関係性に基づいて複数のコンテンツグループ41に分割する。レイアウト部85は、コンテンツグループ41ごとに、所定の領域にレイアウトする。
【0215】
各実施例で記載されている技術的特徴(構成要件)はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0216】
(付記1)
複数のコンテンツを取得する取得部と、
取得した前記コンテンツ同士の相関値を算出する相関値算出部と、
算出した前記相関値に基づいて前記コンテンツをレイアウトするレイアウト部とを備える
情報処理装置。
【0217】
(付記2)
前記コンテンツは、テキストコンテンツと画像コンテンツとを含み、
前記相関値算出部は、取得した前記テキストコンテンツと取得した前記画像コンテンツとの相関値を算出する
付記1に記載の情報処理装置。
【0218】
(付記3)
前記取得部は、複数の前記画像コンテンツを取得し、
前記相関値算出部は、前記画像コンテンツのそれぞれと前記テキストコンテンツとの相関値とを算出する
付記2に記載の情報処理装置。
【0219】
(付記4)
前記取得部は、複数の前記テキストコンテンツを取得し、
前記相関値算出部は、前記テキストコンテンツのそれぞれと前記画像コンテンツとの相関値とを算出する
付記2または付記3に記載の情報処理装置。
【0220】
(付記5)
前記相関値算出部は、前記画像コンテンツから検出された物体を示す単語が前記テキストコンテンツに出現する出現頻度の合計値に基づいて前記相関値を算出する
付記2から付記4のいずれか一つに記載の情報処理装置。
【0221】
(付記6)
前記相関値算出部は、前記画像コンテンツから検出された物体を示す単語が前記テキストコンテンツに出現する出現頻度と、前記画像コンテンツから検出された前記物体の数との積の合計値に基づいて前記相関値を算出する
付記2から付記4のいずれか一つに記載の情報処理装置。
【0222】
(付記7)
前記相関値算出部は、前記画像コンテンツから検出された物体が前記画像コンテンツに占める比率と、前記物体を示す単語が前記テキストコンテンツに出現する出現頻度との積の合計値に基づいて前記相関値を算出する
付記2から付記4のいずれか一つに記載の情報処理装置。
(付記8)
前記相関値算出部は、テキストコンテンツと画像コンテンツとを入力した場合に相関値を出力する学習モデルに、取得したテキストコンテンツと取得した画像コンテンツとを入力して、前記学習モデルから出力された相関値を取得する
付記2から付記4のいずれか一つに記載の情報処理装置。
【0223】
(付記9)
前記レイアウト部は、複数のレイアウトを生成し、
前記相関値に基づいて前記レイアウトの評価を判定する判定部を備える
付記1から付記8のいずれか一つに記載の情報処理装置。
【0224】
(付記10)
前記レイアウト部は、前記相関値が他の組み合わせに比べて高い前記コンテンツの組み合わせを近接配置した前記レイアウトを生成する
付記1から付記9のいずれか一つに記載の情報処理装置。
【0225】
(付記11)
前記取得部は、1ページ分、または、見開きページ1組分の前記コンテンツを取得する
付記1から付記10のいずれか一つに記載の情報処理装置。
【0226】
(付記12)
複数のコンテンツを取得し、
取得した前記コンテンツ同士の相関値を算出し、
算出した前記相関値に基づいて前記コンテンツをレイアウトする
処理をコンピュータに実行させる情報処理方法。
【0227】
(付記13)
複数のコンテンツを取得し、
取得した前記コンテンツ同士の相関値を算出し、
算出した前記相関値に基づいて前記コンテンツをレイアウトする
処理をコンピュータに実行させるプログラム。
【符号の説明】
【0228】
11 ページ配分装置(分割部)
12 ページレイアウト装置(レイアウト部)
20 情報処理装置
21 制御部
22 主記憶装置
23 補助記憶装置
24 通信部
25 表示部
26 入力部
29 読取部
30 コンテンツ
306 ページレイアウト
31 テキストコンテンツ
32 テキストグループ(テキストコンテンツグループ)
33 結合テキスト
36 画像コンテンツ
361 第1画像コンテンツ
362 第2画像コンテンツ
363 第3画像コンテンツ
37 画像グループ(画像コンテンツグループ)
39 変換コンテンツ
41 ページコンテンツ(コンテンツグループ)
411 第1ページコンテンツ
412 第2ページコンテンツ
413 第3ページコンテンツ
414 第4ページコンテンツ
45 学習モデル
51 ページコンテンツ欄
52 サムネール欄
53 レイアウト欄
54 サムネール欄
55 ページ欄
57 採用ボタン
58 保存ボタン
59 終了ボタン
81 取得部
82 分割部
85 レイアウト部
90 コンピュータ
96 可搬型記録媒体
97 プログラム
98 半導体メモリ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29