IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7091267重要点検出装置、重要点検出方法、及び重要点検出プログラム
<>
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図1
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図2
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図3
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図4
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図5
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図6
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図7
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図8
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図9
  • 特許-重要点検出装置、重要点検出方法、及び重要点検出プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-17
(45)【発行日】2022-06-27
(54)【発明の名称】重要点検出装置、重要点検出方法、及び重要点検出プログラム
(51)【国際特許分類】
   G06F 16/58 20190101AFI20220620BHJP
   G06F 3/04845 20220101ALI20220620BHJP
【FI】
G06F16/58
G06F3/04845
【請求項の数】 8
(21)【出願番号】P 2019023187
(22)【出願日】2019-02-13
(65)【公開番号】P2020134998
(43)【公開日】2020-08-31
【審査請求日】2020-12-09
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】石川 健二
【審査官】白石 圭吾
(56)【参考文献】
【文献】特開2018-196046(JP,A)
【文献】国際公開第2017/002505(WO,A1)
【文献】特開2001-333408(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 3/01;3/048-3/04895
G06Q 10/00-10/10;30/00-30/08;50/00-50/20;50/26-99/00;G16Z 99/00
(57)【特許請求の範囲】
【請求項1】
画像一部を拡大表示させる拡大操作に係る情報であって、前記拡大操作による拡大位置を含む操作情報受信する操作取得部と、
前記拡大操作による前記拡大位置に基づいて、前記画像重要点を検出する重要点検出部と、
を備え
前記操作取得部は、複数のユーザが実施した前記拡大操作に係る前記操作情報を取得し、
前記重要点検出部は、複数の前記ユーザが実施した前記拡大操作の前記拡大位置のばらつきに基づいて、前記画像の前記重要点を検出する
ことを特徴とする重要点検出装置。
【請求項2】
請求項1に記載の重要点検出装置において、
前記操作取得部は、前記画像に対する前記操作情報を蓄積し、
前記重要点検出部は、蓄積された前記操作情報の前記拡大位置に基づいて、前記画像の前記重要点を検出する
ことを特徴とする重要点検出装置。
【請求項3】
請求項1または請求項2に記載の重要点検出装置において、
前記ユーザに関するユーザ属性を含むユーザ情報が記録されるユーザデータベースを備え、
前記重要点検出部は、所定ユーザ属性を有する複数の前記ユーザが実施した前記拡大操作の前記拡大位置に基づいて検出された前記重要点に対して、前記所定ユーザ属性を関連付ける
ことを特徴とする重要点検出装置。
【請求項4】
請求項1から請求項のいずれか1項に記載の重要点検出装置において、
前記画像に対し、前記重要点を中心とした範囲を切り出すトリミング処理部を備える
ことを特徴とする重要点検出装置。
【請求項5】
請求項1から請求項のいずれか1項に記載の重要点検出装置において、
前記画像を解析し、前記重要点を含む対象物を特定する重要対象特定部を備える
ことを特徴とする重要点検出装置。
【請求項6】
請求項1から請求項のいずれか1項に記載の重要点検出装置において、
前記画像の前記重要点を中心とした所定領域を第一解像度とし、その他の領域を前記第一解像度よりも低い第二解像度として前記画像を圧縮する画像圧縮部を備える
ことを特徴とする重要点検出装置。
【請求項7】
コンピューターにより画像内の重要点を検出する重要点検出方法であって、
前記コンピューターは、操作取得部、及び重要点検出部として機能し、
前記操作取得部が、画像一部を拡大表示させる拡大操作に係る情報であって、前記拡大操作による拡大位置を含む操作情報受信する操作取得ステップと、
前記重要点検出部が、前記拡大操作による前記拡大位置に基づいて、前記画像重要点を検出する重要点検出ステップと、を実施し、
前記操作取得ステップは、複数のユーザが実施した前記拡大操作に係る前記操作情報を取得し、
前記重要点検出ステップは、複数の前記ユーザが実施した前記拡大操作の前記拡大位置のばらつきに基づいて、前記画像の前記重要点を検出する
とを特徴とする重要点検出方法。
【請求項8】
コンピューターにより読み取り実行可能な重要点検出プログラムであって、
前記コンピューターを、請求項1から請求項のいずれか1項に記載の重要点検出装置として機能させる
ことを特徴とする重要点検出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像から重要点を検出する重要点検出装置、重要点検出方法、及び重要点検出プログラムに関する。
【背景技術】
【0002】
従来、画像から重要点を検出する方法が知られている(例えば、特許文献1参照)。特許文献1に記載の方法は、画像のトリミング手法に関し、画像内の明暗のコントラストが高い部分を重要点として検出し、画像のトリミングを行う。
また、その他の重要点の検出方法として、画像内の顔認識を行い、顔画像を重要点として検出する技術も知られている。
【先行技術文献】
【非特許文献】
【0003】
【文献】Twitter,Inc「画像を最適かつ自動的にトリミングするニューラルネットワークのご紹介」、[online]、[平成30年12月17日検索]、インターネット<URL:https://blog.twitter.com/official/ja_jp/topics/product/2018/0125ML-CR.html >
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、画像のコントラストの明暗がはっきりしている部分をその画像の重要点とする場合、ユーザにとって、重要視されていない部分が重要点とされる場合がある。例えば、画像内のコントラストの明暗がはっきりしている部分とは異なる位置に、少しぼやけたイラストがあり、多くのユーザにそのイラストが注目される場合もあり、このような場合、従来の技術では、重要点と認識することができないとの課題があった。
【0005】
本発明は、ユーザが求める画像内の重要点を適切に検出できる重要点検出装置、重要点検出方法、及び重要点検出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の重要点検出装置は、画像に対して一部を拡大表示させる拡大操作を取得する操作取得部と、前記拡大操作による拡大位置に基づいて、画像における重要点を検出する重要点検出部と、を備えることを特徴とする。
【発明の効果】
【0007】
本発明は、ユーザが実施した拡大操作における画像の拡大位置に基づいて、画像における重要点を検出する。このため、例えば、画像内のコントラストの明暗やエッジ線の密度に基づいて画像内の重要点を検出する場合に比べ、ユーザが意図する重要点を適切に検出することができる。
【図面の簡単な説明】
【0008】
図1】第一実施形態の重要点検出装置であるサーバ装置を含む画像公開システムの概略構成を示す図。
図2】第一実施形態のサーバ装置の概略構成を示すブロック図。
図3】第一実施形態の画像公開方法を示すフローチャート。
図4】画像コンテンツの一例を示す図。
図5】表示部に表示された元画像、及び拡大操作を行った際の拡大画像の一例を示す図。
図6図5の元画像に対する重要点の検出例を示す図。
図7】第二実施形態で検出される重要点及び重要領域の一例を示す図。
図8】第三実施形態のサーバ装置の概略構成を示すブロック図。
図9】第四実施形態のユーザ端末の概略構成を示すブロック図。
図10】第四実施形態の重要点検出方法を示すフローチャート。
【発明を実施するための形態】
【0009】
[第一実施形態]
以下、本発明の第一実施形態について説明する。
図1は、本実施形態の重要点検出装置であるサーバ装置10を含む画像公開システム1の概略構成を示す図である。
本実施形態では、図1に示すように、画像公開システム1は、サーバ装置10と、サーバ装置10に通信可能に接続されるユーザ端末20とを備えて構成されている。この画像公開システム1では、ユーザが操作するユーザ端末20から、サーバ装置10に画像をアップロード(投稿)することで、サーバ装置10は、その画像を他のユーザがユーザ端末20から閲覧できるように公開する。
そして、サーバ装置10は、複数のユーザ端末20から送信される画像に対する拡大操作に基づいて、その画像において、複数のユーザが注目している部分、つまり重要点を検出する。
そして、サーバ装置10は、検出された重要点に基づいて種々の処理を実施する。本実施形態では、一例として、検出された重要点を中心としたトリミング処理、及び重要点に基づいたキャプション付加処理、及び画像圧縮処理を実施する例を示す。
以下、このような画像公開システム1の各構成について詳細に説明する。
【0010】
[サーバ装置10の構成]
図2は、サーバ装置10の概略構成を示すブロック図である。
サーバ装置10は、コンピューターにより構成された重要点検出装置であり、ハードウェア構成として、通信部11と、記憶部12と、制御部13と、等を含んで構成されている。
通信部11は、インターネットに接続されており、インターネットを介してユーザ端末20等の外部装置と通信する。
【0011】
記憶部12は、例えばメモリ、ハードディスク等により構成された情報記録装置であり、サーバ装置10の全体動作を制御するためのOS(Operating System)や、重要点検出プログラムを含む各種プログラム、各種データが記憶される。
また、この記憶部12には、ユーザ情報を記憶するユーザデータベース(ユーザDB121)と、画像データベース(画像DB122)とが設けられている。なお、ここでは、サーバ装置10の記憶部12に、ユーザDB121、及び画像DB122が設けられる例を示すが、サーバ装置10とネットワークを介して通信可能に接続された他のデータサーバに、これらのデータベースが設けられる構成としてもよい。
【0012】
ユーザDB121は、画像公開システム1を利用する各ユーザに関するユーザ情報が記録されている。ユーザ情報は、ユーザを識別するユーザID、ユーザ固有情報、ユーザ属性情報等が記録されている。
ユーザ固有情報は、個々のユーザに特有の情報であり、例えば、ユーザの氏名やハンドルネーム等の名称情報や、メールアドレス等の連絡先情報等、ユーザを特定可能な個人情報が含まれる。
ユーザ属性情報は、例えば、ユーザの性別、ユーザの居住地域、ユーザの年齢層、ユーザの職業、ユーザの趣味や好み等のユーザ属性を示す情報が含まれている。つまり、ユーザ属性情報には、複数のユーザを分類することが可能な様々なユーザ属性が記録されている。
【0013】
画像DB122には、ユーザから送信される画像が記録される。
また、画像DB122には、各画像に関連付けて、画像付帯情報が記録されている。
画像付帯情報には、送信元情報、拡縮履歴、重要点情報、サムネイル画像、キャプション情報、紹介情報等が含まれる。
送信元情報は、画像をサーバ装置10に送信したユーザに関する情報で、例えばユーザIDが記録される。
拡縮履歴は、画像を閲覧したユーザが画像に対して実施した拡縮履歴であり、具体的には、画像の一部を拡大する拡大操作を行った際の操作情報が蓄積されている。蓄積される操作情報には、例えば、拡大操作によって拡大された画像の中心(拡大点)が記録されている。
重要点情報は、拡大操作に基づいて検出された画像における重要点や重要領域が記録されている。これらの重要点や重要領域についての詳細は後述する。
サムネイル画像は、画像の所定領域を切り取る、いわゆるトリミング処理が実施された後の画像が記録されている。
キャプション情報は、画像に対するキャプションである。
紹介情報は、画像とともに表示させるテキスト情報であり、ユーザにより登録される。
【0014】
[制御部13の構成]
制御部13は、CPU(Central Processing Unit)等の演算回路、RAM(Random Access Memory)等の記憶回路により構成される。制御部13は、記憶部12等に記憶されているプログラムをRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。
そして、制御部13は、記憶部12に記憶された情報処理プログラムを読み取り実行することで、図2に示すように、画像取得部131、コンテンツ送信部132、操作取得部133、重要点検出部134、ユーザ情報取得部135、画像処理部136、及び重要対象特定部137として機能する。
【0015】
画像取得部131は、ユーザ端末20から画像が送信されると、送信された画像を画像DB122に登録する。
コンテンツ送信部132は、画像DB122に登録された画像をユーザが閲覧するための画像コンテンツを生成し、ユーザ端末20に送信する。
【0016】
操作取得部133は、ユーザ端末20から送信された画像に対する操作情報を取得する。
重要点検出部134は、拡縮履歴に蓄積された操作情報に基づいて、画像においてユーザが注目する部分、つまり重要点を検出する。
ユーザ情報取得部135は、ユーザ端末20からユーザ情報を取得し、ユーザ情報として登録する。
【0017】
画像処理部136は、重要点に基づいて画像を処理する。この画像処理部136は、トリミング処理部136A、及び画像圧縮部136Bを含む。
トリミング処理部136Aは、画像内の重要点を中心とした所定領域を切り出すトリミング処理を実施する。
画像圧縮部136Bは、画像における重要点を含む所定領域を第一解像度(高解像度)とし、その他の領域を第一解像度より低い第二解像度(低解像度)として画像を圧縮する。
重要対象特定部137は、画像を解析し、画像内の重要点に存在する対象物を特定する。
各機能構成の詳細な動作の説明は後述する。
【0018】
[ユーザ端末20の構成]
次に、ユーザ端末20の構成について説明する。
ユーザ端末20は、ユーザが保有するコンピューターであり、例えばスマートフォンやタブレット端末、パーソナルコンピューター等により構成される。図1に示すように、ユーザ端末20は、各種情報を表示させる表示部21、各種情報を入力操作するための入力操作部22、撮像対象を撮像する端末カメラ23、インターネットを介してサーバ装置10等を通信する端末通信部24、各種情報を記憶する端末記憶部25、及びユーザ端末20を制御する端末制御部26等を含んで構成される。
【0019】
端末記憶部25は、画像公開システム1を利用して画像を閲覧するための端末側プログラムが記録されている。また、ユーザが、端末カメラ23等を用いて取得した画像が記録されていてもよい。
【0020】
端末制御部26は、端末記憶部25に記憶された端末側プログラムを読み込み実行することで、表示制御部261、操作送信部262、及び登録送信部263等として機能する。
表示制御部261は、コンテンツや画像等を、表示部21に表示させる。
操作送信部262は、ユーザ操作によって、画像に対する拡大操作が実施された際に、画像内の拡大位置の座標を含む操作情報をサーバ装置10に送信する。
登録送信部263は、ユーザが撮像した画像や、画像を紹介する紹介情報等をサーバ装置10に送信する。
【0021】
[画像公開方法]
次に、本実施形態の画像公開システム1における、重要点検出方法(重要点検出処理)を含む画像公開方法について説明する。
図3は、本実施形態の画像公開方法を示すフローチャートである。
本実施形態の画像公開システム1では、画像送信元のユーザがユーザ端末20を操作して、画像と、画像を紹介する紹介情報(テキストデータ)とをサーバ装置10に送信する。
これにより、サーバ装置10の画像取得部131は、画像送信元のユーザIDと紹介情報とを含む画像付帯情報を生成し、画像と画像付帯情報とを画像DB122に記録する(ステップS11)。
【0022】
画像の閲覧を希望するユーザが、ユーザ端末20を操作して、画像の閲覧要求をサーバ装置10に送信すると(ステップS21)、サーバ装置10のコンテンツ送信部132は、画像コンテンツをユーザ端末20に送信する(ステップS12)。
ユーザ端末20の表示制御部261は、画像コンテンツを受信すると、表示部21に表示させる(ステップS22)。
【0023】
図4は、画像コンテンツ30の一例を示す図である。
図4に示す画像コンテンツ30は、例えば、サムネイル画像32が配置された記事欄31が、複数配置されたコンテンツである。
各記事欄31には、紹介情報に基づいたテキストが表示される紹介表示部31Aや、他のユーザからのコメントが表示されるコメント表示部31B、他のユーザの評価結果が表示される評価表示部31C等が設けられていてもよい。
記事欄31に配置されるサムネイル画像32は、画像に関連付けられた画像付帯情報に記録されているサムネイル画像である。
各記事欄31は、例えばサーバ装置10に登録された画像の記事が新着順で表示されてもよく、ユーザが設定入力したキーワードに基づいて検索された記事がキーワードへの類似度順(検索スコア順)に表示されていてもよく、ユーザ属性に基づいたお勧め順で各記事が表示されてもよい。
【0024】
ユーザ端末20において、表示部21に表示された画像コンテンツ30に対して、いずれかのサムネイル画像32を選択する旨のユーザ操作が入力されると、ユーザ端末20は、選択されたサムネイル画像32の詳細画像を要求する画像要求をサーバ装置10に送信する(ステップS23)。
【0025】
サーバ装置10のコンテンツ送信部132は、画像要求を受信すると、選択されたサムネイル画像32に対応した画像を、画像DB122から読み出して、ユーザ端末20に送信する(ステップS13)。これにより、ユーザ端末20の表示制御部261は、受信した画像を表示部21に表示させる(ステップS24)。
【0026】
また、ユーザ操作によって、画像に対して拡大操作が入力されると(ステップS25)、表示制御部261は、画像における拡大点の座標を特定し、各拡大点を中心とした所定範囲を拡大表示させる(ステップS26)。
図5は、表示部21に表示された元画像、及び拡大操作を行った際の拡大画像の一例を示す図である。
ユーザが、表示部21に表示された画像の一部を中心にピンチアウト等の拡大操作を行うと、拡大中心の画像内における座標が拡大点Pとして検出される。これにより、表示制御部261は、拡大点Pを画面中心として、操作量に応じた拡大率の拡大画像が表示される。なお、拡大操作としては、タッチパネルにおけるピンチアウト操作や、マウスにおけるマウスホイール操作等が挙げられる。
【0027】
この後、操作送信部262は、検出された拡大点Pを含む操作情報をサーバ装置10に送信する(ステップS27)。操作情報としては、拡大点Pに加え、画像の拡大率または拡大操作により表示された拡大領域が含まれていてもよい。
なお、図3では、ステップS27の後、ユーザ端末20の処理が終了しているが、ユーザ操作に基づいて、各種処理を実施する。例えば、ピンチイン操作が実施されることで拡大画像から元画像を表示させたり、表示遷移前に戻る旨の入力操作により画像コンテンツ30を表示させたりする。
【0028】
サーバ装置10の操作取得部133は、ユーザ端末20から操作情報を受信すると、表示部21に表示されている画像に対応した画像付帯情報の拡縮履歴に、拡大点Pを中心に拡大操作を行った旨の操作情報と、操作情報を受信した日時とを蓄積する(ステップS14)。なお、操作取得部133は、拡大点Pに加え、拡大率または拡大操作により表示された拡大領域を、拡縮履歴に記録してもよい。
【0029】
次に、重要点検出部134は、拡縮履歴として蓄積された操作情報に基づいて、画像における重要点を検出する(ステップS15)。
重要点の検出は、複数のユーザ端末20から送信された拡大点Pの位置のばらつきに基づいて重要点を検出する。
図6は、図5の元画像に対する重要点の検出例を示す図である。
重要点検出部134は、例えば、蓄積された各拡大点Pについて、所定の距離内に存在する他の拡大点Pの数をカウントする。また、重要点検出部134は、所定の距離内に存在する他の拡大点Pの数が所定数以上である拡大点Pを候補点Qとして抽出する。ここで、互いの距離が所定距離内となる候補点Qの集合は、画像内の同一の対象物に対する拡大操作と見なすことができる。したがって、重要点検出部134は、その候補点Qの集合を含む領域を重要領域Rとし、重要領域Rの中心点(重心点)を重要点Xとして検出する。
なお、重要領域Rは、図6に示すように矩形領域であってもよいが、円形領域であってもよく、任意の形状の領域であってもよく、重要点Xを含む対象物のエッジ線により囲われる領域であってもよい。また、重要領域Rを検出し、その重要領域Rの中心を重要点Xとしたが、例えば、互いの距離が所定距離内となる候補点Qの平均位置を重要点Xとして検出してもよい。また、重要領域Rは、重要点Xを中心とした所定の領域(例えば矩形領域等)であってもよい。
そして、重要点検出部134は、検出した重要点Xから、候補点Qの数が最大となる重要点X及び重要領域Rを、最重要点X1及び最重要領域R1として検出する。図6に示す例では、3つの重要点Xが検出される例であり、いずれも所定数のユーザが拡大操作によって注目した部分である。また、候補点Qが最も多い重要領域Rを最重要領域R1とし、最重要領域R1に対応する重要点Xを最重要点X1として検出する。
【0030】
この後、重要対象特定部137は、検出した重要点に基づいて画像のキャプションを設定する(ステップS16)。
具体的には、重要対象特定部137は、検出した最重要領域R1に含まれる対象物を画像認識処理により認識し、キャプションを設定する。画像認識処理は、公知の技術を利用することができ、例えば、記憶部12に、複数のサンプルの画像特徴量を記録しておく。そして、重要対象特定部137は、最重要領域R1に含まれる対象物の特徴量を検出し、その特徴量に最も近い画像特徴量を有するサンプルを検索して、最重要領域R1に含まれる対象物とする。あるいは、AIを用いた画像認識処理により、対象物を認識してもよい。
そして、重要対象特定部137は、認識した対象物を画像付帯情報のキャプション情報に記録する。本実施形態では、重要対象特定部137は、最重要領域R1に対する対象物を特定したが、他の重要領域Rに対する対象物をさらに認識し、キャプション情報として記録してもよい。
【0031】
また、画像処理部136は、最重要点X1を含むサムネイル画像を生成する。
具体的には、トリミング処理部136Aは、トリミング処理を実施して、元画像から最重要点X1を含むサムネイル画像を切り出す(ステップS17)。サムネイル画像のアスペクト比や画像寸法は、予め決められた設定値を用いればよい。図6において、一点鎖線の枠は、サムネイル画像の画像枠(サムネイル枠W)を示している。図6の例では、サムネイル枠Wが、最重要領域R1より大きい。この場合、トリミング処理部136Aは、図6に示すように、最重要領域R1を中心に配置したサムネイル枠Wで、画像を切り出す。なお、サムネイル枠Wよりも最重要領域R1が大きい場合、最重要領域R1をサムネイル枠Wの画像寸法まで縮小してサムネイル画像としてもよい。
【0032】
また、図6の例では、サムネイル枠Wには、最重要領域R1と、最重要領域R1以外の領域とが含まれる。この場合、画像圧縮部136Bは、最重要領域R1を第一解像度(例えば元画像と同じ解像度)とし、それ以外の画像領域を、第一解像度よりも低い第二解像度として画像圧縮処理を実施する(ステップS18)。これにより、単に元画像の一部を切り出した画像をサムネイル画像とする場合に比べて、サムネイル画像のファイルサイズを小さくできる。また、サムネイル枠Wの全体を低解像度とすると、最重要領域R1の解像度が低下し、画像が見にくくなる場合もあるが、最重要領域R1は、他の領域よりも高解像度に維持されるので、画像の見にくさも抑制される。
【0033】
画像処理部136は、以上により作成したサムネイル画像を画像付帯情報に記録する(ステップS19)。これにより、次にユーザ端末20に画像コンテンツ30を送信する際に、最重要点X1に対応したサムネイル画像32が掲載された画像コンテンツ30を送信できる。
【0034】
[本実施形態の作用効果]
本実施形態の画像公開システム1のサーバ装置10は、画像に対して一部を拡大表示させる拡大操作を含む操作情報を取得する操作取得部133と、拡大操作による拡大点Pに基づいて、画像における重要点を検出する重要点検出部134と、を備える。
この場合、ユーザが実施した拡大操作に基づく拡大点Pに基づいた重要点が検出される。つまり、画像において拡大操作される部分は、ユーザにとって注目度が高い部分を意味する。したがって、この部分を重要点とすることで、例えば、画像内のコントラストの明暗やエッジ線の密度に基づいて画像内の重要点を検出する場合に比べ、ユーザが注目する重要点を適切に検出することができる。
【0035】
本実施形態では、操作取得部133は、画像に対する拡大操作の操作情報を拡縮履歴に蓄積し、重要点検出部134は、蓄積された操作情報に基づいて重要点を検出する。これにより、1回の拡大操作に基づいて画像の重要点を検出する場合に比べて、重要点を精度よく検出することができる。
【0036】
この際、操作取得部133は、複数のユーザが実施した拡大操作の操作情報を取得して拡縮履歴に蓄積し、重要点検出部134は、複数のユーザの操作情報に基づいた画像の重要点を検出する。
複数のユーザ端末20から送信される操作情報に基づいて重要点を決定することで、1人のユーザからの操作情報のみを用いて重要点を決定する場合に比べて、多くのデータを迅速に収集することができ、画像を取得してから重要点の検出が実施可能となるまでの期間を短縮できる。また、複数のユーザの操作情報に基づいた重要点を検出することで、その画像に対して多くのユーザが注目している部分を重要点として検出することができる。特に、画像をインターネット上に公開する画像公開システム1において、ユーザが興味を引く画像を見つけやすくなり、ユーザの満足度が向上する。
また、画像の送信元のユーザ(画像投稿者)にとっても、自分が公開した画像に対して、他のユーザが画像のどの部分に注目しているかを確認することができ、画像投稿のモチベーションの向上を促すことができる。
【0037】
本実施形態のサーバ装置10では、トリミング処理部136Aは、重要点Xを中心とした重要領域Rを含む所定領域をサムネイル画像として切り出す。
これにより、画像コンテンツ30に、多くのユーザに注目された部分を表示したサムネイル画像32を掲載させることができる。
【0038】
本実施形態では、重要対象特定部137は、重要点Xに対する画像認識処理を実施して、重要点Xを含む対象物のキャプション情報を登録する。これにより、ユーザは、他の多くのユーザが画像のどの部分に注目しているかのみならず、注目している対象物が何であるかをキャプション情報によって知ることができる。
【0039】
本実施形態では、画像圧縮部136Bは、画像の重要点Xを中心とした重要領域Rを第一解像度とし、その他の領域を第一解像度よりも低い第二解像度として画像を圧縮したサムネイル画像を生成する。これにより、各サムネイル画像において、重要領域Rの画質を落とさず、ファイルサイズのみを小さくできる。
なお、本実施形態では、画像コンテンツ30に掲載するサムネイル画像を画像圧縮する例を示したが、その他の画像を対象としてもよい。例えば、ステップS13において画像を送信する際に、画像圧縮部136Bが、重要領域Rを高解像度とし、その他を低解像度とした画像圧縮を行い、コンテンツ送信部132が画像圧縮後の画像をユーザ端末20に送信してもよい。
【0040】
[第二実施形態]
次に、第二実施形態について説明する。
第一実施形態では、所定領域内の候補点Qが最大となる重要点X、つまり、より多くのユーザにより拡大操作が行われている部分を最重要点X1とした。これに対して、第二実施形態では、ユーザ属性毎に重要点を設定する点で、上記第一実施形態と相違する。
なお、以降の説明にあたり、既に説明した事項については同符号を付し、その説明を省略または簡略化する。
【0041】
第二実施形態では、ユーザ端末20は、画像に対する拡大操作が実施された際、ステップS27で操作情報に加えて、ユーザIDを送信する。また、サーバ装置10は、ステップS14において、拡大操作を実施したユーザのユーザIDと、操作情報とを拡縮履歴に記録する。
そして、重要点検出部134は、ステップS15において、第一実施形態と同様に、最重要点X1を検出するとともに、拡大操作を行ったユーザのユーザ属性に応じて、各重要点Xに対してユーザ属性を関連付ける。
例えば、重要点検出部134は、第一実施形態と同様に複数の候補点Qを抽出した後、重要点X及び重要領域Rを検出し、そのうち、候補点Qが最も多い最重要点X1及び最重要領域R1を検出する。これに加え、本実施形態では、ユーザDB121から、各候補点Qに対応するユーザIDのユーザ情報を抽出し、重要領域Rに含まれる複数の候補点Qに対応するユーザ属性において、所定ユーザ属性が所定割合以上含まれている場合、その重要領域R及び重要点Xに対して、当該所定ユーザ属性を関連付ける。
【0042】
図7は、本実施形態において、検出される重要点X及び重要領域Rの一例を示す図である。図7に示す例では、重要点X2に対して、ユーザ属性「男性」「20代」が関連付けられ、重要点X3に対して、ユーザ属性「趣味:飛行機」が関連付けられている。また、1つのユーザ属性に複数の重要点Xや重要領域Rが検出される場合、ぞれぞれのユーザ属性に対して最重要点や最重要領域が検出されてもよい。
【0043】
また、本実施形態では、ステップS16からステップS19において、ステップS15で検出された最重要点X1、及びユーザ属性に対応した重要点X2,X3に対して、それぞれ、サムネイル画像を生成し、各サムネイル画像にユーザ属性を関連付けて画像付帯情報に記録する。
【0044】
そして、本実施形態では、ユーザ端末20は、ステップS21において閲覧要求に加えてユーザIDを送信する。サーバ装置10において閲覧要求が受信されると、コンテンツ送信部132は、閲覧要求とともに送信されたユーザIDに対応するユーザ情報に記録されたユーザ属性を特定する。さらに、コンテンツ送信部132は、特定したユーザ属性に対応したサムネイル画像を画像付帯情報から読み出し、サムネイル画像32として画像コンテンツ30に掲載してユーザ端末20に送信する。
【0045】
以上のような本実施形態では、記憶部12がユーザ属性を含むユーザ情報が記録されるユーザDB121を備える。そして、重要点検出部134は、各重要点に対し、主に拡大操作を実施したユーザのユーザ属性を関連付ける。
このため、画像を閲覧するユーザのユーザ属性に応じて、画像の重要点を変動させることができる。これにより、例えば画像コンテンツ30において、画像を閲覧するユーザにとっての注目度が高いと予測される部分をサムネイル画像32に表示させることができ、各画像に対してユーザが興味を持つ可能性が高くなるとともに、ユーザが興味のある画像を見つけやすくなる。
【0046】
また、サーバ装置10は、画像の送信元のユーザに対して、ユーザ毎の画像の重要点を送信してもよい。この場合、送信元のユーザは、どのようなユーザ属性のユーザが、どの点に注目しているかを認識することができ、例えば、送信元のユーザがターゲットとしたいユーザ属性に対して注目度が上がる画像をサーバ装置10に登録する等、画像投稿のモチベーション向上を促すことができる。
【0047】
[第三実施形態]
次に、第三実施形態について説明する。
第一実施形態では、複数のユーザが画像に対して拡大操作を実施した後、互いに近接する拡大点Pの数が所定数以上となる場合に候補点Qとして、重要領域Rや重要点Xを検出する。この場合、少なくとも前記所定数以上の操作情報が必要となるので、サーバ装置10に送信された直後の画像に対して重要点を検出することができない。これに対して、第三実施形態では、送信された直後の画像に対して重要点を検出できる点で第一実施形態と相違する。
【0048】
図8は、第三実施形態のサーバ装置10Aの概略構成を示すブロック図である。
本実施形態のサーバ装置10Aは、第一実施形態と略同様の構成を有し、制御部13は、記憶部12に記録された重要点検出プログラムを読み出し実行することで、さらに、モデル生成部138として機能する。
モデル生成部138は、入力した画像に対して、その画像に対する重要点を出力する重要点検出モデルを生成する。
【0049】
本実施形態では、ステップS14により、画像に対する操作情報が得られると、その画像と、操作情報(つまり、拡大操作による拡大点)とを教師データとして記憶部12に蓄積する。なお、教師データとしては、操作情報を送信したユーザのユーザ属性がさらに含まれてもよい。
そして、モデル生成部138は、教師データを用い、AIを用いた機械学習により、画像、または画像及びユーザ属性を入力とし、重要点を出力とした重要点検出モデルを生成する。つまり、重要点検出モデルは、画像の画像特徴量と、当該画像に対する多数の教師データに基づいた拡大点(つまり、ユーザが注目した点)とに基づいて、画像に対して多くのユーザが注目する位置である重要点を推定する。
【0050】
このような本実施形態のサーバ装置10Aでは、ステップS11において、ユーザ端末20から新しい画像を受信すると、重要点検出部134は、その画像を重要点検出モデルに入力することで、当該画像に対する重要点を検出する。
また、ユーザ属性を含む教師データを用い、画像及びユーザ属性を入力することで、重要点を出力する重要点検出モデルを生成している場合、ユーザ属性に対応した重要点を検出することも可能となる。
【0051】
このため、ステップS11で、画像DB122で登録されたばかりの画像に対しても重要点を設定することができ、ステップS16からステップS19の処理、つまり、キャプションの設定や、トリミング処理及び画像圧縮力を用いたサムネイル画像の生成が可能となる。
例えば、コンテンツ送信部132は、ステップS11で取得したばかりの画像のサムネイル画像32が掲載された画像コンテンツ30を送信する場合でも、重要点に基づいたサムネイル画像32を画像コンテンツ30に掲載することができる。
【0052】
[第四実施形態]
次に、第四実施形態について説明する。
上記第一実施形態から第三実施形態では、サーバ装置10またはサーバ装置10Aを、本発明の重要点検出装置として機能させる例を示した。これに対して、ユーザが所有するユーザ装置が重要点検出装置として機能してもよい。
【0053】
図9は、第四実施形態のユーザ端末20Aの概略構成を示すブロック図である。
本実施形態では、端末記憶部25に画像DB251が設けられ、画像と画像付帯情報が記録される。なお、画像付帯情報としては、拡縮履歴、重要点情報、キャプション情報が含まれていればよい。
また、端末記憶部25には、重要点検出プログラムが記録されており、端末制御部26は、重要点検出プログラムを読み込み実行することで、表示制御部261、画像取得部264、操作取得部265、モデル生成部266、重要点検出部267、画像処理部268、及び重要対象特定部269等として機能する。
【0054】
画像取得部264は、端末カメラ23により撮像された画像や、インターネット上に公開されている画像等を取得する。
操作取得部265は、表示制御部261により表示された画像に対するユーザの拡大操作等の操作情報を取得する。
モデル生成部266は、ユーザの画像に対する拡大操作の履歴に基づいて、画像を入力とし、重要点を出力とした重要点検出モデルを生成する。
重要点検出部267は、画像取得部264により画像が取得されると、その画像を重要点検出モデルに入力することで、画像における重要点を検出する。
【0055】
画像処理部268は、第一実施形態と同様、トリミング処理部268Aや画像圧縮部268Bを有する。トリミング処理部268A及び画像圧縮部268Bは、第一実施形態と同様であり、画像のトリミング処理、及び画像の圧縮処理を実施する。
【0056】
重要対象特定部269は、第一実施形態と同様、画像に対して検出された重要点Xに対する画像認識処理を実施し、重要領域Rに含まれる対象物を特定し、キャプション情報を更新する。
【0057】
図10は、ユーザ端末20Aにおける重要点検出方法を示すフローチャートである。
本実施形態における画像の重要点検出方法は、第三実施形態と略同様の手法により実施される。
ユーザ端末20Aにおいて、ユーザ操作によって、所定の画像を表示させる旨の入力操作が実施されると、表示制御部261は、表示部21に画像を表示させる(ステップS31)。そして、表示された画像に対してユーザ操作によって、所定の拡大点を中心とした拡大操作が実施されると、操作取得部265は、操作情報を取得し(ステップS32)、画像付帯情報の拡縮履歴に、操作情報(拡大操作及び拡大点)を記録して蓄積する(ステップS33)。
そして、モデル生成部266は、画像DB251に記録される画像(または画像の特徴量)と拡大操作における拡大点との組み合わせを教師データとして、重要点検出モデルを生成する(ステップS34)。
【0058】
この後、ユーザ端末20Aの画像取得部264は、ユーザにより、外部機器やインターネットを介した画像を取得する旨の入力操作が実施された場合、あるいは、端末カメラ23による撮像処理が実施された場合に、画像を取得する(ステップS35)。
画像が取得されると、重要点検出部267は、取得された画像を重要点検出モデルに入力し、重要点を検出する(ステップS36)。これにより、ユーザ端末20Aが取得した直後の画像に対しても、画像の重要点を検出することができる。
【0059】
また、ユーザが画像を用いて各種処理を実施する際、ユーザによって画像内の特定の位置を重要点とする旨の操作がない限り、ステップS36で検出された重要点Xに基づいた各種処理を実施する。
例えば、ユーザが、画像をインターネット上の所定の外部サーバにアップロードする際、ユーザによる画像のトリミング処理が実施されなかった場合に、トリミング処理部268Aは、自動でトリミング処理を実施する。この際、第一実施形態と同様、検出された重要点X(重要領域R)を含む所定範囲を切り出す処理を実施する。また、重要対象特定部269は、重要点Xに対する画像認識処理を実施し、重要点Xを含む対象物を特定してキャプション情報として記録してもよい。
あるいは、ユーザが画像に対するトリミング処理を実施する際に、画像に対するトリミング枠のデフォルト位置が、重要領域Rを中心とした領域に設定されていてもよい。
また、ユーザが、画像を圧縮する旨の入力操作を実施した場合、画像圧縮部268Bは、第一実施形態と同様、重要点Xを含む重要領域Rの解像度を第一解像度(高解像度)とし、その他の領域の解像度を第一解像度よりも低い第二解像度として、画像を圧縮する。
【0060】
上記のような本実施形態のユーザ端末20Aでは、重要点検出部267は、ユーザ端末20Aを操作するユーザが着目する位置を重要点として検出することができる。
この場合、例えば図4に示すような画像コンテンツ30を表示させる際に、複数の画像のサムネイル画像32を、ユーザ端末20Aを操作するユーザに対応した重要点に応じたサムネイル画像とすることもできる。
【0061】
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形をも含むものであり、以下にその一部を変形例として示す。
[変形例1]
上記実施形態では、拡大操作を行った際の拡大点に基づいて、重要点を検出する例を示したが、これに限定されない。つまり、本発明の拡大位置とは、拡大操作を実施した際の中心点である拡大点のみを指すものではなく、拡大操作を行った際の拡大率や拡大後の表示領域(拡大領域)であってもよく、これらの拡大率や拡大領域に基づいて重要点や重要領域が検出されてもよい。
この場合も上記各実施形態と略同様の処理により重要点や重要領域を検出することができる。例えば、第一実施形態において、ユーザ端末20から送信される操作情報に拡大領域が含まれる場合、複数のユーザが閲覧した拡大領域を拡縮履歴に蓄積する。そして、蓄積した拡大領域のうち、所定数の拡大領域において、互いに重なり合う領域が存在する場合に、その領域を重要領域Rとして検出し、その重要領域Rの中心位置または重心位置を重要点Xとして検出する。
【0062】
[変形例2]
上記実施形態では、複数のユーザからの拡大操作、または、ユーザ端末20Aを操作するユーザの拡大操作を蓄積して重要点を検出する例を示した。これに対して、拡大操作が蓄積されず、新たに取得された拡大操作によって、重要点Xや重要領域Rの位置を修正する構成としてもよい。
例えば、操作取得部133が画像に対する最初の拡大操作の操作情報を取得した場合、重要点検出部134は、その得られた拡大点を重要点とする。次に、操作取得部133が拡大操作の操作情報を取得すると、重要点検出部134は、先に設定された重要点と新たに得られた拡大点とを比較し、所定の距離範囲内である場合は、先に設定された重要点と新たに得られた拡大点との平均位置を次の重要点とする。重要点と拡大点とが所定の距離範囲より離れている場合、新たな重要点として検出してもよい。この場合、拡縮履歴に操作情報が蓄積されていなくてもよく、また、重要点の検出においても多数の操作情報を処理しない分、判定処理に係る処理負荷を軽減できる。
【0063】
[変形例3]
第三実施形態及び第四実施形態では、画像と、その画像に対する操作情報(拡大操作の拡大位置)とを教師データとし、重要点検出モデルを生成したが、これに限定されない。
例えば、モデル生成部138は、画像と、その画像に対して検出された重要点とを教師データとして、重要点検出モデルを生成してもよい。
【0064】
[変形例4]
第一から第三実施形態において、サーバ装置10がコンピューターにより構成されて、画像取得部131、コンテンツ送信部132、操作取得部133、重要点検出部134、ユーザ情報取得部135、画像処理部136、重要対象特定部137、及びモデル生成部138等として機能する例を示した。ここで、サーバ装置10を構成するコンピューターの数は特に限定されない。例えば、1台のコンピューターによってサーバ装置10が構成されてもよく、複数のコンピューターをネットワークで接続して構築されるクラウドサーバをサーバ装置10としてもよい。
【符号の説明】
【0065】
1…画像公開システム、10,10A…サーバ装置(重要点検出装置)、12…記憶部、13…制御部、20…ユーザ端末、20A…ユーザ端末(重要点検出装置)、21…表示部、22…入力操作部、25…端末記憶部、26…端末制御部、131,264…画像取得部、132…コンテンツ送信部、133,265…操作取得部、134,267…重要点検出部、135…ユーザ情報取得部、136,268…画像処理部、136A,268A…トリミング処理部、136B,268B…画像圧縮部、137,269…重要対象特定部、138,266…モデル生成部、261…表示制御部、262…操作送信部、263…登録送信部、121…ユーザDB、122,251…画像DB、P…拡大点、Q…候補点、R…重要領域、R1…最重要領域、W…サムネイル枠、X…重要点、X1…最重要点。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10