IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人早稲田大学の特許一覧

特開2024-44187画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム
<>
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図1
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図2
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図3
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図4
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図5
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図6
  • 特開-画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024044187
(43)【公開日】2024-04-02
(54)【発明の名称】画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240326BHJP
   G06V 10/72 20220101ALI20240326BHJP
【FI】
G06T7/00 350B
G06V10/72
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022149572
(22)【出願日】2022-09-20
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】899000068
【氏名又は名称】学校法人早稲田大学
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】井田 安俊
(72)【発明者】
【氏名】竹内 亨
(72)【発明者】
【氏名】寺本 純司
(72)【発明者】
【氏名】八木 哲志
(72)【発明者】
【氏名】後藤 正幸
(72)【発明者】
【氏名】中澤 真
(72)【発明者】
【氏名】梅澤 克之
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA01
5L096DA02
5L096FA32
5L096HA11
5L096KA04
(57)【要約】
【課題】対象のデータを比較して、どちらがより所定の基準を満たすかという相対的な評価に基づいてアノテーションを行う。
【解決手段】取得部15aが、画像データの集合を取得する。付与部15bが、取得された画像データ集合14aのうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する。
【選択図】図1
【特許請求の範囲】
【請求項1】
画像データの集合を取得する取得部と、
取得された前記画像データの集合のうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する付与部と、
を有することを特徴とする画像アノテーション装置。
【請求項2】
前記ラベルが付与された前記組み合わせを学習データとして用いて、入力された2つの画像データについて、前記ラベルを用いて表される優劣度を推定するモデルを学習する学習部を、さらに有することを特徴とする請求項1に記載の画像アノテーション装置。
【請求項3】
学習された前記モデルを用いて、取得された画像データの集合のうちの2つの画像データの組み合わせについて、前記優劣度を推定する推定部と、
全ての前記組み合わせについて推定された前記優劣度を用いて、取得された各画像データの推定評価を算出する算出部と、
をさらに有することを特徴とする請求項2に記載の画像アノテーション装置。
【請求項4】
前記算出部は、幾何平均法を用いて前記推定評価を算出することを特徴とする請求項3に記載の画像アノテーション装置。
【請求項5】
算出された前記推定評価の高い順に画像アノテーションする提示部を、さらに有することを特徴とする請求項3に記載の画像アノテーション装置。
【請求項6】
画像アノテーション装置が実行する画像アノテーション方法であって、
画像データの集合を取得する取得工程と、
取得された前記画像データの集合のうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する付与工程と、
を含んだことを特徴とする画像アノテーション方法。
【請求項7】
画像データの集合を取得する取得ステップと、
取得された前記画像データの集合のうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する付与ステップと、
をコンピュータに実行させるための画像アノテーションプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像アノテーション装置、画像アノテーション方法および画像アノテーションプログラムに関する。
【背景技術】
【0002】
従来、画像データのアノテーション技術が知られている(非特許文献1参照)。ここで、人工知能の学習システムである機械学習のための教師データ、つまり、正解カテゴリやラベル付きの画像データ集合を作成したり、検索装置において活用される検索用のキーワードやラベルと画像データとを対応付けたりする必要がある。そのために、対象の画像データ集合に対し、その画像が表す概念の正解カテゴリや正解ラベルを付与することを画像データのアノテーションという。
【0003】
このような画像データのアノテーションは、作業者の手作業で行われる。通常、多数の良質な教師データを生成するために、用意した画像データに対して、作業者がその画像が表す概念やラベルを手作業で付与する。
【0004】
情報システム(アノテーションシステム)が用いられる場合には、アノテーションしたい画像データを蓄積し、それらを作業しやすい形で順次、作業者のユーザに提示する。また、作業者が操作画面等から提示された画像が表す概念やラベルを付与したら、アノテーションシステムがそのアノテーション結果を望ましい形式で保存することにより、教師データを生成する。
【0005】
なお、画像データのアノテーションでは、単に1枚の画像の全体に対して適切な概念やラベルを付与するだけでなく、当該画像の一部分を特定して概念やラベルを付与する場合もある。例えば、作業者がラベルを付与する領域を特定しつつ、ラベルを付与する作業が行われる。1枚の画像データに様々な対象物が映り込んだ画像データに対してキメ細かいアノテーション作業が可能となる。
【0006】
また、DNN(Deep Neural Network)モデルを用いて、画像データを入力し、その画像の全体もしくは一部に対して対応するカテゴリやラベルを推定する画像認識システムが知られている。
【0007】
また、非特許文献2,3には、ユーザが求める情報を優先的に上位に表示することが求められる情報検索や推薦システムにおいて、対象をユーザが求める順序で並び変えるランキング技術に関し、ペアワイズ手法によるオンラインランキング学習が記載されている。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】Alama Jonatan,“画像/動画アノテーションシステム「Nota」”, [online]、2021年6月、[2022年7月15日検索]、インターネット<URL:https://dena.ai/news/202106-nota-annotation-open-source/>
【非特許文献2】後藤正幸、“階層型意思決定モデル(AHP)と統計学的考察”、武蔵工業大学環境情報学部紀要、2004年、Vol.5、pp.77-88
【非特許文献3】飯田洋市、”意思決定法AHPにおける一対比較の簡便法”、信州大学人文社会科学研究、2016年、Vol.10、pp.68-78
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、従来技術では、相対的な情報を対象としてラベルを付与することは困難である。例えば、従来技術は、画像データに付与する概念やラベルが、「車」、「飛行機」、「人」等、アノテーションの観点や粒度が固まれば、アノテーション結果に個人差があることがまれな絶対的評価に基づく問題を対象としている。
【0010】
一方、付与するラベルが人間の感性による「良い」「悪い」のような相対的な情報である場合には、作業対象となるデータに対して絶対的評価に基づくラベルや数値を付与することが困難であった。
【0011】
本発明は、上記に鑑みてなされたものであって、対象のデータを比較して、どちらがより所定の基準を満たすかという相対的な評価に基づいてアノテーションを行うことを目的とする。
【課題を解決するための手段】
【0012】
上述した課題を解決し、目的を達成するために、本発明に係る画像アノテーション装置は、画像データの集合を取得する取得部と、取得された前記画像データの集合のうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する付与部と、を有することを特徴とする。
【発明の効果】
【0013】
本発明によれば、対象のデータを比較して、どちらがより所定の基準を満たすかという相対的な評価に基づいてアノテーションを行うことが可能となる。
【図面の簡単な説明】
【0014】
図1図1は、画像アノテーション装置の概略構成を例示する模式図である。
図2図2は、ラベルを説明するための図である。
図3図3は、優劣度を説明するための図である。
図4図4は、画像アノテーション処理手順を示すフローチャートである。
図5図5は、画像アノテーション処理手順を示すフローチャートである。
図6図6は、画像アノテーション処理手順を示すフローチャートである。
図7図7は、画像アノテーションプログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
【0016】
[画像アノテーション装置の構成]
図1は、画像アノテーション装置の概略構成を例示する模式図である。図1に例示するように、本実施形態の画像アノテーション装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
【0017】
入力部11は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部15に対して処理開始などの各種指示情報を入力する。出力部12は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。例えば、出力部12には、後述する画像アノテーション処理の結果が表示される。
【0018】
通信制御部13は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネットなどの電気通信回線を介した外部の装置と制御部15との通信を制御する。例えば、通信制御部13は、画像データや各種のデータを管理する管理装置と制御部15との通信を制御する。
【0019】
記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14には、画像アノテーション装置10を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが予め記憶され、あるいは処理の都度一時的に記憶される。なお、記憶部14は、通信制御部13を介して制御部15と通信する構成でもよい。
【0020】
本実施形態では、記憶部14は、後述する画像アノテーション処理に用いられる画像データ集合14aや、画像アノテーション処理で生成されるモデル14b等を記憶する。なお、後述する付与部15bが処理対象とする画像データ集合14aと、推定部15dが処理対象とする画像データ集合14aとは、異なる画像データで構成されるものとする。
【0021】
制御部15は、CPU(Central Processing Unit)等を用いて実現され、メモリに記憶された処理プログラムを実行する。これにより、制御部15は、図1に例示するように、取得部15a、付与部15b、学習部15c、推定部15d、算出部15eおよび提示部15fとして機能して、後述する画像アノテーション処理を実行する。
【0022】
なお、これらの機能部は、それぞれあるいは一部が異なるハードウェアに実装されてもよい。例えば、付与部15bは付与装置として、学習部15cは学習装置として、その他の機能部とは異なるハードウェアに実装されてもよい。また、制御部15は、その他の機能部を備えてもよい。
【0023】
取得部15aは、画像データの集合を取得する。例えば、取得部15aは、入力部11を介して、あるいは画像データを管理する管理装置等から通信制御部13を介して、画像データの集合を取得する。取得部15aは、取得した画像データの集合を画像データ集合14aとして記憶部14に記憶させる。
【0024】
なお、上記のとおり、後述する付与部15bの処理対象の画像データ集合14aと、推定部15dの処理対象の画像データ集合14aとは、異なる画像データで構成されるものとする。
【0025】
付与部15bは、取得された画像データ集合14aのうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する。例えば、付与部15bは、画像データ集合14aの画像データをランダムに並べ変え、上から選択された2枚の画像データを、出力部12を介してユーザに提示して、2つの画像データの相対的な評価の入力を受け付けて、その評価に対応するラベルを付与する。
【0026】
2枚の画像データの組み合わせに対する相対的な評価として、例えば「1枚目の画像の方が優れている」「2枚目の画像の方が優れている」「2枚の画像は同程度」等に分類した各段階に数値ラベルを設定しておく。そして、付与部15bは、ユーザが選択した段階に対応する数値ラベルを受け付けて、2つの画像データの組み合わせに対してこの数値ラベルを付与する。
【0027】
2つの画像データの組み合わせに対する数値ラベルは、例えば、次式(1)のように設定される。
【0028】
【数1】
【0029】
ここで、数値ラベルは、次式(2)に示すように、2つの画像データのそれぞれに対する評価の比で表されるものと解することができる。
【0030】
【数2】
【0031】
このように、付与部15bは、2つの画像データの組み合わせに対し、各画像データの評価の比で表される数値ラベルを付与する。付与部15bは、数値ラベルを付与した2つの画像データの組み合わせを、学習データとして記憶部14に記憶させてもよい。
【0032】
また、次式(3)に示すように、数値ラベルを0以上1以下の値に変換した値を、優劣度と定義する。すなわち、優劣度は、各画像データの評価の比を用いて表される0以上1以下の値であり、1枚目の画像が2枚目の画像より優れている度合いを表す。
【0033】
【数3】
【0034】
なお、付与部15bは、画像データ集合14aのうちの2つの画像データの組み合わせの全てを網羅して数値ラベルを付与する必要はない。例えば、付与部15bは、画像データ集合14aのうちの2つの画像データの組み合わせを選択して数値ラベルを付与する処理を、所定の回数だけ繰り返せばよい。
【0035】
また、付与部15bは、処理対象の2つの画像データの組み合わせをユーザに提示する際に、画像データ集合14aからランダムに2つの画像データを選択する方法に限定されない。例えば、ベイズ最適化あるいは能動学習の手法を用いて、より効率的に評価値を高精度に算出できるように、画像データ集合14aの画像データを並び替え、上から2つを選択して提示してもよい。あるいは、学習用の画像データ集合14aからランダムにS(S>2)個の画像データをユーザに提示して、その中から最も良いと思う画像データと、最もよくないと思う画像データとの2枚の画像データをユーザに選択させてもよい。
【0036】
また、2枚の画像データの組み合わせに対する相対的な評価の分類は、上記のような3段階に限定されない。例えば、次式(4)に例示するように、より細かく分類された段階に分類されてもよい。次式(4)に示す例では、2枚の画像データの組み合わせに対する相対的な評価が9段階に分類され、それぞれの段階に数値ラベルが設定されている。
【0037】
【数4】
【0038】
ここで、図2は、ラベルを説明するための図である。付与部15bは、図2に例示するように、2つの画像データの組み合わせに対し、数値ラベルを付与し、後述する学習部15cの学習データとする。図2に例示する表において、ある要素のラベルがaである場合に、その対角成分は1/aとなる。また、図2に例示した表のすべての要素に対して数値ラベルが特定されている必要はなく、空白の要素があってもよい。
【0039】
また、図3は、優劣度を説明するための図である。後述する学習部15cは、図2に例示した学習データの数値ラベルを、上記式(3)によって優劣度に変換した後に処理を行う。この場合に、図2に例示した数値ラベルは、図3に例示するように優劣度に変換される。
【0040】
なお、優劣度の定義は、上記式(3)に限定されず、数値ラベルの大小関係が維持されたうえで0以上1以下の値に変換されればよい。
【0041】
図1の説明に戻る。学習部15cは、ラベルが付与された2つの画像データの組み合わせを学習データとして用いて、入力された2つの画像データについて、ラベルを用いて表される優劣度を推定するモデル14bを学習する。
【0042】
具体的には、学習部15cは、まず、付与部15bにより数値ラベルが付与された画像データの組み合わせを学習データとして用いて、上記のように、学習データの数値ラベルを優劣度に変換する。
【0043】
そして、学習部15cは、優劣度が付与された学習データを用いて、2つの画像データが入力された場合にこの2つの画像データの優劣度を定量的に出力するDNNモデル14bを学習により構築する。
【0044】
具体的には、学習部15cは、次式(5)に示す、2つの画像データと優劣度との組を学習データセットに追加する。
【0045】
【数5】
【0046】
学習部15cは、学習データの2つの画像データの組み合わせの全てについてこの処理を行うことにより、次式(6)に示す学習データセットを生成する。
【0047】
【数6】
【0048】
学習部15cは、上記式(6)の学習データセットを用いて、2つの画像データx、xを入力した場合に、この2つの画像データの優劣度を定量的に出力するモデル14bを学習により構築する。
【0049】
推定部15dは、学習されたモデル14bを用いて、取得された画像データ集合14aうちの2つの画像データの組み合わせについて、優劣度を推定する。このモデル14bは、2つの画像データが入力されると、1枚目画像用入力層に1枚目の画像データが入力され、2枚目画像用入力層に2枚目の画像データが入力され、シグモイド関数を活性化関数とした単一の出力ユニットにより、0以上1以下の数値を出力する。ここで出力される数値は、1枚目の画像が2枚目の画像より優れている度合いである優劣度の推定値(以下、推定優劣度と記す)である。
【0050】
具体的には、推定部15dは、学習されたモデル14bの1枚目画像用入力層に1枚目の画像データxを入力し、モデル14bの2枚目画像用入力層に2枚目の画像データxを入力し、推定優劣度ajkを得る。また、推定部15dは、画像データを入れ替え、1枚目画像用入力層に2枚目の画像データxを入力し、モデル14bの2枚目画像用入力層に1枚目の画像データxを入力し、推定優劣度akjを得る。
【0051】
推定部15dは、処理対象の画像データ集合14aのうちの2つの画像データの組み合わせの全てについて、推定優劣度を得る処理を繰り返す。この場合に、L個の画像データから異なる2つの画像データの組み合わせを取り出して並べる順列数L(L-1)通りと同数の推定優劣度が得られる。
【0052】
算出部15eは、全ての組み合わせについて推定された優劣度を用いて、取得された各画像データの推定評価を算出する。具体的には、算出部15eは、幾何平均法を用いて推定評価を算出する。例えば、算出部15eは、得られたL(L-1)個の推定優劣度に対して、次式(7)に示す幾何平均法を用いて、画像データxの推定評価値を算出する。
【0053】
【数7】
【0054】
提示部15fは、算出された推定評価の高い順に提示する。例えば、提示部15fは、出力部12を介して、推定評価値の高い順に所定数の画像を、推定評価値とともにユーザに提示する。これにより、魅力度の高い商品画像を自動的に抽出し、魅力度が高い順にランキング表示させることが可能となる。
【0055】
[画像アノテーション処理]
次に、図4図6を参照して、本実施形態に係る画像アノテーション装置10による画像アノテーション処理について説明する。図4図6は、画像アノテーション処理手順を示すフローチャートである。
【0056】
本実施形態において、画像アノテーション処理は、付与処理と、学習処理と、提示処理を含む。まず、図4には、付与処理手順のフローチャートが例示されている。図4のフローチャートは、例えば、ユーザが開始を指示する操作入力を行ったタイミングで開始される。
【0057】
まず、付与部15bが、取得部15aが取得した画像データ集合14aの画像データを、ランダムに並べかえ(ステップS1)、全ての画像データについて、ステップS3~S7の処理を繰り返す(ステップS2、S8)。
【0058】
つまり、付与部15bは、ランダムに並べかえた画像データの上から2つを選択し(ステップS3)、選択した画像データにすでにラベルが付与されていれば(ステップS4、Yes)、ステップS3に処理を戻す。一方、選択した画像データにラベルが付与されていなければ(ステップS4、No)、付与部15bは、選択した2つの画像データをユーザに提示し(ステップS5)、2枚の画像データの組み合わせに対する相対的な評価の段階の選択入力を受け付ける(ステップS6)。そして、付与部15bは、選択された段階に対応する数値ラベルを付与する(ステップS7)。
【0059】
ランダムに並べ変えた画像データの全てについて、ステップS3~S7の処理が終わった場合には、ステップS3~S7の処理の繰り返し回数が所定の回数に達していなければ(ステップS8→S9、No)、付与部15bは、ステップS1に処理を戻す。一方、ステップS3~S7の処理の繰り返し回数が所定の回数に達した場合に(ステップS9、Yes)、付与部15bは、一連の付与処理を終了させる。
【0060】
次に、図5には、学習処理手順のフローチャートが例示されている。図5のフローチャートは、例えば、ユーザが開始を指示する操作入力を行ったタイミングで開始される。
【0061】
学習部15cは、数値ラベルが付与された画像データの組み合わせを学習データとして用いて、学習データの2つの画像データの組み合わせの全てについて、学習データの数値ラベルを優劣度に変換して、学習データセットを生成する(ステップS11)。
【0062】
次に、学習部15cは、生成した学習データセットを用いて、2つの画像データを入力した場合に、この2つの画像データの優劣度を定量的に出力するモデル14bを学習により構築する(ステップS12)。これにより、一連の学習処理が終了する。
【0063】
また、図6には、提示処理手順のフローチャートが例示されている。図6のフローチャートは、例えば、ユーザが開始を指示する操作入力を行ったタイミングで開始される。
【0064】
まず推定部15dが、取得部15aが取得した、ランキング表示させたい処理対象の画像データ集合14aのうちの2つの画像データの組み合わせの全てについて、学習されたモデル14bに入力し、推定優劣度を得る処理を繰り返す(ステップS21)。
【0065】
次に算出部15eが、全ての組み合わせについて推定された優劣度を用いて、取得された各画像データの推定評価を算出する(ステップS22)。
【0066】
そして、提示部15fが、算出された推定評価の高い順に、ユーザに画像データを提示する(ステップS23)。これにより、一連の提示処理が終了する。
【0067】
[効果]
以上、説明したように、本実施形態の画像アノテーション装置10において、取得部15aが、画像データの集合を取得する。また、付与部15bが、取得された画像データ集合14aのうちの2つの画像データの組み合わせについて、各画像データの評価の比で表されるラベルを付与する。
【0068】
これにより、対象のデータを比較して、どちらがより所定の基準を満たすかという相対的な評価に基づいてラベルを付与して、機械学習のための教師データを生成するアノテーションを行うことが可能となる。
【0069】
また、学習部15cが、ラベルが付与された2つの画像データの組み合わせを学習データとして用いて、入力された2つの画像データについて、ラベルを用いて表される優劣度を推定するモデル14bを学習する。これにより、対象のデータの相対的な評価に基づく機械学習が可能となる。
【0070】
また、推定部15dが、学習されたモデル14bを用いて、取得された画像データ集合14aのうちの2つの画像データの組み合わせについて、優劣度を推定する。この場合に、算出部15eが、全ての組み合わせについて推定された優劣度を用いて、取得された各画像データの推定評価を算出する。
【0071】
具体的には、算出部15eは、幾何平均法を用いて推定評価を算出する。これにより、対象のデータの相対的な評価に基づいてランキング表示のための評価を推定することが可能となる。
【0072】
また、提示部15fが、算出された推定評価の高い順に提示する。これにより、魅力度の高い商品画像を自動的に抽出し、魅力度が高い順にランキング表示させることが可能となる。
【0073】
例えば、一般投稿者がレストランや料理店の感想や主観評価を投稿できるグルメ情報サイトにおいて、一般投稿者がアップロードした膨大な料理写真の中から、新たな一般消費者に魅力的な料理写真を自動的に選定し、各店舗の料理写真の中で上位に提示できる。
【0074】
あるいは、ファッションECサイトや生花ECサイト等の多数のアイテムを扱うサイトにおいて、用意された商品画像の中から、顧客に訴求する良い商品画像を自動的に抽出し、各商品に対して掲示して、各商品ページの魅力度の向上につなげることが可能となる。
【0075】
[プログラム]
上記実施形態に係る画像アノテーション装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、画像アノテーション装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の画像アノテーション処理を実行する画像アノテーションプログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の画像アノテーションプログラムを情報処理装置に実行させることにより、情報処理装置を画像アノテーション装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistant)などのスレート端末などがその範疇に含まれる。また、画像アノテーション装置10の機能を、クラウドサーバに実装してもよい。
【0076】
図7は、画像アノテーションプログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
【0077】
メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。ディスクドライブ1041には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1051およびキーボード1052が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1061が接続される。
【0078】
ここで、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。上記実施形態で説明した各情報は、例えばハードディスクドライブ1031やメモリ1010に記憶される。
【0079】
また、画像アノテーションプログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュール1093として、ハードディスクドライブ1031に記憶される。具体的には、上記実施形態で説明した画像アノテーション装置10が実行する各処理が記述されたプログラムモジュール1093が、ハードディスクドライブ1031に記憶される。
【0080】
また、画像アノテーションプログラムによる情報処理に用いられるデータは、プログラムデータ1094として、例えば、ハードディスクドライブ1031に記憶される。そして、CPU1020が、ハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
【0081】
なお、画像アノテーションプログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、画像アノテーションプログラムに係るプログラムモジュール1093やプログラムデータ1094は、LANやWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【0082】
以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本発明の範疇に含まれる。
【符号の説明】
【0083】
10 画像アノテーション装置
11 入力部
12 出力部
13 通信制御部
14 記憶部
14a 画像データ集合
14b モデル
15 制御部
15a 取得部
15b 付与部
15c 学習部
15d 推定部
15e 算出部
15f 提示部
図1
図2
図3
図4
図5
図6
図7