(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-15
(45)【発行日】2022-01-14
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
G06F 16/50 20190101AFI20220106BHJP
G06F 16/53 20190101ALI20220106BHJP
G06F 16/58 20190101ALI20220106BHJP
G06F 16/903 20190101ALI20220106BHJP
【FI】
G06F16/50
G06F16/53
G06F16/58
G06F16/903
(21)【出願番号】P 2018196417
(22)【出願日】2018-10-18
【審査請求日】2021-02-22
【早期審査対象出願】
(73)【特許権者】
【識別番号】517017975
【氏名又は名称】株式会社LIGHTz
(74)【代理人】
【識別番号】100115749
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】乙部 信吾
(72)【発明者】
【氏名】浅野 克久
(72)【発明者】
【氏名】有田 英幸
(72)【発明者】
【氏名】大泉 圭一
【審査官】三橋 竜太郎
(56)【参考文献】
【文献】特開2005-354134(JP,A)
【文献】特開2004-171185(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
画像または画像から取得された画像関連情報またはテキスト情報である2以上の比較対象が格納される格納部と、
前記2以上の各比較対象
の内の画像または画像関連情報に対応するテキスト情報が格納されるテキスト情報格納部と、
画像を受け付ける受付部と、
前記受付部が受け付けた画像
と前記2以上の比較対象の内の画像との比較処理、または前記受付部が受け付けた画像から取得された画像関連情報
と前記2以上の比較対象の内の画像関連情報との比較処理、または
前記受付部が受け付けた画像から取得されたテキスト情報
と前記2以上
の比較対象
の内のテキスト情報との比較処理を行い、
当該比較処理の結果が予め決められた条件を満たす1以上の比較対象を決定する決定部と、
前記決定部が決定した1以上の各比較対象
が画像または画像関連情報である場合は、当該1以上の各比較対象に対応する1以上のテキスト情報を前記テキスト情報格納部から取得
し、前記決定部が決定した1以上の各比較対象がテキスト情報である場合は、当該1以上のテキスト情報を取得するテキスト情報取得部と、
前記テキスト情報取得部が取得した1以上のテキスト情報を用いて、出力する出力情報を取得する出力情報取得部と、
前記出力情報を出力する出力部とを具備する情報処理装置。
【請求項2】
前記比較対象は、テキスト情報であり、
前記受付部が受け付けた画像からテキスト情報を抽出するテキスト情報抽出部をさらに具備し、
前記決定部は、
前記テキスト情報抽出部が抽出したテキスト情報と前記2以上
の比較対象
の内のテキスト情報との比較処理を行い、予め決められた条件を満たす1以上の比較対象を決定する、請求項1記載の情報処理装置。
【請求項3】
前記比較対象は、
文字列に対応する2以上のノードと、当該ノード間をリンクするエッジとを有するネットワーク構造を有するブレインモデルの情報であり、
前記テキスト情報抽出部は、
前記受付部が受け付けた画像に対してオブジェクト認識処理を行い、オブジェクトを識別する2以上のオブジェクト識別子を取得し、当該2以上の各オブジェクトの位置を示す位置情報を取得し、当該位置情報が閾値以内のオブジェクトのオブジェクト識別子をエッジで連結して、前記ブレインモデルの情報であるテキスト情報を取得する、請求項2記載の情報処理装置。
【請求項4】
前記テキスト情報格納部の前記テキスト情報は、1以上の属性値と対になる2以上の文字列を含み、
前記テキスト情報取得部は、
前記決定部が決定した前記1以上の各比較対象に対応する1以上のテキスト情報のうち、予め決められた属性値と対になる1以上の文字列を取得し、
前記出力情報取得部は、
前記テキスト情報取得部が取得した1以上の文字列を用いて、出力する出力情報を取得する、請求項1から請求項3いずれか一項に記載の情報処理装置。
【請求項5】
前記テキスト情報格納部の前記テキスト情報は、1以上の属性値と対になる2以上の文字列を含み、
前記テキスト情報抽出部は、
前記受付部が受け付けた画像に対してオブジェクト認識処理を行い、1以上のオブジェクトを識別するオブジェクト識別子を取得し、用語の属性値との組の情報を、1組以上、有する辞書を参照し、当該1以上の各オブジェクト識別子の属性値を取得し、
前記決定部は、
前記テキスト情報抽出部が抽出したテキスト情報に含まれる予め決められた属性値と対になる2以上の文字列と、前記テキスト情報格納部の1以上の各テキスト情報に含まれる予め決められた属性値と対になる2以上の文字列とを用いて、前記受付部が受け付けた画像から取得されたテキスト情報に予め決められた条件を満たす1以上のテキスト情報を決定する請求項2または請求項3記載の情報処理装置。
【請求項6】
前記テキスト情報取得部は、
ブレインモデルの情報である2以上のテキスト情報を前記テキスト情報格納部から取得し、
前記出力情報取得部は、
前記テキスト情報取得部が取得した2以上のブレインモデルの情報を結合した出力情報を取得する請求項1から請求項5いずれか一項に記載の情報処理装置。
【請求項7】
画像または画像から取得された画像関連情報またはテキスト情報である2以上の比較対象が格納される格納部と、前記2以上の各比較対象
の内の画像または画像関連情報に対応するテキスト情報が格納されるテキスト情報格納部と、受付部と、テキスト情報抽出部と、決定部と、テキスト情報取得部と、出力情報取得部と、出力部とにより実現される情報処理方法であって、
前記受付部が、画像を受け付ける受付ステップと、
前記決定部が、前記受付ステップで受け付けられた画像
と前記2以上の比較対象の内の画像との比較処理、または前記受付部が受け付けた画像から取得された画像関連情報
と前記2以上の比較対象の内の画像関連情報との比較処理、または
前記受付部が受け付けた画像から取得されたテキスト情報
と前記2以上
の比較対象
の内のテキスト情報との比較処理を行い、
当該比較処理の結果が予め決められた条件を満たす1以上の比較対象を決定する決定ステップと、
前記テキスト情報取得部が、前記決定ステップで決定された1以上の各比較対象
が画像または画像関連情報である場合は、当該1以上の各比較対象に対応する1以上のテキスト情報を前記テキスト情報格納部から取得
し、前記決定部が決定した1以上の各比較対象がテキスト情報である場合は、当該1以上のテキスト情報を取得するテキスト情報取得ステップと、
前記出力情報取得部が、前記テキスト情報取得ステップで取得された1以上のテキスト情報を用いて、出力する出力情報を取得する出力情報取得ステップと、
前記出力部が、前記出力情報を出力する出力ステップとを具備する情報処理方法。
【請求項8】
画像または画像から取得された画像関連情報またはテキスト情報である2以上の比較対象が格納される格納部と、前記2以上の各比較対象
の内の画像または画像関連情報に対応するテキスト情報が格納されるテキスト情報格納部にアクセス可能なコンピュータを、
画像を受け付ける受付部と、
前記受付部が受け付けた画像
と前記2以上の比較対象の内の画像との比較処理、または前記受付部が受け付けた画像から取得された画像関連情報
と前記2以上の比較対象の内の画像関連情報との比較処理、または
前記受付部が受け付けた画像から取得されたテキスト情報
と前記2以上
の比較対象
の内のテキスト情報との比較処理を行い、
当該比較処理の結果が予め決められた条件を満たす1以上の比較対象を決定する決定部と、
前記決定部が決定した1以上の各比較対象
が画像または画像関連情報である場合は、当該1以上の各比較対象に対応する1以上のテキスト情報を前記テキスト情報格納部から取得
し、前記決定部が決定した1以上の各比較対象がテキスト情報である場合は、当該1以上のテキスト情報を取得するテキスト情報取得部と、
前記テキスト情報取得部が取得した1以上のテキスト情報を用いて、出力する出力情報を取得する出力情報取得部と、
前記出力情報を出力する出力部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、受け付けられた画像に対応する適切なテキスト情報を出力する情報処理装置等に関するものである。
【背景技術】
【0002】
従来、対象物の認識を高速に行える画像認識装置があった(特許文献1参照)。かかる画像認識装置は、メモリと、インターフェースと、プロセッサと、を備える。そして、メモリは、対象物に付与されるコード情報から得られる識別情報と、オブジェクト認識に用いる対象物の画像情報とを認識対象とする対象物ごとに記憶する。プロセッサは、画像から対象物がある対象物領域を抽出し、前記対象物領域においてコード情報を抽出し、抽出したコード情報から前記識別情報を認識し、コード情報に基づく対象物の認識に失敗した場合、前記対象物領域の画像と前記メモリに記憶された各対象物の画像情報とにより対象物を認識するように制御する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、受け付けられた画像内のオブジェクトを認識できるが、画像に対する適切な情報を取得し、出力できなかった。
【課題を解決するための手段】
【0005】
本第一の発明の情報処理装置は、画像または画像から取得された画像関連情報に対応する2以上のテキスト情報が格納されるテキスト情報格納部と、画像または画像に対応するテキスト情報を受け付ける受付部と、受付部が受け付けた画像またはテキスト情報に予め決められた条件を満たすほど類似する1以上の画像または1以上の画像関連情報または1以上のテキスト情報を決定する決定部と、決定部が決定した1以上の各画像または1以上の各画像関連情報に対応するテキスト情報、または決定部が決定した1以上のテキスト情報を取得するテキスト情報取得部と、テキスト情報取得部が取得した1以上のテキスト情報を用いて、出力する出力情報を取得する出力情報取得部と、出力情報を出力する出力部とを具備する情報処理装置である。
【0006】
かかる構成により、受け付けられた画像に対する適切な情報を取得し、出力できる。
【0007】
また、本第二の発明の情報処理装置は、第一の発明に対して、決定部は、受付部が受け付けた画像またはテキスト情報に予め決められた条件を満たすほど類似する2以上の画像または2以上の画像関連情報または2以上のテキスト情報を決定し、テキスト情報取得部は、決定部が決定した2以上の各画像または2以上の各画像関連情報に対応するテキスト情報、または決定部が決定した2以上のテキスト情報を取得し、出力情報取得部は、テキスト情報取得部が取得した2以上のテキスト情報を用いて、出力する出力情報を取得する情報処理装置である。
【0008】
かかる構成により、2以上のテキスト情報を用いて、受け付けられた画像に対する適切な情報を取得し、出力できる。
【0009】
また、本第三の発明の情報処理装置は、第一または第二の発明に対して、テキスト情報は、1以上の属性値と対になる2以上の文字列の集合である情報処理装置である。
【0010】
かかる構成により、2以上のテキスト情報を用いて、受け付けられた画像に対するより適切な情報を取得し、出力できる。
【0011】
また、本第四の発明の情報処理装置は、第三の発明に対して、テキスト情報は、文字列に対応する2以上のノードと、ノード間をリンクするエッジとを有するネットワーク構造を有する情報であり、決定部は、受付部が受け付けた画像から取得されたテキスト情報に予め決められた条件を満たすほど類似する1以上のテキスト情報を決定し、テキスト情報取得部は、決定部が決定した1以上のテキスト情報を取得する情報処理装置である。
【0012】
かかる構成により、2以上のテキスト情報を用いて、受け付けられた画像に対するより適切な情報を取得し、出力できる。
【0013】
また、本第五の発明の情報処理装置は、第三または第四の発明に対して、決定部は、受付部が受け付けた画像から取得されたテキスト情報に含まれる予め決められた属性値と対になる2以上の文字列と、テキスト情報格納部の1以上の各テキスト情報に含まれる予め決められた属性値と対になる2以上の文字列とを用いて、受付部が受け付けた画像から取得されたテキスト情報に予め決められた条件を満たすほど類似する1以上のテキスト情報を決定する情報処理装置である。
【0014】
かかる構成により、より適切に2以上のテキスト情報を選択し、当該2以上のテキスト情報を用いて、受け付けられた画像に対するより適切な情報を取得し、出力できる。
【0015】
また、本第六の発明の情報処理装置は、第三から第五いずれか1つの発明に対して、テキスト情報取得部は、決定部が決定した1以上のテキスト情報のうちの、予め決められた属性値と対になる1以上の文字列を取得し、出力情報取得部は、取得部が取得した1以上の文字列を用いて、出力する出力情報を取得する情報処理装置である。
【0016】
かかる構成により、より適切に2以上のテキスト情報を選択し、当該2以上のテキスト情報を用いて、受け付けられた画像に対するより適切な情報を取得し、出力できる。
【発明の効果】
【0017】
本発明による情報処理装置によれば、受け付けられた画像に対する適切な情報を取得し、出力できる。
【図面の簡単な説明】
【0018】
【
図1】実施の形態1における情報処理装置1のブロック図
【
図3】同情報処理装置1の動作について説明するフローチャート
【発明を実施するための形態】
【0019】
以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0020】
(実施の形態1)
本実施の形態において、画像または後述する画像関連情報に対応付けてテキスト情報が格納されている状況において、受け付けられた画像に予め決められた条件を満たすほど類似する1または2以上の画像または画像関連情報を決定する決定処理、当該決定した画像または画像関連情報に対応付いている1または2以上のテキスト情報を取得する取得処理、および当該1または2以上のテキスト情報を用いて出力情報を取得し、出力する出力処理を行う情報処理装置について説明する。なお、本実施の形態において、テキスト情報は、属性値付きの2以上の文字列の集合でも良く、後述するブレインモデルの情報でも良い。
【0021】
また、本実施の形態において、テキスト情報の中の特定の属性値に対応する文字列を用いて、決定処理を行っても良い。また、本実施の形態において、テキスト情報の中の特定の属性値に対応する文字列を用いて、出力処理を行っても良い。
【0022】
図1は、本実施の形態における情報処理装置1のブロック図である。情報処理装置1は、格納部11、受付部12、処理部13、および出力部14を備える。格納部11は、テキスト情報格納部111を備える。処理部13は、テキスト情報抽出部131、決定部132、テキスト情報取得部133、および出力情報取得部134を備える。
【0023】
格納部11には、各種の情報が格納される。各種の情報は、例えば、後述する1または2以上のテキスト情報である。各種の情報は、例えば、テキスト情報が対応付いた1または2以上の画像である。各種の情報は、例えば、テキスト情報に対応付いた画像関連情報である。各種の情報は、例えば、後述する辞書である。辞書は、用語の属性値との組の情報を、1組以上、有する。
【0024】
画像関連情報は、画像から取得された情報である。画像関連情報は、例えば、画像内のオブジェクトのオブジェクト識別子、または学習器である。学習器は、1または2以上の同種の画像を機械学習のアルゴリズムにより学習させた学習器である。機械学習は、例えば、深層学習、決定木、SVM、ランダムフォレスト等、そのアルゴリズムは問わない。同種の画像は、例えば、同種のオブジェクトを撮影した写真である。なお、画像関から、当該画像内のオブジェクトのオブジェクト識別子を取得する技術は、いわゆるオブジェクト認識技術であり、公知技術であるので詳細な説明は省略する。
【0025】
テキスト情報格納部111には、1または2以上のテキスト情報が格納される。テキスト情報は、テキストを含む情報である。テキスト情報は、画像または画像関連情報に対応する情報である。テキスト情報は、例えば、語、文、ブレインモデルの情報である。テキスト情報は、例えば、1以上の属性値と対になる2以上の文字列の集合である。ブレインモデルの情報は、ブレインモデルのテキスト情報と言っても良い。
【0026】
ブレインモデルの情報は、文字列に対応する2以上のノードと、ノード間をリンクするエッジとを有するネットワーク構造を有する情報である。また、エッジは、ここでは有向であるが、無向でも良い。
【0027】
ブレインモデルの情報の例を、
図2に示す。
図2において、ノードは図形の円である。円の中の文字列は、ここでは単語である。また、ノードの円の背景色、線種により、文字列に対応する属性値が異なる。文字列「変速機」はノードであり、その属性値は「部品」である。文字列「変速機」のノードは、文字列「変速段数」、文字列「オイルシール」、文字列「トルクコンバータ」との間でエッジを有する。文字列「変速段数」はノードであり、その属性値は「構成」である。文字列「オイルシール」はノードであり、その属性値は「部品」である。文字列「トルクコンバータ」はノードであり、その属性値は「部品」である。また、文字列「腐食」はノードであり、その属性値は「故障モード」である。文字列「亀裂」はノードであり、その属性値は「故障モード」である。文字列「油漏れ」はノードであり、その属性値は「故障モード」である。文字列「急発進」はノードであり、その属性値は「外部要因」である。文字列「過荷重」はノードであり、その属性値は「外部要因」である。文字列「材質劣化」はノードであり、その属性値は「内部要因」である。文字列「材質変更」はノードであり、その属性値は「対策」である。文字列「部品変更」はノードであり、その属性値は「対策」である。文字列「強度計算」はノードであり、その属性値は「対策」である。
【0028】
なお、ノードに対応する情報は、単語でなくても良い。ノードに対応する情報は、例えば、URL等のリンク情報、ファイル名、数値等でも良い。ノードに対応する情報がリンク情報である場合、当該リンク情報が示すリンク先の情報が、実質的にノードに対応する情報である。また、ノードに対応する情報がファイル名である場合、当該ファイル名で識別されるファイルに含まれる情報が、実質的にノードに対応する情報である。
【0029】
受付部12は、例えば、画像を受け付ける。受付部12は、例えば、画像に対応するテキスト情報を受け付ける。画像に対応するテキスト情は、例えば、画像に対応するブレインモデルの情報である。画像に対応するブレインモデルの情報とは、画像から抽出されたブレインモデルの情報である。画像から抽出されたブレインモデルの情報は、例えば、後述するテキスト情報抽出部131が受け付けられた画像から抽出したブレインモデルの情報である。
【0030】
ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。受け付けは、テキスト情報抽出部131等の処理手段が取得した情報の受け付けも含む。
【0031】
画像等の入力手段は、スキャナやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部12は、スキャナやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0032】
処理部13は、各種の処理を行う。各種の処理とは、例えば、テキスト情報抽出部131、決定部132、テキスト情報取得部133、出力情報取得部134等が行う処理である。
【0033】
テキスト情報抽出部131は、受付部12が受け付けた画像からテキスト情報を抽出する。テキスト情報抽出部131は、例えば、受付部12が受け付けた画像に対してオブジェクト認識処理を行い、1以上のオブジェクトを識別するオブジェクト識別子(文字列)を取得し、1以上の各オブジェクト識別子をノードとする。オブジェクト識別子が2以上、存在する場合、テキスト情報抽出部131は、2以上の各オブジェクトの位置を示す位置情報を取得し、位置情報が閾値以内のオブジェクトのオブジェクト識別子をエッジで連結する。また、テキスト情報抽出部131は、格納部11の辞書を参照し、オブジェクト識別子の属性値を取得する。以上の処理により、テキスト情報抽出部131は、画像からブレインモデルのテキスト情報を得る。
【0034】
決定部132は、受付部12が受け付けた画像またはテキスト情報に予め決められた条件を満たすほど類似する1または2以上の画像または1または2以上の画像関連情報または1または2以上のテキスト情報を決定する。
【0035】
ここで、予め決められた条件とは、例えば、類似度が閾値以上、または類似度が閾値より大きいことである。予め決められた条件とは、例えば、ブレインモデルの情報のグラフ構造の一致度が閾値以上、またはブレインモデルの情報のグラフ構造の一致度が閾値より大きいことである。なお、グラフ構造の一致度とは、グラフ構造のノードとリンクの一致する割合でも良いし、グラフ構造のノードとリンクの一致する数等でも良い。
【0036】
決定部132は、例えば、受付部12が受け付けた画像に予め決められた条件を満たすほど類似する画像を格納部11から検索し、1または2以上の画像を決定する。なお、かかる画像は格納部11の画像である。
【0037】
決定部132は、例えば、受付部12が受け付けた画像を、学習器である画像関連情報に適用し、機械学習のアルゴリズムにより、スコアを取得する。そして、決定部132は、スコアが閾値以上または閾値より大きい画像関連情報を決定する。なお、スコアが閾値以上または閾値より大きい画像関連情報を決定する処理は、予め決められた条件を満たすほど類似する1または2以上の画像関連情報を決定する処理である。また、ここでの機械学習のアルゴリズムは、深層学習、ランダムフォレスト、SVR、SVM等、問わない。
【0038】
決定部132は、例えば、受付部12が受け付けたテキスト情報に予め決められた条件を満たすほど類似する1または2以上のテキスト情報を決定する。
【0039】
決定部132は、例えば、受付部12が受け付けたブレインモデルの情報に予め決められた条件を満たすほど類似する1または2以上のブレインモデルの情報を決定する。ここで決定されるブレインモデルの情報は、格納部11のブレインモデルの情報(テキスト情報)である。また、予め決められた条件とは、例えば、ブレインモデルの情報のグラフ構造の一致度が閾値以上、またはブレインモデルの情報のグラフ構造の一致度が閾値より大きいことである。
【0040】
決定部132は、受付部12が受け付けた画像またはテキスト情報に予め決められた条件を満たすほど類似する2以上の画像または2以上の画像関連情報または2以上のテキスト情報を決定しても良い。
【0041】
決定部132は、受付部12が受け付けた画像から取得されたテキスト情報に予め決められた条件を満たすほど類似する1以上のテキスト情報を決定しても良い。なお、ここで受付部12が受け付けた画像から取得されたテキスト情報は、例えば、テキスト情報抽出部131が取得したブレインモデルの情報である。
【0042】
決定部132は、例えば、受付部12が受け付けた画像から取得されたテキスト情報に含まれる予め決められた属性値と対になる2以上の文字列と、テキスト情報格納部111の1以上の各テキスト情報に含まれる予め決められた属性値と対になる2以上の文字列とを用いて、受付部12が受け付けた画像から取得されたテキスト情報に予め決められた条件を満たすほど類似する1以上のテキスト情報を決定する。なお、ここでの予め決められた属性値は、例えば、「部品」および「故障モード」である。
【0043】
決定部132は、例えば、受付部12が受け付けた画像から取得されたテキスト情報に含まれる予め決められた属性値と対になる2以上の文字列を取得する。そして、決定部132は、かかる2以上の文字列を含むテキスト情報を、テキスト情報格納部111のテキスト情報から決定する。
【0044】
テキスト情報取得部133は、決定部132が決定した1以上の各画像または1以上の各画像関連情報に対応するテキスト情報、または決定部132が決定した1以上のテキスト情報を取得する。
【0045】
テキスト情報取得部133は、例えば、決定部132が決定した2以上の各画像または2以上の各画像関連情報に対応するテキスト情報、または決定部132が決定した2以上のテキスト情報を取得する。
【0046】
テキスト情報取得部133は、例えば、決定部132が決定した1または2以上の各画像または1または2以上の各画像関連情報と対になる1または2以上のテキスト情報をテキスト情報格納部111から取得する。
【0047】
テキスト情報取得部133は、例えば、決定部132が決定した1または2以上のテキスト情報を取得する。
【0048】
テキスト情報取得部133は、例えば、決定部132が決定した1以上のテキスト情報のうちの、予め決められた属性値と対になる1または2以上の文字列を取得する。なお、ここで、予め決められた属性値は、例えば、「外部要因」「内部要因」「対策」である。
【0049】
出力情報取得部134は、テキスト情報取得部133が取得した1以上のテキスト情報を用いて、出力する出力情報を取得する。
【0050】
出力情報取得部134は、例えば、テキスト情報取得部133が取得した2以上のテキスト情報を用いて、出力する出力情報を取得する。
【0051】
出力情報取得部134は、例えば、テキスト情報取得部133が取得した1または2以上の文字列を用いて、出力する出力情報を取得する。
【0052】
出力情報取得部134は、例えば、テキスト情報取得部133が取得した2以上のテキスト情報を続けて配置した出力情報を取得する。
【0053】
出力情報取得部134は、例えば、テキスト情報取得部133が取得した2以上のテキスト情報を結合した出力情報を取得する。
【0054】
出力情報取得部134は、例えば、テキスト情報取得部133が取得した2以上のブレインモデルの情報を結合した出力情報である。なお、2以上のブレインモデルの情報の結合とは、2以上の各ブレインモデルの情報の中の同じ文字列のノードを一つに集約し、複数のブレインモデルのノードをエッジにより連結することである。
【0055】
なお、出力情報は、テキスト情報そのものでも良い。
【0056】
出力部14は、出力情報取得部134が取得した出力情報を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0057】
格納部11、およびテキスト情報格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0058】
格納部11等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部11等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11等で記憶されるようになってもよい。
【0059】
処理部13、テキスト情報抽出部131、決定部132、テキスト情報取得部133、および出力情報取得部134は、通常、MPUやメモリ等から実現され得る。処理部13等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0060】
出力部14は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部14は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0061】
次に、情報処理装置1の動作について、
図3のフローチャートを用いて説明する。
【0062】
(ステップS301)受付部12は、情報を受け付けたか否かを判断する。情報を受け付けた場合はステップS302に行き、情報を受け付けなかった場合はステップS301に戻る。なお、情報とは、例えば、画像またはテキスト情報である。
【0063】
(ステップS302)処理部13は、テキスト情報を取得するか否かを判断する。テキスト情報を取得する場合はステップS303に行き、テキスト情報を取得しない場合はステップS304に行く。なお、テキスト情報を取得するか否かは、予め決められていても良い。また、処理部13は、ステップS301で受け付けられた情報が画像の場合に、テキスト情報を取得すると判断し、ステップS301で受け付けられた情報がテキスト情報の場合に、テキスト情報を取得しないと判断しても良い。
【0064】
(ステップS303)テキスト情報抽出部131は、ステップS301で受け付けられた画像からテキスト情報を取得する。なお、テキスト情報抽出部131は、例えば、上述した処理により、画像からブレインモデルのテキスト情報を取得する。なお、テキスト情報抽出部131が取得したテキスト情報に対して、ユーザが情報を付加して、ブレインモデルのテキスト情報が得られても良い。
【0065】
(ステップS304)決定部132は、カウンタiに1を代入する。
【0066】
(ステップS305)決定部132は、ステップS301で受け付けられた情報、またはステップS303で取得されたテキスト情報と比較するi番目の比較対象が、格納部11に存在するか否かを判断する。i番目の比較対象が存在する場合はステップS306に行き、存在しない場合はステップS309に行く。なお、比較対象とは、例えば、格納部11の画像、格納部11の画像関連情報(例えば、学習器)、またはテキスト情報格納部111のテキスト情報である。
【0067】
(ステップS306)決定部132は、i番目の比較対象を格納部11またはテキスト情報格納部111から取得する。
【0068】
(ステップS307)決定部132は、ステップS301で受け付けられた情報またはステップS303で取得されたテキスト情報と、ステップS306で取得したi番目の比較対象との比較処理を行う。
【0069】
比較処理は、例えば、類似度を取得する処理である。比較処理は、例えば、一致度を取得する処理である。比較処理は、例えば、学習器を用いて、機械学習のアルゴリズムにより、スコアを取得する処理である。
【0070】
つまり、決定部132は、例えば、ステップS301で受け付けられたブレインモデルのテキスト情報またはステップS303で取得されたブレインモデルのテキスト情報と、テキスト情報格納部111のi番目のテキスト情報(ブレインモデルのテキスト情報)とを比較し、一致度または類似度を取得する。
【0071】
また、決定部132は、例えば、ステップS301で受け付けられた画像と格納部11のi番目の画像との類似度を算出する。なお、2つの画像の類似度を算出する処理は、種々あり得、いかなるアルゴリズムを用いるかは問わない。また、2つの画像の類似度を算出する処理は、公知技術につき、詳細な説明を省略する。
【0072】
また、決定部132は、例えば、ステップS301で受け付けられた画像を、格納部11のi番目の学習器に適用し、機械学習のアルゴリズムにより、スコアを取得する。
【0073】
(ステップS308)決定部132は、カウンタiを1、インクリメントする。ステップS305に戻る。
【0074】
(ステップS309)決定部132は、予め決められた条件を満たす1または2以上の比較対象を決定する。予め決められた条件は、例えば、ステップS307で取得された類似度または一致度またはスコアが、閾値以上または閾値より大きいことである。
【0075】
(ステップS310)テキスト情報取得部133は、ステップS309で決定された1以上の各比較対象と対になるテキスト情報を取得する。ここで、テキスト情報取得部133は、ステップS309で決定された1以上の各比較対象と対になる1以上のテキスト情報の中の、予め決められた属性値の文字列を取得することは好適である。
【0076】
(ステップS311)出力情報取得部134は、ステップS310で取得された1または2以上のテキスト情報を用いて、出力情報を構成する。なお、出力情報取得部134は、ステップS310で取得された1または2以上の文字列を用いて、出力情報を構成することは好適である。
【0077】
(ステップS312)出力部14は、ステップS311で構成された出力情報を出力する。ステップS301に戻る。
【0078】
なお、
図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0079】
以上、本実施の形態によれば、受け付けられた画像に対する適切な情報を取得し、出力できる。
【0080】
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置1を実現するソフトウェアは、例えば、以下のようなプログラムである。つまり、このプログラムは、画像または画像から取得された画像関連情報に対応する2以上のテキスト情報が格納されるテキスト情報格納部にアクセス可能なコンピュータを、画像または画像に対応するテキスト情報を受け付ける受付部と、前記受付部が受け付けた画像またはテキスト情報に予め決められた条件を満たすほど類似する1以上の画像または1以上の画像関連情報または1以上のテキスト情報を決定する決定部と、前記決定部が決定した1以上の各画像または1以上の各画像関連情報に対応するテキスト情報、または前記決定部が決定した1以上のテキスト情報を取得するテキスト情報取得部と、前記テキスト情報取得部が取得した1以上のテキスト情報を用いて、出力する出力情報を取得する出力情報取得部と、前記出力情報を出力する出力部として機能させるためのプログラムである。
【0081】
図4は、上記のプログラムを実行して、上述した実施の形態1の情報処理装置1を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。
図4は、このコンピュータシステム300の概観図であり、
図5は、コンピュータシステム300のブロック図である。
【0082】
図4において、コンピュータシステム300は、CD-ROMドライブ3012を含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
【0083】
図5において、コンピュータ301は、CD-ROMドライブ3012に加えて、MPU3013と、CD-ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0084】
コンピュータシステム300に、本実施の形態1の情報処理装置1の機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。
【0085】
プログラムは、コンピュータ301に、上述した実施の形態1の情報処理装置1の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
【0086】
なお、上記プログラムにおいて、情報を送信する送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信するステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0087】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0088】
また、上記実施の形態1,2において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
【0089】
また、上記実施の形態1,2において、各処理や各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0090】
なお、本願発明は、上記の実施の形態1,2に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0091】
以上のように、本発明にかかる情報処理装置は、受け付けられた画像に対する適切な情報を取得し、出力できるという効果を有し、情報処理装置等として有用である。
【符号の説明】
【0092】
1 情報処理装置
11 格納部
12 受付部
13 処理部
14 出力部
111 テキスト情報格納部
131 テキスト情報抽出部
132 決定部
133 テキスト情報取得部
134 出力情報取得部