特許5974746 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特許5974746データ検索プログラム及びデータ検索装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5974746

(24)【登録日】2016年7月29日

(45)【発行日】2016年8月23日

(54)【発明の名称】データ検索プログラム及びデータ検索装置

(51)【国際特許分類】

G06F 17/30 20060101AFI20160809BHJP

G06F 12/00 20060101ALI20160809BHJP

【ＦＩ】

G06F17/30 110C

G06F17/30 380E

G06F12/00 513J

【請求項の数】12

【全頁数】14

(21)【出願番号】特願2012-199044(P2012-199044)

(22)【出願日】2012年9月11日

(65)【公開番号】特開2014-56282(P2014-56282A)

(43)【公開日】2014年3月27日

【審査請求日】2015年5月7日

(73)【特許権者】

【識別番号】000001270

【氏名又は名称】コニカミノルタ株式会社

(74)【代理人】

【識別番号】100114672

【弁理士】

【氏名又は名称】宮本恵司

(72)【発明者】

【氏名】森脇香美

(72)【発明者】

【氏名】出石聡史

(72)【発明者】

【氏名】河渕洋一

(72)【発明者】

【氏名】吉井謙

【審査官】田中秀樹

(56)【参考文献】

【文献】特開平１１−１１０４０６（ＪＰ，Ａ）

【文献】特開２００１−３１８９４７（ＪＰ，Ａ）

【文献】特開２００１−２３６３５２（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

Ｇ０６Ｆ１２／００

(57)【特許請求の範囲】

【請求項1】

検索条件に対応する一連のデータを複数のソースの各々から収集する装置で動作するデータ検索プログラムであって、
前記装置を、
前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、前記複数のソースの中から採用するソースを決定する採用ソース選択部、
前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部、として機能させ、
前記採用ソース選択部は、前記一連のデータを構成する一部のデータが欠落しているソースを除外して、前記採用するソースを決定する、
ことを特徴とするデータ検索プログラム。

【請求項2】

検索条件に対応する一連のデータを複数のソースの各々から収集する装置で動作するデータ検索プログラムであって、
前記装置を、
前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、前記複数のソースの中から採用するソースを決定する採用ソース選択部、
前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部、として機能させ、
前記採用ソース選択部は、前記一連のデータのデータ毎の信頼度を算出する第１の信頼度算出部と、前記一連のデータのデータ毎の信頼度に基づいてソース毎の信頼度を算出する第２の信頼度算出部と、を含み、
前記採用ソース選択部は、前記ソース毎の信頼度を比較することにより、前記採用するソースを決定する、
ことを特徴とするデータ検索プログラム。

【請求項3】

前記第１の信頼度算出部は、前記一連のデータを構成する各々のデータが日付に関連付けられている場合は、前記一連のデータが発行された日付情報と前記各々のデータが関連付けられている日付情報との比較結果に基づいて、前記各々のデータの信頼度を算出する、
ことを特徴とする請求項２に記載のデータ検索プログラム。

【請求項4】

前記第１の信頼度算出部は、前記一連のデータを構成する各々のデータに特定のマークが付与されているか否かに基づいて、前記各々のデータの信頼度を算出する、
ことを特徴とする請求項２に記載のデータ検索プログラム。

【請求項5】

前記検索結果生成部は、前記検索結果として出力する前記一連のデータの中に、前記特定のマークが付与されているデータが含まれる場合、前記特定のマークに関連する注釈情報を関連付けて出力する、
ことを特徴とする請求項４に記載のデータ検索プログラム。

【請求項6】

前記採用ソース選択部は、前記複数のソースの各々に前記ソース毎の信頼度を関連付けたソース選択画面を表示部に表示させ、前記ソース選択画面で選択されたソースを前記採用するソースとして決定する、
ことを特徴とする請求項２乃至５のいずれか一に記載のデータ検索プログラム。

【請求項7】

検索条件の入力を受け付ける入力部と、
前記入力された検索条件に対応する一連のデータを複数のソースの各々から収集するデータ検索部と、
前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、採用するソースを決定する採用ソース選択部と、
前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部と、を少なくとも備え、
前記採用ソース選択部は、前記一連のデータを構成する一部のデータが欠落しているソースを除外して、前記採用するソースを決定する、
ことを特徴とするデータ検索装置。

【請求項8】

検索条件の入力を受け付ける入力部と、
前記入力された検索条件に対応する一連のデータを複数のソースの各々から収集するデータ検索部と、
前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、採用するソースを決定する採用ソース選択部と、
前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部と、を少なくとも備え、
前記採用ソース選択部は、前記一連のデータのデータ毎の信頼度を算出する第１の信頼度算出部と、前記一連のデータのデータ毎の信頼度に基づいてソース毎の信頼度を算出する第２の信頼度算出部と、を含み、
前記採用ソース選択部は、前記ソース毎の信頼度を比較することにより、前記採用するソースを決定する、
ことを特徴とするデータ検索装置。

【請求項9】

前記第１の信頼度算出部は、前記一連のデータを構成する各々のデータが日付に関連付けられている場合は、前記一連のデータが発行された日付情報と前記各々のデータが関連付けられている日付情報との比較結果に基づいて、前記各々のデータの信頼度を算出する、
ことを特徴とする請求項８に記載のデータ検索装置。

【請求項10】

前記第１の信頼度算出部は、前記一連のデータを構成する各々のデータに特定のマークが付与されているか否かに基づいて、前記各々のデータの信頼度を算出する、
ことを特徴とする請求項８に記載のデータ検索装置。

【請求項11】

前記データ検索装置は、表示部を備え、
前記検索結果生成部は、前記検索結果として出力する前記一連のデータの中に、前記特定のマークが付与されているデータが含まれる場合、前記特定のマークに関連する注釈情報を関連付けて出力し、
前記表示部は、前記検索結果に前記注釈情報を付加して表示する、
ことを特徴とする請求項１０に記載のデータ検索装置。

【請求項12】

前記データ検索装置は、表示部を備え、
前記採用ソース選択部は、前記複数のソースの各々に前記ソース毎の信頼度を関連付けたソース選択画面を前記表示部に表示させ、前記ソース選択画面で選択されたソースを前記採用するソースとして決定する、
ことを特徴とする請求項８乃至１１のいずれか一に記載のデータ検索装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データ検索プログラム及びデータ検索装置に関し、特に、入力された検索条件に対応する一連のデータをソースから収集するデータ検索プログラム及びデータ検索装置に関する。

【背景技術】

【0002】

オフィスにおいては、インターネットや自社データベース等からデータを収集して業務を進めている。例えば、企業業務では、調査会社が持つデータベースや報告書からデータを収集して、ターゲット市場の規模や動向を把握し、意志決定を行っている。このようなデータを収集する装置として様々なデータ検索装置が提案されており、データ検索装置に検索条件を入力すると、検索条件に対応するデータが検索されて表示される。

【0003】

また、複数の項目に対して検索を行う場合、項目毎に検索条件を入力するのは煩雑であることから、検索条件を自動的に生成して検索を行うデータ検索装置も提案されている。例えば、下記特許文献１には、複数の項目と前記複数の項目間の関係を表現したアウトラインを入力し、前記項目と項目間の関係から各項目ごとに検索条件を生成し、前記検索条件に基づいて各項目ごとの情報検索を行う装置が開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００１−４３２３２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

データ検索において、関連する一連のデータを収集する場合には、同じソースからデータを収集するのが便利であるが、関連する一連のデータに欠落があると一連のデータを比較することができなくなるため、通常は複数のソースを対象としてデータを収集することになる。

【0006】

その際、「推定値よりも実績値」というように信頼度の高いデータを収集することが好ましいが、一連のデータを複数のソースから収集すると、一連のデータの整合性がとれなくなることがある。例えば、個々のデータの信頼度からデータを収集すると、調査会社Ａのデータと調査会社Ｂのデータとが混在し、調査会社毎にデータの定義が違うなどの理由によってデータの整合性がとれなくなる。

【0007】

このように、ソースからデータを収集するときは、できるだけ信頼度の高いデータを収集することが好ましいが、個々のデータの信頼度に基づいてソースを選択すると、一連のデータのソースがばらばらになり、一連のデータの整合性が取れなくなるという問題があった。

【0008】

本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、関連する一連のデータを収集する場合において、一連のデータの整合性を保ちつつ、信頼度の高いデータを収集することができるデータ検索プログラム及びデータ検索装置を提供することにある。

【課題を解決するための手段】

【0009】

上記目的を達成するため、本発明は、検索条件に対応する一連のデータを複数のソースの各々から収集する装置で動作するデータ検索プログラムであって、前記装置を、前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、前記複数のソースの中から採用するソースを決定する採用ソース選択部、前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部、として機能させ、前記採用ソース選択部は、前記一連のデータを構成する一部のデータが欠落しているソースを除外して、前記採用するソースを決定するものである。

【0010】

また、本発明は、入力された検索条件に対応する一連のデータを複数のソースの各々から収集するデータ検索部と、前記一連のデータに基づいてソース毎に算出した、信頼性を示す指標を比較することにより、採用するソースを決定する採用ソース選択部と、前記採用するソースから収集した前記一連のデータを検索結果として出力する検索結果生成部と、前記検索結果を表示する表示部と、を備え、前記採用ソース選択部は、前記一連のデータを構成する一部のデータが欠落しているソースを除外して、前記採用するソースを決定するものである。

【発明の効果】

【0011】

本発明のデータ検索プログラム及びデータ検索装置によれば、関連する一連のデータを収集する場合において、一連のデータの整合性を保ちつつ、信頼度の高いデータを収集することができる。

【0012】

その理由は、データ検索装置（データ検索プログラム）では、データに関する時間やデータに付与されたマークなどに基づいて一連のデータのデータ毎の信頼度を算出し、その一連のデータのデータ毎の信頼度からソース毎の信頼度を算出し、算出したソース毎の信頼度に基づいて採用するソースを選択し、選択したソースから取得した一連のデータを検索結果として出力する制御を行うからである。

【図面の簡単な説明】

【0013】

【図1】本発明の一実施例に係るデータ検索装置の機能を示すブロック図である。

【図2】本発明の一実施例に係るデータ検索装置の全体処理を示すフローチャート図である。

【図3】本発明の一実施例に係るデータ検索装置の処理（ソース毎の信頼度算出処理）を示すフローチャート図である。

【図4】本発明の一実施例に係るデータ検索装置の処理（データ毎の信頼度算出処理）を示すフローチャート図である。

【図5】本発明の一実施例に係るデータ検索装置の処理（採用ソース選択処理）を示すフローチャート図である。

【図6】本発明の一実施例に係るデータ検索装置における検索条件の入力例を示す図である。

【図7】本発明の一実施例に係るデータ検索装置における検索式の生成例を示す図である。

【図8】本発明の一実施例に係るデータ検索装置における検索結果の表示画面例を示す図である。

【図9】本発明の一実施例に係るデータ検索装置におけるソースの選択画面例を示す図である。

【発明を実施するための形態】

【0014】

背景技術で示したように、ソースからデータを収集するときは、できるだけ信頼度の高いデータを収集することが好ましいが、個々のデータの信頼度に基づいてソースを選択すると、一連のデータのソースがばらばらになり、一連のデータの整合性が取れなくなってしまうという問題がある。そこで、本発明の一実施の形態では、個々のデータの信頼度ではなく、一連のデータの信頼性を示す指標（以下、ソース毎の信頼度と呼ぶ。）を算出し、そのソース毎の信頼度に基づいてソースを選択することによって、一連のデータの整合性を保ちつつ、信頼度の高いデータを収集できるようにする。

【0015】

具体的には、複数のソースからデータの収集が可能なデータ検索装置において、一連のデータのデータ毎の信頼度を算出し、算出した一連のデータのデータ毎の信頼度を用いてソース毎の信頼度を算出し、一連のデータの全てが揃ったソースの中から、ソース毎の信頼度の高いソースを採用する採用ソース選択部を設け、採用したソースから収集した一連のデータを検索結果として出力する。また、データ毎の信頼度を算出する際に、データに関連付けられた日付情報に基づいてデータ毎の信頼度を算出したり、データに付与された特定のマークの有無に基づいてデータ毎の信頼度を算出したりする。

【実施例】

【0016】

上記した本発明の実施の形態についてさらに詳細に説明すべく、本発明の一実施例に係るデータ検索プログラム及びデータ検索装置について、図１乃至図９を参照して説明する。図１は、本実施例のデータ検索装置の機能を示すブロック図であり、図２乃至図５は、本実施例のデータ検索装置の処理を示すフローチャート図である。また、図６乃至図９は、各々、検索条件の入力例、検索式の生成例、検索結果の表示画面例、ソースの選択画面例を示す図である。

【0017】

本実施例は、ＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）などの通信ネットワーク上に複数のソースが存在し、検索により関連する一連のデータを同一ソースから収集し、検索結果を表示するシステムに関する。なお、本実施例において、ソースは、例えば、発行元毎に管理されたファイル（調査会社毎に管理された市場動向を記した文書など）であり、データは、そのファイルに含まれる情報（会社名と年度と売上高など）を指す。

【0018】

図１は、上記システムの一例としてのデータ検索装置１０を示している。このデータ検索装置１０は、検索条件入力部２０とデータ検索部３０と採用ソース選択部４０と検索結果生成部５０と検索結果表示部６０などで構成され、通信ネットワークを介して複数のソース７０が接続されている。

【0019】

検索条件入力部２０は、キーボードやタッチパネルなどであり、検索者による検索条件の入力を受け付ける。

【0020】

データ検索部３０は、検索式生成部３１と検索処理部３２と検索データ蓄積部３３などで構成される。検索式生成部３１は、検索条件入力部２０で入力された検索条件から検索式を生成する。検索処理部３２は、検索式生成部３１が生成した検索式を用いて複数のソース７０の各々から一連のデータを検索する。検索データ蓄積部３３は、ＨＤＤ（Hard Disk Drive）などであり、各々のソース７０から収集した検索データを蓄積する。

【0021】

採用ソース選択部４０は、データ信頼度算出部４１とソース信頼度算出部４２とソース選択処理部４３などで構成される。データ信頼度算出部４１は、各々のデータの時間に関する情報や各々のデータに付与されたマークに関する情報などを用いて、一連のデータのデータ毎の信頼度を算出する。ソース信頼度算出部４２は、データ信頼度算出部４１が算出した一連のデータのデータ毎の信頼度を用いてソース毎の信頼度を算出する。ソース選択処理部４３は、ソース信頼度算出部４２が算出したソース毎の信頼度に基づいて、データ検索装置１０に接続される複数のソース７０の中から採用するソースを決定する。

【0022】

検索結果生成部５０は、データ検索部３０に蓄積された検索データの中から、採用ソース選択部４０が決定したソース７０から収集した検索データを特定し、その検索データを検索結果として出力する。

【0023】

検索結果表示部６０は、ＬＣＤ（Liquid Crystal Display）などであり、検索結果生成部５０が出力した検索結果を表示する。

【0024】

なお、データ検索部３０や採用ソース選択部４０、検索結果生成部５０は、ハードウェアとして構成してもよいし、ＣＰＵ（Central Processing Unit）とＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）などのメモリとで構成される制御部上で動作するソフトウェア（データ検索プログラム）として構成してもよい。

【0025】

また、図１は、本実施例のデータ検索装置１０の一例であり、その構成は適宜変更可能である。例えば、検索条件入力部２０や検索結果表示部６０は検索者のコンピュータ装置上に設け、データ検索部３０や採用ソース選択部４０、検索結果生成部５０等はサーバやクラウド上に設ける構成としてもよい。また、ソース７０は、通信ネットワークを介してデータ検索装置１０に接続される構成としてもよいし、データ検索装置１０内に含む構成としてもよい。

【0026】

以下、本実施例のデータ検索装置１０を用いたデータ検索処理について、図２乃至図５のフローチャート図を参照して説明する。図２は、データ検索装置１０の全体処理を示すフローチャート図であり、図３乃至図５は、各々、ソース毎の信頼度算出処理、データ毎の信頼度算出処理、採用ソース選択処理を示すフローチャート図である。

【0027】

図２に示すように、検索条件入力部２０は、検索条件の入力画面を表示し、検索者による、関連する一連のデータを検索するための検索条件の入力を受け付ける（Ｓ１００）。検索条件の入力方法は特に限定されないが、例えば、図６に示すように、検索条件を文章形式で入力させるようにしてもよいし、表形式で入力させるようにしてもよいし、プルダウンメニューから選択させるようにしてもよい。

【0028】

次に、データ検索部３０の検索式生成部３１は、検索条件入力部２０で入力された検索条件を用いて、関連する一連のデータを検索するための検索式を生成する（Ｓ１１０）。検索式の生成方法も特に限定されないが、例えば、文章形式で検索条件が入力された場合は、その検索条件文を構文解析により分解する。具体的には、図７に示すように、検索条件が「２００８、２００９、２０１０、２０１１、２０１２年のＸ、Ｙ、Ｚ社のお茶の売上高を知りたい」のように文章形式で入力された場合は、構文解析により「２００８年、２００９年、２０１０年、２０１１年、２０１２年」と「Ｘ社、Ｙ社、Ｚ社」と「お茶の売上高」に分解し、属性が共通する年と社名は一つにまとめて、「お茶の売上高＆（２００８年ｏｒ２００９年ｏｒ２０１０年ｏｒ２０１１年ｏｒ２０１２年）＆（Ｘ社ｏｒＹ社ｏｒＺ社）」といった検索式を生成する。なお、さらに分解して、「お茶の売上高＆２００８年＆Ｘ社」、「お茶の売上高＆２００８年＆Ｙ社」、…、「お茶の売上高＆２０１２年＆Ｚ社」といった検索式を生成してもよい。

【0029】

次に、データ検索部３０の検索処理部３２は、検索式生成部３１が生成した検索式を用いてソース７０毎に検索処理を実施して一連のデータを収集し、検索データ蓄積部３３は、検索データをソース７０毎に蓄積する（Ｓ１２０）。表１は、ソース７０の一例であり、データはＸＭＬ（Extensible Markup Language）のようなタグで表現されて保持、若しくは、レコードとして保持されている。また、表２は、ソース７０毎の検索データの一例であり、検索データは、一時的なメモリ上に記憶、若しくは、ファイルに書き出してＨＤＤなどに記憶される。

【0030】

［表１］
・調査会社Ａ（2012年4月発行）から抜粋

＊アジア地域は含まない
・調査会社Ｂ（2011年4月発行）から抜粋

・調査会社Ｃ（2011年4月発行）から抜粋

【0031】

［表２］
・調査会社Ａ（2012年4月発行）

・調査会社Ｂ（2011年4月発行）

・調査会社Ｃ（2011年4月発行）

【0032】

次に、採用ソース選択部４１のソース信頼度算出部４２は、一連のデータに対するソース毎の信頼度を算出する（Ｓ１３０）。図３は、このステップの詳細を示しており、まず、対象ソースの蓄積した検索データをメモリやＨＤＤなどから取り出す（Ｓ１３１）。次に、取り出した一連のデータに対してデータ毎に信頼度を算出する（Ｓ１３２）。このステップの詳細は後述する。そして、算出したデータ毎の信頼度を取りまとめる（Ｓ１３３）。具体的には、対象ソースに含まれる一連のデータのデータ毎の信頼度の和や平均値を計算し、その値をソース毎の信頼度として設定する。

【0033】

図４は、上記Ｓ１３２のデータ毎の信頼度算出ステップの詳細を示しており、まず、時間に関するデータの信頼度を設定する（Ｓ１３２ａ）。例えば、データが時間に関連付けられている場合は、一連のデータが発行された日付情報（ソースの発行年月日）と各々のデータに関連付けられた日付情報とを比較し、一連のデータが発行された日付が各々のデータに関連付けられた日付以降の時は、そのデータ（例えば、表２における調査会社Ａの２００８〜２０１１年の売上高、調査会社Ｂ、Ｃの２００８〜２０１０年の売上高など）は実績値であるため、データの信頼度を相対的に高い値（例えば、「１」）に設定する。また、一連のデータが発行された日付が各々のデータに関連付けられた日付より前の時は、そのデータ（例えば、表２における調査会社Ａの２０１２年の売上高、調査会社Ｂ、Ｃの２０１１年の売上高など）は推定値であるため、データの信頼度を相対的に低い値（例えば、「０．５」）に設定する。また、データが時間に関連付けられていない場合は、データの信頼度を相対的に高い値（例えば、「１」）に設定する。

【0034】

なお、データが時間に関連付けられている場合において、一連のデータが発行された日付が各々のデータに関連付けられた日付より前の時は、その日付の間隔に応じて、１年前は「０．５」、２年前は「０．４」のように年毎に「０．１」ずつ減少させるなど、データの信頼度を細かく設定してもよい。

【0035】

次に、注釈情報のあるソース７０（表１における調査会社Ａのソース）内の検索データを調べ、特定のマークが付与された検索データを抽出する（Ｓ１３２ｂ）。例えば、調査会社Ａのソースは「＊アジア地域は含まない」といった注釈情報があるため、調査会社Ａのソース内の検索データを調べ、＊のマークが付与された検索データ（Ｚ社の２００８年及び２００９年のデータ）を抽出する。なお、ここでは特定のマークとして＊を例示したが、特定のマークは任意であり、例えば、（）などとしてもよい。この特定のマークは、ＸＭＬのタグを用いて、データ部分（例えば「２０＊」）を取り出し、その中身が数字のみかどうかをチェックすることにより容易に検出することができる。

【0036】

次に、マークに関するデータの信頼度を設定する（Ｓ１３２ｃ）。例えば、＊や（）等の特定のマークが付与されている場合は、データの信憑性が低いと考えられることから、データの信頼度を相対的に低い値（例えば、「０．５」）に設定し、特定のマークが付与されていない場合は、データの信憑性が高いと考えられることから、データの信頼度を相対的に高い値（例えば、「１」）に設定する。その後、時間に関するデータの信頼度とマークに関するデータの信頼度とを乗算／加算したり、重み付けして乗算／加算したりして統合する（Ｓ１３２ｄ）。

【0037】

なお、ここでは特定のマークが付与された検索データを抽出する構成としたが、データが文字の場合は、文字がイタリックで記述された検索データを抽出することもできる。例えば、データがＸＭＬのようなタグで表現されている場合、イタリックはタグでは「<i>40</i>」のように記述されることから容易に判断することができる。また、ここでは採用ソース選択部４０（データ信頼度算出部４１）がソース７０に注釈情報があるか否かを判断したが、時間短縮のために、データ検索部３０がデータを検索する際に注釈情報も収集し、検索データ蓄積部３３が検索データと注釈情報とを関連付けて蓄積するようにしてもよい。

【0038】

また、上記では、時間に関するデータの信頼度とマークに関するデータの信頼度とを設定したが、これらに加えて、若しくは、これらに代えて、履歴情報（例えば、データが検索された頻度）など、信頼度に影響がある任意の要素に関するデータの信頼度を設定してもよい。

【0039】

表３は、図３及び図４のフローに従って算出したソース毎の信頼度の一例である。調査会社Ａのソースは２０１２年４月発行であり、２０１２年のデータは推定値であるため、データの信頼度は「０．５」に設定されている。また、Ｚ社の２００８年、２００９年のデータには特定のマークとして＊が付与されているため、データの信頼度は「０．５」に設定されている。また、調査会社Ｂ、Ｃのソースは２０１１年４月発行であり、２０１１年、２０１２年のデータは推定値であるため、２０１１年のデータの信頼度は「０．５」に設定され、２０１２年のデータの信頼度は日付間隔によって重み付けされて「０．４」に設定されている。また、調査会社Ｃのソースは、Ｚ社の２００８年、２００９年、２０１０年のデータがないため、データが存在しない部分はデータの信頼度は「０」に設定されている。

【0040】

［表３］
・調査会社A

・調査会社B

・調査会社C

【0041】

図２のフローチャート図に戻って、採用ソース選択部４０のソース選択処理部４３は、検索対象として採用するソースを選択する（Ｓ１４０）。図５は、このステップの詳細を示しており、まず、一連のデータが揃っているソースを採用ソース候補として設定する（Ｓ１４１）。上記の例では、調査会社Ｃのソースは一連のデータに欠落があるため、採用ソース候補から除外し、調査会社Ａ、Ｂのソースを採用ソース候補とする。次に、採用ソース候補のソース毎の信頼度を比較し、その中から信頼度が最も高いソースを採用ソースとして決定する（Ｓ１４２）。上記の例では、調査会社Ａのソースはデータ毎の信頼度の合計が「１２．５」であり、調査会社Ｂのソースはデータ毎の信頼度の合計が「１２．０」であることから、ソース選択処理部４３は調査会社Ａのソースを採用ソースとして決定する。

【0042】

なお、ここではデータ毎の信頼度を加算した値をソース毎の信頼度としているが、ソース毎の信頼度の算出方法は上記に限定されず、例えば、データ毎の信頼度を乗算した値をソース毎の信頼度としたり、データ毎の信頼度の標準偏差を求め、その値をソース毎の信頼度としたり、データ毎の信頼度の中で最も出現頻度の高い値をソース毎の信頼度としたりすることもできる。データ毎の信頼度を乗算した値をソース毎の信頼度とする場合は、データに欠落があるソースの信頼度は「０」になるため、Ｓ１４１で採用ソース候補を設定する必要がなくなる。

【0043】

次に、検索結果生成部５０は、採用ソースとして決定されたソースから収集した検索データを検索結果として出力する（Ｓ１５０）。表４は、検索結果の一例であり、ここでは、データの信頼度が最も高い調査会社Ａのソースから収集した一連のデータが検索結果として出力される。なお、表１にてデータに特定のマークが付与されている場合は、検索結果にも特定のマークを付与して出力することが好ましい。

【0044】

［表４］

【0045】

次に、検索結果表示部６０は、検索結果生成部５０から出力された検索結果を表示する（Ｓ１６０）。図８は、検索結果の表示画面の一例であり、採用ソースとして決定された調査会社Ａのソースから収集した検索データが表示される。なお、当該ソースに注釈情報がある場合は、検索結果の表示画面上にも注釈情報を表示し、検索データに特定のマークが付与されている場合は、その特定のマークも表示することにより、検索者にデータの信憑性を認識させることができる。

【0046】

なお、上記フローではソース選択処理部４３が採用ソースを決定する構成としたが、ソース信頼度算出部４２が算出したソース毎の信頼度が近い複数のソースが存在する場合に、検索者にどのソースを採用するかを選択させる構成としてもよい。その場合は、図５の採用ソースの選択処理のＳ１４２にて、ソース選択処理部４３が、図９に示すような採用ソースの選択画面を表示し、検索者が当該画面で選択したソースを採用ソースとして決定してもよい。

【0047】

このように、本実施例のデータ検索装置１０では、データの時間に関する情報やマークに関する情報などを用いて一連のデータのデータ毎の信頼度を算出し、その一連のデータのデータ毎の信頼度からソース毎の信頼度を算出し、ソース毎の信頼度に基づいて採用ソースを決定し、決定したソースから収集した検索データを検索結果として出力する制御を行うため、一連のデータの整合性を保ちつつ、信頼度の高いデータを収集することができる。

【0048】

なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨を逸脱しない限りにおいて、その構成や制御は適宜変更可能である。

【0049】

例えば、上記説明では同じ表の中からデータを収集したが、同じソース内でデータが分散して存在する場合は、同じソース内の複数の表の中から一連のデータを収集するようにしてもよい。

【0050】

また、各々のソースのデータを定期的にチェックし、データが更新された場合はデータ検索装置１０に通知し、データ検索装置１０は再度データ収集を行って検索結果を更新できるようにしてもよい。

【0051】

また、上記実施例では、ソースから収集するデータが売上高のような数字の場合を示したが、ソースから収集するデータがスペック表のような文字列の場合も、本発明の制御を同様に適用することができる。

【産業上の利用可能性】

【0052】

本発明は、入力された検索条件に対応する一連のデータをソースから収集する装置及び当該装置で動作するプログラムに利用可能である。

【符号の説明】