IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7404679判定処理プログラム、判定処理方法および情報処理装置
<>
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図1
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図2
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図3
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図4
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図5
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図6
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図7
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図8
  • 特許-判定処理プログラム、判定処理方法および情報処理装置 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】判定処理プログラム、判定処理方法および情報処理装置
(51)【国際特許分類】
   G06F 16/907 20190101AFI20231219BHJP
【FI】
G06F16/907
【請求項の数】 5
(21)【出願番号】P 2019129181
(22)【出願日】2019-07-11
(65)【公開番号】P2021015402
(43)【公開日】2021-02-12
【審査請求日】2022-04-07
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】阿部 修也
【審査官】酒井 恭信
(56)【参考文献】
【文献】特開2018-106662(JP,A)
【文献】特開2006-189915(JP,A)
【文献】特開2015-148981(JP,A)
【文献】小山 聡,馬場 雪乃,櫻井 祐子,鹿島 久嗣,クラウドソーシングにおけるワーカーの確信度を用いた高精度なラベル統合,2013年度人工知能学会全国大会(第27回)論文集,一般社団法人 人工知能学会,2013年06月07日,pp. 1-4
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00 - 16/958
(57)【特許請求の範囲】
【請求項1】
所定の事象について判定した複数人の、判定値と当該判定値に対する自己評価の確信度とを含む回答結果を入力し、前記所定の事象について、前記回答結果の前記複数人の各々の前記判定値と当該判定値に対する自己評価の確信度とに基づいて、第1の判定値である確率および第2の判定値である確率を計算して、前記第1の判定値である確率および前記第2の判定値である確率を含む判定結果である第1の判定結果を取得し、
前記所定の事象について、前記回答結果に基づいて、前記複数人のうちの、前記回答結果に含まれる自己評価の確信度が所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出し、
前記所定の事象について、前記第1の判定結果および前記第2の判定結果のうち、前記第1の判定値である確率および前記第2の判定値である確率の間の差が大きい方の判定結果を出力する、
処理をコンピュータに実行させることを特徴とする判定処理プログラム。
【請求項2】
前記所定の事象と類似する事象について、前記第1の判定結果を取得し、前記所定の事象において回答を除外した人と同じ人の回答を除外した場合の前記第2の判定結果を算出する処理を更にコンピュータに実行させ、
前記出力する処理は、前記類似する事象について、取得した前記第1の判定結果と、算出した前記第2の判定結果のうち、前記第1の判定値である確率および前記第2の判定値である確率の間の差が大きい方の判定結果を出力する、
ことを特徴とする請求項1に記載の判定処理プログラム。
【請求項3】
前記回答結果は、所定の物質または態様と、当該物質または態様との関連についての、複数人の判定値と当該判定値に対する各人の自己評価の確信度である、
ことを特徴とする請求項1または2に記載の判定処理プログラム。
【請求項4】
所定の事象について判定した複数人の、判定値と当該判定値に対する自己評価の確信度とを含む回答結果を入力し、前記所定の事象について、前記回答結果の前記複数人の各々の前記判定値と当該判定値に対する自己評価の確信度とに基づいて、第1の判定値である確率および第2の判定値である確率を計算して、前記第1の判定値である確率および前記第2の判定値である確率を含む判定結果である第1の判定結果を取得し、
前記所定の事象について、前記回答結果に基づいて、前記複数人のうちの、前記回答結果に含まれる自己評価の確信度が所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出し、
前記所定の事象について、前記第1の判定結果および前記第2の判定結果のうち、前記第1の判定値である確率および前記第2の判定値である確率の間の差が大きい方の判定結果を出力する、
処理をコンピュータが実行することを特徴とする判定処理方法。
【請求項5】
所定の事象について判定した複数人の、判定値と当該判定値に対する自己評価の確信度とを含む回答結果を入力し、前記所定の事象について、前記回答結果の前記複数人の各々の前記判定値と当該判定値に対する自己評価の確信度とに基づいて、第1の判定値である確率および第2の判定値である確率を計算して、前記第1の判定値である確率および前記第2の判定値である確率を含む判定結果である第1の判定結果を取得する取得部と、
前記所定の事象について、前記回答結果に基づいて、前記複数人のうちの、前記回答結果に含まれる自己評価の確信度が所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出する算出部と、
前記所定の事象について、前記第1の判定結果および前記第2の判定結果のうち、前記第1の判定値である確率および前記第2の判定値である確率の間の差が大きい方の判定結果を出力する出力部と、
を有することを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、判定処理プログラム、判定処理方法および情報処理装置に関する。
【背景技術】
【0002】
従来、例えばヘルスケアの分野などは、キュレーターが論文を読み、論文に記述されている事象(以下、知識)をデータベースに登録する作業、キュレーションが行われている。このキュレーションでは、キュレーターの誤りに対処するため、複数のキュレーターが同じ知識について判断した結果から真と判定した知識をデータベースに登録している。
【0003】
このような複数のキュレーターの判断結果から真とする知識を判定する従来技術としては、複数のワーカーが同一データに付与したラベルから真のラベルを推定する際に、ワーカーが自己申告した確信度(confidence)を利用する方法が知られている。
【先行技術文献】
【非特許文献】
【0004】
【文献】小山 聡, 馬場 雪乃, 櫻井 祐子, 鹿島 久嗣,クラウドソーシングにおけるワーカーの確信度を用いた高精度なラベル統合,The 27th Annual Conference of the Japanese Society for Artificial Intelligence, 2013
【発明の概要】
【発明が解決しようとする課題】
【0005】
ある知識に対するキュレーターの判断や、確信度の正しさは、判断対象の知識についてキュレーターが詳しいか否かに影響される。このため、上記の従来技術では、例えばキュレーションの対象となる知識について、キュレーターが詳しいものと、詳しくないものとが混在していると、真の知識として適正に判定することが困難な場合があるという問題がある。
【0006】
1つの側面では、キュレーションにおける適正な知識の登録を支援することができる判定処理プログラム、判定処理方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
第1の案では、判定処理プログラムは、取得する処理と、算出する処理と、出力する処理とをコンピュータに実行させる。取得する処理は、所定の事象について判定した複数人の回答結果に基づき、事象に関する判定が複数の判定値のいずれに対応するかを、複数の判定値それぞれに対する確度と対応付けて示す判定結果である第1の判定結果を取得する。算出する処理は、複数人のうちの所定の条件を満たす人の回答を除外した場合の判定結果である第2の判定結果を算出する。出力する処理は、第1の判定結果と、第2の判定結果のうち、複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する。
【発明の効果】
【0008】
本発明の1実施態様によれば、キュレーションにおける適正な知識の登録を支援することができる。
【図面の簡単な説明】
【0009】
図1図1は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。
図2図2は、キュレーションする知識の一例を示す説明図である。
図3図3は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。
図4図4は、判定推定の処理例を示すフローチャートである。
図5図5は、判断の削除の処理例を示すフローチャートである。
図6図6は、所定の知識における判断削除の処理例を示すフローチャートである。
図7図7は、類似知識における判断削除の処理例を示すフローチャートである。
図8図8は、類似知識における判断削除の処理例を示すフローチャートである。
図9図9は、判定処理プログラムを実行するコンピュータの一例を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、実施形態にかかる判定処理プログラム、判定処理方法および情報処理装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する判定処理プログラム、判定処理方法および情報処理装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。
【0011】
[実施形態について]
図1は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図1に示すように、情報処理装置1は、通信部10、記憶部20および制御部30を有する、例えばPC(パーソナルコンピュータ)などである。
【0012】
通信部10は、有線又は無線を問わず接続する外部機器との通信を制御する。通信部10は、例えばNIC(Network Interface Card)等の通信インタフェース等である。
【0013】
記憶部20は、例えば制御部30が実行するプログラム、判断結果情報21、設定情報22および推定結果情報23などの各種データを記憶する。記憶部20は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリなどの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
【0014】
判断結果情報21は、論文を読んだ複数のキュレーターそれぞれがデータベース(DB)に登録する事象(知識)について判定した回答結果である。すなわち、判断結果情報21は、所定の事象について判定した複数人の回答結果の一例である。
【0015】
具体的には、判断結果情報21は、論文に記述された各知識について、キュレーターそれぞれがDBに登録する知識であるか、または、登録しない知識であるかを判断したものである。この判断には、キューレーターが自己申告した判断に対する確信度が含まれる。一例として、確信度は、判断に対する確信が最も高い場合に1とし、最も低い場合に0とする0~1までの数値であってもよい。
【0016】
なお、本実施形態において判断結果情報21に示された回答結果は、DBへ登録する知識であるか(○)、DBへ登録しない知識であるか(×)の二択となっているが、二択に限定するものではない。例えば、論文に記述された各知識について、重要度のランク付け(例えば5段階)を判断したものであってもよい。
【0017】
図2は、キュレーションする知識の一例を示す説明図である。具体的には、図2は、自然言語処理(NLP)で遺伝子変異と病気に関する知識(事象)2を論文から抽出した結果を例示している。図2に示すように、論文には、所定の物質(例えば、遺伝子名、遺伝子変異)または態様(例えば疾患、病気)と、その物質または態様との関連を示す知識(事象)2が含まれる。図示例では、遺伝子名、遺伝子変異、薬、疾患といった固有表現の間の関係について、固有表現をハイライト表示し、固有表現の間の関係を矢印で示している。
【0018】
論文を読んだキュレーターは、NLPなどで抽出した知識(事象)2について、DBへの登録の有無を判断して回答する。例えば、キュレーターは、「ある遺伝子変異Aがある病気Bの原因になる」などの知識(事象)2について、DBへ登録する知識であるか(○)、DBへ登録しない知識であるか(×)の判断と、判断に対する確信度を回答する。
【0019】
図1に戻り、設定情報22は、制御部30の処理(詳細は後述する)に関連する各種の設定値(例えばパラメータ、閾値など)などである。
【0020】
推定結果情報23は、判断結果情報21に基づき、判断結果情報21に含まれる各知識(事象)2について制御部30の処理により推定した結果である。具体的には、推定結果情報23は、判断結果情報21に含まれる各知識(事象)2に関する判断が、複数の判定値(例えばDBへ登録する知識(○)、DBへ登録しない知識(×))のいずれに対応するかの確度を推定したものである。
【0021】
制御部30は、情報処理装置1の全体的な処理を司る処理部である。制御部30は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部30は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。
【0022】
制御部30は、入力部31、取得部32、算出部33および出力部34を有する。なお、入力部31、取得部32、算出部33および出力部34は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。
【0023】
入力部31は、通信部10などを介して入力される各種データの入力処理を行う処理部である。例えば、入力部31は、各知識(事象)2におけるキュレーターそれぞれの判断と、判断に対する確信度の入力を受け付けて、判断結果情報21として記憶部20に格納する。また、入力部31は、制御部30の処理における各種の設定値(例えばパラメータ、閾値など)の入力を受け付けて、設定情報22として記憶部20に格納する。
【0024】
取得部32は、判断結果情報21に基づき、判断結果情報21の知識(事象)2に関する判定が複数の判定値のいずれに対応するかを、複数の判定値それぞれに対する確度と対応付けて示す判定結果を取得する処理部である。
【0025】
具体的には、取得部32は、自己評価による確信度をもとに、複数のキュレーターそれぞれが判断した知識を統合する非特許文献1に記載された手法を用いて、判断結果情報21の各知識(事象)2に関する判定が複数の判定値のいずれに対応するかを確度と対応付けて推定する。次いで、取得部32は、判断結果情報21の各知識(事象)2における判定結果(推定結果)を推定結果情報23として記憶部20に格納する。
【0026】
例えば、非特許文献1に記載された手法では、キュレーターの自己評価にはばらつきがあり、自信過剰なキュレーターや自信過小なキュレーターが存在している点に注目している。具体的には、キュレーターの自信の度合いを考慮した確信度のモデルを作成する。次いで、作成したモデルを用いて、EMアルゴリズム(expectation-maximization algorithm)で、複数のキュレーターによる知識の正誤の判断結果から真の正誤を確度とともに推定する。
【0027】
算出部33は、判断結果情報21の知識(事象)2について、複数人のうちの所定の条件を満たす人(キュレーター)の回答を除外した場合の判定結果を算出する処理部である。
【0028】
具体的には、算出部33は、判断結果情報21の知識(事象)2における複数のキュレーターの回答の中で、所定の条件(例えば確信度が所定値より低い人の回答)を満たす回答を除外する。次いで、算出部33は、取得部32と同様に、非特許文献1に記載された手法を用いて、判断結果情報21の各知識(事象)2に関する判定が複数の判定値のいずれに対応するかを確度と対応付けて推定する。次いで、算出部33は、回答を除外して推定した判断結果情報21の各知識(事象)2における判定結果(推定結果)を推定結果情報23として記憶部20に格納する。
【0029】
なお、推定結果情報23について、取得部32の判定結果(推定結果)と、算出部33の判定結果(推定結果)とをそれぞれ区別する場合、取得部32の推定結果は推定結果情報23a、算出部33の推定結果は推定結果情報23bと区別して表記する。
【0030】
出力部34は、推定結果情報23をもとに、取得部32の判定結果と、算出部33の判定結果のうち、複数の判定値それぞれに対する確度の間の差が大きい方の判定結果を出力する処理部である。具体的には、出力部34は、知識(事象)2について、取得部32の推定結果情報23aと、算出部33の推定結果情報23bとを比較し、確度の差が大きい方の判定結果をDBへの登録のための判定結果としてディプレイやファイルなどに出力する。
【0031】
図3は、実施形態にかかる情報処理装置1の動作例を示すフローチャートである。図3に示すように、まず、NLPなどにより論文から抽出した各知識(事象)2について、複数のキュレーターが正誤(DBへ登録する(○)またはDBへ登録しない(×))を判断する。次いで、キュレーターは、各知識(事象)2における判断結果を、判断に対する確信度とともに情報処理装置1に入力する。情報処理装置1の入力部31は、キュレーターからの入力を受け付け、各知識(事象)2における判断結果を判断結果情報21として記憶部20に格納する(S1)。
【0032】
具体的には、図3に示すように、判断結果情報21は、知識IDで識別される各知識(事象)2について、複数のキュレーターの回答(判断および確信度)を含む。
【0033】
次いで、取得部32は、判断結果情報21に基づき、判断結果情報21の各知識(事象)2に関する判定が複数の判定値のいずれに対応するかを確度と対応付けて推定する判定推定を行う(S2)。
【0034】
図4は、判定推定の処理例を示すフローチャートである。図4に示すように、取得部32は、判断結果情報21の全ての知識(事象)2について、複数のキュレーターの判断結果と自己評価による確信度から、非特許文献1に記載された手法を用いて、各知識(事象)2が正解(○)である確率と不正解(×)である確率を計算する(S10)。
【0035】
具体的には、図4の右側に示す推定結果情報23aのとおり、取得部32は、各知識IDが示す知識(事象)2について、正解(○)である確率と不正解(×)である確率を計算する。
【0036】
次いで、取得部32は、正解または不正解のうち、確率が高い方を各知識(事象)2の正誤の推定結果(判断結果)として計算する(S11)。例えば、知識IDが「1」の知識(事象)2については、正解(○)の確率が「0.9」であり、不正解(×)の確率が「0.1」であることから、判断結果は「○」となる。
【0037】
次いで、取得部32は、正解(○)の確率と、不正解(×)の確率の差を計算する(S12)。例えば、知識IDが「1」の知識(事象)2については、正解(○)の確率が「0.9」であり、不正解(×)の確率が「0.1」であることから、確率の差は「0.8」となる。
【0038】
図3に戻り、S2に次いで、算出部33は、判断結果情報21の知識(事象)2における複数のキュレーターの回答(判断)の中で、所定の条件を満たす判断の削除をして判定結果(推定結果)を算出する処理を行う(S3)。
【0039】
図5は、判断の削除の処理例を示すフローチャートである。図5に示すように、まず、ユーザは、確率差の閾値とするNなどの設定値の入力を行う。入力部31は、ユーザからの入力を受け付け、Nなどの設定値を設定情報22として記憶部20に格納する(S20)。
【0040】
次いで、算出部33は、取得部32による推定結果情報23aについて、正解/不正解の確率差の昇順に知識(事象)2を並び替える(S21)。例えば、図示例では、確率差が「0.2」と最も小さい知識ID「4」の知識(事象)2が先頭となる。
【0041】
次いで、算出部33は、並び替え後の推定結果情報23aより先頭の知識(事象)2を選択する(S22)。次いで、算出部33は、選択した知識における判断の削除を行い、判定結果(推定結果)を算出する処理を行う(S23)。
【0042】
図6は、所定の知識における判断削除の処理例を示すフローチャートである。図6に示すように、S23の処理が開始されると、算出部33は、S22で選択した知識(事象)2についてキュレーター判断を並べ替える(S30)。具体的には、算出部33は、自己評価の確信度が低いキュレーターの判断を優先して順位が高くなるように並べ替える。
【0043】
次いで、算出部33は、先頭から順にキュレーターの判断を選択し(S31)、選択したキュレーターの判断を除外する(S32)。具体的には、図6の右側に示すように、S22において選択した知識ID「4」の知識(事象)2について、確信度が「0.2」と最も低い「キュレーター1」が先頭となることから、算出部33は、「キュレーター1」の判断「○」を選択する。次いで、算出部33は、選択した「キュレーター1」の判断「○」を除外する。
【0044】
次いで、算出部33は、S2と同様に、非特許文献1に記載された手法を用いて判定推定を行う(S33)。図6の右側に示すように、S33の判定推定により得られた推定結果情報23bは、知識ID「4」の知識(事象)2について「キュレーター1」の判断「○」を除外したことから、推定結果が推定結果情報23aと異なるものとなる。
【0045】
具体的には、推定結果情報23bでは、知識ID「4」の知識(事象)2について、正解(○)の確率が「0.3」であり、不正解(×)の確率が「0.7」であることから、判断結果は「×」となる。
【0046】
次いで、出力部34は、推定結果情報23a、23bを比較し、確率差がキュレーターを除く前よりも大きくなっているか否かを判定する(S34)。正解(○)の確率と、不正解(×)の確率との差が大きくなるということは、判定の精度が高まっていることを意味する。よって、キュレーターを除く前よりも大きく(推定結果情報23bの方が大きく)なっている場合(S34:Yes)、出力部34は、推定結果情報23bを出力対象とし、S36へ処理を進める。
【0047】
キュレーターを除く前よりも大きくなっていない(推定結果情報23aの方が大きい)場合(S34:No)、出力部34は、除いたキュレーターの判断をもとに戻し(S35)、S31へ処理を戻す。
【0048】
S36において、算出部33は、選択した知識(事象)2と類似する第1の類似知識について、S23と同様に知識における判断の削除を行い、判定結果(推定結果)を算出する処理を行う。次いで、算出部33は、選択した知識(事象)2と類似する第2の類似知識についても、S23と同様に知識における判断の削除を行い、判定結果(推定結果)を算出する処理を行う(S37)。
【0049】
なお、類似知識とは、選択した知識(事象)2との間で、物質または態様に共通点を有するものである。例えば、物質または態様を示す固有表現(固有名詞)に共通するものを有するものが類似知識となる。本実施形態では、2つの固有表現とその関係を記述している知識(事象)2同士で、1つ目の固有表現が共通するものを第1の類似知識とする。また、2つ目の固有表現が共通するものを第2の類似知識とする。
【0050】
図7図8は、類似知識における判断削除の処理例を示すフローチャートである。具体的には、図7は、第1の類似知識における判断削除の処理例を示す。また、図8は、第2の類似知識における判断削除の処理例を示す。
【0051】
図7に示すように、第1の類似知識における処理が開始されると、算出部33は、S31で削除した知識(事象)2の1つ目の固有表現と同じ固有表現を持つ知識から、先ほど削除したキュレーターの判断と同じキュレーターの判断を除く(S40)。
【0052】
図7の右側の例では、S31で削除した知識ID「4」の知識(事象)2と「固有名詞1」が同じ「c.126C>A」である、知識ID「2」について、同じ「キュレーター1」の判断を除く。
【0053】
次いで、算出部33は、S2と同様に、非特許文献1に記載された手法を用いて判定推定を行う(S41)。図7の右側に示すように、S41の判定推定により得られた推定結果情報23cは、知識ID「2」の知識(事象)2について「キュレーター1」の判断「×」を除外したことから、推定結果が推定結果情報23bと異なるものとなる。
【0054】
具体的には、推定結果情報23cでは、知識ID「2」の知識(事象)2について、正解(○)の確率が「0.3」であり、不正解(×)の確率が「0.7」であることから、判断結果は「×」となる。
【0055】
次いで、出力部34は、推定結果情報23b、23cを比較し、確率差がキュレーターを除く前よりも大きくなっているか否かを判定する(S42)。正解(○)の確率と、不正解(×)の確率との差が大きくなるということは、判定の精度が高まっていることを意味する。よって、キュレーターを除く前よりも大きく(推定結果情報23cの方が大きく)なっている場合(S42:Yes)、出力部34は、推定結果情報23cを出力対象とし、第1の類似知識に関する処理を終了する。
【0056】
キュレーターを除く前よりも大きくなっていない(推定結果情報23bの方が大きい)場合(S42:No)、出力部34は、除いたキュレーターの判断をもとに戻し(S43)、第1の類似知識に関する処理を終了する。
【0057】
図8に示すように、第2の類似知識における処理が開始されると、算出部33は、S31で削除した知識(事象)2の2つ目の固有表現と同じ固有表現を持つ知識から、先ほど削除したキュレーターの判断と同じキュレーターの判断を除く(S50)。
【0058】
図8の右側の例では、S31で削除した知識ID「4」の知識(事象)2と「固有名詞2」が同じ「autism」である、知識ID「3」について、同じ「キュレーター1」の判断を除く。
【0059】
次いで、算出部33は、S2と同様に、非特許文献1に記載された手法を用いて判定推定を行う(S51)。図8の右側に示すように、S51の判定推定により得られた推定結果情報23dは、知識ID「3」の知識(事象)2について「キュレーター1」の判断「×」を除外したことから、推定結果が推定結果情報23bと異なるものとなる。
【0060】
具体的には、推定結果情報23dでは、知識ID「3」の知識(事象)2について、正解(○)の確率が「0.9」であり、不正解(×)の確率が「0.1」であることから、判断結果は「○」となる。
【0061】
次いで、出力部34は、推定結果情報23b、23dを比較し、確率差がキュレーターを除く前よりも大きくなっているか否かを判定する(S52)。正解(○)の確率と、不正解(×)の確率との差が大きくなるということは、判定の精度が高まっていることを意味する。よって、キュレーターを除く前よりも大きく(推定結果情報23dの方が大きく)なっている場合(S52:Yes)、出力部34は、推定結果情報23dを出力対象とし、第2の類似知識に関する処理を終了する。
【0062】
キュレーターを除く前よりも大きくなっていない(推定結果情報23bの方が大きい)場合(S52:No)、出力部34は、除いたキュレーターの判断をもとに戻し(S53)、第2の類似知識に関する処理を終了する。
【0063】
図5に戻り、S23に次いで、算出部33は、出力対象の推定結果情報23において、最も小さな確率差が閾値として設定されたN未満であるか否かを判定する(S24)。N未満でない場合(S24:No)、算出部33は、S21へ処理を戻し、判断の削除の処理を継続する。N未満である場合(S24:Yes)、算出部33は、判断の削除の処理を終了する。
【0064】
図3に戻り、S3に次いで、出力部34は、出力対象の推定結果情報23を読み出し、推定結果の出力を行う(S4)。すなわち、出力部34は、取得部32の判定結果と、算出部33の判定結果のうち、複数の判定値それぞれに対する確率差が大きく、判定の精度が高まっている方の判定結果を出力する。
【0065】
[効果について]
以上のように、情報処理装置1は、取得部32と、算出部33と、出力部34とを有する。取得部32は、所定の事象について判定した複数人の回答結果に基づき、事象に関する判定が複数の判定値のいずれに対応するかを、複数の判定値それぞれに対する確度と対応付けて示す判定結果である第1の判定結果(推定結果情報23a)を取得する(S2)。算出部33は、複数人のうちの所定の条件を満たす人の回答を除外した場合の判定結果である第2の判定結果(推定結果情報23b)を算出する(S3)。出力部34は、第1の判定結果と、第2の判定結果のうち、複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する(S4)。
【0066】
例えばキュレーションにおいて、所定の事象について判定した複数のキュレーターの回答結果の中から所定のキュレーターの回答を除外した場合と、除外しない場合との、複数の判定値それぞれに対する確度の差が大きくなるということは、除外した方が精度が高まるということを意味する。一例として、回答を除外したキュレーターは、その回答した事象において慣れておらず(習熟度が高くない)、知識不足であるものと推測できる。したがって、情報処理装置1は、知識不足と推定されるキュレーターを除外した場合の判定結果を出力することで、キュレーションにおける適正な知識の登録を支援することができる。
【0067】
また、算出部33は、複数人の回答結果に含まれる、複数人それぞれの回答への確信度をもとに、確信度が所定の条件を満たす人の回答を除外する。これにより、情報処理装置1は、例えば確信度が低い人(キュレーター)の回答から除外して知識不足のキュレーターであるか否かを検証していくことができる。
【0068】
また、算出部33は、所定の事象と類似する事象について、第1の判定結果を取得し、所定の事象において回答を除外した人と同じ人の回答を除外した場合の第2の判定結果を算出する。また、出力部34は類似する事象について取得した、第1の判定結果と、第2の判定結果のうち、複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する。
【0069】
このように、情報処理装置1は、所定の事象と類似する事象について、所定の事象で知識不足のキュレーターである可能性が高いことが明らかになったキュレーターの回答を優先的に除外する。これにより、情報処理装置1は、知識の有無について不明なキュレーターが知識不足であることを確認するための計算時間を費やすことなく、キュレーションにおける適正な知識の登録を支援することができる。
【0070】
また、回答結果は、所定の物質または態様と、物質または態様との関連について、複数人の回答および回答に対する各人の確信度である。これにより、情報処理装置1は、例えば、キュレーターの回答結果である、所定の物質または態様と、物質または態様との関連についての知識を、データベースなどに登録するキュレーションに適用できる。
【0071】
[その他]
図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0072】
例えば、入力部31と取得部32、算出部33と出力部34を統合してもよい。また、図示した各処理は、上記の順番に限定されるものでなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
【0073】
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。
【0074】
[ハードウエア構成例について]
ところで、上記の各実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の各実施形態と同様の機能を有する学習プログラムを実行するコンピュータの一例を説明する。図9は、判定処理プログラムを実行するコンピュータの一例を示すブロック図である。
【0075】
図9に示すように、コンピュータ100は、各種演算処理を実行するCPU101と、データ入力を受け付ける入力装置102と、モニタ103とを有する。また、コンピュータ100は、記憶媒体からプログラム等を読み取る媒体読取装置104と、各種装置と接続するためのインタフェース装置105と、他の情報処理装置等と有線または無線により接続するための通信装置106とを有する。また、コンピュータ100は、各種情報を一時記憶するRAM107と、ハードディスク装置108とを有する。また、各装置101~108は、バス109に接続される。
【0076】
ハードディスク装置108には、図1に示した入力部31、取得部32、算出部33および出力部34の各処理部と同様の機能を有する判定処理プログラム108Aが記憶される。また、ハードディスク装置108には、判断結果情報21、設定情報22および推定結果情報23に関する各種データが記憶される。入力装置102は、例えば、コンピュータ100の利用者から操作情報等の各種情報の入力を受け付ける。モニタ103は、例えば、コンピュータ100の利用者に対して表示画面等の各種画面を表示する。インタフェース装置105は、例えば印刷装置等が接続される。通信装置106は、図示しないネットワークと接続され、他の情報処理装置と各種情報をやりとりする。
【0077】
CPU101は、ハードディスク装置108に記憶された判定処理プログラム108Aを読み出して、RAM107に展開して実行することで、各種の処理を行う。また、この判定処理プログラム108Aは、コンピュータ100を入力部31、取得部32、算出部33および出力部34として機能させることができる。
【0078】
なお、上記の判定処理プログラム108Aは、ハードディスク装置108に記憶されていなくてもよい。例えば、コンピュータ100が読み取り可能な記憶媒体に記憶された判定処理プログラム108Aを、コンピュータ100が読み出して実行するようにしてもよい。コンピュータ100が読み取り可能な記憶媒体は、例えば、CD-ROMやDVD(Digital Versatile Disc)、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置に判定処理プログラム108Aを記憶させておき、コンピュータ100がこれらから判定処理プログラム108Aを読み出して実行するようにしてもよい。
【0079】
以上の実施形態に関し、さらに以下の付記を開示する。
【0080】
(付記1)所定の事象について判定した複数人の回答結果に基づき、前記事象に関する判定が複数の判定値のいずれに対応するかを、前記複数の判定値それぞれに対する確度と対応付けて示す判定結果である第1の判定結果を取得し、
前記複数人のうちの所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出し、
前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する、
処理をコンピュータに実行させることを特徴とする判定処理プログラム。
【0081】
(付記2)前記算出する処理は、前記複数人の回答結果に含まれる当該複数人それぞれの回答への確信度をもとに、前記確信度が所定の条件を満たす人の回答を除外する、
ことを特徴とする付記1に記載の判定処理プログラム。
【0082】
(付記3)前記所定の事象と類似する事象について、前記第1の判定結果を取得し、前記所定の事象において回答を除外した人と同じ人の回答を除外した場合の前記第2の判定結果を算出する処理を更にコンピュータに実行させ、
前記出力する処理は、前記類似する事象について取得した、前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する、
ことを特徴とする付記1または2に記載の判定処理プログラム。
【0083】
(付記4)前記回答結果は、所定の物質または態様と、当該物質または態様との関連について、複数人の回答および当該回答に対する各人の確信度である、
ことを特徴とする付記1乃至3のいずれか一に記載の判定処理プログラム。
【0084】
(付記5)所定の事象について判定した複数人の回答結果に基づき、前記事象に関する判定が複数の判定値のいずれに対応するかを、前記複数の判定値それぞれに対する確度と対応付けて示す判定結果である第1の判定結果を取得し、
前記複数人のうちの所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出し、
前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する、
処理をコンピュータが実行することを特徴とする判定処理方法。
【0085】
(付記6)前記算出する処理は、前記複数人の回答結果に含まれる当該複数人それぞれの回答への確信度をもとに、前記確信度が所定の条件を満たす人の回答を除外する、
ことを特徴とする付記5に記載の判定処理方法。
【0086】
(付記7)前記所定の事象と類似する事象について、前記第1の判定結果を取得し、前記所定の事象において回答を除外した人と同じ人の回答を除外した場合の前記第2の判定結果を算出する処理を更にコンピュータが実行し、
前記出力する処理は、前記類似する事象について取得した、前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する、
ことを特徴とする付記5または6に記載の判定処理方法。
【0087】
(付記8)前記回答結果は、所定の物質または態様と、当該物質または態様との関連について、複数人の回答および当該回答に対する各人の確信度である、
ことを特徴とする付記5乃至7のいずれか一に記載の判定処理方法。
【0088】
(付記9)所定の事象について判定した複数人の回答結果に基づき、前記事象に関する判定が複数の判定値のいずれに対応するかを、前記複数の判定値それぞれに対する確度と対応付けて示す判定結果である第1の判定結果を取得する取得部と、
前記複数人のうちの所定の条件を満たす人の回答を除外した場合の前記判定結果である第2の判定結果を算出する算出部と、
前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する出力部と、
を有することを特徴とする情報処理装置。
【0089】
(付記10)前記算出部は、前記複数人の回答結果に含まれる当該複数人それぞれの回答への確信度をもとに、前記確信度が所定の条件を満たす人の回答を除外する、
ことを特徴とする付記9に記載の情報処理装置。
【0090】
(付記11)前記算出部は、前記所定の事象と類似する事象について、前記第1の判定結果を取得し、前記所定の事象において回答を除外した人と同じ人の回答を除外した場合の前記第2の判定結果を算出し、
前記出力部は、前記類似する事象について取得した、前記第1の判定結果と、前記第2の判定結果のうち、前記複数の判定値それぞれに対する確度の間の差が大きい判定結果を出力する、
ことを特徴とする付記9または10に記載の情報処理装置。
【0091】
(付記12)前記回答結果は、所定の物質または態様と、当該物質または態様との関連について、複数人の回答および当該回答に対する各人の確信度である、
ことを特徴とする付記9乃至11のいずれか一に記載の情報処理装置。
【符号の説明】
【0092】
1…情報処理装置
2…知識(事象)
10…通信部
20…記憶部
21…判断結果情報
22…設定情報
23、23a~23d…推定結果情報
30…制御部
31…入力部
32…取得部
33…算出部
34…出力部
100…コンピュータ
101…CPU
102…入力装置
103…モニタ
104…媒体読取装置
105…インタフェース装置
106…通信装置
107…RAM
108…ハードディスク装置
108A…判定処理プログラム
109…バス
図1
図2
図3
図4
図5
図6
図7
図8
図9