【新規性喪失の例外の表示】特許法第30条第2項適用 投稿日 平成27年1月13日 平成27年1月13日に投稿した論文 http://db−event.jpn.org/deim2015/submit.html 投稿日 平成27年1月13日 平成27年4月9日時点におけるDEIM2015 論文投稿に関するページ http://db−event.jpn.org/deim2015/index.html 投稿日 平成27年1月13日 平成27年4月9日時点におけるDEIM2015 トップページ 投稿日 平成27年2月13日 平成27年2月13日に投稿した論文 http://db−event.jpn.org/deim2015/submit.html 投稿日 平成27年2月13日 平成27年4月9日時点におけるDEIM2015 論文投稿に関するページ http://db−event.jpn.org/deim2015/index.html 投稿日 平成27年2月13日 平成27年4月9日時点におけるDEIM2015 トップページ 展示日 平成27年3月3日 平成27年3月3日に展示したポスター http://db−event.jpn.org/deim2015/index.html 展示日 平成27年3月3日 平成27年4月9日時点におけるDEIM2015 トップページ http://db−event.jpn.org/deim2015/presentation.html展示日 平成27年3月3日 平成27年4月9日時点におけるDEIM2015 ポスター発表を説明するページ 開催日 平成27年3月3日 平成27年3月3日に発表した論文 http://db−event.jpn.org/deim2015/index.html 開催日 平成27年3月3日 平成27年4月9日時点におけるDEIM2015 トップページ http://db−event.jpn.org/deim2015/program.html 開催日 平成27年3月3日 平成27年4月9日時点における発表スケジュールを説明するページ
【新規性喪失の例外の表示】特許法第30条第2項適用 開催日 平成27年3月19日 平成27年3月19日の講演内容 https://www.gakkai−web.net/gakkai/ipsj/temporary_program/html/event/A−22.html 開催日 平成27年3月19日 平成27年4月9日時点における情報処理学会の紹介ページ http://research−lab.yahoo.co.jp/topics/20150325_nobushim.html 開催日 平成27年3月19日 平成27年4月9日時点における講演報告のページ
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下に、本願に係る情報提供装置、情報提供方法および情報提供プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報提供装置、情報提供方法および情報提供プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.実施形態〕
〔1−1.実施形態に係る提供処理〕
まず、
図1を用いて、実施形態に係る提供処理の一例について説明する。
図1は、実施形態に係る提供システム1による提供処理の一例を示す説明図である。
図1の例では、仲介業者が管理する情報提供装置100によってリクエスタRe(発注者の一例に相当)がワーカWa〜Wc(受注者の一例に相当)に依頼するタスク(依頼業務の一例に相当)の生成に役立つ情報を提供する提供処理が行われる。
【0011】
図1に示すように、提供システム1には、発注端末10と、受注端末50A〜50Cと、情報提供装置100とが含まれる。発注端末10、受注端末50A〜50C、情報提供装置100は、それぞれネットワークと有線または無線により通信可能に接続される。なお、以下では、受注端末50A〜50Cの各装置を区別なく総称する場合には、「受注端末50」と記載する場合がある。また、以下では、ワーカWa〜Wcを区別なく総称する場合には、「ワーカW」と記載する場合がある。
【0012】
発注端末10および受注端末50は、例えば、PC(Personal Computer)や、タブレット型端末や、スマートフォンや、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置である。情報提供装置100は、発注端末10と受注端末50との間のタスクの委託を仲介するサーバ装置である。
【0013】
リクエスタReは、タスクを作成する。具体的には、リクエスタReは、タスクとして、質問文を作成する。ここで、例えば、リクエスタReが作成した質問文があいまいな表現である場合には、リクエスタReの依頼意図がワーカWに伝わらないという課題がある。この場合、ワーカWは、リクエスタReの意図と異なる解釈をしてタスクの成果物を作成するので、リクエスタReが所望する成果物と異なる成果物を作成してしまう可能性がある。そこで、情報提供装置100は、リクエスタReによって作成されたタスクの質問文の文面を改善するのに役立つ情報をリクエスタReに提供する提供処理を実行する。
【0014】
まず、リクエスタReは、質問文に対する回答を入力させるタスクを作成する。
図2は、タスクの一例を示す図である。
図2の例では、タスクT1の質問文Q1は、「これはコーヒーですか?」である。また、
図2の例では、タスクT1の質問文Q1に関する対象物は、コーヒーが描出された画像P1である。また、タスクT1には、
図2に示すように、質問文Q1に対する回答が入力される回答入力欄AF1が設けられる。
図2の例では、回答入力欄AF1には、「はい」、「いいえ」もしくは「わからない」が入力される。
【0015】
そして、リクエスタReは、発注端末10を操作して、生成したタスクT1を情報提供装置100に送信する(ステップS1)。これにより、情報提供装置100は、リクエスタReによって生成されたタスクT1を発注端末10から受信する。そして、情報提供装置100は、受信したタスクT1を記憶する。
【0016】
続いて、情報提供装置100は、質問文Q1に対する回答の判断理由を問う欄をタスクT1に追加した判断理由付きタスクT11を生成する。
図3は、判断理由付きタスクの一例を示す図である。
図3に示すように、判断理由付きタスクT11には、質問文Q1に対する回答の判断理由が入力される判断理由入力欄ReF1〜ReF2が設けられる。判断理由入力欄ReF1には、質問文Q1に対する回答が「はい」である場合に、回答を「はい」にした理由が入力される。一方、判断理由入力欄ReF2には、質問文Q1に対する回答が「いいえ」である場合に、回答を「いいえ」にした理由が入力される。なお、回答が「わからない」場合には、判断理由入力欄ReF1及び判断理由入力欄ReF2の両方に判断理由が入力される。例えば、判断理由入力欄ReF1には、回答が「はい」になり得る理由が入力される。一方、判断理由入力欄ReF2には、回答が「いいえ」になり得る理由が入力される。
【0017】
そして、情報提供装置100は、判断理由付きタスクT11をワーカWa〜Wcに提示する(ステップS2)。例えば、情報提供装置100は、クラウドソーシングの受注者として登録されているワーカWa〜Wcの受注端末50A〜50Cに判断理由付きタスクT11を送信する。これにより、受注端末50A〜50Cは、情報提供装置100から判断理由付きタスクT11を受信する。
【0018】
続いて、ワーカWa〜Wcは、受注端末50A〜50Cを操作して、タスクT11の質問文Q1に対する回答を回答入力欄AF1に入力する。また、ワーカWa〜Wcは、回答入力欄AF1に入力した回答の判断理由を判断理由入力欄ReF1〜ReF2に入力する。そして、受注端末50A〜50Cは、ワーカWa〜Wcによって回答入力欄AF1に入力された回答と、判断理由入力欄ReF1〜ReF2に入力された判断理由とを情報提供装置100に送信する。これにより、情報提供装置100は、質問文Q1に対する回答と回答の判断理由とをワーカWa〜Wcから受け付ける(ステップS3)。
【0019】
そして、情報提供装置100は、受け付けられた判断理由を類型に分類する(ステップS4)。具体的には、情報提供装置100は、判断理由と回答とに基づいた類型に受け付けられた判断理由を分類する。例えば、情報提供装置100は、判断理由及び回答の肯定表現と否定表現に基づいて、PP型、NP型、PNP型、PN型、NN型、PNN型の6つの類型に判断理由を分類する。このような類型に関して以下に詳細に説明する。
【0020】
まず、判断理由について説明する。判断理由は、例えば、「理由」と「帰結」とによって形成される場合がある。一例としては、「商品にコーヒーと書いてあるのでコーヒーである」という判断理由の場合、「商品にコーヒーと書いてある」は、理由に該当する。一方、「コーヒーである」は、帰結に該当する。すなわち、判断理由が「理由」と「帰結」によって形成されている場合、「理由」が判断理由に相当し、「帰結」が回答に相当する。また、「商品にコーヒーと書いてあるのでコーヒーである」という判断理由は、「商品にコーヒーと書いてあるか否か」が判断基準となる。なお、判断基準は、「理由」と「帰結」が同一である場合には、自明な判断基準となる。例えば、「コーヒーだからコーヒー」のような判断理由は、自明な判断基準となる。
【0021】
次に、各種の類型について説明する。PP(Positive Positive)型は、理由及び帰結が肯定表現となっている判断理由の型である。例えば、「商品にコーヒーと書いてあるのでコーヒーである。」という判断理由の場合、理由は、「商品にコーヒーと書いてある」という肯定表現である。また、帰結は、「コーヒーである」という肯定表現である。したがって、「商品にコーヒーと書いてあるのでコーヒーである。」という判断理由は、理由及び帰結がともに肯定表現なので、PP型に分類される。
【0022】
NP(Negative Positive)型は、理由が否定表現で帰結が肯定表現となっている判断理由の型である。例えば、「コーヒーでない証拠がないのでコーヒーである。」という判断理由の場合、理由は、「コーヒーでない証拠がない」という否定表現である。また、帰結は、「コーヒーである」という肯定表現である。したがって、「コーヒーでない証拠がないのでコーヒーである。」という判断理由は、理由が否定表現で帰結が肯定表現なので、NP型に分類される。
【0023】
PNP(Positive Negative Positive)型は、2つの理由が記載されており、肯定表現の理由と、否定表現の理由と、肯定表現の帰結とによって形成されている判断理由の型である。例えば、「商品にコーヒーと書いており、コーヒーでない証拠がないのでコーヒーである。」という判断理由の場合、一方の理由は「商品にコーヒーと書いてある」という肯定表現であり、他方の理由は「コーヒーでない証拠がない」という否定表現である。また、帰結は、「コーヒーである」という肯定表現である。したがって、「商品にコーヒーと書いており、コーヒーでない証拠がないのでコーヒーである。」という判断理由は、肯定表現の理由と、否定表現の理由と、肯定表現の帰結とによって形成されているので、PNP型に分類される。
【0024】
PN(Positive Negative)型は、理由が肯定表現で帰結が否定表現となっている判断理由の型である。例えば、「カレーなのでコーヒーではない。」という判断理由の場合、理由は、「カレーである」という肯定表現である。また、帰結は、「コーヒーではない」という否定表現である。したがって、「カレーなのでコーヒーではない。」という判断理由は、理由が肯定表現で帰結が否定表現なので、PN型に分類される。
【0025】
NN(Negative Negative)型は、理由及び帰結が否定表現となっている判断理由の型である。例えば、「コーヒー豆が入ってないのでコーヒーではない。」という判断理由の場合、理由は、「コーヒー豆が入ってない」という否定表現である。また、帰結は、「コーヒーではない」という否定表現である。したがって、「コーヒー豆が入ってないのでコーヒーではない。」という判断理由は、理由及び帰結が否定表現なので、NN型に分類される。
【0026】
PNN(Positive Negative Negative)型は、2つの理由が記載されており、肯定表現の理由と、否定表現の理由と、否定表現の帰結とによって形成されている判断理由の型である。例えば、「黒い液体でなく、透明な液体であるので、コーヒーではない。」という判断理由の場合、一方の理由は「黒い液体でなく」という否定表現であり、他方の理由は「透明な液体である」という肯定表現である。また、帰結は、「コーヒーではない」という否定表現である。したがって、「黒い液体でなく、透明な液体であるので、コーヒーではない。」という判断理由は、肯定表現の理由と、否定表現の理由と、否定表現の帰結とによって形成されているので、PNN型に分類される。
【0027】
なお、理由の文章が不適切な文章である判断理由は、wrong型に分類される。例えば、回答入力欄AF1に入力された回答が「はい」にも関わらず「いいえ」の判断理由入力欄ReF2に記載されている判断理由は、wrong型に分類される。他の例では、質問文Q1に対する回答と全く異なる判断理由は、wrong型に分類される。例えば、「これはコーヒーですか?」という質問文に対して「いいえ」と回答したにも関わらず、「食品の味を変えるものは調味料なので、はい、になり得る。」という判断理由は、wrong型に分類される。また、他の例では、単なる感想や質問文などといった理由ではない文章は、wrong型に分類される。例えば、「ない」や「これはカレーですか?」といった判断理由は、wrong型に分類される。
【0028】
続いて、情報提供装置100は、分類された類型に基づいて、所定の類型に属する判断理由を抽出する(ステップS5)。例えば、情報提供装置100は、PN型及びNP型以外の類型に属する判断理由を抽出する。すなわち、情報提供装置100は、PP型、NN型、PNP型、PNN型に属する判断理由を抽出する。肯定的な表現で判断基準が記載されている判断理由の方が、相対的に有益な判断基準が記載されている場合が多いので、有益な判断理由であると考えられるからである。なお、NN型は、対偶がPP型となるので、NN型に属する判断理由も有益な判断理由であると考えられる。これにより、情報提供装置100は、ワーカWa〜Wcから受け付けた判断理由のうち有益な判断理由を抽出することができる。
【0029】
先の例では、情報提供装置100は、有益な判断理由として、PP型の判断理由「商品にコーヒーと書いてあるのでコーヒーである。」と、NN型の判断理由「コーヒー豆が入ってないのでコーヒーではない。」と、PNP型の判断理由「商品にコーヒーと書いており、コーヒーでない証拠がないのでコーヒーである。」と、PNN型の判断理由「黒い液体でなく、透明な液体であるので、コーヒーではない。」とを抽出する。一方、情報提供装置100は、NP型の判断理由「コーヒーでない証拠がないのでコーヒーである。」と、PN型の判断理由「カレーなのでコーヒーではない。」とは抽出しない。例えば、コーヒーであるか否かを判定するのに「カレーであるか否か」という判断基準は、コーヒーでない物が多数存在するので、適切ではないと考えられるからである。
【0030】
続いて、情報提供装置100は、抽出された判断理由をクラスタに分類する(ステップS6)。具体的には、情報提供装置100は、抽出された判断理由を、かかる判断理由と判断基準が共通するクラスタに分類する。例えば、情報提供装置100は、抽出された判断理由の数が所定値より多い場合に、抽出された判断理由を階層型クラスタリング手法によって他の判断理由と判断基準が共通するクラスタに分類する。
【0031】
その後、情報提供装置100は、少ない数の判断理由で多様な判断基準をカバーできるように有益な判断理由を抽出する。具体的には、情報提供装置100は、分類された各クラスタの中から代表的な判断理由を抽出する(ステップS7)。例えば、情報提供装置100は、距離関数に基づいて各クラスタの中から代表的な判断理由を抽出する。
【0032】
そして、情報提供装置100は、抽出された判断理由をリクエスタに提供する(ステップS8)。これにより、情報提供装置100は、ワーカWa〜Wcから受け付けた判断理由のうち厳選された有益な判断理由をリクエスタReに提供することができる。
【0033】
このように、実施形態に係る情報提供装置100は、依頼業務に対する回答と回答の判断理由とをワーカから受け付ける。また、情報提供装置100は、判断理由と回答とに基づいた類型に受け付けられた判断理由を分類する。また、情報提供装置100は、分類された類型に基づいて、所定の類型に属する判断理由を抽出する。また、情報提供装置100は、抽出された判断理由をリクエスタに提供する。
【0034】
また、実施形態に係る情報提供装置100は、抽出された判断理由を、かかる判断理由と判断基準が共通するクラスタに分類する。また、情報提供装置100は、分類されたクラスタの中から代表的な判断理由を抽出する。また、情報提供装置100は、抽出された判断理由を提供する。
【0035】
これにより、情報提供装置100は、タスクの文面を改善するのに役立つ情報を提供することができるので、適切なタスクの生成を支援することができる。例えば、情報提供装置100は、タスクの質問文に対する回答の判断理由のうち有益な判断基準に基づいた判断理由を抽出してリクエスタに提供することができるので、誤解を生みにくい質問文の作成を支援することができる。このため、情報提供装置100は、質の高いタスクをリクエスタに生成させることができるとともに、リクエスタが質問の記述を考える手間を減らすことができる。
【0036】
また、情報提供装置100は、ワーカから受け付けた判断理由の中から適切な判断基準に基づく判断理由を抽出することができるので、質問文の改善に有益な判断理由をリクエスタに提供することができる。例えば、情報提供装置100は、クラウドソーシングによってワーカから多数の多様な判断理由を収集した場合でも、質問文の改善に有益な判断理由を厳選してリクエスタに提供することができる。
【0037】
また、情報提供装置100は、タスクの質問文に対する回答の判断理由の中から多様な判断基準をカバーした少ない数の判断理由を抽出することができるので、質問文の改善に有益な判断理由を厳選してリクエスタに提供することができる。このため、情報提供装置100は、リクエスタにとって扱いやすい数の判断理由を参考に質問文を改善させることができるので、リクエスタが質問の記述を考える手間を減らすことができる。
【0038】
また、情報提供装置100は、タスクの質を高めることができるので、ワーカにとって魅力的な業務委託形態を提供することができる。例えば、情報提供装置100は、リクエスタの依頼意図が高い精度で記述された質問文の生成を支援することができるので、ワーカがリクエスタの意図と異なる解釈をして成果物を作成してしまい納品を拒絶されてしまうことを防ぐことができる。また、情報提供装置100は、タスクの質問文の記述があいまいなことが原因で質の高いワーカがリクエスタの所望しない成果物を作成してしまいスパマーとして疑われる事態を防ぐことができる。
【0039】
なお、
図1では、提供システム1に、1台の発注端末10と、3台の受注端末50A〜50Cと、1台の情報提供装置100とが含まれる例を示したが、提供システム1には、複数台の発注端末10や、3台に限らず複数台の受注端末50A〜50Cや、複数台の情報提供装置100が含まれてもよい。
【0040】
また、
図1では、説明を簡単にするため3人のワーカWa〜Wcから質問を受け付ける例を示したが、実際には3人のワーカWa〜Wcに限らず、有益な判断理由を抽出するのに十分な人数のワーカから判断理由を受け付ける。
【0041】
〔1−2.実施形態に係る情報提供装置の構成〕
次に、
図4を用いて、実施形態に係る情報提供装置100の構成について説明する。
図4は、実施形態に係る情報提供装置100の構成例を示す図である。
図4に示すように、情報提供装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報提供装置100は、情報提供装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0042】
(通信部110について)
通信部110は、例えば、NIC等によって実現される。通信部110は、ネットワークと有線または無線で接続され、ネットワークを介して、発注端末10や受注端末50との間で情報の送受信を行う。
【0043】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、タスク情報記憶部121と、判断理由情報記憶部122とを有する。
【0044】
(タスク情報記憶部121について)
タスク情報記憶部121は、タスクに関する情報を記憶する。具体的には、タスク情報記憶部121は、タスク毎に、タスクの質問文や対象物に関する情報を記憶する。ここで、
図5に、実施形態に係るタスク情報記憶部121の一例を示す。
図5に示すように、タスク情報記憶部121は、「タスクID」、「質問文」および「対象物」といった項目を有する。
【0045】
「タスクID」は、タスクを識別するための識別情報を示す。「質問文」は、タスクの質問文を示す。例えば、「質問文」には、リクエスタによって作成された質問文の記述が記憶される。「対象物」は、タスクの質問文に関する対象物を示す。例えば、「対象物」には、タスクの質問文の対象が描出された画像が記憶される。
【0046】
すなわち、
図5では、タスクID「T1」によって識別されるタスクT1の質問文は、「これはコーヒーですか?」である例を示している。また、タスクT1の対象物は、画像P1である例を示している。
【0047】
(判断理由情報記憶部122について)
判断理由情報記憶部122は、タスクの質問文に対する回答を判断した理由である判断理由に関する情報を記憶する。具体的には、判断理由情報記憶部122は、タスク毎に、タスクの質問文に対する回答と、回答の判断理由とを記憶する。ここで、
図6に、実施形態に係る判断理由情報記憶部122の一例を示す。
図6に示すように、判断理由情報記憶部122は、「タスクID」、「理由ID」、「回答」、「判断理由」、「類型」および「クラスタ」といった項目を有する。
【0048】
「タスクID」は、タスクを識別するための識別情報を示す。「理由ID」は、判断理由を識別するための識別情報を示す。「回答」は、タスクの質問文に対する回答を示す。具体的には、「回答」には、ワーカによってタスクの回答入力欄に入力された回答が記憶される。例えば、「回答」には、ワーカによって入力された「はい」、「いいえ」、「わからない」といった回答が記憶される。「判断理由」は、タスクの質問文に対する回答を判断した理由を示す。具体的には、「判断理由」には、ワーカによってタスクの判断理由入力欄に入力された理由が記憶される。例えば、「判断理由」には、回答が「はい」の場合には、「はい」と判断した理由が記憶される。一方、回答が「いいえ」の場合には、「判断理由」には、「いいえ」と判断した理由が記憶される。また、回答が「わからない」の場合には、「判断理由」には、回答が「はい」になり得る理由と、回答が「いいえ」になり得る理由とが記憶される。「類型」は、判断理由が属する所定の類型の型を示す。具体的には、「類型」には、判断理由と回答とに基づいた類型が記憶される。例えば、「類型」には、PP型、NP型、PNP型、PN型、NN型、PNN型といった6つの類型のうち判断理由が属する型が記憶される。なお、「類型」には、判断理由が不適切である場合などには、wrong型が記憶される。「クラスタ」には、判断理由が属するクラスタが記憶される。例えば、「クラスタ」には、他の判断理由と判断基準が共通するクラスタが記憶される。
【0049】
すなわち、
図6では、タスクID「T1」によって識別されるタスクT1の質問文に対する理由ID「Re11」の回答は、「はい」である例を示している。また、理由ID「Re11」の回答「はい」の判断理由は、「商品にコーヒーと書いてあるのでコーヒーである」である例を示している。また、理由ID「Re11」の判断理由は、類型「PP型」に属する例を示している。また、理由ID「Re11」の判断理由は、「クラスタA」に分類される例を示している。
【0050】
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報提供装置100内部の記憶装置に記憶されている各種プログラム(情報提供プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0051】
制御部130は、
図4に示すように、受信部131と、送信部132と、受付部133と、類型分類部134と、類型抽出部135と、クラスタ分類部136と、クラスタ抽出部137と、提供部138とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図4に示した構成に限られず、後述する提供処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、
図4に示した接続関係に限られず、他の接続関係であってもよい。
【0052】
(受信部131について)
受信部131は、発注端末10からタスクに関する情報を受信する。具体的には、受信部131は、タスクの質問文や質問文に関連する対象物などを発注端末10から受信する。ここで、タスクの質問文は、例えば、リクエスタによって作成される。また、タスクの質問文に関連する対象物は、例えば、質問文に関連する画像である。一例としては、受信部131は、「これはコーヒーですか?」という質問文と、質問文に関連する対象物であるコーヒーが描出された画像とを発注端末10から受信する。また、受信部131は、発注端末10からタスクに関する情報を受信した場合に、受信したタスクに関する情報をタスク情報記憶部121に格納する。例えば、受信部131は、タスクを識別するタスクIDを付与し、質問文と対象物とをタスクIDに対応付けてタスク情報記憶部121に格納する。
【0053】
(送信部132について)
送信部132は、タスクに関する情報を受注者に送信する。具体的には、送信部132は、まず、受信部131によって受信されたタスクに、質問文に対する回答の判断理由を問う欄を追加して判断理由付きタスクを生成する。例えば、送信部132は、判断理由付きタスクとして、リクエスタによって作成されたタスクに、回答を「はい」にした理由が入力される判断理由入力欄と回答を「いいえ」にした理由が入力される判断理由入力欄とを追加したタスクを生成する。そして、送信部132は、生成した判断理由付きタスクをワーカに送信する。例えば、送信部132は、クラウドソーシングの受注者として登録されているワーカに判断理由付きタスクを送信する。
【0054】
(受付部133について)
受付部133は、受注端末50から納品物を受け付ける。具体的には、受付部133は、依頼業務に対する回答と回答の判断理由とをワーカから受け付ける。例えば、受付部133は、送信部132によって送信された判断理由付きタスクの回答入力欄に入力された回答と、判断理由入力欄に入力された回答の判断理由とを受け付ける。
【0055】
(類型分類部134について)
類型分類部134は、判断理由と回答とに基づいた類型に受付部133によって受け付けられた判断理由を分類する。そして、類型分類部134は、判断理由情報記憶部122の「類型」項目のうち判断理由に対応する「類型」項目に分類した類型を格納する。例えば、類型分類部134は、判断理由及び回答の肯定表現と否定表現に基づいて、PP型、NP型、PNP型、PN型、NN型、PNN型の6つの類型に判断理由を分類する。この点について、
図7を用いて説明する。
【0056】
図7は、判断理由が属する分類について説明するための説明図である。
図7に示す例1の質問文「これはお茶ですか?」に対する回答「はい」の判断理由は、「粉末緑茶と書いてある。故にこれはお茶である。」である。この判断理由は、「粉末緑茶と書いてある」が理由に該当し、「お茶」が帰結に該当するので、PP型に属する。例2の質問文「これは炭酸飲料ですか?」に対する回答「はい」の判断理由は、「サイダーと記載してあるため」である。この判断理由は、「サイダーと記載してある」が理由に該当し、回答の「はい」(=炭酸飲料である)が帰結に該当するので、PP型に属する。
【0057】
例3の質問文「これはインスタント食品ですか?」に対する回答「はい」の判断理由は、「茶葉をポットに入れて作る、といった本格的な作り方の食品ではないので、はい、となりうる。」である。この判断理由は、「茶葉をポットに入れて作る、といった本格的な作り方の食品ではない」が理由に該当し、回答の「はい」(=インスタント食品である)が帰結に該当するので、NP型に属する。
【0058】
例4の質問文「これはコーヒーですか?」に対する回答「いいえ」の判断理由は、「ドレッシングはコーヒーでないので」である。この判断理由は、一見NN型に見えるが、NN型ではない。この判断理由は、「ドレッシングである」が理由に該当し、「コーヒーでない」が帰結に該当するので、PN型に属する。例5の質問文「これは紅茶ですか?」に対する回答「いいえ」の判断理由は、「コーヒー」である。この判断理由は、「コーヒーである」が理由に該当し、「紅茶ではない」が帰結に該当するので、PN型に属する。
【0059】
例6の質問文「これは緑茶ですか?」に対する回答「いいえ」の判断理由は、「ミルクティーに緑茶の成分は入っていないから。」である。この判断理由は、「ミルクティーに緑茶の成分は入っていない」が理由に該当し、回答の「いいえ」(=緑茶ではない)が帰結に該当するので、NN型に属する。例7の質問文「これは調味料ですか?」に対する回答「いいえ」の判断理由は、「調味料は、料理に味をつけるもの。」である。この判断理由は、否定表現はないがNN型となる。この例の場合、質問文が「これは調味料ですか?」であるため、帰結は、回答の「いいえ」(=調味料ではない)である。また、理由の「調味料は、料理に味をつけるもの。」を論理式で表現すると、「調味料」→「料理に味をつけるもの」となる。この対偶は、「料理に味をつけるもの」→「調味料」となるため、「料理に味をつけるもの」を判断基準とすれば、NN型となる。このように、質問文の「これはtargetですか?」のtargetに関する必要条件が理由の文章に入っている場合は、NN型とする。
【0060】
例8の質問文「これはコーヒーですか?」に対する回答「いいえ」の判断理由は、「これはハーブ茶であり、コーヒーは原料に含まれないので、コーヒーではない。」である。この判断理由には、「これはハーブ茶であり」、「コーヒーは原料に含まれない」、「コーヒーではない」と3つの事実が含まれている。このため、「これはハーブ茶であり」が1つ目の理由、「コーヒーは原料に含まれない」が2つ目の理由、「コーヒーではない」が帰結となる。ここで、1つ目の理由は肯定表現であり、2つ目の理由および帰結は否定表現であるので、PNN型となる。例9の質問文「これはインスタント食品ですか?」に対する回答「いいえ」の判断理由は、「インスタント食品とは手軽に簡単に利用できるものだがこれは豆を煎ってから使用するものなので、いいえ、になりうる。」である。この判断理由は、「インスタント食品とは手軽に簡単に利用できるもの」と、「これは豆を煎ってから使用するものなので、いいえ、になりうる。」との2つ文章に大まかに分けることができる。前者の文章は、例7の場合と同様であるので、NN型である。後者の文章は、典型的なPN型である。判断理由の文章は、これらの2つの文章を合わせたものであるので、PNN型となる。このように、理由の文章が複数に分けられる場合、分けた後の文章の型を判断し、それらを合わせたものを理由の型とする。
【0061】
ここで、類型分類部134は、機械学習を用いた文書分類手法によって判断理由を類型に分類する。例えば、類型分類部134は、機械学習を用いた文書分類手法として、BoW(Bag of Words)を用いて判断理由を分類することが考えられる。しかし、BoWを用いた分類手法は、判断理由が相対的に長い部分文字列情報である場合には、単語ベースのBoW表現では利用できず、どのような単位で素性を定義すべきか自明ではない。そこで、類型分類部134は、素性の取りこぼしを防ぐため、全ての部分文字列を素性として明示的に利用する線形識別モデルを考え、極大部分文字列を用いた分類手法によって判断理由を分類する。
【0062】
具体的には、類型分類部134は、判断理由に含まれる同値関係を持つ部分文字列のうち長さが最大の極大部分文字列に基づいて判断理由を類型に分類する。ここで、同値関係を持つ部分文字列について説明する。例えば、判断理由の文書集合d
1、d
2、・・・d
nがあったとき、文書内に存在しない特殊記号$を文書間に入れて繋ぎTとする。そして、T中の部分文字列qの出現回数をocc(q)と定義する。また、T中の部分文字列qの出現場所をP(q)=p
1、p
2、・・・p
occ(q)]と定義する。さらに、P(q)−c=[p
1−c、p
2−c、・・・p
occ(q)−c]と定義する。ここで、α、βが空文字を含む部分文字列であるとき、2つの部分文字列q
1、q
2が、q
1=αq
2βであり、かつ、P(q
1)−|α|=P(q
2)を満たすとき、q
1とq
2は、同値関係を持つと定義する。このような同値関係を持つ部分文字列qのうち、最大の長さ|q|を持つものが極大部分文字列となる。そして、類型分類部134は、例えば、極大部分文字列を素性として用いて判断理由を分類する。これにより、類型分類部134は、判断理由を類型により高い精度で分類する。
【0063】
(類型抽出部135について)
類型抽出部135は、ワーカから受け付けた判断理由のうち有益な判断理由を抽出する。具体的には、類型抽出部135は、類型分類部134によって分類された類型に基づいて、所定の類型に属する判断理由を抽出する。例えば、類型分類部135は、所定の類型として、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する判断理由を抽出する。すなわち、類型分類部135は、PN型およびNP型以外の類型であるPP型、NN型、PNP型、PNN型に属する判断理由を抽出する。PP型、NN型、PNP型またはPNN型に属する判断理由は、肯定的な表現で判断基準が記載されているので、相対的に有益な判断基準が記載されている場合が多く、有益な判断理由であると考えられるからである。一方、NP型またはPN型に属する判断理由は、相対的に有益な判断基準が記載されている場合が少ないので抽出対象としない。一例としては、類型抽出部135は、判断理由情報記憶部122に記憶された「類型」を参照し、PP型、NN型、PNP型、PNN型に属する判断理由を抽出する。
【0064】
(クラスタ分類部136について)
クラスタ分類部136は、類型抽出部135によって抽出された判断理由を、かかる判断理由と判断基準が共通するクラスタに分類する。例えば、クラスタ分類部136は、類型抽出部135によって抽出された判断理由の数が所定値より多い場合に、判断理由をクラスタに分類する。
【0065】
一態様としては、クラスタ分類部136は、類型抽出部135によって抽出された判断理由の一般化が困難または不適切な場合に、階層型クラスタリング手法を反復することで、他の判断理由と判断基準が共通するクラスタに判断理由を分類する。すなわち、同じクラスタには、同じ判断基準に基づく判断理由が分類される。
図6の例では、クラスタ分類部136は、理由ID「Re11」の判断理由「商品にコーヒーと書いてあるのでコーヒーである。」の判断基準と、理由ID「Re13」の判断理由「商品にコーヒーと書いており、コーヒーでない証拠がないのでコーヒーである。」の判断基準とが「商品にコーヒーと書いてある」で共通するので、「クラスタA」に分類する。
【0066】
例えば、クラスタ分類部136は、階層型クラスタリング手法として、凝縮型クラスタリングによって判断理由を分類する。一例としては、クラスタ分類部136は、類型抽出部135によって抽出された各判断理由からそれぞれクラスタを生成し、クラスタ間の距離関数の結果が最も小さい二つのクラスタを順に併合することで、判断理由をクラスタに分類する。
【0067】
他の例では、クラスタ分類部136は、階層型クラスタリング手法として、分枝型クラスタリングによって判断理由を分類する。一例としては、クラスタ分類部136は、類型抽出部135によって抽出された判断理由から一つのクラスタを生成し、生成したクラスタをクラスタ間の距離関数に基づいて順次分割することで、判断理由をクラスタに分類する。
【0068】
ここで、クラスタ分類部136は、距離関数として、例えばtf−idfやコサイン類似度を用いて、凝縮型クラスタリングまたは分枝型クラスタリングを実行する。一例としては、クラスタ分類部136は、トップk件だけで算出したコサイン類似度を用いてクラスタリングを行う。なお、「k」には、実験等によって得られた、クラスタの理由のまとまりが良い値が採用される。
【0069】
(クラスタ抽出部137について)
クラスタ抽出部137は、類型抽出部135によって抽出された判断理由のうち有益な判断理由を抽出する。具体的には、クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する。例えば、クラスタ抽出部137は、代表的な判断理由を、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する確率に基づいて抽出する。すなわち、クラスタ抽出部137は、判断理由がPN型およびNP型以外の類型であるPP型、NN型、PNP型、PNN型に属する確率に基づいて抽出する。一例としては、クラスタ抽出部137は、PP型、NN型、PNP型、PNN型に属する確率が最も高い判断理由を抽出する。これにより、クラスタ抽出部137は、ランダムに判断理由を抽出する場合と比較して、有益な判断理由をより高い精度で抽出することができる。
【0070】
(提供部138について)
提供部138は、リクエスタによって作成されたタスクの質問文の文面を改善するのに役立つ情報を提供する。具体的には、提供部138は、クラスタ抽出部137によって抽出された判断理由をタスクの発注者であるリクエスタに提供する。例えば、提供部138は、類型抽出部135によって抽出された判断理由の数が所定値より多い場合には、クラスタ抽出部137によって抽出された判断理由を提供し、類型抽出部135によって抽出された判断理由の数が所定値より少ない場合には、類型抽出部135によって抽出された判断理由を提供する。一例としては、提供部138は、PP型、NN型、PNP型、PNN型に属する確率が高い順に並べた判断理由のリストをリクエスタに提供する。
【0071】
ここで、
図8を用いて、受付処理、類型分類処理、クラスタ分類処理の全体の流れについて説明する。
図8は、情報提供装置100による処理の流れを説明するための説明図である。
図8に示すように、情報提供装置100は、まず、ステップ1として、判断理由の入力が行われる。具体的には、情報提供装置100は、依頼業務に対する回答と回答の判断理由とをワーカから受け付ける。
【0072】
次に、情報提供装置100は、ステップ2として、適切な判断理由の抽出を行う。具体的には、情報提供装置100は、まず、判断理由と回答とに基づいた類型に、受け付けられた判断理由を分類する。続いて、情報提供装置100は、分類された類型に基づいて、所定の類型に属する判断理由を抽出する。
【0073】
最後に、情報提供装置100は、ステップ3として、判断理由の列挙を行う。具体的には、情報提供装置100は、まず、抽出された判断理由をクラスタに分類する。続いて、情報提供装置100は、分類されたクラスタの中から代表的な判断理由を抽出する。そして、情報提供装置100は、抽出された判断理由を列挙してリクエスタに提供する。
【0074】
〔1−3.実施形態に係る提供処理手順〕
次に、
図9を用いて、実施形態に係る提供システム1による処理の手順について説明する。
図9は、実施形態に係る提供システム1による提供処理手順を示すシーケンスである。
【0075】
図9に示すように、発注端末10は、タスクを情報提供装置100に送信する(ステップS101)。例えば、発注端末10は、質問文と質問文に関連する画像とを情報提供装置100に送信する。これにより、情報提供装置100は、タスクを発注端末10から受信する。そして、情報提供装置100は、受信したタスクの質問文と画像とを対応付けてタスク情報記憶部121に記憶する。
【0076】
続いて、情報提供装置100は、判断理由付きタスクを提示する(ステップS102)。例えば、情報提供装置100は、発注端末10から受信したタスクに回答の判断理由入力欄を追加した判断理由付きタスクを受注端末50Aや受注端末50B(以下、受注端末50)に送信する。
【0077】
その後、情報提供装置100は、タスクの質問文に対する回答と回答の判断理由とを受注端末50から受け付ける(ステップS103)。例えば、ワーカは、受注端末50を操作して、回答入力欄に回答を入力し、判断理由入力欄に判断理由を入力する。そして、受注端末50は、ワーカによって回答入力欄に入力された回答と、判断理由入力欄に入力された判断理由とを情報提供装置100に送信する。これにより、情報提供装置100は、リクエスタによって回答入力欄に入力された回答と、判断理由入力欄に入力された判断理由とを受注端末50から受け付ける。
【0078】
そして、情報提供装置100は、判断理由を類型に分類する(ステップS104)。例えば、情報提供装置100は、判断理由と回答とに基づいた類型に、受け付けられた判断理由を分類する。
【0079】
続いて、情報提供装置100は、分類された類型に基づいて、所定の類型に属する判断理由を抽出する(ステップS105)。例えば、情報提供装置100は、所定の類型として、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する判断理由を抽出する。
【0080】
その後、情報提供装置100は、抽出された判断理由をクラスタに分類する(ステップS106)。例えば、情報提供装置100は、抽出された判断理由を、階層型クラスタリング手法によって他の判断理由と判断基準が共通するクラスタに分類する。
【0081】
続いて、情報提供装置100は、分類された各クラスタの中から代表的な判断理由を抽出する(ステップS107)。例えば、情報提供装置100は、代表的な判断理由を、判断理由がPN型およびNP型以外の類型であるPP型、NN型、PNP型、PNN型に属する確率に基づいて抽出する。
【0082】
そして、情報提供装置100は、抽出された判断理由を列挙してリクエスタに提供する
(ステップS108)。例えば、情報提供装置100は、類型抽出部135によって抽出された判断理由の数が所定値より多い場合には、クラスタ抽出部137によって抽出された判断理由を提供し、類型抽出部135によって抽出された判断理由の数が所定値より少ない場合には、類型抽出部135によって抽出された判断理由を提供する。
【0083】
〔1−4.実施形態の効果〕
上述してきたように、実施形態に係る情報提供装置100は、受付部133と、類型分類部134と、類型抽出部135と、提供部138とを有する。受付部133は、依頼業務に対する回答と回答の判断理由とを受注者から受け付ける。類型分類部134は、判断理由と回答とに基づいた類型に受付部133によって受け付けられた判断理由を分類する。類型抽出部135は、類型分類部134によって分類された類型に基づいて、所定の類型に属する判断理由を抽出する。提供部138は、類型抽出部135によって抽出された判断理由を提供する。
【0084】
また、実施形態に係る情報提供装置100において、類型抽出部135は、所定の類型として、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する判断理由を抽出する。
【0085】
また、実施形態に係る情報提供装置100において、類型分類部134は、機械学習を用いた文書分類手法によって判断理由を類型に分類する。
【0086】
また、実施形態に係る情報提供装置100において、類型分類部134は、判断理由に含まれる同値関係を持つ部分文字列のうち長さが最大の極大部分文字列に基づいて判断理由を類型に分類する。
【0087】
また、実施形態に係る情報提供装置100は、クラスタ分類部136とクラスタ抽出部137とをさらに有する。クラスタ分類部136は、類型抽出部135によって抽出された判断理由を、かかる判断理由と判断基準が共通するクラスタに分類する。クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する。提供部138は、クラスタ抽出部137によって抽出された判断理由を提供する。
【0088】
また、実施形態に係る情報提供装置100において、クラスタ分類部136は、類型抽出部135によって抽出された判断理由の数が所定値より多い場合に、判断理由をクラスタに分類する。クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する。提供部138は、類型抽出部135によって抽出された判断理由の数が所定値より多い場合には、クラスタ抽出部137によって抽出された判断理由を提供し、類型抽出部135によって抽出された判断理由の数が所定値より少ない場合には、類型抽出部135によって抽出された判断理由を提供する。
【0089】
また、実施形態に係る情報提供装置100において、クラスタ分類部136は、類型抽出部135によって抽出された各判断理由からそれぞれクラスタを生成し、クラスタ間の距離関数の結果が最も小さい二つのクラスタを順に併合することで、判断理由をクラスタに分類する。
【0090】
また、実施形態に係る情報提供装置100において、クラスタ分類部136は、類型抽出部135によって抽出された判断理由から一つのクラスタを生成し、生成したクラスタをクラスタ間の距離関数に基づいて順次分割することで、判断理由をクラスタに分類する。
【0091】
また、実施形態に係る情報提供装置100において、クラスタ抽出部137は、代表的な判断理由を、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する確率に基づいて抽出する。
【0092】
これにより、情報提供装置100は、タスクの文面を改善するのに役立つ情報を提供することができるので、適切なタスクの生成を支援することができる。例えば、情報提供装置100は、タスクの質問文に対する回答の判断理由のうち有益な判断基準に基づいた判断理由を抽出してリクエスタに提供することができるので、誤解を生みにくい質問文の作成を支援することができる。このため、情報提供装置100は、質の高いタスクをリクエスタに生成させることができるとともに、リクエスタが質問の記述を考える手間を減らすことができる。
【0093】
また、情報提供装置100は、ワーカから受け付けた判断理由の中から適切な判断基準に基づく判断理由を抽出することができるので、質問文の改善に有益な判断理由をリクエスタに提供することができる。例えば、情報提供装置100は、クラウドソーシングによってワーカから多数の多様な判断理由を収集した場合でも、質問文の改善に有益な判断理由を厳選してリクエスタに提供することができる。
【0094】
また、情報提供装置100は、タスクの質問文に対する回答の判断理由の中から多様な判断基準をカバーした少ない数の判断理由を抽出することができるので、質問文の改善に有益な判断理由を厳選してリクエスタに提供することができる。このため、情報提供装置100は、リクエスタにとって扱いやすい数の判断理由を参考に質問文を改善させることができるので、リクエスタが質問の記述を考える手間を減らすことができる。
【0095】
また、情報提供装置100は、タスクの質を高めることができるので、ワーカにとって魅力的な業務委託形態を提供することができる。例えば、情報提供装置100は、リクエスタの依頼意図が高い精度で記述された質問文の生成を支援することができるので、ワーカがリクエスタの意図と異なる解釈をして成果物を作成してしまい納品を拒絶されてしまうことを防ぐことができる。また、情報提供装置100は、タスクの質問文の記述があいまいなことが原因で質の高いワーカがリクエスタの所望しない成果物を作成してしまいスパマーとして疑われる事態を防ぐことができる。
【0096】
〔2.変形例〕
上述した実施形態に係る情報提供装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の情報提供装置100の他の実施形態について説明する。
【0097】
〔2−1.クラスタ分類〕
上記の実施形態では、情報提供装置100が類型抽出部135によって抽出された判断理由をクラスタに分類する例を挙げて説明した。ここで、情報提供装置100は、類型抽出部135によって抽出された判断理由に限らず、受付部133によって受け付けられた判断理由をクラスタに分類してもよい。
【0098】
具体的には、まず、情報提供装置100の受付部133は、依頼業務に対する回答と回答の判断理由とをワーカから受け付ける。続いて、クラスタ分類部136は、受付部133によって受け付けられた判断理由をクラスタに分類する。その後、クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する。そして、提供部138は、クラスタ抽出部137によって抽出された判断理由を提供する。
【0099】
これにより、情報提供装置100は、類型抽出部135によって抽出された判断理由に限らず、受付部133によって受け付けられた判断理由をクラスタに分類することができるので、類型抽出部135によって抽出された判断理由の数が少な過ぎる場合でもクラスタの中から代表的な判断理由を抽出してリクエスタに提供することができる。なお、この場合、例えば、情報提供装置100は、類型分類部134と、類型抽出部135とを有さなくてもよい。
【0100】
〔2−2.類型分類〕
上記の実施形態では、情報提供装置100がクラスタ抽出部137によって抽出された判断理由を提供する例を挙げて説明した。ここで、情報提供装置100は、クラスタ抽出部137によって抽出された判断理由に限らず、類型抽出部135によって抽出された判断理由を提供してもよい。
【0101】
具体的には、まず、情報提供装置100の受付部133は、依頼業務に対する回答と回答の判断理由とをワーカから受け付ける。続いて、情報提供装置100の類型分類部134は、判断理由と回答とに基づいた類型に受付部133によって受け付けられた判断理由を分類する。その後、類型抽出部135は、類型分類部134によって分類された類型に基づいて、所定の類型に属する判断理由を抽出する。そして、提供部138は、類型抽出部135によって抽出された判断理由を提供する。
【0102】
これにより、情報提供装置100は、クラスタ抽出部137によって抽出された判断理由に限らず、類型抽出部135によって抽出された判断理由を提供することができるので、クラスタ抽出部137によって抽出された判断理由の数が少な過ぎる場合でも、有益な判断理由をリクエスタに提供することができる。なお、この場合、例えば、情報提供装置100は、クラスタ分類部136と、クラスタ抽出部137とを有さなくてもよい。
【0103】
〔2−3.マッピング〕
上記の実施形態では、情報提供装置100が類型抽出部135によって抽出された判断理由をクラスタに分類する例を挙げて説明した。ここで、情報提供装置100は、下層要素の判断理由(インスタンス)を上位要素の判断理由(クラス)にマッピングした上で判断理由をクラスタに分類してもよい。
【0104】
具体的には、情報提供装置100のクラスタ分類部136は、判断理由のうち下位概念の判断理由を上位概念の判断理由に変換した上で判断理由をクラスタに分類する。例えば、質問文「これはコーヒーですか?」に対する回答「はい」の判断理由「コーヒーと書いてあるからコーヒー」は、「コーヒー」が上位概念に該当するので、上位概念の判断理由となる。また、質問文「これはコーヒーですか?」に対する回答「はい」の判断理由「コーヒー缶だからコーヒー」は、「コーヒー」が上位概念に該当するので、上位概念の判断理由となる。一方、質問文「これはコーヒーですか?」に対する回答「はい」の判断理由「ジョージア(登録商標)だからコーヒー」は、「ジョージア(登録商標)」がコーヒーのブランド名であり「コーヒー」の下位概念に該当するので、下位概念の判断理由となる。ここで、コーヒーを特定するプロパティは相対的に多くはないが、下位概念であるインスタンスまで含めると多くなってしまい、クラスタの数が多くなってしまう。そこで、この場合、クラスタ分類部136は、判断理由「ジョージア(登録商標)だからコーヒー」の「ジョージア(登録商標)」を上位概念の「コーヒー」に変換した上でクラスタに分類する。これにより、クラスタ分類部136は、クラスタの数を抑制することができる。
【0105】
他の例では、質問文「これはコーヒーですか?」に対する回答「いいえ」の判断理由「食べ物だからコーヒーではない」は、「食べ物」が上位概念に該当するので、上位概念の判断理由となる。一方、質問文「これはコーヒーですか?」に対する回答「いいえ」の判断理由「カレーだからコーヒーではない」は、「カレー」が「食べ物」の下位概念に該当するので、下位概念の判断理由となる。この場合、クラスタ分類部136は、判断理由「カレーだからコーヒーではない」の「カレー」を上位概念の「食べ物」に変換した上でクラスタに分類する。ここで、回答が「いいえ」の判断理由は、コーヒーが持たないプロパティへの言及になるので、多数存在するため、クラスタの数が多くなってしまう。そこで、この場合、クラスタ分類部136は、判断理由「カレーだからコーヒーではない」の「カレー」を上位概念の「食べ物」に変換した上でクラスタに分類する。これにより、クラスタ分類部136は、クラスタの数を抑制することができる。
【0106】
このように、情報提供装置100は、判断理由のうち下位概念の判断理由を上位概念の判断理由に変換した上で判断理由をクラスタに分類する。これにより、情報提供装置100は、下位概念の判断理由を上位概念の判断理由に統一することができるので、クラスタの数を抑制することができる。このため、情報提供装置100は、抑制された数のクラスタの中から代表的な判断理由を抽出するので、リクエスタにとって扱いやすい数の判断理由をリクエスタに提供することができる。
【0107】
〔2−4.肯定回答の判断理由に重みを付ける〕
上記の実施形態では、情報提供装置100が類型抽出部135によって抽出された判断理由をクラスタに分類する例を挙げて説明した。ここで、情報提供装置100は、否定表現の回答にかかる判断理由より肯定表現の回答にかかる判断理由に重みをつけてクラスタリングを行ってもよい。
【0108】
具体的には、情報提供装置100のクラスタ分類部136は、判断理由のうち肯定表現の回答にかかる判断理由を否定表現の回答にかかる判断理由より重みを持たせてクラスタの中心にする。肯定表現の回答にかかる判断理由は、否定表現の回答にかかる判断理由と比較して、判断理由として直接的な理由を書かれることが多く有益な判断理由である場合が多いからである。このため、クラスタ分類部136は、肯定表現の回答にかかる判断理由を否定表現の回答にかかる判断理由より重みを持たせてクラスタの中心にすることで、有益な判断理由を提供する。
【0109】
このように、情報提供装置100は、判断理由のうち肯定表現の回答にかかる判断理由を否定表現の回答にかかる判断理由より重みを持たせてクラスタの中心にする。これにより、情報提供装置100は、有益な判断理由である肯定表現の回答にかかる判断理由を重視することができるので、有益な判断理由を高い精度でリクエスタに提供することができる。
【0110】
〔2−5.tf−idf値に基づいて判断理由を抽出〕
上記の実施形態では、情報提供装置100がクラスタの中から代表的な判断理由を抽出する例を挙げて説明した。ここで、情報提供装置100は、判断理由のtf−idf値に基づいて代表的な判断理由を抽出してもよい。
【0111】
具体的には、情報提供装置100のクラスタ抽出部137は、代表的な判断理由を、クラスタ分類部136によって分類されたクラスタのうち判断理由のtf−idf値に基づいて選択されるクラスタの中から抽出する。例えば、クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタのうち判断理由のtf−idf値が高いクラスタを優先して選択し、選択したクラスタの中から代表的な判断理由を抽出する。tf−idf値が高く数の少ない2、3語が強く影響しているクラスタほど同じ意味でよくまとまっており有益な判断理由と考えられるからである。
【0112】
tf−idf値は、単語の出現頻度を示すtf(Term Frequency)と逆文書頻度を示すidf(Inverse Document Frequency)との二つの指標の積に基づいて計算される。ここで、idfは、一種の一般語フィルタとして働く。具体的には、idfは、多くのドキュメントに出現する一般的な語の重要度を下げて、特定のドキュメントにしか出現しない単語の重要度を上げる役割を果たす。このため、tf−idf値が高いほど有益な判断理由である可能性が高くなる。したがって、クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタのうち判断理由のtf−idf値が高いクラスタを優先して選択し、選択したクラスタの中から代表的な判断理由を抽出することで、有益な判断理由を高い精度で抽出することができる。
【0113】
このように、情報提供装置100は、代表的な判断理由を、クラスタ分類部136によって分類されたクラスタのうち判断理由のtf−idf値に基づいて選択されるクラスタの中から抽出する。これにより、情報提供装置100は、リクエスタにとって有益な判断理由を高い精度で抽出することができるので、有益な判断理由を高い精度でリクエスタに提供することができる。
【0114】
〔2−6.Bayonクラスタリング〕
上記の実施形態では、情報提供装置100がクラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する例を挙げて説明した。ここで、情報提供装置100は、Bayonクラスタリングを用いて代表的な判断理由を抽出してもよい。
【0115】
例えば、情報提供装置100は、Bayonクラスタリングでは、まず、全てのデータを1つのクラスタに格納する。その後、情報提供装置100は、データ集合を繰り返し2分割することでクラスタリングを行う。一例としては、情報提供装置100は、まず、複数のクラスタの中から分割するクラスタを1つ選択する。ここで、情報提供装置100は、例えば、分割するクラスタとして、クラスタ内のまとまりが最も悪いクラスタを選択する。続いて、情報提供装置100は、クラスタの中からランダムに2つの要素を選択し、それぞれの要素を格納したクラスタを2つ生成する。その後、情報提供装置100は、元のクラスタ中の全ての要素に対して、ランダムに選択した要素との間の類似度を算出する。続いて、情報提供装置100は、算出した類似度が高い方のクラスタに要素を追加する。ここで、情報提供装置100は、移動できる要素がなくなるまでクラスタ間で要素の移動を行い、分割結果を洗練する。
【0116】
そして、情報提供装置100は、Bayonクラスタリングの重みの偏りを利用する。例えば、情報提供装置100のクラスタ抽出部137は、Bayonクラスタリングのセントロイドで最も重い次元2つの重みを合計してランキングを生成する。そして、クラスタ抽出部137は、生成したランキングの順位が高い判断理由を優先して抽出する。
【0117】
このように、情報提供装置100は、Bayonクラスタリングのセントロイドで最も重い次元2つの重みを合計してランキングに基づいて代表的な判断理由を抽出する。これにより、情報提供装置100は、リクエスタにとって有益な判断理由を高い精度で抽出することができるので、有益な判断理由を高い精度でリクエスタに提供することができる。
【0118】
〔2−7.動詞に重みを付ける〕
上記の実施形態では、情報提供装置100が類型抽出部135によって抽出された判断理由をクラスタに分類する例を挙げて説明した。ここで、情報提供装置100は、判断理由をベクトル化する際に動詞に重みを付けてもよい。
【0119】
例えば、情報提供装置100の類型分類部134は、判断理由の素性のうち動詞の素性を他の品詞の素性より重みを付けてベクトル化する。動詞の方が他の品詞より有益な判断基準である場合が多いからである。これにより、情報提供装置100は、クラスタリングの質を高めることができるので、有益な判断理由をより高い精度で抽出することができる。
【0120】
〔2−8.クラスタの重心からの距離に基づいて判断理由を抽出〕
上記の実施形態では、情報提供装置100が代表的な判断理由を、判断理由が肯定表現であって回答が否定表現である類型および判断理由が否定表現であって回答が肯定表現である類型以外の類型に属する確率に基づいて抽出する例を挙げて説明した。ここで、情報提供装置100は、クラスタの重心からの距離に基づいて代表的な判断理由を抽出してもよい。
【0121】
具体的には、情報提供装置100のクラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する際に、クラスタの重心からの距離に基づいて代表的な判断理由を抽出する。例えば、クラスタ抽出部137は、クラスタに含まれる要素である判断理由のうちクラスタの中心に近い判断理由を優先して抽出する。
【0122】
このように、情報提供装置100は、クラスタの重心からの距離に基づいて代表的な判断理由を抽出する。これにより、情報提供装置100は、ランダムに判断理由を抽出する場合と比較して、有益な判断理由を高い精度で抽出することができる。
【0123】
〔2−9.ストップワード〕
上記の実施形態では、情報提供装置100が類型抽出部135によって抽出された判断理由をクラスタに分類する例を挙げて説明した。ここで、情報提供装置100は、ストップワード等を考慮してクラスタリングを行ってもよい。
【0124】
具体的には、情報提供装置100のクラスタ分類部136は、一般的な単語(例えば、助詞や助動詞などの機能語である「は」、「の」、「です」、「ます」など)を除いて、判断理由のクラスタリングを行う。これにより、情報提供装置100は、一般的でない単語が判断基準として共通する判断理由を同じクラスタに分類することができるので、有益な判断理由を高い精度で抽出することができる。
【0125】
〔2−10.適用対象〕
上記の実施形態では、情報提供装置100がクラウドソーシングにおけるタスクの質問文を改善するのに有益な判断理由を抽出して提供する例を挙げて説明した。ここで、情報提供装置100は、タスクの質問文を改善するのに有益な判断理由に限らず、各種の用途において有益な情報を抽出して提供してもよい。例えば、情報提供装置100は、コールセンタなどにおいて収集された問い合わせや苦情などの情報から業務改善に役立つ情報を抽出して提供してもよい。これにより、情報提供装置100は、多様な分野で得られる情報から有益な情報を抽出して提供することができるので、多様な分野における業務等の改善を図ることができる。
【0126】
〔2−11.抽出した判断理由を精査〕
上記の実施形態では、情報提供装置100が類型抽出部135又はクラスタ抽出部136によって抽出された判断理由を提供する例を挙げて説明した。ここで、情報提供装置100は、類型抽出部135又はクラスタ抽出部136によって抽出された判断理由を精査した上で提供してもよい。
【0127】
具体的には、情報提供装置100は、類型抽出部135又はクラスタ抽出部136によって抽出された判断理由をワーカWに再び提示する。例えば、情報提供装置100は、類型抽出部135又はクラスタ抽出部136によって抽出された判断理由が、質問文に対する回答の理由として妥当であるか否かを尋ねる質問文をワーカWに提示する。一例としては、情報提供装置100は、このような質問文を、判断理由を提供したワーカとは異なる他のワーカに対して提示する。
【0128】
そして、ワーカWは、受注端末50を操作して、判断理由が質問文に対する回答の理由として妥当であるか否かの回答を情報提供装置100に送信する。これにより、情報提供装置100は、判断理由が質問文に対する回答の理由として妥当であるか否かの回答を受注端末50から受信する。そして、情報提供装置100は、質問文に対する回答の理由として妥当であると回答された判断理由をリクエスタReに提供する。
【0129】
このように、情報提供装置100は、情報提供装置100は、類型抽出部135又はクラスタ抽出部136によって抽出された判断理由を精査した上で提供する。これにより、情報提供装置100は、提供する判断理由やシステムを改善することができるので、より質の高い判断理由を提供することができる。
【0130】
なお、情報提供装置100は、質問文に対する回答の理由として妥当であると回答された判断理由が適切であるか否かを尋ねる質問文をさらに他のワーカに提示して繰り返し精査を行った上でリクエスタReに提供してもよい。また、情報提供装置100は、クラスタ分類部136によって分類されたクラスタのまとまりが良いか否かを尋ねる質問文をワーカWに提示してクラスタの精査を行ってもよい。
【0131】
〔2−12.変形例の効果〕
上述してきたように、変形例に係る情報提供装置100は、受付部133と、クラスタ分類部136と、クラスタ抽出部137と、提供部138とを有する。受付部133は、依頼業務に対する回答と当該回答の判断理由とを受注者から受け付ける。クラスタ分類部136は、受付部133によって受け付けられた判断理由を、かかる判断理由と判断基準が共通するクラスタに分類する。クラスタ抽出部137は、クラスタ分類部136によって分類されたクラスタの中から代表的な判断理由を抽出する。提供部138は、クラスタ抽出部137によって抽出された判断理由を提供する。
【0132】
これにより、変形例に係る情報提供装置100は、類型抽出部135によって抽出された判断理由に限らず、受付部133によって受け付けられた判断理由をクラスタに分類することができるので、類型抽出部135によって抽出された判断理由の数が少な過ぎる場合でもクラスタの中から代表的な判断理由を抽出してリクエスタに提供することができる。
【0133】
また、変形例に係る情報提供装置100において、クラスタ分類部136は、判断理由のうち下位概念の判断理由を上位概念の判断理由に変換した上でかかる判断理由をクラスタに分類する。
【0134】
これにより、変形例に係る情報提供装置100は、下位概念の判断理由を上位概念の判断理由に統一することができるので、クラスタの数を抑制することができる。このため、情報提供装置100は、抑制された数のクラスタの中から代表的な判断理由を抽出するので、リクエスタにとって扱いやすい数の判断理由をリクエスタに提供することができる。
【0135】
また、変形例に係る情報提供装置100において、クラスタ分類部136は、判断理由のうち肯定表現の回答にかかる判断理由を否定表現の回答にかかる判断理由より重みを持たせてクラスタの中心にする。
【0136】
これにより、変形例に係る情報提供装置100は、有益な判断理由である肯定表現の回答にかかる判断理由を重視することができるので、有益な判断理由を高い精度でリクエスタに提供することができる。
【0137】
また、変形例に係る情報提供装置100において、クラスタ抽出部137は、代表的な判断理由を、クラスタ分類部136によって分類されたクラスタのうち判断理由のtf−idf値に基づいて選択されるクラスタの中から抽出する。
【0138】
これにより、変形例に係る情報提供装置100は、リクエスタにとって有益な判断理由を高い精度で抽出することができるので、有益な判断理由を高い精度でリクエスタに提供することができる。
【0139】
〔3.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0140】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0141】
例えば、
図4に示したタスク情報記憶部121は、情報提供装置100が保持せずに、ストレージサーバ等に保持されてもよい。この場合、情報提供装置100は、ストレージサーバにアクセスすることで、タスクに関する情報を取得する。
【0142】
また、情報提供装置100は、類型抽出処理とクラスタ抽出処理と提供処理とは行わず、類型分類部134による類型分類処理とクラスタ分類部136によるクラスタ分類処理とのみを行う分類装置であってもよい。この場合、分類装置は、類型抽出部135と、クラスタ抽出部137と、提供部138とを有しない。そして、類型抽出部135とクラスタ抽出部137と提供部138とを有する抽出装置が判断理由の抽出を行い、抽出した判断理由を提供する。
【0143】
また、上述してきた実施形態に係る情報提供装置100は、例えば
図10に示すような構成のコンピュータ1000によって実現される。以下、情報提供装置100を例に挙げて説明する。
図10は、情報提供装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
【0144】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0145】
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網50を介して他の機器へ送信する。
【0146】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
【0147】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0148】
例えば、コンピュータ1000が実施形態に係る情報提供装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網50を介してこれらのプログラムを取得してもよい。
【0149】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0150】
また、上述した情報提供装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0151】
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、受信部は、受信手段や受信回路に読み替えることができる。