(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G06F 16/90 20190101AFI20231121BHJP
【FI】
G06F16/90 100
(21)【出願番号】P 2021046060
(22)【出願日】2021-03-19
【審査請求日】2021-12-17
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】清水 徹
(72)【発明者】
【氏名】小林 隼人
(72)【発明者】
【氏名】増山 毅司
(72)【発明者】
【氏名】日暮 立
【審査官】酒井 恭信
(56)【参考文献】
【文献】特開2019-096148(JP,A)
【文献】特開2019-125145(JP,A)
【文献】特開2010-009471(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00 - 16/958
(57)【特許請求の範囲】
【請求項1】
ユーザの入力に基づく検索クエリを取得する取得部と、
前記検索クエリを用いて検索された複数の質問文のうち、前記ユーザが選択した前記質問文である選択質問文を検出する検出部と、
前記選択質問文を構成するワードのうち、前記選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、前記選択質問文における、抽出した前記キーワードの重要度を、前記選択質問文と前記キーワードとの組ごとに算出する算出部と、
前記重要度が高いキーワードを、
当該重要度が高いキーワードを含む質問文に付与するタグに用いることにより、
タグを選択した前記ユーザに対して、
当該タグが付与された質問文を提供する情報処理部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記算出部は、前記検索クエリを用いて複数の前記質問文が検索された際において前記選択質問文が選択された回数に基づいて前記重要度を算出する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記算出部は、前記検索クエリを用いて前記選択質問文が検索された回数に基づいて前記重要度を算出する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記算出部は、前記選択質問文と、前記選択質問文に対する回答文とに含まれるワードのうち、前記選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、前記選択質問文と前記回答文とにおける、抽出した前記キーワードの重要度を、前記選択質問文と前記回答文と前記キーワードとの組ごとに算出する
ことを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
コンピュータが実行する情報処理方法であって、
ユーザの入力に基づく検索クエリを取得する取得工程と、
前記検索クエリを用いて検索された複数の質問文のうち、前記ユーザが選択した前記質問文である選択質問文を検出する検出工程と、
前記選択質問文を構成するワードのうち、前記選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、前記選択質問文における、抽出した前記キーワードの重要度を、前記選択質問文と前記キーワードとの組ごとに算出する算出工程と、
前記重要度が高いキーワードを、
当該重要度が高いキーワードを含む質問文に付与するタグに用いることにより、
タグを選択した前記ユーザに対して、
当該タグが付与された質問文を提供する情報処理工程と、
を含むことを特徴とする情報処理方法。
【請求項6】
コンピュータに、
ユーザの入力に基づく検索クエリを取得する取得手順と、
前記検索クエリを用いて検索された複数の質問文のうち、前記ユーザが選択した前記質問文である選択質問文を検出する検出手順と、
前記選択質問文を構成するワードのうち、前記選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、前記選択質問文における、抽出した前記キーワードの重要度を、前記選択質問文と前記キーワードとの組ごとに算出する算出手順と、
前記重要度が高いキーワードを、
当該重要度が高いキーワードを含む質問文に付与するタグに用いることにより、
タグを選択した前記ユーザに対して、
当該タグが付与された質問文を提供する情報処理手順と、
を実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
従来、様々な情報をユーザに提供する情報提供技術が知られている。このような情報提供技術の一例として、情報提供先となるユーザの属性に応じて、提供対象となる情報を選択する技術が知られている。例えば、所謂Q&A(question answering)サイトにおいて、質問者の属性に基づいて理想的な回答者を推定し、推定した回答者に質問を通知する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来技術では、適切な情報をユーザに提供しているとは言えない場合がある。
【0005】
例えば、ユーザが検索クエリを用いて質問文を検索した際において、適切な質問文が検索されない場合、質問文に対する回答文も、ユーザが求めていたものからかけ離れたものになり、ユーザは適切な情報を得難くなる虞がある。
【0006】
本願は、上記に鑑みてなされたものであって、ユーザに対してより適切な情報を提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る情報処理装置は、ユーザの入力に基づく検索クエリを取得する取得部と、前記検索クエリを用いて検索された複数の質問文のうち、前記ユーザが選択した前記質問文である選択質問文を検出する検出部と、前記選択質問文を構成するワードのうち、前記選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、前記選択質問文における、抽出した前記キーワードの重要度を、前記選択質問文と前記キーワードとの組ごとに算出する算出部と、前記重要度が高いキーワードを、当該重要度が高いキーワードを含む質問文に付与するタグに用いることにより、タグを選択した前記ユーザに対して、当該タグが付与された質問文を提供する情報処理部と、を有することを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、ユーザに対してより適切な情報を提供することができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理の一例を示す図である。
【
図2】
図2は、実施形態に係る情報処理システムの構成例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、実施形態に係る質問情報記憶部の一例を示す図である。
【
図5】
図5は、実施形態に係る回答情報記憶部の一例を示す図である。
【
図6】
図6は、実施形態に係る検索情報記憶部の一例を示す図である。
【
図7】
図7は、実施形態に係るキーワード情報記憶部の一例を示す図である。
【
図8】
図8は、実施形態に係る情報処理の一例を示すフローチャートである。
【
図9】
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
【0011】
(実施形態)
〔1.情報処理〕
まず、
図1を用いて、実施形態に係る情報処理の一例について説明する。
図1は、実施形態に係る情報処理の一例を示す図である。情報処理装置100は、例えばQ&Aサイトに関するサービスを提供する。また、ユーザU1、U2及びU3は、Q&Aサイトを利用するユーザである。
【0012】
各ユーザは、端末装置200を介して、Q&Aサイトへの質問文及び回答文の投稿を行うことができる。また、各ユーザは、端末装置200を介して、Q&Aサイトに投稿された質問文を検索し、閲覧することができる。
【0013】
また、
図1に示す例においては、端末装置200を利用するユーザに応じて、端末装置200を端末装置200-1~200-3として説明する。例えば、端末装置200-1は、ユーザU1により使用される端末装置200である。また、例えば、端末装置200-2は、ユーザU2により使用される端末装置200である。また、以下では、端末装置200-1~200-3について、特に区別なく説明する場合には、端末装置200と記載する。
【0014】
なお、上記のように、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により識別されるユーザであることを示す。例えば、「ユーザU1」と記載した場合、そのユーザはユーザID「U1」により識別されるユーザである。
【0015】
また、本稿における文は、1つ以上の単語を含んだテキストデータであるものとする。また、文は、句点、感嘆符、疑問符、空白等で区切られたテキストデータの範囲であるものとする。また、質問文は、情報処理装置100において、質問することを意図して作成されたものとして処理される文である。また、回答文は、情報処理装置100において、質問に対して回答することを意図して作成されたものとして処理される文である。また、1つの質問文に複数の回答文が対応していてもよい。
【0016】
Q&Aサイトにおいて、ユーザは、文章を入力することによって質問文及び回答文の投稿を行うことができる。ユーザによって入力された文章は、入力したユーザを識別するためのID等とともに、質問文又は回答文として情報処理装置100に記憶される。
【0017】
また、ユーザは、検索用のキーワードを入力することで、情報処理装置100に記憶されている質問文の検索を行うことができる。このとき、情報処理装置100は、検索結果の質問文及び質問文に対応付けられた回答文とともに、関連する質問文をユーザに提供する。
【0018】
〔2.情報処理システムの構成〕
まず、
図1の説明に先立って、
図2に示す情報処理システム1について説明する。
図2に示すように、情報処理システム1は、情報処理装置100及び端末装置200を有する。情報処理装置100と端末装置200とは所定のネットワークNを介して、有線又は無線により通信可能に接続される。
図2は、実施形態に係る情報処理システムの構成例を示す図である。なお、
図2に示した情報処理システム1には、複数台の情報処理装置100や、複数台の端末装置200が含まれていてもよい。
【0019】
情報処理装置100は、ユーザにコンテンツを提供するための処理装置である。情報処理装置100は、例えば、Webサーバ、データベースサーバ等により実現される。本実施形態では、情報処理装置100は、Q&Aサイトに投稿された質問文及び回答文をコンテンツとして記憶し、また、記憶したコンテンツを提供するものとする。なお、情報処理装置100が提供するコンテンツは、質問文及び回答文に限られず、SNS(Social Networking Service)に投稿された文章、ニュースやブログの記事等であってもよい。
【0020】
端末装置200は、ユーザによって利用される処理装置である。端末装置200は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。
図1に示す例においては、端末装置200がユーザの利用するノート型PCである場合を示す。なお、以下では、端末装置200をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置200と読み替えることもできる。
【0021】
端末装置200は、ユーザによる操作を受け付ける。また、端末装置200は、ユーザの操作に応じて、情報処理装置100に種々の情報を送信する。例えば、端末装置200は、情報処理装置100に、ユーザによって入力された質問文及び回答文を送信する。
【0022】
また、端末装置200は、情報処理装置100から種々の情報を受信する。例えば、端末装置200は、情報処理装置100から質問文及び回答文を受信する。また、例えば、端末装置200は、情報処理装置100から受信した質問文の一覧を表示する。
【0023】
ユーザ及び情報処理装置100によって行われる処理について説明する。まず、
図1に示すように、ユーザU1は、端末装置200-1を介して質問文を投稿する(ステップS11)。例えば、ユーザU1は、端末装置200-1のWebブラウザに表示されているQ&Aサイトに、あらかじめ設定したIDを使ってログインし、所定の入力欄に質問文を入力し、送信操作を行うことで質問文の投稿を行うことができる。このとき、端末装置200-1は、ユーザU1のID及び質問文を情報処理装置100に送信する。また、情報処理装置100は、質問文とユーザのIDとを対応付けて記憶部120(
図3参照)に格納する。
【0024】
例えば、情報処理装置100は、ユーザU1によって投稿された「製品Xと製品Yだとどちらを買うのが良いでしょうか?・・・」という質問文をユーザのIDと対応付けて記憶部120に格納する。
【0025】
ユーザU2は、提供された質問文に対する回答文を投稿する(ステップS12)。例えば、まず、ユーザU2は、端末装置200-2のWebブラウザに表示されているQ&Aサイトに、あらかじめ設定したIDを使ってログインし、回答の対象の質問文を端末装置200-2のWebブラウザに表示させる。
【0026】
そして、ユーザU2は、所定の入力欄に回答文を入力し、送信操作を行うことで回答文の投稿を行うことができる。このとき、端末装置200-2は、ユーザU2のID及び回答文を情報処理装置100に送信する。また、情報処理装置100は、質問文と回答文とユーザのIDと、を対応付けて記憶部120に格納する。
【0027】
例えば、情報処理装置100は、「製品Xと製品Yだとどちらを買うのが良いでしょうか?」という質問文に対する回答文であって、ユーザU2によって投稿された「製品Xと製品Yとでは、耐久性に違いがあります。・・・」という回答文をユーザのIDと対応付けて記憶部120に格納する。
【0028】
ユーザU3は、端末装置200-3を介して情報処理装置100に質問文を検索するためのキーワードを入力する(ステップS13)。例えば、ユーザU3は、端末装置200-3のWebブラウザに表示されているQ&Aサイトの検索欄に1つ以上のキーワードを入力し、送信操作を行う。例えば、ユーザU3は、「製品X 製品Y 違い」というキーワードを入力する。
【0029】
そして、情報処理装置100は、キーワードの入力を受け付けると、キーワードから生成された検索クエリを用いて質問文の検索を行う(ステップS14)。そして、情報処理装置100は、検索結果の質問文の一覧を提供する(ステップS15)。例えば、情報処理装置100は、ユーザU3によって検索した質問文を端末装置200-3のWebブラウザに一覧表示させることで質問文の一覧を提供することができる。また、このとき、情報処理装置100は、検索に用いられた検索クエリを後述する
図3の検索情報記憶部123に格納する。検索クエリは、入力されたキーワードそのものであってもよいし、入力されたキーワードが所定の方法で変換されたものであってもよい。
【0030】
ここで、ユーザU3は、提供された質問文の一覧の中から質問文を選択する(ステップS16)。例えば、端末装置200-3に表示されている質問文の一覧のうちのいずれかにカーソルを当て、クリックすることで質問文を選択することができる。このとき、端末装置200-3は、ユーザU3によって選択された質問文を特定するための情報を情報処理装置100に送信する。
【0031】
そして、情報処理装置100は、選択された質問文に対応する回答文を取得する(ステップS17)。例えば、ユーザU3によって「製品Xと製品Yだとどちらを買うのが良いでしょうか?・・・」という質問文が選択された場合、情報処理装置100は、選択された質問文に対応付けられた「製品Xと製品Yとでは、耐久性に違いがあります。・・・」という回答文を取得する。
【0032】
また、情報処理装置100は、選択された質問文に含まれるキーワードの、検索クエリに関連する重要度を算出する(ステップS18)。つまり、情報処理装置100は、選択された質問文に含まれる当該質問文を代表するキーワードの、検索クエリに関連する重要度を算出する。
【0033】
情報処理装置100は、例えば、検索クエリを用いて複数の質問文が検索された際において、選択された質問文が選択された回数に基づいて、質問文を代表するキーワードの、検索クエリに関連する重要度を算出する。即ち、検索クエリを用いて検索された複数の質問文のうち、ユーザによって選択される回数が多い質問文ほど、質問文を代表するキーワードの重要度が高いものとして算出する。または、情報処理装置100は、検索クエリを用いて質問文の検索が行われた際に、検索された回数が多い質問文ほど、質問文を代表するキーワードの重要度が高いものとして算出する。
【0034】
また、情報処理装置100は、選択された質問文とともに回答文を、端末装置200-3を介してユーザU3に提供する(ステップS19)。これにより、情報処理装置100は、質問文と回答文とを端末装置200-3の表示部に表示させる。
【0035】
〔3.情報処理装置の構成〕
次に、
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。
図3は、実施形態に係る情報処理装置100の構成例を示す図である。
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0036】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線又は無線で接続され、端末装置200との間で情報の送受信を行う。
【0037】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、
図3に示すように、質問情報記憶部121と、回答情報記憶部122と、検索情報記憶部123と、キーワード情報記憶部124とを有する。
【0038】
(質問情報記憶部121)
質問情報記憶部121は、質問文に関する情報を記憶する。
図4は、実施形態に係る質問情報記憶部の一例を示す図である。
図4に示すように、質問情報記憶部121は、「質問ID」、「ユーザID」及び「質問文」といった項目を含んで、質問文に関する情報を記憶する。
【0039】
質問情報記憶部121で記憶する「質問ID」は、質問文を識別するための情報である。また、質問情報記憶部121で記憶する「ユーザID」は、質問文を投稿したユーザを識別するための情報である。また、質問情報記憶部121で記憶する「質問文」は、投稿された質問文のテキストデータである。
【0040】
質問情報記憶部121は、「質問ID」ごとに、「ユーザID」と「質問文」を記憶する。これにより、質問情報記憶部121は、「質問文」ごとに、「ユーザID」を関連付けて記憶する。
【0041】
(回答情報記憶部122)
回答情報記憶部122は、回答文に関する情報を記憶する。
図5は、実施形態に係る回答情報記憶部の一例を示す図である。
図5に示すように、回答情報記憶部122は、「回答ID」、「質問ID」、「ユーザID」及び「回答文」といった項目を含んで、回答文に関する情報を記憶する。
【0042】
回答情報記憶部122で記憶する「回答ID」は、回答文を識別するための情報である。また、回答情報記憶部122で記憶する「質問ID」は、回答文がどの質問文に対して投稿されたものであるかを識別するための情報である。また、回答情報記憶部122で記憶する「ユーザID」は、回答文を投稿したユーザを識別するための情報である。また、回答情報記憶部122で記憶する「回答文」は、投稿された回答文のテキストデータである。
【0043】
回答情報記憶部122は、「回答ID」ごとに、「質問ID」と「ユーザID」と「回答文」を記憶する。これにより、回答情報記憶部122は、「回答文」ごとに、「ユーザID」と「質問文」を関連付けて記憶する。
【0044】
(検索情報記憶部123)
検索情報記憶部123は、質問文の検索に関する情報を記憶する。
図6は、実施形態に係る検索情報記憶部の一例を示す図である。
図6に示すように、検索情報記憶部123は、「検索ID」、「ユーザID」、「検索クエリ」及び「質問ID」といった項目を含んで、質問文の検索に関する情報を記憶する。
【0045】
検索情報記憶部123で記憶する「検索ID」は、検索を識別するための情報である。また、検索情報記憶部123で記憶する「ユーザID」は、検索を要求したユーザを識別するための情報である。また、検索情報記憶部123で記憶する「検索クエリ」は、質問文の検索に用いられた検索クエリである。また、検索情報記憶部123で記憶する「質問ID」は、「検索クエリ」によって検索された質問を識別するための情報であり、1組の「検索クエリ」によって複数の質問文が検索された場合は、1つの「検索クエリ」に対して複数の「質問ID」が関連付けられる。
【0046】
(キーワード情報記憶部124)
キーワード情報記憶部124は、質問文におけるキーワードに関する情報を記憶する。
図7は、実施形態に係るキーワード情報記憶部の一例を示す図である。
図7に示すように、キーワード情報記憶部124は、「ユーザID」、「質問ID」、「質問文」、「キーワード」及び「重要度」といった項目を含んで、質問文におけるキーワードに関する情報を記憶する。
【0047】
キーワード情報記憶部124で記憶する「キーワード」は、質問文を構成するワードのうち、当該質問文の検索に用いられた検索クエリに含まれるワードの情報である。また、キーワード情報記憶部124で記憶する「重要度」は、質問文における「キーワード」の重要度であり、質問文において、「キーワード」がその質問文をどの程度代表するかを示す指標となる情報である。
【0048】
質問情報記憶部121、回答情報記憶部122、検索情報記憶部123及びキーワード情報記憶部124が記憶する情報は、これまで説明したものに限られない。例えば、各記憶部は、各情報が格納された日時を記憶してもよい。
【0049】
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(提供プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0050】
図3に示すように、制御部130は、取得部131と、検索部132と、検出部133と、算出部134とを有し、以下に説明する情報処理の機能や作用を実現又は実行する。なお、制御部130の内部構成は、
図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0051】
(取得部131)
取得部131は、ユーザが端末装置200に対して行った各種入力情報を、ネットワークN及び通信部110を介して取得する。また、取得部131は、各種情報を外部の情報処理装置から取得してもよい。また、取得部131は、記憶部120に記憶された情報を必要に応じて取得し、各処理部に受け渡すことができる。例えば、取得部131は、質問情報記憶部121、回答情報記憶部122、検索情報記憶部123及びキーワード情報記憶部124等から各種情報を取得する。
【0052】
例えば、取得部131は、端末装置200を用いてユーザによって投稿された質問文を、ネットワークN及び通信部110を介して取得し、質問情報記憶部121に格納する。また、取得部131は、端末装置200を用いてユーザによって投稿された回答文を、ネットワークN及び通信部110を介して取得し、回答情報記憶部122に格納する。また、取得部131は、端末装置200へのユーザの入力に基づく検索クエリを、ネットワークN及び通信部110を介して取得し、検索情報記憶部123に格納する。
【0053】
(検索部132)
検索部132は、質問文を検索する。検索部132は、検索クエリを用いて質問情報記憶部121を検索する。また、検索部132は、検索の結果得られた質問文の質問IDを、検索情報記憶部123に格納する。つまり、検索部132は、検索クエリが、複数のキーワードからなる場合は、検索部132は、検索クエリに用いられる複数のキーワードが含まれる質問文を質問情報記憶部121より検索する。検索部132は、このように検索クエリを用いて検索された質問文と、当該質問文の質問IDを、検索結果として検索情報記憶部123に格納する。また、検索部132で、検索クエリを用いて複数の質問文が検索された場合は、検索部132は、それぞれの質問文と質問IDを検索情報記憶部123に格納する。
【0054】
(検出部133)
検出部133は、検索クエリを用いて検索された複数の質問文のうち、ユーザが選択した質問文である選択質問文を検出する。ユーザによる質問文の選択は、例えば、検索クエリを用いて検索部132によって検索された複数の質問文を、端末装置200の表示部に表示し、表示部に表示された複数の質問文の中から、ユーザが任意の質問文を選択することにより行う。検出部133は、複数の質問文のうち、ユーザによって選択された質問文を検出することにより、選択質問文の検出を行う。
【0055】
(算出部134)
算出部134は、検出部133で検出した選択質問文に含まれるキーワードの、検索クエリに関連する重要度を算出する。算出部134は、選択質問文を構成するワードのうち、当該選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、選択質問文における、抽出したキーワードの重要度を算出する。算出部134は、質問文に含まれるキーワードの重要度を、重要度が高くなるに従って値が大きくなる数値によって示し、質問文ごとにキーワード情報記憶部124に格納する。
【0056】
例えば、算出部134は、検索クエリを用いて検索された複数の選択文の中から、ユーザが選択質問文を選択したことを検出部133で検出するごとに、選択質問文の質問文と、キーワードをキーワード情報記憶部124と共に、重要度を格納する。その際に、検出部133で検出した選択質問文とキーワードとが、重要度と共に既にキーワード情報記憶部124に格納されている場合には、格納されている重要度を加算する。
【0057】
これにより、算出部134は、検索クエリを用いて複数の質問文が検索された際において、選択質問文が選択された回数に基づいて、選択質問文に含まれるキーワードの重要度を算出する。このため、1組の検索クエリを用いて複数の選択文を検索した際にした際において、ユーザが選択質問文を複数選択した場合には、算出部134は、複数の選択文において、同一のキーワードの重要度を算出する。
【0058】
また、算出部134は、検索クエリを用いて選択質問文が検索された回数に基づいて重要度を算出してもよい。例えば、算出部134は、検索クエリを用いて質問文を検索した際において、ユーザが選択した選択質問文を、当該検索クエリを用いることにより検索した回数が多くなるに従って、選択質問文を構成するワードのうち、検索クエリに含まれるワードであるキーワードの重要度を高くしてもよい。この場合、算出部134は、複数の質問文の中からユーザが選択質問文を選択したことを検出部133で検出した際において、選択質問文の質問文を、当該選択質問文の検索に用いられたキーワードごとに、重要度と共にキーワード情報記憶部124に格納する。
【0059】
その際に、検出部133で検出した選択質問文とキーワードとが、重要度と共に既にキーワード情報記憶部124に格納されている場合には、格納されている重要度を加算する。これにより、算出部134は、検索クエリを用いて選択質問文が検索された回数に基づいて、選択質問文に含まれるキーワードの重要度を算出する。このため、1つの選択質問文が、異なる検索クエリを用いて検索された場合は、算出部134は、1つの選択質問文における、異なるキーワードごとの重要度を算出する。
【0060】
(情報処理部135)
情報処理部135は、算出部134で算出した、選択質問文に含まれるキーワードの、検索クエリに関連する重要度に基づいて、選択質問文に対して様々な情報処理を行う。情報処理部135は、例えば、質問文にタグを付けることにより、ユーザが質問文の閲覧時に関連する質問を閲覧し易くする際に、選択質問文において重要度が高いキーワードをタグに用いる。タグは、端末装置200の表示部で質問文と共に表示され、タグを選択することにより、タグに同じ内容のキーワードが用いられる複数の質問文が表示される。これにより、質問文を閲覧するユーザが、閲覧している質問文に関連する質問文も閲覧し易くなるようにする。
【0061】
〔4.情報処理のフロー〕
次に、
図8を用いて、実施形態に係る情報処理システム1による情報処理の手順について説明する。
図8は、実施形態に係る情報処理の一例を示すフローチャートである。
【0062】
図8に示すように、まず、情報処理装置100は、ユーザの入力に基づく検索クエリを取得し、取得した検索クエリを用いて質問文を検索する(ステップS101)。即ち、端末装置200に対してユーザが入力した検索クエリを、情報処理装置100の制御部130が有する取得部131で取得し、取得した検索クエリを用いて、検索部132で質問情報記憶部121を検索する。
【0063】
次に、端末装置200は、検索された質問文の一覧を表示する(ステップS102)。つまり、端末装置200は、検索部132で検索された質問文の一覧を、ユーザが検索クエリを入力した端末装置200に送り、端末装置200で表示する。
【0064】
次に、情報処理装置100は、端末装置200に表示した質問文の中から質問文がユーザにより選択されたか否かの判定を行い(ステップS103)、質問文が選択されていない場合(ステップS103、No)は、ユーザによって質問文が選択されるまで待機する。
【0065】
端末装置200に表示した質問文の中からユーザによって質問文が選択された場合(ステップS103、Yes)、ユーザが選択した質問文である選択質問文に含まれるキーワードの重要度を、制御部130が有する算出部134によって算出する(ステップS104)。
【0066】
算出部134は、選択質問文を構成するワードのうち、当該選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして抽出し、選択質問文における、抽出したキーワードの重要度を算出する。即ち、算出部134は、検索クエリにより示される、選択質問文に含まれるキーワードが、選択質問文においてどの程度重要なものであるかを算出する。選択質問文におけるキーワードの重要度は、検索クエリを用いて検索された複数の質問文の中から選択質問文が選択された回数や、検索クエリを用いて質問文を検索した際に、選択質問文が検索された回数に基づいて算出する。このように算出した重要度は、記憶部120が有するキーワード情報記憶部124に記憶される。
【0067】
次に、情報処理装置100は、制御部130が有する情報処理部135により、選択質問文に対して重要度が高いキーワードを用いてタグ付けを行う(ステップS105)。即ち、情報処理部135は、キーワード情報記憶部124に記憶されている、質問文におけるキーワードの重要度を参照し、選択質問文において重要度が高いキーワードを、選択質問文のタグとして設定し、質問情報記憶部121に格納する。このため、質問文に付与されるタグには、質問文の内容に適した、質問文を代表するキーワードが用いられる。これにより、ユーザが質問文を閲覧する際に、端末装置200で質問文と共に表示されるタグをユーザが選択することにより、ユーザは、選択したタグのキーワードより期待される内容の質問文を得易くなる。
【0068】
〔5.ハードウェア構成〕
また、上述した実施形態に係る情報処理装置100は、例えば
図9に示すような構成のコンピュータ1000によって実現される。
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0069】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0070】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0071】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0072】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0073】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0074】
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。
【0075】
〔6.効果〕
上述してきたように、実施形態に係る情報処理装置100は、検出部133及び算出部134を有する。検出部133は、ユーザが入力した検索クエリを用いて検索された複数の質問文のうち、ユーザが選択した質問文である選択質問文を検出する。算出部134は、選択質問文に含まれるキーワードの、検索クエリに関連する重要度を算出する。
【0076】
このように、実施形態に係る情報処理装置100は、ユーザが選択した選択質問文に含まれるキーワードの、検索クエリに関連する重要度を算出するため、選択質問文を構成するワードのうち、選択質問文の内容を適切に表す、代表的なキーワードを得ることができる。従って、例えば、重要度が高いキーワードを、質問文に付与するタグに用いることにより、ユーザに対して、ユーザが欲する内容の質問文をより多く提供し易くなり、ユーザに対してより適切な情報を提供することができる。
【0077】
また、実施形態に係る情報処理装置100において、算出部134は、検索クエリを用いて複数の質問文が検索された際において選択質問文が選択された回数に基づいてキーワードの重要度を算出するため、検索クエリに含まれるワードと選択質問文を構成するワードの関連性が高いほど、キーワードの重要度を高くすることができる。これにより、重要度が高いキーワードほど、選択質問文の内容を適切に示し、選択質問文を代表するワードになるため、選択質問文の内容を適切に示すキーワードを得ることができる。従って、ユーザに対してより適切な情報を提供することができる。
【0078】
また、実施形態に係る情報処理装置100において、算出部134が、検索クエリを用いて選択質問文が検索された回数に基づいてキーワードの重要度を算出した場合も同様に、選択質問文を構成するワードのうち、検索クエリに含まれるワードとの関連性が高いキーワードの重要度を高くすることができる。これにより、重要度が高いキーワードほど、選択質問文の内容を適切に示し、選択質問文を代表するワードになるため、選択質問文の内容を適切に示すキーワードを得ることができる。従って、ユーザに対してより適切な情報を提供することができる。
【0079】
〔7.変形例〕
上述した実施形態に係る情報処理装置100では、算出部134は、選択質問文に含まれるキーワードの、検索クエリに関連する重要度を算出しているが、算出部134は、選択質問文に対する回答文に含まれるキーワードの、検索クエリに関連する重要度も算出してもよい。つまり、算出部134は、選択質問文と、選択質問文に対する回答文とに含まれるキーワードの、検索クエリに関連する重要度を算出してもよい。この場合、算出部134は、選択質問文に対する回答文を回答情報記憶部122から取得し、選択質問文の検索に用いられた検索クエリに含まれるワードをキーワードとして回答文から抽出し、回答文における、抽出したキーワードの重要度を算出する。即ち、算出部134は、検索クエリにより示される、選択質問文に対する回答文に含まれるキーワードが、回答文においてどの程度重要なものであるかを算出する。
【0080】
回答文におけるキーワードの重要度は、検索クエリを用いて検索された複数の質問文の中から、回答文に対応する質問文が選択された回数や、検索クエリを用いて質問文及び回答文を検索した際に、検索クエリに含まれるワードを含む回答文が検索された回数に基づいて算出する。このように算出した回答文に含まれるキーワードの重要度は、記憶部120が有するキーワード情報記憶部124に記憶される。
【0081】
この場合、情報処理部135では、質問文に対してタグ付けを行う際に、回答文に対して重要度が高いキーワードも質問文のタグとして設定し、質問情報記憶部121に格納する。このため、質問文に付与されるタグには、回答文の内容に適した、回答文を代表するキーワードも用いられる。これにより、ユーザが質問文を閲覧する際に、端末装置200で質問文と共に表示されるタグをユーザが選択することにより、ユーザは、回答文に記載されている内容も含めて、選択したタグのキーワードより期待される内容の質問文を得易くなる。従って、ユーザに対してより適切な情報を提供することができる。
【0082】
上述した実施形態に係る情報処理装置100では、キーワード情報記憶部124は、ユーザが選択した質問文の検索に用いた検索クエリ全体を、キーワードとして用いているが、キーワードは、検索クエリの一部であってもよい。例えば、検索クエリに含まれる一部のワードを抽出し、抽出したワードが、ユーザが選択した質問文に含まれている場合は、そのワードを、質問文を代表するキーワードとして用いて、キーワードの重要度を算出してもよい。
【0083】
上述した実施形態に係る情報処理装置100では、選択質問文に含まれるキーワードの、検索クエリに対する重要度を算出部134で算出し、キーワード情報記憶部124で記憶しているが、例えば、DSSM(Deep Structured Semantic Model)のような深層学習の技術でモデル化することによって、質問文に含まれるキーワードの重要度を求めてもよい。これにより、例えば、投稿されたばかりで検索された履歴のない質問文に対しても、質問文に含まれるキーワードの重要度に基づいて、タグ付け等を行うことが可能になる。
【0084】
また、キーワード情報記憶部124に記憶された、質問文に含まれるキーワードの重要度は、検索クエリを用いた検索以外に用いてもよい。例えば、キーワード情報記憶部124に記憶されているキーワードより、キーワードの重要度が高い質問文を抽出することによって、世の中の話題のクラスタを抽出したり、話題の移り変わりの把握を行ったりしてもよい。また、質問文に対するキーワードをモデル化してキーワード情報記憶部124に記憶した場合には、記憶されているモデルを、与えられた任意の文章から、それを代表するようなキーワードを抽出するために用いてもよい。これらのように、キーワード情報記憶部124に記憶されている、質問文に対するキーワードの重要度の使い道は問わない。
【0085】
以上、本願の実施形態及び変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0086】
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0087】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【0088】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0089】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0090】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0091】
1 情報処理システム
100 情報処理装置
110 通信部
120 記憶部
121 質問情報記憶部
122 回答情報記憶部
123 検索情報記憶部
124 キーワード情報記憶部
130 制御部
131 取得部
132 検索部
133 検出部
134 算出部
135 情報処理部
200 端末装置