(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024021725
(43)【公開日】2024-02-16
(54)【発明の名称】情報処理装置、情報処理方法、プログラム
(51)【国際特許分類】
G06F 16/90 20190101AFI20240208BHJP
【FI】
G06F16/90 100
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022124767
(22)【出願日】2022-08-04
(71)【出願人】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(71)【出願人】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(72)【発明者】
【氏名】田中 靖大
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175EA01
(57)【要約】
【課題】 ユーザが望む情報を効率的に提示すること
【解決手段】 文書から質問及び回答を抽出する抽出手段と、
ユーザから受け付けた検索クエリを用いて、前記文書と前記抽出された質問及び回答とに対して検索を行う検索手段と、
前記検索手段により検索された文書を表示し、前記検索手段により検索された質問及び回答を当該質問及び回答の抽出元である文書に対応付けて表示するよう制御する表示制御手段と、
を備えることを特徴とする情報処理装置。
【選択図】
図1
【特許請求の範囲】
【請求項1】
文書から質問及び回答を抽出する抽出手段と、
ユーザから受け付けた検索クエリを用いて、前記文書と前記抽出された質問及び回答とに対して検索を行う検索手段と、
前記検索手段により検索された文書を表示し、前記検索手段により検索された質問及び回答を当該質問及び回答の抽出元である文書に対応付けて表示するよう制御する表示制御手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記表示制御手段は、前記検索された質問及び回答の全文を、当該質問及び回答の抽出元である文書と対応付けて表示するよう制御することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記表示制御手段は、前記検索された質問及び回答の抽出元である文書の内容をスニペット表示するよう制御することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記検索クエリと検索対象との一致度を示す検索スコアを算出する算出手段を備え、
前記表示制御手段は、前記検索スコアの高い質問及び回答を含む文書を優先して表示制御することを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記検索の結果として表示される文書に含まれる質問及び回答のうち、前記検索スコアの高い質問及び回答を優先して表示するよう制御することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記文書は、一つの文書ファイルのうち所定の条件により特定されるセクションであることを特徴とする請求項1に記載の情報処理装置。
【請求項7】
情報処理装置の抽出手段が、文書から質問及び回答を抽出する抽出工程と、
前記情報処理装置の検索手段が、ユーザから受け付けた検索クエリを用いて、前記文書と前記抽出された質問及び回答とに対して検索を行う検索工程と、
前記情報処理装置の表示制御手段が、前記検索工程により検索された文書を表示し、前記検索工程により検索された質問及び回答を当該質問及び回答の抽出元である文書に対応付けて表示するよう制御する表示制御工程と、
を備えることを特徴とする情報処理。
【請求項8】
コンピュータを、
文書から質問及び回答を抽出する抽出手段と、
ユーザから受け付けた検索クエリを用いて、前記文書と前記抽出された質問及び回答とに対して検索を行う検索手段と、
前記検索手段により検索された文書を表示し、前記検索手段により検索された質問及び回答を当該質問及び回答の抽出元である文書に対応付けて表示するよう制御する表示制御手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラムに関する。
【背景技術】
【0002】
近年、コールセンターや製品サポートにおいて、オペレーション業務を管理するシステムが一般的になっている。オペレーション業務で発生した顧客からの質問とそれに対する回答は蓄積され、FAQ(よくある質問と回答)としてまとめられ、FAQ検索やチャットボットで活用されている。
【0003】
しかしながら、企業などにおける組織内の業務に対しては、ヘルプデスクやコールセンターのように専任者を配置するのはコスト面から難しく、対象も多様であることから各々の業務担当部門がヘルプデスクの役割を担うことも少なくない。このため業務に対するFAQは作成されたとしても、各担当部門が各々作成している程度で、組織全体で統一的に管理されているケースは少ないのが現状である。
【先行技術文献】
【特許文献】
【0004】
【発明の開示】
【発明が解決しようとする課題】
【0005】
特許文献1には、文書から質問内容部分及び回答部分を特定して抽出し、抽出された質問内容部分と回答内容部分とを対応付けてデータベースに格納し、ユーザから受け付けた質問に対する回答をデータベースから検索して出力することが開示されている。
【0006】
特許文献1に開示された技術おける検索は、FAQとして整備されている知識を収集して検索対象とするものであり、FAQ化されていない有用な情報を取得できないという課題がある。
【0007】
そこで、本発明は、ユーザが望む情報を効率的に提示できる仕組みを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明は、文書から質問及び回答を抽出する抽出手段と、
ユーザから受け付けた検索クエリを用いて、前記文書と前記抽出された質問及び回答とに対して検索を行う検索手段と、
前記検索手段により検索された文書を表示し、前記検索手段により検索された質問及び回答を当該質問及び回答の抽出元である文書に対応付けて表示するよう制御する表示制御手段と、
を備えることを特徴とする。
【発明の効果】
【0009】
本発明によれば、ユーザが望む情報を効率的に提示できる仕組みを提供することが可能となる。
【図面の簡単な説明】
【0010】
【
図1】本発明の実施形態における、FAQ収集検索装置のシステム構成の一例を示す図である。
【
図2】本発明の実施形態における、FAQ収集検索装置、文書管理装置、FAQ検索端末のハードウェア構成の一例を示すブロック図である。
【
図3】本発明の実施形態における、FAQ収集検索装置の機能構成の一例を示す図である。
【
図4】本発明の実施形態における、文書・FAQ検索インデックスを構築する処理の一例を示すフローチャートである。
【
図5】本発明の実施形態における、文書保存領域の構成の一例を示す図である。
【
図6】本発明の実施形態における、文書からFAQを抽出する処理の一例を示すフローチャートである。
【
図7】本発明の実施形態における、質問及び回答の質問および回答ラベルを判定する正規表現の一例を示す図である。
【
図8】本発明の実施形態における、質問及び回答抽出の対象となる文書の一例を示す図である。
【
図9】本発明の実施形態における、文書・FAQ検索インデックスの一例を示す図である。
【
図10】本発明の実施形態における、検索処理の一例を示すフローチャートである。
【
図11】本発明の実施形態における、検索画面の一例を示す図である。
【
図12】本発明の実施形態における、検索結果の一例を示す図である。
【
図13】本発明の実施形態における、検索結果を集約した集約結果の一例を示す図である。
【発明を実施するための形態】
【0011】
図1は、本発明の実施形態におけるFAQ収集検索装置のシステム構成の一例を示す図である。FAQ収集検索装置100は、文書管理装置110およびFAQ検索端末120とネットワークを介して接続される構成となっている。
【0012】
文書管理装置110は、情報の共有を目的として、イントラネットやインターネットに各種文書を公開する機能を提供する。
【0013】
FAQ収集検索装置100は、文書管理装置110が管理する文書集合から質問及び回答となる部分を抽出して検索する機能を提供する。FAQ検索端末120は、FAQ収集検索装置100に検索要求を送り、検索要求に対する結果を表示する。
【0014】
図2は、本発明のサーバ装置101やクライアント端末102として適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。
【0015】
図2に示すように、情報処理装置は、システムバス200を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
【0016】
CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。
【0017】
ROM202あるいは外部メモリ213は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
【0018】
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
【0019】
入力コントローラ205は、キーボード210や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
【0020】
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
【0021】
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
【0022】
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
【0023】
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
【0024】
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。
【0025】
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ212上での表示を可能としている。また、CPU201は、ディスプレイ212上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0026】
図3は本発明の情報処理システムの機能を示す図である。
【0027】
文書収集処理部301は文書管理装置110の文書集合310から文書を収集し、文書保存領域302に保存する機能を備える。
【0028】
FAQ抽出処理部303は文書保存領域302に保存された文書から質問及び回答を抽出して検索可能な状態にするインデックス構築処理を行う機能を備える。
【0029】
検索処理部304は、FAQ検索端末120のブラウザ320を介してユーザから受け付けた検索要求に対して、文書・FAQ検索インデックス502を用いた検索処理を行う機能を備える。
【0030】
次に
図4のフローチャートを用いて、本発明の実施形態におけるFAQ抽出処理部303が実行する処理について説明する。
【0031】
図4のフローチャートは、FAQ収集検索装置100のCPU201が所定の制御プログラムを読み出して実行する処理であり、文書収集処理部301が文書管理装置110から収集し、文書保存領域302の文書保存テーブル501に保存した文書から質問及び回答を抽出して検索可能な状態にするインデックス構築処理を示すフローチャートである。
【0032】
文書収集処理部301が文書管理装置110から文書を取得する方法に関しては特に規定しない。文書管理システムの管理情報を用いても構わないし、特定のページを始点として文書内のリンクを再帰的にクロールしても構わない。
【0033】
ステップS401で、FAQ抽出処理部303は、取得した文書に対して、ステップS405までの繰り返し処理を開始する。
【0034】
ステップS402で、FAQ抽出処理部303は、処理対象の文書からタイトル、本文を抽出し書誌情報とともに、文書保存領域302における文書・FAQ検索インデックス502に登録する。書誌情報にはレコードの種別として「文書」を追加する。
【0035】
ステップS403で、FAQ抽出処理部303は、処理対象の文書から質問及び回答を抽出する。質問及び回答の抽出処理については後述する。
【0036】
ステップS404で、FAQ抽出処理部303は、ステップS403で抽出した質問及び回答に対して、質問文をタイトル、回答文を本文として書誌情報とともに文書・FAQ検索インデックス502に登録する。書誌情報にはレコードの種別として「FAQ」を追加し、文書のタイトルをコンテキストとして追加する。
【0037】
ステップS405で、FAQ抽出処理部303は、処理対象となる文書がまだあれば、ステップS401からの繰り返し処理を実施する。処理対象となる文書がなければ、処理を終了する。
【0038】
次に
図6のフローチャートを用いて、ステップS403のFAQ抽出処理について説明する。
本発明の実施形態においては、各種フォーマットの文書から抽出したテキストから質問及び回答を抽出する例を示すが、文書ごとにフォーマットに応じて文書構造を特定し、文書構造に応じて質問及び回答を抽出するように構成しても構わない。
【0039】
ステップS601で、FAQ抽出処理部303は、返却領域を初期化する。
【0040】
ステップS602で、FAQ抽出処理部303は、一時領域を初期化する。
【0041】
ステップS603で、FAQ抽出処理部303は、処理対象の文書の行に対して、ステップS612までの繰り返し処理を開始する。
【0042】
ステップS604で、FAQ抽出処理部303は、対象の行が空行であるか、行が質問ラベル条件に合致した場合、ステップS605に処理を移す。空行でなく質問ラベル条件に合致しない場合、ステップS608に処理を移す。
図7の正規表現701に質問ラベル条件の一例を示す。
【0043】
ステップS605で、FAQ抽出処理部303は、一時領域が空であれば、ステップS607に処理を移す。一時領域が空でなければ、ステップS606に処理を移す。
【0044】
ステップS606で、FAQ抽出処理部303は、一時領域に保存されている質問及び回答を返却領域に保存し、一時領域を初期化する。回答文または質問文のいずれかがない場合は、返却領域に保存せず、一時領域を初期化する。
【0045】
ステップS607で、FAQ抽出処理部303は、行から質問文を抽出して一時領域の質問文に追加する。空行など質問文が抽出できない場合は何もしない。
【0046】
ステップS608で、FAQ抽出処理部303は、対象の行が回答ラベル条件に合致した場合、ステップS609に処理を移す。回答ラベル条件に合致しない場合、ステップS610に処理を移す。
図7の正規表現702に回答ラベル条件の一例を示す。
【0047】
ステップS609で、FAQ抽出処理部303は、行から回答文を抽出して一時領域の回答文に追加する。回答文が抽出できない場合は何もしない。
【0048】
ステップS610で、FAQ抽出処理部303は、一時領域が空であれば、ステップS612に処理を移す。一時領域が空でなければ、ステップS611に処理を移す。
【0049】
ステップS611で、FAQ抽出処理部303は、一時領域の末尾に行を追加する。一時領域に回答文がない場合は、質問文が末尾となり、質問文に追加する。一時領域に回答文がある場合は、回答文が末尾となり、回答文に追加する。
【0050】
ステップS612で、FAQ抽出処理部303は、処理対象となる行がまだあれば、ステップS603からの繰り返し処理を実施する。処理対象となる行がなければ、処理を終了する。
【0051】
ステップS613で、FAQ抽出処理部303は、返却領域の質問及び回答を呼び出し元に返す。
【0052】
次にインデックス構築処理の具体例として、
図8に示す文書保存テーブル501に保存した文書に対して、
図4に示すインデックス構築処理が実施された場合について説明する。
【0053】
ステップS401で、FAQ抽出処理部303は、文書801に対して、ステップS405までの繰り返し処理を開始する。
【0054】
ステップS402で、FAQ抽出処理部303は、処理対象の文書801からファイルパス804からファイル名「XX-200ユーザーズがイド」をタイトルとして抽出し、ファイルパス804の実体から本文を抽出する。なお、タイトルとして抽出する対象としてはファイル名に限らず、ファイルの冒頭に記載された文字列など所定の条件を満たす文字列をタイトルとして抽出しても良い。また後述の通りセクションごとに登録する場合には、当該セクションごとにタイトルを抽出するものとする。
【0055】
抽出したタイトルと本文と、文書801の文書ID802と取得元を示すURL803を書誌情報とし、更にレコードの「種別」として「文書」を付与して、
図9に示す文書・FAQ検索インデックス502に登録する(901)。
【0056】
ステップS403で、FAQ抽出処理部303は、処理対象の文書801に対して、
図6に示すFAQ抽出処理を実行して質問及び回答を抽出する。
【0057】
ステップS601で、FAQ抽出処理部303は、返却領域を初期化する。
ステップS602で、FAQ抽出処理部303は、一時領域を初期化する。
【0058】
ステップS603で、FAQ抽出処理部303は、文書810の行811に対して、ステップS612までの繰り返し処理を開始する。
【0059】
ステップS604で、FAQ抽出処理部303は、対象の行811が空行ではなく、質問ラベル条件701にも合致しないので、ステップS608に処理を移す。
【0060】
ステップS608で、FAQ抽出処理部303は、対象の行811が回答ラベル条件702に合致しないので、ステップS610に処理を移す。
【0061】
ステップS610で、FAQ抽出処理部303は、一時領域が空でなので、ステップS612に処理を移す。
【0062】
ステップS612で、FAQ抽出処理部303は、処理対象となる行がまだあるので、ステップS603からの繰り返し処理を実施する。
【0063】
同様の処理を行812まで繰り返す。
【0064】
ステップS603で、FAQ抽出処理部303は、文書801の行812に対して、ステップS612までの繰り返し処理を開始する。
【0065】
ステップS604で、FAQ抽出処理部303は、対象の行812が質問ラベル条件701に合致する(813)ので、ステップS605に処理を移す。
【0066】
ステップS605で、FAQ抽出処理部303は、一時領域が空なので、ステップS607に処理を移す。
【0067】
ステップS607で、FAQ抽出処理部303は、行812から質問文「使用可能なレンズの種類は?」を抽出して一時領域に質問文として追加する。
【0068】
ステップS612で、FAQ抽出処理部303は、処理対象となる行814がまだあるので、ステップS603からの繰り返し処理を実施する。
【0069】
ステップS603で、FAQ抽出処理部303は、文書801の行814に対して、ステップS612までの繰り返し処理を開始する。
【0070】
ステップS604で、FAQ抽出処理部303は、対象の行814が空行ではなく、質問ラベル条件701にも合致しないので、ステップS608に処理を移す。
【0071】
ステップS608で、FAQ抽出処理部303は、対象の行814が回答ラベル条件702に合致する(815)ので、ステップS609に処理を移す。
【0072】
ステップS609で、FAQ抽出処理部303は、行813から回答文「Sシリーズ、Mシリーズはそのまま使用できます。」を抽出して一時領域に回答文として追加する。
【0073】
ステップS612で、FAQ抽出処理部303は、処理対象となる行816がまだあるので、ステップS603からの繰り返し処理を実施する。
【0074】
ステップS603で、FAQ抽出処理部303は、文書810の行816に対して、ステップS612までの繰り返し処理を開始する。
【0075】
ステップS604で、FAQ抽出処理部303は、対象の行816が空行ではなく、質問ラベル条件701に合致しないので、ステップS608に処理を移す。
【0076】
ステップS608で、FAQ抽出処理部303は、対象の行816が回答ラベル条件702に合致しないので、ステップS610に処理を移す。
【0077】
ステップS610で、FAQ抽出処理部303は、一時領域が空ではないので、ステップS611に処理を移す。
【0078】
ステップS611で、FAQ抽出処理部303は、一時領域に回答文があるので、回答文に「Rシリーズはアダプタを使うことで利用できます。」を追加する。
【0079】
ステップS612で、FAQ抽出処理部303は、処理対象となる行817がまだあるので、ステップS603からの繰り返し処理を実施する。
【0080】
ステップS603で、FAQ抽出処理部303は、文書801の行817に対して、ステップS612までの繰り返し処理を開始する。
【0081】
ステップS604で、FAQ抽出処理部303は、対象の行が空行なので、ステップS605に処理を移す。
【0082】
ステップS605で、FAQ抽出処理部303は、一時領域が空ではないので、ステップS606に処理を移す。
【0083】
ステップS606で、FAQ抽出処理部303は、一時領域に保存されている質問及び回答を返却領域に保存し、一時領域を初期化する。
【0084】
ステップS607で、FAQ抽出処理部303は、行817から質問文を抽出しようとするが、空行であり質問文が抽出できないので何もしない。
【0085】
以下同様のステップを繰り返し、行818、819からそれぞれ質問及び回答を抽出して返却領域に保存し、ステップS612に処理を移す。
【0086】
ステップS613で、FAQ抽出処理部303は、返却領域のFAQをステップS403に返す。
【0087】
ステップS404で、FAQ抽出処理部303は、ステップS403で抽出した質問及び回答の質問文をタイトル、回答文を本文として書誌情報とともに文書・FAQ検索インデックス502に登録する。書誌情報にはレコードの種別として「FAQ」を追加し、文書のタイトル「XX-200ユーザーズがイド」をコンテキストとして追加する(902~904)。
【0088】
ステップS405で、FAQ抽出処理部303は、処理対象となる文書805がまだあるので、ステップS401からの繰り返し処理を実施する。
【0089】
以下同様の処理を実施してインデックスを構築し、コンテキスト、タイトル、本文に対して全文検索ができるようになる。
【0090】
次に
図10のフローチャートを用いて、本発明の実施形態における検索処理部304が実行する処理について説明する。
【0091】
図10のフローチャートは、FAQ収集検索装置100のCPU201が所定の制御プログラムを読み出して実行する処理であり、FAQ検索端末120のブラウザ320からの検索要求に対して、文書・FAQ検索インデックス502を用いた検索処理を示すフローチャートである。
【0092】
ステップS1001で、検索処理部304は、ブラウザ320に検索画面を表示し、検索クエリを取得する。
【0093】
ステップS1002で、検索処理部304は、ステップS1001で受け取った検索クエリを用いて、文書・FAQ検索インデックス502に対して検索を実行し、検索結果を取得する。
【0094】
本発明の実施形態においては、検索は、文書・FAQ検索インデックス502に登録されたレコードの「タイトル」「本文」「コンテキスト」それぞれに対して、検索クエリに一致する度合いをスコアとして算出し、得られたスコアの合計をレコード全体に対するスコアとし、スコア順に検索結果を並べる。
【0095】
ステップS1003で、検索処理部304は、ステップS1002で取得した検索結果を文書IDで集約する。集約された検索結果文書を集約後のスコア順に並べる。集約後の文書に対するスコアは集約したレコードに対するスコアの最大値とする。
【0096】
ステップS1004で、検索処理部304は、ステップS1003で集約した検索結果を並び順に表示する。集約した結果に含まれるレコードのうち種別が「FAQ」である場合は、FAQであることを強調して表示する。
【0097】
次に、検索処理の具体例として、
図9に示した文書・FAQ検索インデックス502に対して、
図10に示す検索処理実施された場合について説明する。
【0098】
ステップS1001で、検索処理部304は、ブラウザ320に、
図11に示す検索画面1101を表示する。
【0099】
利用者が検索クエリとして「XX-200 R-100mmF4.0 使える」を入力し、検索ボタン1102を押下すると、検索処理部304は、検索クエリとして「XX-200 R-100mmF4.0 使える」を取得する。
【0100】
ステップS1002で、検索処理部304は、ステップS1001で受け取った検索クエリ「XX-200 R-100mmF4.0 使える」を用いて、文書・FAQ検索インデックス502に対して検索を実行し、
図12に示す検索結果1201を取得する。
【0101】
ステップS1003で、検索処理部304は、ステップS1002で取得した検索結果1201を文書IDで集約する。
図13に集約した結果を示す。
【0102】
検索結果1201におけるレコード1202とレコード1203文書IDが同じ「1」であり、集約結果1301においては検索結果文書に集約される。
【0103】
ステップS1004で、検索処理部304は、
図11に示すように、ステップS1003で集約した検索結果を検索結果表示領域1103に表示する。
【0104】
図11に示す通り、検索結果表示領域1103には、検索された文書を示す情報(例えば、「XX-200ユーザーズガイド」)と当該文書から抽出された質問及び回答(例えば「使用可能なレンズは?・・・」)とが対応付けて表示されている。
【0105】
検索された文書については、当該文書の内容を示すスニペット(文書の一部や要約)が表示され、質問及び回答については全文が表示されるものとする。なお、文書全体が短い(所定の文字数より少ない等)場合にはスニペット表示ではなく全文を表示しても良いし、質問及び回答について長文の場合(所定の文字数より多い場合等)には全文でなくスニペットでもよい。スニペット表示する場合は、検索クエリと一致する文字列の前後が表示されるようにすることが好ましい。
【0106】
また検索結果として表示される文書の表示順は、検索スコアの高い順となっており、同一文書内の質問及び回答の表示(
図11では一つの質問及び回答のみ表示されているが、一つの文書内に複数の質問及び回答が存在する場合は当該複数の質問及び回答が当該文書に対応付けて表示されるものとする)についても、検索スコアの高い順に表示されるものとする。
【0107】
また、集約結果1301において、種別が「FAQ」のレコード1302を強調表示(1104)する。
【0108】
本発明の実施形態においては、検索時のスコアを各要素の合計する構成として説明したが、抽出したFAQの質問文(または質問文と回答文)を検索クエリと見做した際に質問及び回答が上位にくるようにランキング学習を用いるよう構成してもよい。
【0109】
このように、質問及び回答抽出の対象となった文書集合に含まれる他の文書も検索対象に含め、検索語が質問及び回答に合致する場合に優先的に、かつ質問及び回答であることを明示的に提示することで、整備された質問及び回答だけでなく、未整備の質問及び回答や質問及び回答化されていない有用な情報も同時に検索することが可能となる。
【0110】
また、本発明の実施形態においては、質問及び回答以外の文書は、文書全体を一つのレコードとして扱う構成として説明したが、文書をセクションなど構成要素に分割して、構成要素をレコードとするよう構成してもよい。
【0111】
以上、実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0112】
また、本発明におけるプログラムは、
図3に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は
図3の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは
図3の各装置の処理方法ごとのプログラムであってもよい。
【0113】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0114】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0115】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0116】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0117】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0118】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0119】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【符号の説明】
【0120】
100 FAQ収集検索装置
110 文書管理装置
120 FAQ検索端末
130 LAN