特許6040819 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

特許6040819情報処理装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6040819

(24)【登録日】2016年11月18日

(45)【発行日】2016年12月7日

(54)【発明の名称】情報処理装置及びプログラム

(51)【国際特許分類】

G10L 15/10 20060101AFI20161128BHJP

G10L 15/22 20060101ALI20161128BHJP

G10L 15/00 20130101ALI20161128BHJP

【ＦＩ】

G10L15/10 200W

G10L15/22 460Z

G10L15/00 200A

【請求項の数】8

【全頁数】15

(21)【出願番号】特願2013-59093(P2013-59093)

(22)【出願日】2013年3月21日

(65)【公開番号】特開2014-186061(P2014-186061A)

(43)【公開日】2014年10月2日

【審査請求日】2015年3月6日

(73)【特許権者】

【識別番号】000005496

【氏名又は名称】富士ゼロックス株式会社

(74)【代理人】

【識別番号】110000154

【氏名又は名称】特許業務法人はるか国際特許事務所

(72)【発明者】

【氏名】外池昌嗣

(72)【発明者】

【氏名】増市博

【審査官】安田勇太

(56)【参考文献】

【文献】特開２０１２−０３２５６２（ＪＰ，Ａ）

【文献】国際公開第２００８／０５０６４９（ＷＯ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１５／００ −１５／３４

(57)【特許請求の範囲】

【請求項1】

通話の内容を記録したテキスト文書に含まれる複数の単位テキストそれぞれに関する形態素解析処理の結果と、音声データにより示される前記通話において発された複数の発話音声それぞれに関する音声認識処理の結果と、に基づき、前記単位テキストをいずれかの前記発話音声に関連づける関連づけ手段と、
前記テキスト文書に含まれる前記複数の単位テキストにおいて、前記複数の発話音声のうちの予め定められた重要語の音声を含む発話音声である重要発話音声の前の発話音声に関連づけられた前記単位テキストたる第１テキストと、前記重要発話音声の後の発話音声に関連づけられた前記単位テキストたる第２テキストと、の間に、前記重要語の文字列を含む前記単位テキストが存在するか否かを判定する判定手段と、
を含む情報処理装置。

【請求項2】

前記第１テキストと前記第２テキストとの間に、前記重要語の文字列を含む前記単位テキストが存在しないと判定された場合に、その旨を出力することを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記テキスト文書を表示手段に表示させる表示制御手段をさらに含み、
前記表示制御手段は、
前記第１テキストと前記第２テキストとの間に、前記重要語の文字列を含む前記単位テキストがない場合、前記テキスト文書とともに、前記重要語を示す情報を、前記表示手段に表示させること、
を特徴とする請求項２に記載の情報処理装置。

【請求項4】

前記第１テキストと前記第２テキストとの間に、前記重要語の文字列と予め定められた関係を有する文字列である代替文字列を含む前記単位テキストがあるか否かを判定する手段をさらに含み、
前記表示手段は、
前記第１テキストと前記第２テキストとの間に、前記代替文字列を含む前記単位テキストがある場合、前記テキスト文書とともに、前記重要語と前記代替文字列とを示す情報を、前記表示手段に表示させること、
を特徴とする請求項３に記載の情報処理装置。

【請求項5】

前記第１テキストと前記第２テキストとの間に、前記代替文字列を含む前記単位テキストがある場合、前記テキスト文書を更新し、前記第１テキストと前記第２テキストとの間に存在する前記単位テキストに含まれる前記代替文字列を、前記重要語の文字列に修正する手段をさらに含むこと、
を特徴とする請求項４に記載の情報処理装置。

【請求項6】

形態素解析処理により、前記単位テキストに含まれる自立語を抽出する自立語抽出手段と、
音声認識処理により、前記発話音声で発される、前記自立語抽出手段により抽出された自立語を特定する自立語特定手段と、
をさらに含み、
前記関連づけ手段は、
前記単位テキストを、その単位テキストに含まれる自立語と同一の自立語が発される前記発話音声に関連づけること、
を特徴とする請求項１乃至５のいずれかに記載の情報処理装置。

【請求項7】

前記複数の発話音声を示す前記音声データを取得する音声取得手段をさらに含むことを特徴とする請求項１乃至６のいずれかに記載の情報処理装置。

【請求項8】

前記通話の内容を記録したテキスト文書に含まれる複数の単位テキストそれぞれに関する形態素解析処理の結果と、音声データにより示される前記通話において発された複数の前記発話音声それぞれに関する音声認識処理の結果と、に基づき、前記単位テキストをいずれかの発話音声に関連づける関連づけ手段、
前記テキスト文書に含まれる前記複数の単位テキストにおいて、前記複数の発話音声のうちの予め定められた重要語の音声を含む発話音声である重要発話音声の前の発話音声に関連づけられた前記単位テキストたる第１テキストと、前記重要発話音声の後の発話音声に関連づけられた前記単位テキストたる第２テキストと、の間に、前記重要語の文字列を含む前記単位テキストが存在するか否かを判定する判定手段、
としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置及びプログラムに関する。

【背景技術】

【0002】

下記特許文献１には、オペレータの通話音声に含まれるキーワードから、複数の入力項目のうちで、オペレータによるデータ入力がなされるべき入力項目を特定し、特定した入力項目にデータが入力されているか否かを判別すること、が記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１２−３２５６２号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

本発明の目的は、通話において発された重要語が通話の内容を記録したテキスト文書中のしかるべき場所に記載されているか否かを判別することである。

【課題を解決するための手段】

【0005】

上記課題を解決するために、請求項１に記載の情報処理装置は、通話の内容を記録したテキスト文書に含まれる複数の単位テキストそれぞれに関する形態素解析処理の結果と、音声データにより示される前記通話において発された複数の発話音声それぞれに関する音声認識処理の結果と、に基づき、各単位テキストを、いずれかの発話音声に関連づける関連づけ手段と、前記複数の発話音声のうちの予め定められた重要語の音声を含む発話音声である重要発話音声、の前の発話音声に関連づけられた単位テキストたる第１テキストと、前記重要発話音声の後の発話音声に関連づけられた単位テキストたる第２テキストと、の間に、前記重要語の文字列を含む単位テキストが存在するか否かを判定する判定手段と、を含む。

【0006】

また、請求項２に記載の情報処理装置は、請求項１に記載の情報処理装置において、前記第１テキストと前記第２テキストとの間に、前記重要語の文字列を含む単位テキストが存在しないと判定された場合に、その旨を出力することを特徴としている。

【0007】

また、請求項３に記載の情報処理装置は、請求項２に記載の情報処理装置に、前記テキスト文書を表示手段に表示させる表示制御手段をさらに備えさせ、前記表示制御手段が、前記第１テキストと前記第２テキストとの間に、前記重要語の文字列を含む単位テキストがない場合、前記テキスト文書とともに、前記重要語を示す情報を、前記表示手段に表示させること、を特徴としている。

【0008】

また、請求項４に記載の情報処理装置は、請求項３に記載の情報処理装置に、前記第１テキストと前記第２テキストとの間に、前記重要語の文字列と予め定められた関係を有する文字列である代替文字列を含む単位テキストがあるか否かを判定する手段をさらに備えさせ、前記表示制御手段が、前記第１テキストと前記第２テキストとの間に、前記代替文字列を含む単位テキストがある場合、前記テキスト文書とともに、前記重要語と前記代替文字列とを示す情報を、前記表示手段に表示させること、を特徴としている。

【0009】

また、請求項５に記載の情報処理装置は、請求項４に記載の情報処理装置に、前記第１テキストと前記第２テキストとの間に、前記代替文字列を含む単位テキストがある場合、前記テキスト文書を更新し、前記第１テキストと前記第２テキストとの間に存在する単位テキストに含まれる前記代替文字列を、前記重要語の文字列に修正する手段、をさらに備えさせたことを特徴としている。

【0010】

また、請求項６に記載の情報処理装置は、請求項１乃至５のいずれかに記載の情報処理装置に、形態素解析処理により、各単位テキストに含まれる自立語を抽出する自立語抽出手段と、音声認識処理により、各発話音声で発される、前記自立語抽出手段により抽出された自立語を特定する自立語特定手段と、をさらに備えさせ、前記関連づけ手段が、各単位テキストを、その単位テキストに含まれる自立語と同一の自立語が発される発話音声に関連づけることを特徴としている。

【0011】

また、請求項７に記載の情報処理装置は、請求項１乃至６のいずれかに記載の情報処理装置に、前記複数の発話音声を示す前記音声データを取得する音声取得手段をさらに備えさせたことを特徴としている。

【0012】

上記課題を解決するために、請求項８に記載のプログラムは、通話の内容を記録したテキスト文書に含まれる複数の単位テキストそれぞれに関する形態素解析処理の結果と、音声データにより示される前記通話において発された複数の発話音声それぞれに関する音声認識処理の結果と、に基づき、各単位テキストをいずれかの発話音声に関連づける関連づけ手段、前記複数の発話音声のうちの予め定められた重要語の音声を含む発話音声である重要発話音声、の前の発話音声に関連づけられた単位テキストたる第１テキストと、前記重要発話音声の後の発話音声に関連づけられた単位テキストたる第２テキストと、の間に、前記重要語の文字列を含む単位テキストが存在するか否かを判定する判定手段、としてコンピュータを機能させる。

【発明の効果】

【0013】

請求項１、７、８の発明によれば、通話において発された重要語が通話の内容を記録したテキスト文書中のしかるべき場所に記載されているか否かを判別できる。

【0014】

請求項２の発明によれば、重要語がテキスト文書中のしかるべき場所に記載されていないことを、報知できる。

【0015】

請求項３の発明によれば、本構成を有しない場合と比較して、重要語がテキスト文書中のしかるべき場所に記載されていないことを、より詳しく報知できる。

【0016】

請求項４の発明によれば、例えば、重要語がテキスト文書中のしかるべき場所に記載されているものの、重要語が正しく記載されていないことを、報知できる。

【0017】

請求項５の発明によれば、例えば、しかるべき場所に記載されている重要語の誤りを訂正できる。

【0018】

請求項６の発明によれば、重要語が記録されるべきテキスト文書中の場所を、本構成を有しない場合と比較して、より正確に特定できる。

【図面の簡単な説明】

【0019】

【図1】情報処理装置のハードウェア構成の一例を示す図である。

【図2】情報処理装置で実現される機能群を示す機能ブロック図である。

【図3】音声データの一例を示す図である。

【図4】一部の発話音声の一例を示す図である。

【図5】テキスト文書の内容の一例を示す図である。

【図6】重要リストの一例を示す図である。

【図7】キーワード記憶部の記憶内容を示す図である。

【図8】単語ラティスの一例を示す図である。

【図9】ワードスポッティング結果記憶部の記憶内容を示す図である。

【図10】情報処理装置で実行される処理を示すフロー図である。

【図11】対象テキストが発話音声に関連づけられる様子を示す概念図である。

【図12】情報処理装置で実行される処理を示すフロー図である。

【図13】表示部に表示される画像を示す図である。

【図14】情報処理装置で実行される処理を示すフロー図である。

【図15】表示部に表示される画像を示す図である。

【発明を実施するための形態】

【0020】

以下、本発明の実施形態の例について図面に基づき詳細に説明する。

【0021】

図１は、本発明の実施形態に係る情報処理装置２のハードウェア構成を示す図である。情報処理装置２は、制御部４、主記憶６、ハードディスク８、表示部１０、及び操作入力部１２等を備えたコンピュータとして実現される。本実施形態の場合、情報処理装置２は、製造業者により利用される。

【0022】

制御部４は、マイクロプロセッサであり、主記憶６に格納されるプログラムに従って各種情報処理を実行する。主記憶６は、ＲＯＭ及びＲＡＭによって実現され、上記プログラムの他、各種情報処理に必要な情報を格納する。ここで、上記プログラムは、コンピュータ読み取り可能な情報記憶媒体（例えば、ＤＶＤ（登録商標）−ＲＯＭ）から読み出されて主記憶６に格納される。上記プログラムは、ネットワークを介してダウンロードされて主記憶６に格納されてもよい。

【0023】

ハードディスク８は、各種情報を記憶する。ハードディスク８に記憶される情報については後述する。表示部１０は、液晶ディスプレイ等のディスプレイであり、制御部４の命令に従い、情報を表示する。

【0024】

また、操作入力部１２は、マウス及びキーボード等であり、情報処理装置２の管理者が実行した操作内容を示す信号を、制御部４に渡す。

【0025】

図２は、情報処理装置２で実現される機能群を示す機能ブロック図である。情報処理装置２では、通話音声データ記憶部８ａ、通話要約記憶部８ｂ、及び重要語記憶部８ｃが実現される。これらは、ハードディスク８により実現される。

【0026】

また、情報処理装置２では、さらに、キーワード記憶部６ａ、ワードスポッティング結果記憶部６ｂ、及びペア記憶部６ｃが実現される。これらは、主記憶６により実現される。

【0027】

また、情報処理装置２では、さらに、キーワード抽出部４ａ、音声認識部４ｂ、ワードスポッティング部４ｃ、関連づけ実行部４ｄ、重要発話音声特定部４ｅ、第１対象テキスト特定部４ｆ、第２対象テキスト特定部４ｇ、重要語有無判定部４ｈ、及び通話要約表示部４ｆが実現される。これらは、管理者により通話要約表示操作が行われた場合に制御部４が上記プログラムに従い情報処理を実行することによって実現される。

【0028】

[通話音声データ記憶部]
通話音声データ記憶部８ａは、製造業者のコールセンターで働くオペレータが、顧客との通話において発した一連の発話音声を示す音声データである通話音声データ１４を記憶している。通話音声データ１４は、通話中にオペレータが電話の受話器に入力した音声の録音データである。

【0029】

図３は、通話音声データ１４の一例を示す図である。矢印は、通話開始からの時間経過を示す。通話音声データ１４は、オペレータが発した一連の発話音声に係る音声部分を含む。オペレータが発話を行っていない部分をハッチングしている。通話音声データ１４には、各発話音声の開始タイミング及び終了タイミングが記録されている。また、本実施形態の場合、各発話音声には先頭から通し番号（以下、発話番号と表記する）が付与されており、通話音声データ１４には、各発話音声の発話番号が記録されている。図４に、一部の発話音声の一例を示した。図４では、各発話音声の左に発話番号を記載している。

【0030】

[通話要約記憶部]
通話要約記憶部８ｂは、通話要約データを記憶している。通話要約データは、顧客との通話が終了した後、通話内容を思い出しながらオペレータが作成したテキスト文書を示す文書データである。テキスト文書には、通話の内容が記録され、複数の文それぞれのテキスト（以下、テキスト文と表記する）が含まれる。すなわち、テキスト文書には、オペレータの発話部分に係る複数のテキスト文（複数の単位テキストに相当）と、顧客の発話部分に係る複数のテキスト文と、が含まれる。本実施形態の場合、文書データには、各テキスト文がオペレータと顧客とのうちのどちらの発話部分に係るテキスト文なのかを示す情報が含まれる。図５に、テキスト文書の内容の一例を示した。本実施形態の場合、一つの行に記載の文字列が一つのテキスト文となる。なお、図５では、便宜上、各テキスト文の左に通し番号を記載している。また、図５では、便宜上、オペレータの発話部分に係るテキスト文を太字で示している。

【0031】

以下、オペレータの発話部分に係るテキスト文のことを、対象テキストと表記する。

【0032】

[重要語記憶部]
重要語記憶部８ｃは、重要語リストを記憶している。重要語リストは、管理者により予め登録されている複数の重要語を示すデータである。また、重要語リストは、各重要語の読み方も示す。図６は、重要語リストの一例を示す図である。同図に示すように、重要語リストは、重要語ごとに、その重要語の文字列と、その重要語の読み方を示す音素と、を関連付けて記憶している。

【0033】

なお、重要語リストが表す各重要語の文字列及び音素は、音声認識のための単語辞書に予め登録されている。

【0034】

通話音声データ、通話要約データ、及び重要語リストは、上述した通話要約表示操作が行われた場合に、制御部４（音声取得手段）により読み出される。

【0035】

次に、キーワード抽出部４ａ、音声認識部４ｂ、ワードスポッティング部４ｃ、関連づけ実行部４ｄ、及び重要発話音声特定部４ｅについて説明する。

【0036】

[キーワード抽出部]
キーワード抽出部４ａは、各対象テキストに対して形態素解析処理を行い、各対象テキストに含まれる自立語をキーワードとして抽出する。

【0037】

本実施形態の場合、キーワード抽出部４ａは、まず、テキスト文書中の各テキスト文に対して、先頭のテキスト文から通し番号（以下、文番号と表記する）を付与する。その後、キーワード抽出部４ａは、テキスト文書中の対象テキストごとに、形態素解析処理を行ってその対象テキストに含まれる自立語をキーワードとして抽出するとともに、抽出したキーワードをその対象テキストの文番号と関連づけてキーワード記憶部６ａに保存する。なお、形態素解析処理のための形態素解析器としては、MeCab、茶筌、及びJUMANなどが用いられる。図７に、キーワード記憶部６ａの記憶内容を示した。括弧内の数字は、文番号を示している。また、文番号の右側に、その文番号の対象テキストから抽出されたキーワードを示している。

【0038】

[音声認識部]
音声認識部４ｂは、通話音声データに対して音声認識処理を実行する。本実施形態の場合、音声認識部４ｂは、オープンソースの音声認識エンジン「Julius」で用いられる音声認識アルゴリズムに従って、通話音声データに対して音声認識処理を実行する。これにより、音声認識部４ｂは、発話音声ごとに、音声認識処理の結果であるいわゆる単語ラティスを得る。また、音声認識部４ｂは、発話音声の発話番号に関連づけてその発話音声から得られた単語ラティスのデータを主記憶６に保存する。

【0039】

図８は、単語ラティスの一例を示す図である。同図に示すように、単語ラティスは、一つ一つの単語と、連接可能な単語を結ぶリンクと、を含むグラフを表す。一つ一つの単語がノードに対応している。矩形がノード（単語）を表し、矩形間を結ぶ線がリンクを表している。

【0040】

[ワードスポッティング部]
ワードスポッティング部４ｃは、発話音声ごとに、その発話音声で発される重要語及びキーワードを、その発話音声の発話番号に関連づけられた単語ラティスのデータに基づいて特定する。

【0041】

本実施形態では、ワードスポッティング部４ｃは、まず、キーワード記憶部６ａの記憶内容に基づいてキーワード抽出部４ａが各対象テキストから抽出したキーワードの集合（以下、キーワード集合と表記する）を示すデータを生成する。そして、ワードスポッティング部４ｃは、発話音声ごとに、その発話音声の発話番号に関連づけられた単語ラティスに含まれる重要語及びキーワード（すなわちその発話音声で発される重要語及びキーワード）を重要語リスト及びキーワード集合を示すデータに基づいて特定するとともに、特定した重要語及びキーワードをその発話音声の発話番号に関連づけてワードスポッティング結果記憶部６ｂに保存する。

【0042】

図９に、ワードスポッティング結果記憶部６ｂの記憶内容を示した。括弧内の数字は、発話番号を示している。また、発話番号の右側に、その発話番号の発話音声で発される重要語及びキーワードを示している。重要語及びキーワードは区別して記憶される。図９では、重要語に二重下線し、キーワードに一重下線している。

【0043】

[関連づけ実行部]
関連付け実行部４ｄは、各対象テキストを、いずれかの発話音声に関連づける。

【0044】

図１０は、関連づけ実行部４ｄにより実行される処理を示すフロー図である。まず、関連づけ実行部４ｄは、テキスト文書に含まれる複数の対象テキストを文番号の昇順にソートする（Ｓ１０１）。以下、「ｉ」番目の対象テキストのことを対象テキスト[ｉ]と表記する。

【0045】

また、関連づけ実行部４ｄは、発話音声集合を設定する（Ｓ１０２）。すなわち、Ｓ１０２で関連づけ実行部４ｄは、通話音声データが表す複数の発話音声全部を、発話音声集合の元として設定する。

【0046】

そして、一番目の対象テキスト[１]から順番にＳ１０３以降のステップが実行される。

【0047】

すなわち、関連づけ実行部４ｄは、発話音声集合に含まれる発話音声を発話番号の昇順にソートする（Ｓ１０３）。以下、「ｊ」番目の発話音声のことを発話音声[ｊ]と表記する。そして、関連づけ実行部４ｄは、一番目の発話音声[１]から順番にＳ１０４及びＳ１０５のステップを実行する。

【0048】

すなわち、関連づけ実行部４ｄは、対象テキスト[ｉ]と発話音声[ｊ]とで共有されるキーワードの数（以下、キーワード数と表記する）を計数する（Ｓ１０４）。より詳しくは、Ｓ１０４で関連づけ実行部４ｄは、対象テキスト[ｉ]の文番号に関連づけてキーワード記憶部６ａに記憶されるキーワードの集合と、発話音声[ｊ]の発話番号に関連づけてワードスポッティング結果記憶部６ｂに記憶されるキーワードの集合と、の両方に含まれるキーワードの数をキーワード数として計数する。

【0049】

また、関連づけ実行部４ｄは、Ｓ１０４で計数したキーワード数を、発話音声[ｊ]の発話番号に関連づけて主記憶６に保存する。こうして、発話音声集合中の全発話音声につきキーワード数が計数される。その後、関連づけ実行部４ｄは、主記憶６に記憶されるキーワード数のうちの最大のキーワード数に関連づけられた発話番号を特定し（Ｓ１０６）、特定した発話番号と対象テキスト[ｉ]の文番号とのペアをペア記憶部６ｃに保存する（Ｓ１０７）。なお、主記憶６に記憶されるキーワード数がすべて「０」の場合、Ｓ１０６及びＳ１０７はスキップされる。

【0050】

また、関連づけ実行部４ｄは、Ｓ１０６のステップで特定した発話番号以前の発話番号が付与された発話音声を、発話音声集合から削除する（Ｓ１０８）。

【0051】

図１１に、関連づけ実行部４ｄにより対象テキストが発話音声に関連づけられる様子を示す概念図を示した。各矢印が関連づけ先の発話音声を示している。同図によれば、発話番号が「３４」の発話音声に文番号が「２４」の対象テキストが関連づけられている。また、発話番号が「３８」の発話音声に文番号が「２５」の対象テキストが関連づけられている。発話番号が「４４」の発話音声に文番号が「２６」の対象テキストが関連づけられている。

【0052】

[重要発話音声特定部]
重要発話音声特定部４ｅは、通話音声データが表す複数の発話音声のうちで、いずれかの重要語の音声を含む発話音声である重要発話音声を特定する。本実施形態の場合、重要発話音声特定部４ｅは、ワードスポッティング結果記憶部６ｂの記憶内容に基づいて重要発話音声を特定する。より詳しくは、重要発話音声特定部４ｅは、ワードスポッティング結果記憶部６ｂに記憶される発話番号のうちで、いずれかの重要語に関連づけられている発話番号を１又は複数特定する。

【0053】

次に、第１対象テキスト特定部４ｆ、第２対象テキスト特定部４ｇ、重要語有無判定部４ｈ、及び通話要約表示部４ｆについて説明する。なお、以下、重要発話音声特定部４ｅにより特定された１又は複数の発話番号のうちの任意の発話番号、の発話音声のことを重要発話音声Ｘと呼ぶ。

【0054】

[第１対象テキスト特定部]
第１対象テキスト特定部４ｆは、重要発話音声Ｘより発話番号が前の発話音声、に関連づけられた対象テキスト（以下、第１対象テキストと表記する）を特定する。具体的には、第１対象テキスト特定部４ｆは、重要発話音声Ｘの発話番号より小さい発話番号を含むペアのうちで、最大の発話番号を含むペアを特定し、特定したペアに含まれる文番号を、第１対象テキストの文番号として特定する。例えば、図１１に示す発話番号「４１」の発話音声が重要発話音声Ｘである場合、発話番号「３８」の発話音声に関連づけられた、文番号「２５」の対象テキストが第１対象テキストとして特定される。

【0055】

[第２対象テキスト特定部]
第２対象テキスト特定部４ｇは、重要発話音声Ｘより発話番号が後の発話音声、に関連づけられた対象テキスト（以下、第２対象テキストと表記する）を特定する。具体的には、第２対象テキスト特定部４ｇは、重要発話音声Ｘの発話番号より大きい発話番号を含むペアのうちで、最小の発話番号を含むペアを特定し、特定したペアに含まれる文番号を、第２対象テキストの文番号として特定する。例えば、図１１に示す発話番号「４１」の発話音声が重要発話音声Ｘである場合、発話番号「４４」の発話音声に関連づけられた、文番号「２６」の対象テキストが第２対象テキストとして特定される。

【0056】

[重要語有無判定部]
重要語有無判定部４ｈは、第１対象テキストと第２対象テキストとの間に、重要発話音声Ｘで発される重要語、の文字列を含む対象テキストが存在するか否かを判定する。

【0057】

図１２は、重要語有無判定部４ｈにより実行される処理を示すフロー図である。まず、重要語有無判定部４ｈは、主記憶６に記憶されるフラグの値を「０」に設定する（Ｓ２０１）。また、重要語有無判定部４ｈは、第１対象テキストの文番号と第２対象テキストの文番号とが連番になっているか否かを判定する（Ｓ２０２）。第１対象テキストの文番号と第２対象テキストの文番号とが連番になっている場合（Ｓ２０２のＹＥＳ）、重要語有無判定部４ｈは、処理を終了する。

【0058】

一方、第１対象テキストの文番号と第２対象テキストの文番号とが連番になっていない場合（Ｓ２０２のＮＯ）、重要語有無判定部４ｈは、第１対象テキストの文番号と第２対象テキストの文番号との間の文番号の対象テキストを、文番号の昇順にソートする（Ｓ２０３）。以下、「ｉ」番目の対象テキストのことを対象テキスト[ｉ]と表記する。

【0059】

そして、重要語有無判定部４ｈは、「１」番目の対象テキスト[１]から順番に、対象テキスト[ｉ]が、重要発話音声Ｘの発話番号に関連づけてワードスポッティング結果記憶部６ｂに記憶される重要語の文字列を含むか否かを、通話要約データ及び重要語リストに基づいて判定する（Ｓ２０４）。対象テキスト[ｉ]が、重要発話音声Ｘの発話番号に関連づけて記憶される重要語の文字列を含む場合（Ｓ２０４のＹＥＳ）、重要語有無判定部４ｈは、フラグの値を「１」に更新し（Ｓ２０５）、処理を終了する。

【0060】

フラグの値「０」は、「重要発話音声Ｘで発される重要語の文字列を含む対象テキストが第１対象テキストと第２対象テキストとの間に存在しない」ことを示し、フラグの値「１」は、「重要発話音声Ｘで発される重要語の文字列を含む対象テキストが第１対象テキストと第２対象テキストとの間に存在する」ことを示す。

【0061】

[通話要約表示部]
通話要約表示部４ｉは、通話要約データが表すテキスト文書の画像１６を表示部１０に表示する。但し、上記フラグの値が「０」である場合、すなわち、重要発話音声Ｘで発される重要語の文字列を含む対象テキストが第１対象テキストと第２対象テキストとの間に存在しない場合、通話要約表示部４ｉは、その旨を示す情報を出力する。すなわち、上記フラグの値が「０」である場合、通話要約表示部４ｉは、図１３に示すように、重要発話音声Ｘの発話番号に関連づけられた重要語を示す情報（ここでは、文字列）を含む図、アイコン、及びウィンドウ等の画像１８を、画像１６と併せて表示部１０に表示する。文字列「Fujisan x430」が重要語の文字列を示す。

【0062】

以上のように、この情報処理装置２では、通話においてオペレータが発した重要語がテキスト文書中のしかるべき場所に記載されているか否かが判別される。また、通話においてオペレータが発した重要語がテキスト文書中のしかるべき場所に記録されていないことが、管理者に報知される。

【0063】

なお、本発明の実施形態は、上記実施形態だけに限らない。

【0064】

[変形例]
例えば、重要語有無判定部４ｈは、第１対象テキストと第２対象テキストとの間に、重要語の文字列と所定関係を有する代替文字列を含む対象テキストが存在するか否かも判定してよい。ここで、代替文字列とは、例えば、重要語の上位概念語又は下位概念語の文字列、重要語の類義語の文字列、及び重要語の文字列の一部の文字のケース（大文字小文字の区別）を変更した文字列などである。ここでは、代替文字列が、「重要語の文字列の一部の文字のケースを変更した文字列」である場合を例に取り上げ、変形例を説明する。

【0065】

図１４は、変形例において、重要語有無判定部４ｈにより実行される処理を示すフロー図である。同図に示すように、変形例では、図１２に示す処理に、Ｓ２０６及びＳ２０７のステップが加えられている。すなわち、重要語有無判定部４ｈは、対象テキスト[ｉ]が重要発話音声Ｘの発話番号に関連づけて記憶される重要語の文字列を含まない場合に（Ｓ２０５のＮＯ）、さらに、対象テキスト[ｉ]が代替文字列を含むか否かを判定する（Ｓ２０６）。そして、重要語有無判定部４ｈは、対象テキスト[ｉ]が代替文字列を含む場合（Ｓ２０６のＹＥＳ）、対象テキスト[ｉ]の文番号を文番号Ｘとして主記憶６に保存するとともに、上記フラグの値を「２」に更新して（Ｓ２０７）、処理を終了する。

【0066】

フラグの値「２」は、「代替文字列を含む対象テキストが第１対象テキストと第２対象テキストとの間に存在する」ことを示す。

【0067】

また、変形例では、通話要約表示部４ｉが、上記フラグの値が「２」である場合、図１５に示すように、重要発話音声Ｘの発話番号に関連づけられた重要語とその代替文字列とを示す情報（ここでは、文字列）を含む図、アイコン、及びウィンドウ等の修正案内画像２０を、画像１６と併せて表示部１０に表示する。文字列「Fujisan x430」が重要語の文字列であり、文字列「FUJISAN X430」が代替文字列を示す。図１５に示すように、修正案内画像２０には、修正指示画像２２及びキャンセル指示画像２４が含まれる。

【0068】

また、変形例では、通話要約表示部４ｉは、修正指示ボタン画像２２を選択する操作が行われた場合に、以下に説明するようにして通話要約データを更新する。すなわち、通話要約表示部４ｉは、文番号Ｘの対象テキストに含まれる代替文字列を、重要発話音声Ｘの発話番号に関連づけられた重要語の文字列へと修正する。

【符号の説明】

【0069】

２情報処理装置、４制御部、４ａキーワード抽出部、４ｂ音声認識部、４ｃワードスポッティング部、４ｄ関連づけ実行部、４ｅ重要発話音声特定部、４ｆ第１対象テキスト特定部、４ｇ第２対象テキスト特定部、４ｈ重要語有無判定部、４ｉ通話要約表示部、６主記憶、６ａキーワード記憶部、６ｂワードスポッティング結果記憶部、６ｃペア記憶部、８ハードディスク、８ａ通話音声データ記憶部、８ｂ通話要約記憶部、８ｃ重要語記憶部、１０表示部、１２操作入力部、１４通話音声データ、１６，１８画像、２０修正案内画像、２２修正指示画像、２４キャンセル指示画像。

【図1】