(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-02
(45)【発行日】2023-03-10
(54)【発明の名称】音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法
(51)【国際特許分類】
G06F 16/383 20190101AFI20230303BHJP
G10L 15/10 20060101ALI20230303BHJP
G06F 40/279 20200101ALI20230303BHJP
G06F 3/16 20060101ALI20230303BHJP
【FI】
G06F16/383
G10L15/10 200W
G06F40/279
G06F3/16 650
(21)【出願番号】P 2018137875
(22)【出願日】2018-07-23
【審査請求日】2021-06-28
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】藤井 亮太
【審査官】松尾 真人
(56)【参考文献】
【文献】特開2000-259713(JP,A)
【文献】特開2011-065304(JP,A)
【文献】特開2013-037401(JP,A)
【文献】特開2016-021196(JP,A)
【文献】特開平10-240536(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/20-40/58
G06F 3/16
G10L 15/00-17/26
(57)【特許請求の範囲】
【請求項1】
相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、
前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、
前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、
前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備え
、
前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、
前記判定部は、前記複数の項目のうちいずれかの項目に複数の内容が存在した場合に、前記キーワード関連性情報を参照し、前記複数の内容が対応する項目との関係で矛盾するか否かを判定する、
音声認識データ処理装置。
【請求項2】
生成された前記相談内容の要約レポートをディスプレイに表示する制御部、をさらに備える、
請求項1に記載の音声認識データ処理装置。
【請求項3】
前記生成部は、前記複数の内容が対応する項目との関係で矛盾すると判定された場合に、前記複数の内容のうち少なくとも1つの内容を要確認項目であることが識別可能に前記要約レポートを生成する、
請求項1に記載の音声認識データ処理装置。
【請求項4】
前記生成部は、前記要確認項目に対応する内容に下線を付与して前記要約レポートを生成する、
請求項3に記載の音声認識データ処理装置。
【請求項5】
前記判定部は、前記相談者の発話音声の1フレーズに対応する前記音声データの音声認識結果を取得する度に、前記テーブルに登録されたキーワードとの比較を行う、
請求項1~4のうちいずれか一項に記載の音声認識データ処理装置。
【請求項6】
前記複数の項目のそれぞれの内容の決定状況に応じて、内容が未だ決定されていない項目の有無を検索し、未決定項目に関する情報をディスプレイに表示する提示処理部、をさらに備える、
請求項1に記載の音声認識データ処理装置。
【請求項7】
前記相談内容の種別を含む複数の項目のそれぞれの内容の決定数が所定値で、かつ少なくとも前記種別の内容が決定された場合に、前記種別の内容に対応する対策の提案内容を生成してディスプレイに表示する提示処理部、をさらに備える、
請求項1に記載の音声認識データ処理装置。
【請求項8】
相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、
前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、
前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、
前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備え
、
前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、
前記判定部は、前記複数の項目のうちいずれかの項目に複数の内容が存在した場合に、前記キーワード関連性情報を参照し、前記複数の内容が対応する項目との関係で矛盾するか否かを判定する、
音声認識データ処理システム。
【請求項9】
相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリを有する音声認識データ処理システムにおいて、
前記相談者の発話音声を集音するマイクから入力された音声データを音声認識するステップと、
前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するステップと、
前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込むステップと、
前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成するステップと、を有
し、
前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、
前記決定において、前記複数の項目のうちいずれかの項目に複数の内容が存在した場合に、前記キーワード関連性情報を参照し、前記複数の内容が対応する項目との関係で矛盾するか否かを判定する、
音声認識データ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法に関する。
【背景技術】
【0002】
商品やサービスの問合せを受け付けるコールセンターあるいは自治体等の相談窓口での通話等において、その通話の発話音声を集音し、その発話音声を音声認識して文字列(つまり、テキストデータ)に変換して処理する音声認識データ処理システムが用いられるようになった。
【0003】
この種の音声認識データ処理システムとして、例えば特許文献1には、送話側チャネルからの音声を第1音声認識手段により音声認識し、交換機を介して送られてきた受話側チャネルの音声を第2音声認識手段により音声認識し、それぞれの音声認識結果を文字列に変換して表示する通話内容書き起こしシステムが開示されている。この通話内容書き起こしシステムは、表示された文字列を文字列編集手段により編集することが可能に構成される。これにより、編集者は、送話側および受話側の通話内容が時系列に並べられて表示されるのを確認しながら、通話内容を書き起こす(つまり、テキスト化する)ことが可能となる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1では、通話内容の全てを書き起こすことは考慮されているものの、その通話内容の概略(つまり、要約)を作成することまでは考慮されていない。そのため、特許文献1の構成を、行政機関(例えば警察署)等の相談窓口で相談員が相談者からの相談に応対する際、その相談内容をテキスト化する場合に適用しても相談者および相談員の発話内容の全てがテキスト化された出力内容が作成されることになる。従って、相談員が出力内容を後で見返す際、相談内容を一目で概略を把握しにくいことがあり、その結果、相談員の利便性が低化し、相談窓口の相談対応能力の向上を妨げる可能性があった。
【0006】
本開示は、上述した従来の事情に鑑みて案出され、相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減し、相談窓口の相談対応能力を向上できる音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示は、相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備え、前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、前記判定部は、前記複数の項目のうちいずれかの項目に複数のキーワードが存在した場合に、前記キーワード関連性情報を参照し、前記複数のキーワードの中から前記比較に用いるキーワードを絞り込む、音声認識データ処理装置を提供する。
【0008】
また、本開示は、相談者の発話音声を集音するマイクから入力された音声データを音声認識する音声認識部と、前記相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するとともに、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込む判定部と、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成する生成部と、を備え、前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、前記判定部は、前記複数の項目のうちいずれかの項目に複数のキーワードが存在した場合に、前記キーワード関連性情報を参照し、前記複数のキーワードの中から前記比較に用いるキーワードを絞り込む、音声認識データ処理システムを提供する。
【0009】
また、本開示は、相談者からの相談内容の種別を含む複数の項目とそれぞれの前記項目に対応するキーワードとが対応付けて登録されたテーブルを保持するメモリを有する音声認識データ処理システムにおいて、前記相談者の発話音声を集音するマイクから入力された音声データを音声認識するステップと、前記音声データの音声認識結果と前記テーブルに登録されたキーワードとの比較に応じて、前記相談内容の種別を含む複数の項目のそれぞれの内容を決定するステップと、前記決定された種別に応じて、前記テーブルに登録された複数のキーワードのうち前記比較に用いるキーワードを絞り込むステップと、前記テーブルに登録されたキーワードまたは前記絞り込まれたキーワードに基づいて決定された前記複数の項目のそれぞれの内容を用いて、前記相談内容の要約レポートを生成するステップと、を有し、前記テーブルは、前記項目に対応するそれぞれのキーワードごとに、前記相談内容の種別の観点において関連性の低いキーワードが指定されたキーワード関連性情報を保持し、前記決定において、前記複数の項目のうちいずれかの項目に複数の内容が存在した場合に、前記キーワード関連性情報を参照し、前記複数の内容が対応する項目との関係で矛盾するか否かを判定する、音声認識データ処理方法を提供する。
【発明の効果】
【0010】
本開示によれば、相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減でき、相談窓口の相談対応能力を向上できる。
【図面の簡単な説明】
【0011】
【
図1】音声認識データ処理のために保持されるカルテ表を示す図
【
図2】音声認識データ処理で生成される要約レポートの一例を示す図
【
図3】実施の形態1に係る音声認識データ処理システムの構成例を示す図
【
図4】
図3に示す音声認識データ処理システムの構成の一例を示すブロック図
【
図5】実施の形態1に係る音声認識データ処理のメインルーチンを示すフローチャート
【
図6】
図5に示す音声認識処理のサブルーチンを示すフローチャート
【
図7】
図5に示すキーワード一致判定処理のサブルーチンを示すフローチャート
【
図8】
図5に示すカルテ表登録処理のサブルーチンを示すフローチャート
【
図9】
図5に示すカルテ表登録処理の処理前のカルテ表を例示する図
【
図10】
図5に示すカルテ表登録処理の処理後のカルテ表を例示する図
【
図11】
図5に示すカルテレポート生成処理のサブルーチンを示すフローチャート
【
図12】実施の形態1に係る音声認識データ処理システムの変形例を示すブロック図
【
図13】実施の形態2に係る音声認識データ処理のメインルーチンを示すフローチャート
【
図14】
図13に示す相談員提示処理のサブルーチンを示すフローチャート
【
図15】実施の形態3に係る相談員提示処理を示すフローチャート
【発明を実施するための形態】
【0012】
(音声認識データ処理装置、その処理システムおよびその処理方法の概要)
本開示に係る音声認識データ処理システムの具体的な説明を行う前に、
図1および
図2を参照して、先ず音声認識データ処理システムの概要について説明する。
図1は、音声認識データ処理のために保持されるカルテ表を示す図である。
図2は、音声認識データ処理で生成される要約レポートの一例を示す図である。
【0013】
以下に詳述する実施の形態1では、相談者からの相談内容のジャンル(種別)を含む複数の項目ITとそれぞれの項目ITに対応しかつその項目に関連する複数のキーワード(文章も含む。以下同様。)とが予め対応付けて登録されたテーブルTBが事前に登録設定され、そのテーブルTBがデータベースとしてメモリ16に保持される(
図1および
図4参照)。テーブルTBは、項目ITに対応するそれぞれのキーワードについて、相談内容のジャンルとして関連性の低い1つ以上のキーワードをさらに登録している。つまり、テーブルTBは、キーワードごとにジャンルとの観点で関連性の低い1つ以上のキーワードが指定されたキーワード関連性情報を保持している。このキーワード関連性情報において指定されている、キーワードごとの関連性の低い1つ以上のキーワードは、後述するキーワードの絞り込みの際に使用される。また、相談内容をテキスト入力するためのフォーマットとしてカルテ表RTも同様に、メモリ16に保持される(
図1、
図4、
図9および
図10参照)。カルテ表RTの形式は、テーブルTBに事前登録された各項目ITに対応して事前に設定される。
【0014】
例えば相談窓口が行政機関のうち警察署である場合、その相談内容は、例えば犯罪、迷惑行為に関するものが主に想定される。カルテ表RTには、
図1に示すように、相談内容の項目ITには項番NOの順に「ジャンル(種別)」、「相談者」、「相手」、「被害状況」、「相談者の要求」、「警察からの提案内容」、「相談者の理解度・納得度」および「次のアクション」等が設定される。また、その項目ITごとの具体的な相談内容を入力するための内容入力欄CTもカルテ表RTに設けられる。さらに、カルテ表RTには、相談者C1の音声データに基づいて得られるキーワードを入力するための相談者側キーワード入力欄K1と、相談員C2の音声データに基づいて得られるキーワードを入力するための相談員側キーワード入力欄K2と、が項目ITごとに設けられる(
図9および
図10参照)。相談者側キーワード入力欄K1および相談員側キーワード入力欄K2にそれぞれ入力されている複数のキーワードは、テーブルTBにて規定されているキーワードから選択されて予め登録されているが、後述するように、人工知能(AI)を用いた学習処理によって使用頻度に応じて適宜更新(追加、変更、削除)されて構わない。
【0015】
なお、カルテ表RTの初期状態では、各項目ITの内容入力欄CTは少なくとも空欄に設定される。また、カルテ表RTは例示であり、
図1の図示内容に限定されず、相談窓口の性質により適宜変更されて設定される。以降の図面も同様であり、本開示の理解を促すための例示である。
【0016】
実施の形態1に係る音声認識データ処理システム1は、相談者C1および相談員C2の発話音声を1フレーズごとに音声認識し、その音声認識結果とテーブルTBに登録されたキーワードとの比較に応じて、相談内容のジャンルを含む前述の項目ITそれぞれの内容を決定してカルテ表RTの各内容欄CNにテキスト入力する。
【0017】
具体例として、
図1中、項番NOが1番目の「ジャンル」にはその内容に「近隣トラブル」のキーワードが、6番目の「警察からの提案内容」にはその内容に「まず注意する所からはじめてはどうか。我々が注意します。」のキーワードが、8番目の「次のアクション」にはその内容に「注意する日を連絡します」のキーワードが音声認識の結果としてテキスト入力される。またこのとき、音声認識データ処理システム1は、テーブルTBを用いて、決定されたジャンルに応じて、テーブルTBに登録された複数のキーワードのうち比較に用いるキーワードを絞り込む。この絞り込みにより、音声認識結果に対するキーワード一致判定の高速化を図ることが可能となる。
【0018】
カルテ表RTの各項目ITは音声データの1フレーズごとに逐次入力され、相談内容全体を示すリストとしてそれぞれの内容が順次決定される。その過程で各内容欄CNが埋められ、カルテ表RTが完成されていく。その際、
図2に示すように、決定された項目ITのそれぞれの内容に基づいて相談内容の要約レポートが生成される。
【0019】
具体例として、
図2に示すように、
図1に示すカルテ表RTに基づいて「タイトル:近隣トラブル」および「相談者:○○」を表題にした要約レポートABが生成される。その要約レポートABの内容は「近隣トラブルで困っている。…(省略)…警察からの提案内容として、まずは注意する所から始めてはどうか。警察が(下線あり)注意する(下線あり)と提案。…(省略)…次のアクションとしては警察が(下線あり)注意する日を連絡。」とテキスト入力される。なお、要約レポートABの内容では後述するように要確認項目に対応する内容に下線が付される。このように、要約レポートABは、
図2に示すような文章形式で生成されてもよいが、
図1に示すカルテ表RTのようなテーブル形式で生成されてもよい。
【0020】
このように、実施の形態1では、要約レポートABの作成により、行政機関等(本説明では警察署)の相談窓口で相談者C1からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援することが可能となる。そこで、その作成を支援可能とするため、音声認識データ処理装置10、音声認識データ処理システム1および音声認識データ処理方法は、以下に説明する複数の実施の形態に示す具体的構成を有する。
【0021】
以下、適宜図面を参照しながら、本開示に係る音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法を具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0022】
また、実施の形態1,2,3でいう「部」または「装置」とは単にハードウェアによって実現される物理的構成に限定されず、その構成が有する機能をプログラム等のソフトウェアにより実現されるものも含む。また、1つの構成が有する機能が2つ以上の物理的構成により実現されても、または2つ以上の構成の機能が例えば1つの物理的構成によって実現されていても構わない。
【0023】
(実施の形態1)
図3および
図4を参照して、実施の形態1に係る音声認識データ処理装置10および音声認識データ処理システム1の構成について説明する。
図3は、実施の形態1に係る音声認識データ処理システム1の構成の一例を示す模式図である。
図4は、
図3に示す音声認識データ処理システム1の構成の一例を示すブロック図である。
【0024】
図3および
図4に示すように、実施の形態1に係る音声認識データ処理装置10および音声認識データ処理システム1は、行政機関(例えば、警察署)に設置される相談窓口での使用が例示される。例えば地域住民である相談者C1が警察署の相談窓口に出向き、警察官等の相談員C2に面会して犯罪や迷惑行為等を直接相談する場面が想定される。
【0025】
実施の形態1では、その相談窓口に複数のマイクM1,M2および音声認識データ処理装置10が設置されており、このマイクM1,M2を通じて相談者C1と相談員C2との発話音声を集音し、その音声データを音声認識データ処理装置10に入力して音声認識させる。なお、実施の形態1では警察署の相談窓口での使用を想定して説明するが、これに限定されない。その他、市役所等での相談窓口、病院等の医療機関での相談窓口、さらには公共的機関に限定されず民間機関での相談窓口等にも適応可能である。
【0026】
実施の形態1の音声認識データ処理システム1は、相談者C1および相談員C2の発話音声を集音する複数(例えば、2本)のマイクM1,M2と、これらマイクM1,M2から入力された音声データに基づき相談内容の要約レポートAB(
図2参照)を生成する音声認識データ処理装置10と、音声認識データ処理装置10から送信される音声データに基づき自動で音声認識する音声認識サーバ20と、音声認識データ処理装置10と音声認識サーバ20とを接続するネットワークNWと、を含んで構成される。
【0027】
複数のマイクM1,M2は、相談者C1および相談員C2の発話音声を集音して電気信号の音声データとしてそれぞれ出力する。音声データは、電気的な振動波形データとして音声認識データ処理装置10に出力される。なお、実施の形態1ではマイクM1,M2を2本設置するが、これに限定されず1本でもよい。この場合、1つのマイクM1は相談者C1および相談員C2の両方の発話音声を識別可能に集音可能に構成されればよい。
【0028】
音声認識データ処理装置10は、汎用のパーソナル・コンピュータで構成されており、プロセッサ11と、メモリ16と、ディスプレイ17と、入出力インターフェイス回路18と、通信回路19と、を含んで構成される。
図4では、入出力インターフェイス回路を便宜的に「入出力I/F」と示している。なお、音声認識データ処理装置10は、パーソナル・コンピュータに限定されず、前述の各種回路を有するものであればタブレット端末、スマートフォン等の各種装置を用いてもよい。
【0029】
メモリ16は、RAM(Random Access Memory)、ROM(Read Only Memory)等の半導体メモリ等により構成される。メモリ16は、プロセッサ11で実行される所定のプログラムや各種の設定パラメータ等を記憶保持するとともに、デジタル変換された音声データやプロセッサが各種プログラムを実行する際に中間的に生成するデータを一時的に記憶する。
【0030】
また、実施の形態1では、メモリ16は、前述のように、相談者C1からの相談内容のジャンルを含む複数の項目ITとそれぞれの項目ITに対応しかつその項目ITに関連する複数のキーワードとが予め対応付けて登録されたテーブルTBを記憶保持する。つまり、前述したように、テーブルTBにおいて、キーワードは相談内容の項目ITごとに事前に複数設定されており、この複数のキーワードは項目ITごとにグループ登録され記憶保持される。また、メモリ16には、相談内容の入力用のフォーマットとしてカルテ表RT(
図9参照)も同様に記憶保持される。なお、これらテーブルTBおよびカルテ表RTは半導体メモリの代わりにSSD(Solid State Drive)やHDD(Hard Disk Drive)等のストレージデバイス等の記憶回路内に記憶保持されてもよい。また、前述のように、テーブルTBは、項目ITに対応するそれぞれのキーワードについて、相談内容のジャンルとして関連性の低い他のキーワードをさらに登録している。
【0031】
ディスプレイ17は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等により構成される。ディスプレイ17は、その表示部に音声データ、前述のカルテ表RTおよび要約レポート等ABを適宜切り替えて少なくとも相談員C2に表示する。
【0032】
入出力インターフェイス回路18は、マイクM1,M2にて取得した音声データを各種信号処理可能なデジタル信号に変換するオーディオ用のインターフェイスである。入出力インターフェイス回路18は、そのデジタル変換の際、所定の量子化ビットおよびサンプリング周波数によりアナログの音声データをデジタルに変換する。サンプリング周波数は、例えば48kHzに設定される。また、入出力インターフェイス回路18はバッファ回路を含み、このバッファ回路はマイクM1,M2の音声データをデジタル変換させるため、音声データを所定時間バッファリングする。入出力インターフェイス回路18は、プロセッサ11およびディスプレイ17にデジタル変換した音声データを送信する。
【0033】
通信回路19は、無線通信の機能を有しており、所定の無線通信回線を介してネットワークNWに接続され、音声認識サーバ20との間で無線通信を行う。即ち、音声認識データ処理装置10は通信回路19およびネットワークNWを介して音声認識サーバ20に接続され、音声データ等の所定のデータを送受信可能に構成される。なお、通信回路19は、無線通信回路として携帯電話網(セルラー網)、無線LAN等を使用することが可能である。また、通信回路19は無線通信に限らず有線LAN等を使用して有線通信可能に構成してもよい。
【0034】
プロセッサ11は、例えば、CPU(Central Processing Unit),MPU(Micro Processor Unit),DSP(Digital Signal Processor)あるいはFPGA(Field Programmable Gate Array)等が用いられる。プロセッサ11は、メモリ16に格納されるプログラムや設定パラメータを適宜読み出し、読み出したプログラムに従って所定の処理を実行する。
【0035】
プロセッサ11は、機能的構成として、マイクM1,M2から得られた音声データを音声認識する音声認識部12と、音声認識結果とテーブルTBに登録されたキーワードとを比較して項目ITのそれぞれの内容を決定するキーワード一致判定部13(判定部の一例)と、各項目ITの決定に基づいて相談内容の要約レポートABを生成するカルテレポート生成部14(生成部の一例)と、登録されている複数のキーワードとキーワード一致判定部13の判定結果とを学習して、テーブルTBでのキーワードの登録内容を適宜更新するAI(Artificial Intelligence)処理部15と、を有する。
【0036】
音声認識部12は、入出力インターフェイス回路18からデジタル変換された音声データを取得する。音声認識部12は、取得した音声データを例えば所定のコーパスに基づき音声認識してテキストデータ(文字列)に変換する。テキストデータの変換や解釈は、所定の自動音声認識アルゴリズムに従って実行される。自動音声認識アルゴリズムは、例えばAI処理部15に実装される人工知能(AI:Artificial Intelligence)エンジンを用いて生成される。
【0037】
ここで、音声認識データ処理装置10の音声認識部12は、音声認識データ処理装置10のプロセッサの処理能力(つまり、性能)の制限を受ける。また、音声認識部12は、プロセッサ11のAI処理部15により生成される自動音声認識アルゴリズムに従うためその性能や精度は限定的になってしまう可能性がある。そのため、実施の形態1では、様々な相談窓口での相談内容の音声データを取得可能な音声認識サーバ20を、ネットワークNWを介して通常使用して、後述する音声認識処理(例えば、
図5に示すステップS20参照)を実行する。但し、ネットワークNWのトラフィック量が過多になる等、ネットワークNWの接続が不調である場合、音声認識データ処理装置10の音声認識部12が音声認識サーバ20の代わりに機能し、音声データを音声認識してよい。なお、音声認識サーバ20でも同様に、人工知能の学習により自動音声認識アルゴリズムを生成して音声認識する。
【0038】
また、音声認識データ処理装置10および音声認識サーバ20に実行される人工知能の学習は、1つ以上の統計的な分類技術を用いて実行されてもよい。統計的分類技術としては、線形分類器(linear classifiers)、サポートベクターマシン(support vector machines)、二次分類器(quadratic classifiers)、カーネル密度推定(kernel estimation)、決定木(decision trees)、人工ニューラルネットワーク(artificial neural networks)、ベイジアン技術および/またはネットワーク(Bayesian techniques and/or networks)、隠れマルコフモデル(hidden Markov models)、バイナリ分類子(binary classifiers)、マルチクラス分類器(multi-class classifiers)、クラスタリング(a clustering technique)、ランダムフォレスト(a random forest technique)、ロジスティック回帰(a logistic regression technique)、線形回帰(a linear regression technique)、勾配ブースティング(a gradient boosting technique)等が例示される。但し、使用される統計的分類技術はこれらに限定されない。
【0039】
音声認識サーバ20または音声認識データ処理装置10の音声認識部12は、音声認識結果であるテキストデータをキーワード一致判定部13に逐次送信する。キーワード一致判定部13は、その音声認識結果を1フレーズごとに取得し、テーブルTBに予め登録されたキーワードとの一致の有無を判定する。即ち、キーワード一致判定部13は、相談者C1および相談員C2の発話音声の1フレーズに対応する音声データの音声認識結果を取得する度に、テーブルTBに登録された複数のキーワードとの比較を行う。また、キーワード一致判定部13は、テーブルTBを用いて、決定されたジャンルに応じて、テーブルTBに登録された複数のキーワードのうち比較に用いるキーワードを絞り込む。
【0040】
カルテレポート生成部14は、テーブルTBに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目ITのそれぞれの内容を用いて、相談内容の要約レポートABを生成する(
図2参照)。
【0041】
次に
図5~
図11を参照して、実施の形態1の音声認識データ処理方法の手順について説明する。
図5は、実施の形態1に係る音声認識データ処理のメインルーチンを示すフローチャートである。
図6は、
図5に示す音声認識処理S20のサブルーチンを示すフローチャートである。
図7は、
図5に示すキーワード一致判定処理S30のサブルーチンを示すフローチャートである。
図8は、
図5に示すカルテ表登録処理S40のサブルーチンを示すフローチャートである。
図9は、
図5に示すカルテ表登録処理S40の処理前のカルテ表RTを例示する図である。
図10は、
図5に示すカルテ表登録処理S40の処理後のカルテ表RTを例示する図である。
図11は、
図5に示すカルテレポート生成処理S50のサブルーチンを示すフローチャートである。
【0042】
相談員C2は相談者C1に応対する際、音声認識データ処理システム1を稼働させる(
図3参照)。各マイクM1,M2は、相談者C1または相談員C2の発話音声を集音し始め、アナログの音声データを音声認識データ処理装置10に出力する。
図5に示すように、音声認識データ処理装置10は、その入力された音声データを入出力インターフェイス回路18により1フレーズごとに取得するとともに、その音声データの振動波形をディスプレイ17に表示させる(S10)。
【0043】
次に、
図5および
図6に示すように、音声認識処理のサブルーチンが開始される(S20)。音声認識処理S20では、入出力インターフェイス回路18はそのバッファ回路で音声データをバッファリングして音声データをデジタルに変換し、プロセッサ11に出力する(S21)。プロセッサ11はデジタル変換された音声データを、通信回路19を通じて音声認識サーバ20に送信する(S22)。音声認識サーバ20は、音声データを受信し受信した音声データを自動音声認識アルゴリズムに従って音声認識し、音声認識結果としてテキストデータに変換する(S23)。このとき、音声認識サーバ20は、発話音声の1フレーズごとに音声認識結果を音声認識データ処理装置10に送信する。音声認識データ処理装置10は音声認識サーバ20の音声認識結果を、通信回路19を通じて受信する(S24)。この受信により音声認識処理のサブルーチンが終了する。
【0044】
次に、
図5および
図7に示すように、音声認識処理S20の終了後、キーワード一致判定処理のサブルーチンが開始される(S30)。キーワード一致判定処理S30では、プロセッサ11のキーワード一致判定部13は相談者C1および相談員C2の発話音声の1フレーズに対応する音声データの音声認識結果を取得する(S31)。キーワード一致判定部13は、その取得の際、音声認識結果を単語ごとに分解する(S32)。ここでいう単語は、単語に限らず、句あるいは節等の文章でもよい。キーワード一致判定部13は、音声認識結果とテーブルTBに予め登録された複数のキーワードとを比較して一致するか否かを、相談者C1および相談員C2のそれぞれの発話内容に対応する音声認識結果について個別で比較する(S33)。比較の結果、キーワード一致判定部13は、テーブルTBに登録されているキーワードと一致するか否かを判定する(S34)。一致しないと判定する場合、キーワード一致判定処理S30のサブルーチンは終了する。なお、キーワード一致判定部13はキーワードの一致判定の際(S34)、例えば「我々」の発話音声を「警察」に、または「私」の発話音声を「相談者」等に適宜補完変換して状況に応じた一人称の変換が可能に構成されてよい。
【0045】
また、このようなキーワード一致判定処理S30の終了処理により、音声認識データ処理システム1は、マイクM1,M2の集音中において相談者C1または相談員C2が相談内容と無関係(例えば雑談や世間話等)なことを話していると推定し、次のカルテ表登録処理(ステップS40)にそのまま進む。これにより、カルテ表RTや要約レポートABに相談内容と無関係な内容、即ちノイズ情報が混入するのを抑制することが可能となる。
【0046】
その一方、一致すると判定する場合、キーワード一致判定部13はその一致した音声認識結果が相談内容のジャンルに対応するキーワードと一致するか否かをさらに判定する(S35)。
【0047】
一致しないと判定する場合、キーワード一致判定処理S30のサブルーチンは終了する。その一方、ジャンルに対応するキーワードと一致すると判定する場合、キーワード一致判定部13は相談者C1の相談内容のジャンルが例えば「近隣トラブル」であるのか、「ストーカー被害」であるのか、あるいは「詐欺被害」であるのか等を決定して、その決定結果をカルテ表RTに入力する。さらに、キーワード一致判定部13は、決定されたジャンルに応じてテーブルTBに登録された複数のキーワードのうち前述のステップS33で用いるキーワードを絞り込む(S36)。例えば、前述したように、テーブルTBには、項目ITに対応するそれぞれのキーワードごとに、相談内容のジャンルの観点からして関連性の低い1つ以上のキーワードが指定されたキーワード関連性情報を保持している。例えば、ジャンル「ストーカー」というキーワードは、キーワード「○○円振り込んだ」と関連性が低いと考えられる。また、ジャンル「詐欺被害」というキーワードは、キーワード「切りつけられた」と関連性が低いと考えられる。このように、キーワードごとに登録されている関連性の低い1つ以上のキーワードは、キーワード一致判定部13におけるキーワードの絞り込み時に使用される。これにより、キーワード一致判定処理S30のサブルーチンを終了する。
【0048】
次に、
図5および
図8に示すように、キーワード一致判定処理S30の終了後、カルテ表登録処理のサブルーチンが開始される(S40)。カルテ表登録処理S40では、プロセッサ11のキーワード一致判定部13は、メモリ16のテーブルTBを参照して、ステップS33において一致したと判定されたキーワードに対応する項目ITを検索する(S41)。検索の結果、キーワード一致判定部13は、該当する項目ITにキーワードが入力済みか否かを判定する(S42)。未入力であると判定する場合、キーワード一致判定部13は、該当する項目ITの内容欄CNに、その一致したキーワードを決定して入力していく(S45)。
【0049】
具体的には、
図9に示すように、相談者C1の発話に基づく音声認識結果の単語の中に、相談者側キーワード入力欄K1のキーワード「隣の部屋の人が」がステップS33において一致したと判定された場合、テーブルTBにて登録されているキーワード「隣の部屋の人が」に対応する項目(ジャンル)「近隣住民トラブル」が、ジャンルの内容欄CNに入力される。
【0050】
また、別の例として、相談員C2の発話に基づく音声認識結果の単語の中に、相談員側キーワード入力欄K2のキーワード「ストーカー」がステップS33において一致したと判定された場合、テーブルTBに登録されているキーワード「ストーカー」に対応する項目(ジャンル)「ストーカー」が、ジャンルの内容欄CNに入力される。また、音声認識データ処理システム1により入力途中のカルテ表RTは、音声認識データ処理装置10のディスプレイ17に表示されており、相談員C2はその入力状況を相談中に確認することが可能である。
【0051】
その一方、該当する項目ITが入力済みと判定する場合(即ち、複数の項目ITのうちいずれかの項目ITに複数の内容が存在した場合)、キーワード一致判定部13は、テーブルTBに保持されているキーワード関連性情報を参照し、入力済みである複数の内容が対応する項目ITのジャンルとの関係で矛盾するか否かを判定する(S43)。矛盾しないと判定する場合、カルテ表登録処理S40のサブルーチンは終了する。
【0052】
その一方、矛盾すると判定する場合、キーワード一致判定部13は要確認項目としてその旨をメモリ16に記憶保持させる(S44)。キーワード一致判定部13は、逐次取得する音声認識結果ごとに、該当する項目ITに対してキーワードを決定して入力する(S45)。さらに、入力されたキーワードに基づいて項目ITごとの内容に対する見出しを自動認識し、その見出しをカルテ表RTの内容の内容欄CNにそれぞれ入力する(
図10参照)。これにより、カルテ表登録処理S40のサブルーチンが終了する。
【0053】
次に、
図5および
図11に示すように、カルテ表登録処理S40の終了後、カルテレポート生成処理のサブルーチンが開始される(S50)。カルテレポート生成処理S50では、プロセッサ11のカルテレポート生成部14は、メモリ16に記憶保持されるカルテ表RTを参照して、内容が入力済みの項目ITを検索する(S51)。検索の結果、カルテレポート生成部14は、入力済みの項目ITに対応するテキストを生成する(S52)。またこのとき、カルテレポート生成部14は、メモリ16に記憶保持される要確認項目も同時に参照して、項目ITのいずれかで矛盾があると判定された場合、該当する項目ITの内容を要確認項目であることが識別可能にテキストを生成する。具体的には、カルテレポート生成部14は、要確認項目に対応する内容に下線を付与して識別可能とする(
図2参照)。
【0054】
さらにカルテレポート生成部14は、生成したテキストにおいて前後の意味等で違和感が生じないに補正するとともに(S53)、主語が抜けているテキストに対し主語を推測して補完挿入する(S54)。このとき、カルテレポート生成部14は主語を推測した場合、同様に要確認項目として下線を付して識別可能にテキストを生成する。
【0055】
このようにカルテレポート生成部14はキーワードに基づいて決定された複数の項目ITのそれぞれの内容を用いて相談内容の要約レポートをAB生成する(
図2参照)。プロセッサ11は入出力インターフェイス回路18を介してその要約レポートABをディスプレイ17に表示させる(S56)。
【0056】
図5に示すように、カルテレポート生成処理S50の終了後、メイン処理に対する終了トリガが入力されたかが判定される(S60)。判定の結果、終了トリガが入力されない限り、ステップS10からステップS50までの一連の処理ステップが繰り返して実行される。終了トリガが入力された場合、例えば相談窓口での相談が終了して音声認識データ処理システムのスイッチが相談員C2によりオフ(OFF)された場合、音声認識データ処理システム1のメイン処理が終了する。
【0057】
以上により、実施の形態1に係る音声認識データ処理装置10および音声認識データ処理システム1は、相談者C1の発話音声を集音するマイクM1から入力された音声データを音声認識する音声認識部12を備える。音声認識データ処理装置10および音声認識データ処理システム1は、相談者C1からの相談内容のジャンル(種別)を含む複数の項目ITとそれぞれの項目ITに対応するキーワードとが対応付けて登録されたテーブルTBを保持するメモリ16を備える。音声認識データ処理装置10および音声認識データ処理システム1は、音声データの音声認識結果とテーブルTBに登録されたキーワードとの比較に応じて、相談内容のジャンルを含む複数の項目ITのそれぞれの内容を決定するとともに、決定されたジャンルに応じて、テーブルTBに登録された複数のキーワードのうち比較に用いるキーワードを絞り込むキーワード一致判定部13(判定部の一例)を備える。音声認識データ処理装置10および音声認識データ処理システム1は、テーブルTBに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目ITのそれぞれの内容を用いて、相談内容の要約レポートABを生成するカルテレポート生成部14(生成部の一例)を備える。
【0058】
従って、実施の形態1では、音声認識データ処理装置10は、音声データの音声認識結果とテーブルに登録されたキーワードとの比較に応じて、相談内容の種別を含む複数の項目のそれぞれの内容を決定する。音声認識データ処理装置10は、決定された種別に応じて、テーブルTBに登録された複数のキーワードのうち比較に用いるキーワードを絞り込み、テーブルTBに登録されたキーワードまたは絞り込まれたキーワードに基づいて決定された複数の項目のそれぞれの内容を用いて、相談内容の要約レポートABを生成する。これにより、音声認識データ処理装置10は、要約レポートABの作成により、行政機関等の相談窓口で相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減する。その結果、相談窓口の相談対応能力を向上させることができる。
【0059】
また、音声認識データ処理装置10および音声認識データ処理システム1は、生成された相談内容の要約レポートABをディスプレイ17に表示するプロセッサ11(制御部の一例)をさらに備える。これにより、相談員C2は、相談窓口で相談の応対をしながら相談内容を確認することができるので、音声認識データ処理装置10は相談員C2の負荷をさらに低減するとともに相談内容に関する相談員C2の問いかけの質も向上させることができる。
【0060】
また、音声認識データ処理装置10および音声認識データ処理システム1では、キーワード一致判定部13(判定部の一例)は、複数の項目ITのうちいずれかの項目ITに複数の内容が存在した場合に、複数の内容が対応する項目ITとの関係で矛盾するか否かを判定する。カルテレポート生成部14(生成部の一例)は、複数の内容が対応する項目ITとの関係で矛盾すると判定された場合に、複数の内容のうち少なくとも1つの内容を要確認項目と識別可能に要約レポートABを生成する。これにより、音声認識データ処理装置10は、要約レポートABの一貫性および整合性を高めて要約レポートの質を向上させ、相談員C2が後で見返す際、相談内容を一目で把握するのを容易にすることができる。
【0061】
また、音声認識データ処理装置10および音声認識データ処理システム1では、カルテレポート生成部14(生成部の一例)は、要確認項目に対応する内容に下線を付与して要約レポートABを生成する。これにより、音声認識データ処理装置10は、要約レポートABでの要確認項目に対する視認性を高めるので、相談中での相談員C2に再確認を促したり、相談後での要約レポートの修正を容易にしたりすることができる。
【0062】
また、音声認識データ処理装置10および音声認識データ処理システム1では、キーワード一致判定部13(判定部の一例)は、相談者C1の発話音声の1フレーズに対応する音声データの音声認識結果を取得する度に、テーブルTBに登録されたキーワードとの比較を行う。これにより、相談窓口での相談の最中に音声認識およびキーワード比較が行われてカルテ表RTに逐次入力されて表示されるので、相談員C2はカルテ表RTの入力状況を把握しながら相談者C1の応対を行うことができる。このため、相談窓口での相談対応能力をより一層高めることができる。
【0063】
(実施の形態1の変形例)
実施の形態1の変形例として、音声認識データ処理システム1は、音声認識データ処理の機能を補完したり代行したりするAI処理サーバ30をさらに有して構成されてもよい。AI処理サーバ30は、ネットワークNWに接続され、人工知能の性能が強化されて設けられる。AI処理サーバ30は、汎用のサーバーシステム(高機能なコンピュータ)で構成されており、音声認識データ処理装置10と同様に、プロセッサ31と、メモリ36と、通信回路39と、を含んで構成される。
【0064】
AI処理サーバ30のプロセッサ31は、機能的構成として同様に、キーワード一致判定部33と、カルテレポート生成部34と、AI処理部35と、を有する。但し、これらAI処理サーバ30は人工知能の性能が強化されており、また複数の相談窓口での音声データが取得可能に構成される。そのため、その人工知能のモデルは、音声認識データ処理装置10と比較して精度が高く構築可能である。従って、実施の形態1の変形例では、より高速且つより精度良く相談内容の要約の作成を支援して、相談員C2の負荷を低減することができる。
【0065】
(実施の形態2)
次に、
図13および
図14を参照して、実施の形態2に係る音声認識データ処理装置10および音声認識データ処理システム1の音声認識データ処理方法の手順について説明する。
図13は、実施の形態2に係る音声認識データ処理のメインルーチンを示すフローチャートである。
図14は、
図13に示す相談員提示処理S70のサブルーチンを示すフローチャートである。なお、実施の形態1と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。
【0066】
図13および
図14に示すように、実施の形態2では、カルテレポート生成処理(S50)の終了後、相談員提示処理のサブルーチンが開始される(S70)。なお、相談員提示処理S70の終了後、プロセッサ11は実施の形態1と同様に終了トリガが入力されたか否かが判定する(S60)。また、相談員提示処理S60はプロセッサ11のAI処理部15(提示処理部の一例)により主に実行されるが、これに限定されず、前述のAI処理サーバ30のAI処理部35がその処理を補佐または代理可能なように構成してもよい。
【0067】
相談員提示処理S70では、プロセッサ11のAI処理部15は、カルテ表RTの決定状況応じて、所定の優先順位に従って内容が未だ決定されていない未決定の項目ITの項目ITの有無を検索する(S71)。検索の結果、AI処理部15は未決定の項目ITがあるか否かを判定する(S72)。未決定の項目ITがないと判定する場合、相談員提示処理S70は終了する。
【0068】
その一方、未決定の項目ITがあると判定する場合、AI処理部15は「相談員(C2)が次に尋ねるべき項目」として未決定の項目ITに関する情報を、ディスプレイ17を通じて提示する。例えば、AI処理部15は相談内容のジャンルが決定済みで被害状況の項目ITが未決定である場合、「被害状況を尋ねて下さい。」と相談員C2に提示する。その提示後、相談員提示処理S70は終了する。なお、優先順位に関する情報は事前に設定されており、音声認識データ処理装置10のメモリ16に記憶保持される。
【0069】
以上により、実施の形態2に係る音声認識データ処理装置10および音声認識データ処理システム1は、複数の項目ITのそれぞれの内容の決定状況に応じて、内容が未だ決定されていない項目ITの有無を検索し、未決定の項目ITに関する情報をディスプレイ17に表示するAI処理部(提示処理部の一例)を備える。これにより、相談員C2は、相談者C1からの相談内容を漏れなく聞き出せるので、相談内容の質をより高め、相談窓口の相談対応能力をさらに向上させることができる。その他の構成や作用効果については、上記実施の形態1と同様である。
【0070】
(実施の形態3)
次に、
図15を参照して、実施の形態3に係る音声認識データ処理装置10および音声認識データ処理システム1の音声認識データ処理方法の手順について説明する。
図15は、実施の形態3に係る相談員提示処理S70を示すフローチャートである。なお、実施の形態1および形態2と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。
【0071】
図15に示すように、実施の形態3の相談員提示処理S70では、音声認識データ処理装置10のAI処理部15(提示処理部の一例)は、相談員C2から相談者C1へ提案するために必要な情報が揃っているか検索する(S75)。検索の結果、AI処理部15は、相談内容のジャンルを含む複数の項目ITのそれぞれの内容の決定数が所定値で、且つ少なくともジャンルの内容が決定されているか否かを判定する(S76)。例えばAI処理部15は、
図1に示す項目ITの項番NOの第1~第5の内容が決定済みか否かを判定する。未決定と判定する場合、相談員提示処理S70は終了する。
【0072】
その一方、決定済みと判定する場合、AI処理部15は決定済みの内容に基づきジャンルに対応する対策の提案内容を生成する(S77)。このとき、AI処理部15はルール(規定)が事前に規定された所定のハッシュテーブルに従って提案内容を一意に決定する。AI処理部15は、生成した提案内容のテキストをディスプレイ17に提示し(S78)、相談員提示処理S70は終了する。
【0073】
なお、AI処理部15は、ハッシュテーブル等のルールベースに従った手法に限定されず、人工知能を用いて過去の履歴を参照して提案内容を機械学習しておき、その機械学習で得た学習モデルに従って決定してもよい。また、学習モデルをAI処理サーバ30で生成してもよい。この場合、複数の相談窓口の相談内容から学習モデルが生成されるので、精度の良い学習モデルを生成することができる。
【0074】
以上により、実施の形態3に係る音声認識データ処理装置10および音声認識データ処理システム1は、相談内容のジャンル(種別)を含む複数の項目ITのそれぞれの内容の決定数が所定値で、かつ少なくともジャンルの内容が決定された場合に、ジャンルの内容に対応する対策の提案内容を生成してディスプレイ17に表示するAI処理部15(提示処理部の一例)を備える。これにより、相談内容に基づいて提案内容を適切且つ自動的に導き出して相談員C2に提示するので、相談者C1に対する支援を容易にして相談員C2の負荷をより低減することができる。その他の構成や作用効果については、上記実施の形態1および形態2と同様である。
【0075】
以上、図面を参照しながら各種の実施の形態について説明したが、本開示はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した各種の実施の形態における各構成要素を任意に組み合わせてもよい。
【産業上の利用可能性】
【0076】
本開示は、行政機関等の相談窓口で相談者からの相談内容の中から必要なキーワードを漏らさず効率的に絞り込み、相談内容の要約の簡易な作成を支援して相談員の負荷を低減して、相談対応能力を向上させることができる音声認識データ処理装置、音声認識データ処理システム、および音声認識データ処理方法として有用である。
【符号の説明】
【0077】
1 音声認識データ処理システム
10 音声認識データ処理装置
11 プロセッサ
12 音声認識部
13 キーワード一致判定部
14 カルテレポート生成部
15 AI処理部
16 メモリ
17 ディスプレイ
18 入出力インターフェイス回路
19 通信回路
20 音声認識サーバ
30 AI処理サーバ
31 プロセッサ
33 キーワード一致判定部
34 カルテレポート生成部
35 AI処理部
36 メモリ
39 通信回路
M1 マイク
M2 マイク
NW ネットワーク
TB テーブル
AB 要約レポート