IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2023-47767音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023047767
(43)【公開日】2023-04-06
(54)【発明の名称】音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラム
(51)【国際特許分類】
   G10L 15/22 20060101AFI20230330BHJP
【FI】
G10L15/22 200V
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021156868
(22)【出願日】2021-09-27
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLU―RAY DISC
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(72)【発明者】
【氏名】藤崎 克己
(57)【要約】
【課題】従来の技術では、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に関係なく限られた認識パターンで発話音声を与える必要があるため、利用者にとって柔軟性に欠けるという課題があった。
【解決手段】音声記録管理装置3は、利用者の発話音声に基づく音声情報と、発話音声を発した利用者が所属するテナントのテナント識別情報及びその利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた音声情報を解析するための認識パターンを識別する認識パターン識別情報と、を音声解析サーバ4に対して送信し(S113)、解析サーバ4が音声情報及び認識パターン識別情報に基づいて解析した解析結果を、解析結果管理DB3006で管理されている「記録種別」、「作業対象」、「作業項目」、「作業結果」に対応付けて登録する(S122)。
【選択図】図1
【特許請求の範囲】
【請求項1】
発話音声を認識するための一以上の認識パターンを登録する登録管理用端末と、前記登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置と、を含む音声記録管理システムであって、
前記登録管理用端末は、
前記発話音声に基づく音声情報を解析してテキスト情報に変換する音声解析サーバが前記音声情報を解析可能となるように、前記一以上の認識パターンを送信する送信手段、
を有し、
前記音声記録管理装置は、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、
を有する、
ことを特徴とする音声記録管理システム。
【請求項2】
前記音声記録管理装置の前記送信手段は、
前記音声記録情報が登録されたことを示す登録完了通知情報、及び前記登録完了通知情報を音声化した登録完了音声情報の少なくとも一方を、前記発話音声が入力された入力端末が受信可能となるように前記音声通信管理装置に対して送信する、
ことを特徴とする請求項1に記載の音声記録管理システム。
【請求項3】
前記登録手段は、
前記登録管理用端末が送信した前記特定の認識パターンを含む前記一以上の認識パターンを、前記認識パターンを識別する認識パターン識別情報に対応付けて管理する認識パターン項目管理手段に登録する、
を有する、
ことを特徴とする請求項1又は2に記載の音声記録管理システム。
【請求項4】
前記登録手段は、
前記一以上の認識パターンを示すそれぞれの認識パターン識別情報を、前記発話音声を発した利用者が所属する所定のテナントを識別するテナント識別情報及び前記利用者が所属する所定のグループを識別するグループ識別情報に対応付けて管理する認識パターン識別管理手段に登録する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の音声記録管理システム。
【請求項5】
前記登録手段は、
前記発話音声に含まれ、前記認識パターンを構成する各項目の類義語を、前記各項目を示すキーワードに対応付けて管理する類義語管理手段に登録する、
ことを特徴とする請求項1乃至4のいずれか一項に記載の音声記録管理システム。
【請求項6】
前記登録手段は、
前記音声解析結果情報に含まれる各値を、前記認識パターン項目管理手段で管理されている各項目と対応付けた後、前記音声記録情報を識別する音声記録識別情報に対応付けて管理する解析結果管理手段に登録する、
ことを特徴とする請求項3乃至5のいずれか一項に記載の音声記録管理システム。
【請求項7】
請求項1乃至6に記載の音声記録管理システムであって、
前記音声記録管理装置は、更に、
前記音声解析サーバが送信した前記音声解析結果情報に合致する認識パターンがあるかを判断する判断手段を有する、
ことを特徴とする音声記録管理システム。
【請求項8】
前記判断手段が前記音声解析結果情報に合致する認識パターンがないと判断した場合に、前記音声記録管理装置の前記送信手段は、
前記音声解析サーバが前記音声情報に対する解析ができなかったことを示す登録失敗通知を、前記入力端末が受信可能とするように前記音声記録管理装置に対して送信する、
ことを特徴とする請求項7に記載の音声記録管理システム。
【請求項9】
前記音声情報は、介護記録、又は、介護及び看護における申し送りに係る申送情報を含み、前記一以上の認識パターン情報は、前記一以上の認識パターンを識別するための認識パターン識別情報と、前記認識パターンに含まれる一以上の項目と、を含む、
ことを特徴とする請求項1乃至8のいずれか一項に記載の音声記録管理システム。
【請求項10】
発話音声を認識するための一以上の認識パターンを登録する登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置であって、
前記登録管理用端末が送信した前記一以上の認識パターンを受信する受信手段と、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、
を有する、
ことを特徴とする音声記録管理装置。
【請求項11】
発話音声を認識するための一以上の認識パターンを登録する登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置が実行する音声記録管理方法であって、
前記登録管理用端末が送信した前記一以上の認識パターンを受信する受信ステップと、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信ステップと、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録ステップと、
を含む処理を実行することを特徴とする音声記録管理方法。
【請求項12】
音声情報に基づいて得られた音声記録情報を管理する音声記録管理装置に、
発話音声を認識するための一以上の認識パターンを登録する登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置に、
前記登録管理用端末が送信した前記一以上の認識パターンを受信する受信ステップと、
前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信ステップと、
前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録ステップと、
を含む処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラムに関する。
【背景技術】
【0002】
従来から、認識パターンに基づいて音声データを認識して、テキストに変換する技術が知られている。
【0003】
例えば、ユーザが発話した作業の内容を示す音声データをテキストに変換して、作業記録として管理する技術が知られている(例えば、特許文献1参照)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に関係なく限られた認識パターンで発話音声を与える必要があるため、利用者にとって柔軟性に欠けるという課題があった。
【課題を解決するための手段】
【0005】
上述した課題を解決するために、請求項1に係る発明は、発話音声を認識するための一以上の認識パターンを登録する登録管理用端末と、前記登録管理用端末に入力された前記一以上の認識パターンに基づいて得られた音声記録情報を管理する音声記録管理装置と、を含む音声記録管理システムであって、前記登録管理用端末は、前記発話音声に基づく音声情報を解析してテキスト情報に変換する音声解析サーバが前記音声情報を解析可能となるように、前記一以上の認識パターンを送信する送信手段、を有し、前記音声記録管理装置は、前記音声情報に対する解析を要求するための音声解析要求として、前記発話音声を発した利用者が所属するテナントのテナント識別情報及び前記利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた前記一以上の認識パターンを識別する一以上の認識パターン識別情報及び前記音声情報を、前記音声解析サーバに対して送信する送信手段と、前記音声解析要求に対して、前記音声解析サーバが前記一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び前記特定の認識パターンを示す特定の認識パターン識別情報に基づいて、前記音声情報に対応する音声記録情報を登録する登録手段と、を有する、ことを特徴とする音声記録管理システムを提供する。
【発明の効果】
【0006】
以上説明したように本発明によれば、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に対応した認識パターンで発話音声を与えることができるので、利用者に対する柔軟性を向上させることが可能になるという効果を奏する。
【図面の簡単な説明】
【0007】
図1】通信システムの全体構成の一例を示す図である。
図2】登録管理用端末、音声記録管理装置、音声解析サーバ及び音声通信管理装置のハードウエア構成の一例を示す図である。
図3】入力端末及び閲覧用端末のハードウエア構成の一例を示す図である。
図4A】通信システムの機能構成の一例を示す図である。
図4B】通信システムの機能構成の一例を示す図である。
図4C】通信システムの機能構成の一例を示す図である。
図5】認識パターン項目管理テーブルの一例を示す概念図である。
図6】認識パターン識別管理テーブルの一例を示す概念図である。
図7】類義語管理テーブルの一例を示す概念図である。
図8】テナントグループ管理テーブルの一例を示す概念図である。
図9】音声記録管理テーブルの一例を示す概念図である。
図10】解析結果管理テーブルの一例を示す概念図である。
図11】通知情報管理テーブルの一例を示す概念図である。
図12】認識パターンの一例を示す概念図である。
図13】ユーザ情報管理テーブルの一例を示す概念図である。
図14】音声情報管理テーブルの一例を示す概念図である。
図15】認識パターンの登録処理の一例を示すシーケンス図である。
図16】類義語の登録処理の一例を示すシーケンス図である。
図17】音声情報(データ)の格納までの処理の一例を示すシーケンス図である。
図18】合致する認識パターンが無い場合の音声解析処理の一例を示すシーケンス図である。
図19】合致する認識パターンがある場合の音声解析処理の一例を示すシーケンス図である。
図20】(a)は入力端末における指示入力の失敗通知の画面表示例、(B)は入力端末における指示入力の成功通知の画面表示例である。
図21】閲覧用端末における介護記録確認通知の画面表示例である。
図22】閲覧用端末における申し送り確認通知の画面表示例である。
図23】検索処理及び音声記録処理の一例を示すシーケンス図である。
図24】(a)は閲覧用端末における申し送り検索時の画面表示例、(b)は閲覧用端末における申し送り確認通知の他の画面表示例である。
図25】(a)は他の閲覧用端末における申し送り検索時の画面表示例、(b)は他の閲覧用端末における申し送り確認通知の他の画面表示例である。
【発明を実施するための形態】
【0008】
以下、図面を用いて、発明を実施するための形態について説明する。なお、図面の説明において同一要素には同一符号を付し、重複する部分があればその説明を省略する。
【0009】
〔実施形態〕
図1乃至図25を用いて、実施形態について説明する。
【0010】
〔通信システムの全体構成〕
<<システム構成例>>
図1は、通信システムの全体構成の一例を示す図である。図1に示されているように、通信システム1は、登録管理用端末2、音声記録管理装置3、音声解析サーバ4、音声通信管理装置5、ユーザ端末6、通話機7、閲覧用端末9を含む各装置及びサーバを有している。登録管理用端末2、音声記録管理装置3、音声解析サーバ4、音声通信管理装置5、ユーザ端末6、通話機7及び閲覧用端末9は、通信ネットワーク100を介してそれぞれ互いに接続されている。ここで、通信ネットワーク100は、不特定多数の通信が行われる通信ネットワークであり、インターネット、イントラネット、LAN(Local Area Network)等によって構築されている。なお、通信ネットワーク100には、有線通信だけでなく、3G(3rd Generation)、4G(4th Generation)、5G(5th Generation)、WiMAX(Worldwide Interoperability for Microwave Access)、LTE(Long Term Evolution)等の無線通信による通信ネットワークが含まれてもよい。
【0011】
通信システム1は、登録管理用端末2及び音声記録管理装置3によって構築された音声記録管理システム10を有している。なお、登録管理用端末2及び音声記録管理装置3は、専用の構内ネットワーク等で互いに接続されていてもよいし、通信ネットワーク100の内側に、ファイアウォール(Fire Wall)を介して互いに接続されていてもよい。
【0012】
通信システム1は更に、登録管理用端末2及び音声記録管理装置3で構成される音声記録管理システム10に、入力端末8及び閲覧用端末9を加えた音声入力閲覧管理システム20を構築してもよい。また、本実施形態において、ユーザ端末6と通話機7とを総称して入力端末8と呼ぶ。以下、各装置及びサーバの基本的な機能については、以下に詳細を説明する。
【0013】
<登録管理用端末>
登録管理用端末2は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、登録管理用端末2は、音声記録管理システム10を構築する一つの装置である。また、登録管理用端末2は、発話音声を認識するための一以上の認識パターンを登録する。また、登録管理用端末2は、登録管理用端末2を管理する管理者によって入力された認識パターンの登録指示を受け付け、受け付けた認識パターンを、ネットワーク100を介して音声記録管理装置3に対して送信する。なお、登録管理用端末2は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。登録管理用端末2は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0014】
<音声記録管理装置>
音声記録管理装置3は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、音声記録管理装置3は、音声記録管理システム10を構築する一つの装置である。また、音声記録管理装置3は、登録管理用端末2に入力された一以上の認識パターンに基づいて得られた音声記録情報を管理する。なお、音声記録情報は、後述する解析結果管理DB3006で管理され、認識パターンごとに定義された項目名に対応する音声解析結果情報を含む。また、音声記録管理装置3は、音声通信アプリを記憶手段に記憶している。
【0015】
なお、音声記録管理装置3は、単一のコンピュータによって構築されてもよいし、ストレージ等の各部(機能又は手段)を分割して任意に割り当てられた複数のコンピュータによって構築されてもよい。また、音声記録管理装置3の機能の全てまたは一部は、クラウド環境に存在するサーバコンピュータであってもよいし、オンプレミス環境に存在するサーバコンピュータであってもよい。
【0016】
<音声解析サーバ>
音声解析サーバ4は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。音声解析サーバ4は、音声記録管理装置3が送信したテナント及びグループの少なくとも一方に関連付けられた一以上の認識パターンを登録する。また音声解析サーバ4は、利用者が発話した発話音声に基づく音声データ(音声情報)を音声認識エンジンによって解析し、テキストデータ(テキスト情報)に変換して音声記録管理装置3に応答する。つまり、本実施形態に係る通信システムでは、音声解析サーバ4が、音声情報からテキスト情報に変換するクラウドサービス機能を有している。具体的には、音声解析サーバは、音声認識を可能とする他社サービスを利用するようにしてもよく、例えば、汎用の音声認識エンジンサービスで提供されてよい。
【0017】
<音声通信管理装置>
音声通信管理装置5は、一般的なサーバOSなどが搭載された一以上の情報処理装置(コンピュータシステム)によって実現される。また、音声通信管理装置5は、入力端末が送信した音声データを所定の記憶手段に記憶し、音声記録管理装置3が送信した音声データの問合せに応じて、所定の記憶手段に記憶した音声データを音声記録管理装置3に送信する。また、音声通信管理装置5は、音声通信アプリを記憶手段に記憶し、入力端末8が送信した音声データ(音声情報)を音声記録管理装置3に送信する。また、音声通信管理装置5は、入力端末8と音声記録管理装置3との間を仲介して音声記録管理装置3が送信する各種通知情報、画面データ(画面情報)等を入力端末8に送信する仲介装置の機能も有する。なお、音声通信管理装置5は、他社サービスにより提供される。
【0018】
また、音声通信管理装置5は、後述する入力端末8に対してプッシュ通知(送信)によりデータ(情報)を通知(送信)してもよい。その場合、音声通信管理装置5は、例えば、プッシュ通知サーバの一例であるFCM(Firebase Cloud Messaging)を利用してプッシュ通知することで実現することが可能である。なお、音声通信管理装置5は、一般的に使用されるPC(Personal Computer)であってもよい。音声通信管理装置5は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0019】
<ユーザ端末>
ユーザ端末6は、一般的なOSなどが搭載された通信を行うための一以上の情報処理装置(コンピュータシステム)によって実現される。ユーザ端末6は、利用者の発話による発話音声を音声情報に変換して音声通信管理装置5に送信する。また、ユーザ端末6は、音声通信管理装置5が送信(転送)した、音声記録管理装置3が生成した各種通知情報、画面データ(画面情報)を受信してユーザ端末6のディスプレイ上に表示し、スピーカを介して通知音声を再生する。なお、ユーザ端末6は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。ユーザ端末6は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0020】
<通話機>
通話機7は、マイクを備え、通話機を利用する利用者が発話した発話音声を電気信号に変換して通信ネットワーク100に送信する機能を有する。また、通話機7は、通信ネットワーク100を介して送信された音声データを音声信号に変換してスピーカを介して再生する。なお、通話機7は、一般的に知られているインカムを一例とする通信機器である。
【0021】
なお、本実施形態において、ユーザ端末6及び通話機7は、所定のテナント、グループ等に所属する利用者の発話音声によって与えられた音声データ(音声信号)を送信し、音声通信管理装置5が送信した各種通知情報及び画面データを表示、又は音声再生する入力端末8として機能する。
【0022】
<閲覧用端末>
閲覧用端末9は、一般的なOSなどが搭載された通信を行うための一以上の情報処理装置(コンピュータシステム)によって実現される。閲覧用端末9は、閲覧者の操作を受け付けることによって音声通信管理装置5が送信(転送)した、音声記録管理装置3が生成した各種通知情報、画面データをディスプレイ上に表示し、スピーカを介して通知音声を再生する。なお、閲覧用端末9は、一般的に使用されるPC(Personal Computer)、携帯型ノートPC、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末(サングラス型、腕時計型等)の通信機能を有する通信端末であってもよい。閲覧用端末9は、更に、ブラウザソフトウエア等のソフトウエアを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0023】
●用語について●
本実施形態において利用者とは、以下に該当する者をいう。例えば、利用者には、所定のイベント、作業、医療行為等において発話する作業者、閲覧用端末を利用して各種情報を閲覧する閲覧者、人間が話す言語を生成可能なAIを搭載した機械、人型ロボット等が含まれる。本実施形態では、説明の便宜上、利用者という用語を使用する。
【0024】
更に、本実施形態において音声情報とは、介護記録、又は、介護及び看護における申し送りに係る申送情報を含む。また、一以上の認識パターン情報とは、一以上の認識パターンを識別するための認識パターン識別情報と、認識パターンに含まれる一以上の項目と、を含む。
【0025】
更に、本実施形態においてテキスト(テキスト情報)とは、利用者が発話した音声に係る音声情報を、所定の辞書等によって認識された結果に基づいて、視認可能な文字で表される単語、熟語、数字、記号、文などに変換された各種情報をいう。
【0026】
更に、本実施形態において音声記録とは、会議等の所定のイベントにおいて一以上のイベントへの参加者(利用者)が発話した発話音声に係る音声情報(データ)に基づいて得られたテキスト情報(データ)、画像、発話音声を含む議事録などで構成される記録をいう。
【0027】
そして、音声記録情報とは、後述する解析結果管理テーブルで管理され、認識パターン毎に定義された項目名に対応する解析結果情報を示す。
【0028】
〔ハードウエア構成〕
続いて、図2及び図3を用いて、実施形態に係る通信システムを構成する装置又は端末のハードウエア構成について説明する。なお、図2及び図3に示されている装置又は端末のハードウエア構成は、必要に応じて構成要素が追加又は削除されてもよい。
【0029】
<登録管理用端末、音声記録管理装置、音声解析サーバ、音声通信管理装置のハードウエア構成>
図2は、登録管理用端末、音声記録管理装置、音声解析サーバ及び音声通信管理装置のハードウエア構成の一例を示す図である。図2に示されているように、登録管理用端末2は、例えばコンピュータによって構築されており、CPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220を備えている。
【0030】
これらのうち、CPU201は、登録管理用端末2全体の動作を制御する。ROM202は、CPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。EEPROM204は、CPU201の制御にしたがって、アプリ等の各種データの読出し又は書込みを行う。HD205は、プログラム等の各種データを記憶する。HDDコントローラ206は、CPU201の制御にしたがってHD205に対する各種データの読出し又は書込みを制御する。ディスプレイ207は、カーソル、メニュー、ウィンドウ、文字又は画像などの各種情報を表示する。近距離通信I/F208は、NFC(Near Field Communication)、Bluetooth(登録商標。以下省略)、Wi-Fi(登録商標。以下省略)等の無線通信インターフェイスを備える通信装置、又は通信端末等とデータ通信を行うための通信回路である。CMOSセンサ209は、CPU201の制御にしたがって被写体を撮像して画像データ又は動画データを得る内蔵型の撮像手段の一種である。なお、撮像手段は、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等で構成される撮像手段であってもよい。撮像素子I/F210は、CMOSセンサ209の駆動を制御する回路である。
【0031】
ネットワークI/F211は、通信ネットワーク100を利用してデータ通信をするためのインターフェイスである。キーボード212は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス213は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。メディアI/F215は、フラッシュメモリ等の記録メディア214に対するデータの読出し又は書込み(記憶)を制御する。外部機器接続I/F216は、各種の外部機器を接続するためのインターフェイスである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリ等である。音入出力I/F217は、CPU201の制御にしたがってマイク218及びスピーカ219との間で音信号の入出力を処理する回路である。マイク218は、音を電気信号に変える内蔵型の回路であり、外部のスピーカ等から発する音声や音波を取得し電気信号を用いた情報を取得する。スピーカ219は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。バスライン220は、CPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0032】
音声記録管理装置3は、例えばコンピュータによって構築されており、CPU301、ROM302、RAM303、EEPROM304、HD305、HDD(Hard Disk Drive)コントローラ306、ディスプレイ307、近距離通信I/F308、CMOSセンサ309、撮像素子I/F310、ネットワークI/F311、キーボード312、ポインティングデバイス313、メディアI/F315、外部機器接続I/F316、音入出力I/F317、マイク318、スピーカ319及びバスライン320を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。
【0033】
音声解析サーバ4は、例えばコンピュータによって構築されており、CPU401、ROM402、RAM403、EEPROM404、HD405、HDD(Hard Disk Drive)コントローラ406、ディスプレイ407、近距離通信I/F408、CMOSセンサ409、撮像素子I/F410、ネットワークI/F411、キーボード412、ポインティングデバイス413、メディアI/F415、外部機器接続I/F416、音入出力I/F417、マイク418、スピーカ419及びバスライン420を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。
【0034】
音声通信管理装置5は、例えばコンピュータによって構築されており、CPU501、ROM502、RAM503、EEPROM504、HD505、HDD(Hard Disk Drive)コントローラ506、ディスプレイ507、近距離通信I/F508、CMOSセンサ509、撮像素子I/F510、ネットワークI/F511、キーボード512、ポインティングデバイス513、メディアI/F515、外部機器接続I/F516、音入出力I/F517、マイク518、スピーカ519及びバスライン520を備えている。これらのハードウエア資源は、登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、HD205、HDD(Hard Disk Drive)コントローラ206、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、キーボード212、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。
【0035】
<入力端末、閲覧用端末のハードウエア構成>
入力端末及び閲覧用端末のハードウエア構成の一例を示す図である。図3に示されているように、入力端末8は、例えばコンピュータによって構築されており、CPU801、ROM802、RAM803、EEPROM804、ディスプレイ807、近距離通信I/F808、CMOSセンサ809、撮像素子I/F810、ネットワークI/F811、ポインティングデバイス813、メディアI/F815、外部機器接続I/F816、音入出力I/F817、マイク818、スピーカ819及びバスライン820を備えている。これらのハードウエア資源は、図2に示した登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。なお、入力端末8は、ブラウザソフトウエア等のプログラムを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0036】
閲覧用端末9は、例えばコンピュータによって構築されており、CPU901、ROM902、RAM903、EEPROM904、ディスプレイ907、近距離通信I/F908、CMOSセンサ909、撮像素子I/F910、ネットワークI/F911、ポインティングデバイス913、メディアI/F915、外部機器接続I/F916、音入出力I/F917、マイク918、スピーカ919及びバスライン920を備えている。これらのハードウエア資源は、図2に示した登録管理用端末2のCPU201、ROM202、RAM203、EEPROM204、ディスプレイ207、近距離通信I/F208、CMOSセンサ209、撮像素子I/F210、ネットワークI/F211、ポインティングデバイス213、メディアI/F215、外部機器接続I/F216、音入出力I/F217、マイク218、スピーカ219及びバスライン220の各ハードウエア資源と同様であるため、説明を省略する。なお、閲覧用端末9は、ブラウザソフトウエア等のプログラムを動作させることが可能な通信装置又は通信端末が用いられてもよい。
【0037】
更に、上記プログラムは、インストール可能な形式又は実行可能な形式のファイルで、コンピュータで読取り可能な記録媒体に記録、又はネットワークを介してダウンロードを行い流通させるようにしてもよい。記録媒体の例として、CD-R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、Blu-ray Disc、SDカード、USBメモリ等が挙げられる。また、記録媒体は、プログラム製品(Program Product)として、国内又は国外へ提供されることができる。例えば、音声記録管理装置3は、本発明に係るプログラムが実行されることで、本発明に係る音声記録管理方法を実現する。
【0038】
〔通信システムの機能構成〕
次に、図4乃至図14を用いて、本実施形態の機能構成について説明する。図4は、通信システムの機能構成の一例を示す図である。
【0039】
<登録管理用端末の機能構成>
図4Aに示されているように、登録管理用端末2は、送受信部21、操作受付部22、表示制御部24、登録部26、アプリ起動部28及び記憶読出部29を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM202、EEPROM204及びHD205のうち少なくとも一つからRAM203に展開された登録管理用端末2用のプログラムに従ったCPU201からの命令により動作することで実現される機能又は手段である。また、登録管理用端末2は、図2に示されているROM202、EEPROM204及びHD205のうち少なくとも一つにより構築される記憶部2000を有している。更に、記憶部2000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
【0040】
<<登録管理用端末の各機能構成>>
次に、登録管理用端末2の各機能構成について詳細に説明する。図4Aに示されている登録管理用端末2の送受信部21は、主に、ネットワークI/F211及び近距離通信I/F208に対するCPU201の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。また、送受信部21は、音声解析サーバ4が音声情報を解析可能となるように、登録管理用端末2に入力された一以上の認識パターンを送信する。本実施形態において、送受信部21は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0041】
操作受付部22は、主に、キーボード212、ポインティングデバイス213が受け付けた各種操作により生成された信号をCPU201が処理することによって実現される。なお、操作受付部22は、キーボード212、ポインティングデバイス213に代えて、タッチパネル321等の入力手段が用いられてもよい。本実施形態において、操作受付部22は、受付手段の一例として機能する。
【0042】
表示制御部24は、主に、ディスプレイ207に対するCPU201の処理によって実現され、登録管理用端末2における各種画面及び情報(データ)の表示制御を行う。また、表示制御部24は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ207に表示させる。本実施形態において、表示制御部24は、表示制御手段の一例として機能する。
【0043】
登録部26は、主にCPU201の処理によって実現され、登録管理用端末2に対して入力された認識パターン等の各種情報を、記憶部2000の所定領域に記憶、登録する。本実施形態において、登録部26は、登録手段の一例として機能する。
【0044】
アプリ起動部28は、主に、CPU201の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部28は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM303の所定の作業領域上で動作させる。本実施形態において、アプリ起動部28は、起動手段の一例として機能する。
【0045】
記憶読出部29は、主に、図2に示されているROM202、EEPROM204及びHD205のうち少なくとも一つに対するCPU201の処理によって実現され、記憶部2000に各種データ(又は情報)を記憶したり、記憶部2000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部29は、記憶読出手段の一例として機能する。
【0046】
<入力端末の機能構成>
図4Aに示されているように、入力端末8は、送受信部81、操作受付部82、音・画像取得部83、表示制御部84、音声再生部86、アプリ起動部88及び記憶読出部89を有する。これら各機能部は、図3に示された各ハードウエア資源のいずれかが、ROM802及びEEPROM804のうち少なくとも一つからRAM803に展開された入力端末8用のプログラムに従ったCPU801からの命令により動作することで実現される機能又は手段である。また、入力端末8は、図3に示されているROM802及びEEPROM804のうち少なくとも一つにより構築される記憶部8000を有している。更に、記憶部8000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
【0047】
<<入力端末の各機能構成>>
次に、入力端末8の各機能構成について詳細に説明する。図4Aに示されている入力端末8の送受信部81は、主に、ネットワークI/F811及び近距離通信I/F808に対するCPU801の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部81は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0048】
操作受付部82は、主に、ポインティングデバイス813が受け付けた各種操作により生成された信号をCPU801が処理することによって実現される。なお、操作受付部22は、ポインティングデバイス813に代えて、キーボード、タッチパネル等の入力手段が用いられてもよい。本実施形態において、操作受付部82は、受付手段の一例として機能する。
【0049】
音・画像取得部83は、主に、マイク818、音入出力I/F817、CMOSセンサ809及び撮像素子I/F810に対するCPU801の処理によって実現され、入力端末8を利用する利用者が発話した発話音声等に係る音声(音)を集音して音声情報(音声データ)又は音情報(音データ)を取得する。音・画像取得部83は、更に、利用者の顔などの画像に係る画像を撮影して画像情報(画像データ)を取得する。本実施形態において、音・画像取得部83は、取得手段の一例として機能する。
【0050】
表示制御部84は、主に、ディスプレイ807に対するCPU801の処理によって実現され、入力端末8における各種画面及び情報(データ)の表示制御を行う。また、表示制御部84は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ807に表示させる。本実施形態において、表示制御部84は、表示制御手段の一例として機能する。
【0051】
音声再生部86は、主に、スピーカ819及び音入出力I/F817に対するCPU801の処理によって実現され、入力端末8を利用する利用者に対して、音声記録管理装置3が生成した各種通知情報に係る音声(音)を、スピーカ819を介して出力(再生)する。本実施形態において、音声再生部86は、再生手段の一例として機能する。
【0052】
アプリ起動部88は、主に、CPU801の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部88は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM803の所定の作業領域上で動作させる。本実施形態において、アプリ起動部88は、起動手段の一例として機能する。
【0053】
記憶読出部89は、主に、図3に示されているROM802及びEEPROM804のうち少なくとも一つに対するCPU801の処理によって実現され、記憶部8000に各種データ(又は情報)を記憶したり、記憶部8000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部89は、記憶読出手段の一例として機能する。
【0054】
<閲覧用端末の機能構成>
図4Aに示されているように、閲覧用端末9は、送受信部91、操作受付部92、表示制御部94、音声再生部96、アプリ起動部98及び記憶読出部99を有する。これら各機能部は、図3に示された各ハードウエア資源のいずれかが、ROM902及びEEPROM904のうち少なくとも一つからRAM903に展開された閲覧用端末9用のプログラムに従ったCPU901からの命令により動作することで実現される機能又は手段である。また、閲覧用端末9は、図3に示されているROM902及びEEPROM904のうち少なくとも一つにより構築される記憶部9000を有している。更に、記憶部9000には、各装置、各端末と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)、ブラウザアプリ等が記憶されている。
【0055】
<<閲覧用端末の各機能構成>>
次に、閲覧用端末9の各機能構成について詳細に説明する。図4Aに示されている閲覧用端末9の送受信部91は、主に、ネットワークI/F911及び近距離通信I/F908に対するCPU901の処理によって実現され、通信ネットワーク100を介して各端末、各装置との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部91は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0056】
操作受付部92は、主に、ポインティングデバイス913が受け付けた各種操作により生成された信号をCPU901が処理することによって実現される。なお、操作受付部92は、ポインティングデバイス913に代えて、キーボード、タッチパネル等の入力手段が用いられてもよい。本実施形態において、操作受付部92は、受付手段の一例として機能する。
【0057】
表示制御部94は、主に、ディスプレイ907に対するCPU901の処理によって実現され、閲覧用端末9における各種画面及び情報(データ)の表示制御を行う。また、表示制御部94は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、ディスプレイ907に表示させる。本実施形態において、表示制御部94は、表示制御手段の一例として機能する。
【0058】
音声再生部96は、主に、スピーカ919及び音入出力I/F917に対するCPU901の処理によって実現され、閲覧用端末9を利用する利用者に対して、音声記録管理装置3が生成した各種通知情報に係る音声(音)を、スピーカ919を介して出力(再生)する。本実施形態において、音声再生部96は、再生手段の一例として機能する。
【0059】
アプリ起動部98は、主に、CPU901の処理によって実現され、各装置、各端末との間で通信ネットワーク100を介して各種アプリの起動を行う。また、アプリ起動部98は、音声通信管理装置5に対して各種テキスト情報をアップロードするためのアプリを、RAM903の所定の作業領域上で動作させる。本実施形態において、アプリ起動部98は、起動手段の一例として機能する。
【0060】
記憶読出部99は、主に、図3に示されているROM902及びEEPROM904のうち少なくとも一つに対するCPU901の処理によって実現され、記憶部9000に各種データ(又は情報)を記憶したり、記憶部9000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部99は、記憶読出手段の一例として機能する。
【0061】
<音声記録管理装置の機能構成>
図4Bに示されているように、音声記録管理装置3は、送受信部31、表示制御部34、判断部35、登録部36、検索部37、生成部38及び記憶読出部39を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM302、EEPROM304及びHD305のうち少なくとも一つからRAM303に展開された音声記録管理装置3用のプログラムに従ったCPU301からの命令により動作することで実現される機能又は手段である。また、音声記録管理装置3は、図2に示されているROM302、EEPROM304及びHD305のうち少なくとも一方により構築される記憶部3000を有している。更に、記憶部3000には、核装置、各端末と通信ネットワーク100を介してそれぞれ通信を行うための通信プログラム(通信アプリ)と及びブラウザアプリと、記録管理アプリ等が記憶されている。
【0062】
●認識パターン項目管理テーブル●
図5は、認識パターン項目管理テーブルの一例を示す概念図である。記憶部3000には、図5に示されているような認識パターン項目管理テーブルによって構成された認識パターン項目管理DB3001が構築されている。認識パターン項目管理テーブルでは、後述する認識パターン識別情報ごとに、登録順序、項目名が関連付けられて記憶、管理されている。
【0063】
これらのうち、認識パターン識別情報は、入力端末8が送信した音声情報を音声解析サーバ4が音声認識を行いテキスト情報に変換するために用いられる認識パターンを識別するための識別情報を表し、例えば、「R0001」、「R0002」等で与えられる。登録順序は、一つの認証パターンを構成する「記録種別」、「作業対象」、「作業項目」及び「作業結果」の各項目のうち、どの項目をどの順序で登録するかを示す順序情報である。このテーブルによって、管理者は所定のテナント、所定のグループごとに複数の認識パターンを登録することが可能になる。なお、項目名は、上述した一つの認証パターンを構成する各項目の名称である。本実施形態において、認識パターン項目管理DB3001は、一以上の認識パターンを、認識パターンを識別する認識パターン識別情報に対応付けて管理する認識パターン項目管理手段の一例である。
【0064】
●認識パターン識別管理テーブル●
図6は、認識パターン識別管理テーブルの一例を示す概念図である。記憶部3000には、図5に示されているような認識パターン項目管理テーブルによって構成された認識パターン項目管理DB3001が構築されている。認識パターン識別管理テーブルでは、テナント識別情報ごとに、グループ識別情報及び認識パターン識別情報が関連付けられて記憶、管理されている。
【0065】
これらのうち、テナント識別情報は、通信システム1を利用する利用者、管理者、閲覧者等が所属するテナントを識別するための識別情報であり、テナントは、会社、学校等の組織、団体等を一例とする。ここではテナント識別情報は、例えば、「T0001」、「T0115」等で与えられる。グループ識別情報は、所定のテナントに割り振られた所定のグループを識別するための識別情報である。ここではグループ識別情報は、例えば、「G0001」、「G0002」等で与えられる。認識パターン識別管理テーブルでは、テナント識別情報及びグループ識別情報に、どの認識パターンを示す認識パターン識別情報が対応付けられているかが管理されている。例えば、テナント識別情報「T0001」及びグループ識別情報「G0001」に対応付けられているのは、二つの認識パターン(「R0001」、「R0002」)であり、テナント識別情報「T0115」及びグループ識別情報「G0004」に対応付けられているのは、三つの認識パターン(「R1234」、「R1235」、「R1236」)であることを示している。本実施形態において、認識パターン識別管理DB3002は、一以上の認識パターンを示すそれぞれの認識パターン識別情報を、発話音声を発した利用者が所属する所定のテナントを識別するテナント識別情報及び利用者が所属する所定のグループを識別するグループ識別情報に対応付けて管理する認識パターン識別管理手段の一例である。
【0066】
●類義語管理テーブル●
図7は、類義語管理テーブルの一例を示す概念図である。記憶部3000には、図7に示されているような類義語管理テーブルによって構成された類義語管理DB3003が構築されている。類義語管理テーブルでは、項目識別情報ごとに、項目名キーワード、類義語1、類義語2、・・・が関連付けられて記憶、管理されている。
【0067】
これらのうち、項目識別情報は類義語としての項目を識別するための識別情報(例えば通し番号)である。項目名キーワードは、認識パターンを構成する各項目において、キーワードとなるものが管理され、例えば、「体温」、「服薬」、「投薬」等で与えられる。類義語1、類義語2、・・・は、項目名キーワードに似たことばが管理され、例えば、「体温」に似たことばとして、「熱」、「お熱」などが管理される。これにより、利用者(作業者)は、介護、看護の場における発話時の言葉の制約を緩和させることができる。本実施形態において、類義語管理DB3003は、発話音声に含まれ、認識パターンを構成する各項目の類義語を、各項目を示すキーワードに対応付けて管理する類義語管理手段の一例である。
【0068】
●テナントグループ管理テーブル●
図8は、テナントグループ管理テーブルの一例を示す概念図である。記憶部3000には、図8に示されているようなテナントグループ管理テーブルによって構成されたテナントグループ管理DB3004が構築されている。テナントグループ管理テーブルでは、テナント識別情報に対応付けられてグループ識別情報が記憶、管理されている。このように、テナントグループ管理テーブルは、テナントとグループとを対応付けるためのテーブルである。
【0069】
●音声記録管理テーブル●
図9は、音声記録管理テーブルの一例を示す概念図である。記憶部3000には、図9に示されているような音声記録管理テーブルによって構成された音声記録管理DB3005が構築されている。音声記録管理テーブルでは、テナント識別情報及びグループ識別情報を一組のタブとするそれぞれのタブで分けられた音声記録識別情報ごとに、音声データのパス、利用者識別情報及び登録日時の各項目が関連付けられて記憶、管理されている。
【0070】
これらのうち、音声記録識別情報は、音声記録を管理するための識別情報で、例えば、「V0001」、「V0002」等で与えられる。音声データのパスは、保存される音声データの保存先、パスの情報が示される。この音声データのパスは、例えば、「https://aaa/0001.wav」等で与えられる。なお、音声データのパスで管理されているそれぞれの内容は、上述した音声情報管理テーブルで管理されている音声データのパスと同じ内容でもよい。利用者識別情報は、利用者(作業者)を識別するための情報で、例えば、「User001」、「User002」等で与えられる。登録日時は、音声記録を登録した日時情報であり、例えば、「2021/08/06 15:00:39」等の日付情報で与えられる。
【0071】
●解析結果管理テーブル●
図10は、解析結果管理テーブルの一例を示す概念図である。記憶部3000には、図10に示されているような解析結果管理テーブルによって構成された解析結果管理DB3006が構築されている。解析結果管理テーブルでは、音声記録識別情報ごとに、記録種別、作業対象、作業項目、作業日時及び利用者識別情報が関連付けられて記憶、管理されている。
【0072】
これらのうち、記録種別、作業対象、作業項目、作業対象は、上述した認識パターン項目管理テーブルで説明した各項目名に対応する具体的な内容が、音声記録識別情報ごとに対応付けられて管理される。さらに、音声記録識別情報に対応付けられて、作業日時、利用者識別情報も管理される。解析結果管理テーブルでは、後述する音声解析サーバ4が解析した結果である音声解析結果情報を構成する各成分が管理される。本実施形態において、解析結果管理DB3006は、音声解析結果情報に含まれる各値を、認識パターン項目管理DB3001(図5参照)で管理されている各項目と対応付けた後、音声記録情報を識別する音声記録識別情報に対応付けて管理する解析結果管理手段の一例である。
【0073】
●通知情報管理テーブル●
図11は、通知情報管理テーブルの一例を示す概念図である。記憶部3000には、図11に示されているような通知情報管理テーブルによって構成された通知情報管理DB3007が構築されている。通知情報管理テーブルでは、記録種別に対応させて通知情報の音声データが管理されている。ここでは、記録種別として、「介護記録」、「申し送り」が与えられるが、これらに限らない。通知情報の音声データは、それぞれの記録種別に対応付けられ、入力端末8、閲覧用端末9に対して通知される通知情報の音声データのパス(「https://aaa.notice01.wav等」)が与えられる。
【0074】
<<音声記録管理装置の各機能構成>>
次に、音声記録管理装置3の各機能構成について詳細に説明する。図4Bに示されている音声記録管理装置3の送受信部31は、主に、ネットワークI/F311及び近距離通信I/F308に対するCPU301の処理によって実現され、通信ネットワーク100を介して音声解析サーバ4と音声通信管理装置5との間でそれぞれ各種データ(又は情報)の送受信を行う。また、送受信部31は、音声情報に対する解析を要求するための音声解析要求として、発話音声を発した利用者が所属するテナントのテナント識別情報及び利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた一以上の認識パターンを識別する一以上の認識パターン識別情報及び音声情報を、音声解析サーバ4に対して送信する。また、送受信部31は、音声記録情報が登録されたことを示す登録完了通知情報、及び登録完了通知情報を音声化した登録完了音声情報の少なくとも一方を、入力端末8が受信可能となるように音声通信管理装置5に対して送信する。送受信部31は更に、音声解析サーバ4が音声情報に対する解析ができなかったことを示す登録失敗通知を、入力端末8が受信可能とするように音声通信管理装置5に対して送信する。本実施形態において、送受信部31は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0075】
表示制御部34は、主に、ディスプレイ307に対するCPU301の処理によって実現され、音声記録管理装置3における各種画面及び情報(データ)の表示制御を行う。また、表示制御部34は、例えば、ブラウザを用いて、HTML等により作成された表示画面を、通信ネットワーク100を介して、入力端末8のディスプレイ807に表示させるように制御してもよい。本実施形態において、表示制御部34は、表示制御手段の一例として機能する。
【0076】
判断部35は、主に、CPU301の処理によって実現され、音声記録管理装置3における各種判断を行う。また、判断部35は、音声解析サーバ4が送信した音声解析結果情報に合致する認識パターンがあるかを判断する。本実施形態において、判断部35は、与えられた所定の条件を満たすかを判断する判断手段の一例として機能する。なお、判断部が判断する内容は、与えられた所定の条件を満たすかを判断する以外に、与えられた所定の条件を満たすか否かを判断するようにしてもよい。
【0077】
登録部36は、主にCPU301の処理によって実現され、音声記録管理装置3に対して送信された認識パターン、類義語、音声データ、解析結果、音声記録等の各種データ(情報)を、各種DB、又は記憶部3000の所定領域に記憶、登録する。また、登録部36は、音声解析サーバ4に対して送信した音声解析要求に対して、発話された音声情報に対応する音声記録情報を登録する。具体的には、登録部36は、音声解析サーバ4が一以上の認識パターンのうち特定の認識パターンを用いて解析した音声解析応答に含まれる音声解析結果情報及び特定の認識パターン識別情報に基づいて、音声記録情報を登録する。なお、特定の認識パターン識別情報とは、特定の認識パターンを示す識別情報である。また、登録部36は、登録管理用端末2が送信した特定の認識パターンを含む一以上の認識パターンを、認識パターン項目管理DB3001(図5参照)に登録する。また、登録部36は、登録管理用端末2が送信した一以上の認識パターンを示すそれぞれの認識パターン識別情報を、認識パターン識別管理DB3002(図6参照)に登録する。また、登録部36は、発話音声に含まれ、認識パターンを構成する各項目の類義語を、類義語管理DB3003(図7参照)に登録する。また、登録部36は、音声データのパス、利用者識別情報、登録日時を含む音声記録情報を、音声記録管理DB3005(図9参照)に登録する。また、登録部36は、音声解析結果情報に含まれる各値を、解析結果管理DB3006(図10参照)に登録する。本実施形態において、登録部36は、登録手段の一例として機能する。
【0078】
検索部37は、主に、CPU301の処理によって実現され、例えば、閲覧用端末9が要求した音声記録情報に対する検索要求に基づいて、音声記録管理装置3で登録、管理している各種データ(情報)の検索を行う。本実施形態において、検索部37は、検索手段の一例として機能する。
【0079】
生成部38は、主に、CPU301の処理によって実現され、音声解析サーバが送信した音声解析結果情報に基づいて、入力端末8及び閲覧用端末9に表示させる画面データ、音声記録データ(音声記録情報)を生成する。本実施形態において、生成部38は、生成手段の一例として機能する。
【0080】
記憶読出部39は、主に、ROM302、EEPROM304及びHD305のうち少なくとも一つに対するCPU301の処理によって実現され、記憶部3000に各種データ(又は情報)を記憶したり、記憶部3000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部39は、記憶読出手段の一例として機能する。
【0081】
<音声解析サーバの機能構成>
図4Cに示されているように、音声解析サーバ4は、送受信部41、解析部45、登録部46及び記憶読出部49を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM402、EEPROM404及びHD405のうち少なくとも一つからRAM403に展開された音声解析サーバ4用のプログラムに従ったCPU401からの命令により動作することで実現される機能又は手段である。また、音声解析サーバ4は、図2に示されているROM402、EEPROM404及びHD405のうち少なくとも一つにより構築される記憶部4000を有している。更に、記憶部4000には、音声記録管理装置3と通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)等が記憶されている。
【0082】
●認識パターン●
図12は、認識パターンの一例を示す概念図である。記憶部4000には、図12に示されているような一以上の認識パターンが記憶、管理されている。本実施形態において、認識パターンは以下のようなデータ構造をもつ。例えば、認識パターン識別情報「R0001」、「R0002」等ごとに、(1)記録種別、(2)作業対象、(3)作業項目、(4)作業結果が対応付けられて管理される。具体的には、
・認識パターン識別情報「R0001」のとき、
(1)記録種別・・・[申し送り/介護記録]
(2)作業対象・・・<名前>[さん/様]
(3)作業項目・・・[項目名]
(4)作業結果・・・[項目値]
・認識パターン識別情報「R0002」のとき、
(1)記録種別・・・<名前>[さん/様]
(2)作業対象・・・[項目名]
(3)作業項目・・・[項目値]
(4)作業結果・・・[申し送り/介護記録]
とするそれぞれの対応付けで管理される。
【0083】
ここで、解析サーバ4が認識パターンを用いて所定の音声情報を解析する際の処理イメージの一例を以下に示す。例えば、介護士(作業者)が通話機7(インカム)を用いて、
「介護記録 理光さん、血圧 114の60」
と発話した場合に、解析サーバ4が行う処理について以下に説明する。まず、解析サーバ4は、
・発話された音声情報から、「介護記録」というキーワードを検出する。
・続いて、解析サーバ4は、「介護記録」というキーワードが、登録されている認識パターンの(1)記録種別に合致することを確認するので、
・次のキーワードである「理光さん」を検知し、「理光」を(2)作業対象の<名前>として認識する。
・更に、次のキーワードである「血圧」を検出し、「血圧」を(3)作業結果の<項目名>として認識する。
・更に、次のキーワードである「114の60」を検出し、「114の60」を(4)作業結果の<項目値>として認識する。
【0084】
このように、解析サーバ4は、発話された音声情報をテキストに変換した後、変換されたキーワード(成分)を一つずつ解析したそれぞれの解析結果と、登録されている認識パターン中の各項目と、を評価して、音声解析結果情報を得る。
【0085】
<<音声解析サーバの各機能構成>>
次に、音声解析サーバ4の各機能構成について詳細に説明する。図4Cに示されている音声解析サーバ4の送受信部41は、主に、ネットワークI/F411及び近距離通信I/F408に対するCPU401の処理によって実現され、通信ネットワーク100を介して音声記録管理装置3との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部41は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0086】
解析部45は、主に、CPU401の処理によって実現され、音声記録管理装置3が送信した音声解析要求に対して、記憶部4000の所定領域に登録、管理された認識パターンを用いてテキスト情報に変換する。本実施形態において、解析部45は、解析手段の一例として機能する。
【0087】
登録部46は、主にCPU401の処理によって実現され、音声解析サーバ4に対して送信された一以上の認識パターン、音声解析結果等の各種データ(情報)を、記憶部4000の所定領域に記憶、登録する。本実施形態において、登録部46は、登録手段の一例として機能する。
【0088】
記憶読出部49は、主に、ROM402、EEPROM404及びHD405のうち少なくとも一つに対するCPU401の処理によって実現され、記憶部4000に各種データ(又は情報)を記憶したり、記憶部4000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部49は、記憶読出手段の一例として機能する。
【0089】
<音声通信管理装置の機能構成>
図4Cに示されているように、音声通信管理装置5は、送受信部51、取得部53、情報管理部56及び記憶読出部59を有する。これら各機能部は、図2に示された各ハードウエア資源のいずれかが、ROM502、EEPROM504及びHD505のうち少なくとも一つからRAM503に展開された音声通信管理装置5用のプログラムに従ったCPU401からの命令により動作することで実現される機能又は手段である。また、音声通信管理装置5は、図2に示されているROM502、EEPROM504及びHD505のうち少なくとも一つにより構築される記憶部5000を有している。更に、記憶部5000には、音声記録管理装置3、入力端末8及び閲覧用端末9とそれぞれ通信ネットワーク100を介して通信を行うための通信プログラム(通信アプリ)等が記憶されている。
【0090】
●ユーザ情報管理テーブル●
図13は、ユーザ情報管理テーブルの一例を示す概念図である。記憶部5000には、図13に示されているようなユーザ情報管理テーブルによって構成されたユーザ情報管理DB5001が構築されている。ユーザ情報管理テーブルでは、テナント識別情報及びグループ識別情報を一組のタブとするそれぞれのタブで分けられた利用者識別情報ごとに、パスワード、メールアドレスを含む各項目が関連付けられて記憶、管理されている。
【0091】
これらのうち、パスワードは利用者識別情報を有する利用者が利用可能なパスワードであり、メールアドレスは利用者識別情報を有する利用者の電子メールの宛先情報であり、例えば、「u01@aaa.com」等で与えられる。
【0092】
●音声情報管理テーブル●
図14は、音声情報管理テーブルの一例を示す概念図である。記憶部5000には、図14に示されているような音声情報管理テーブルによって構成された音声情報管理DB5002が構築されている。音声情報管理テーブルでは、利用者識別情報ごとに、音声データのパス、発話日時が対応付けられて記憶、管理されている。
【0093】
これらのうち、音声データのパスは、利用者は発話した発話内容を音声通信管理装置5で管理するためのデータ(ファイル)パスを示すもので、例えば、「<filepath>●●●.wav
」等で与えられる。発話日時は、利用者(作業者)が発話をした日時が管理され、日付情報で与えられる。
【0094】
<<音声通信管理装置の各機能構成>>
次に、音声通信管理装置5の各機能構成について詳細に説明する。図4Cに示されている音声通信管理装置5の送受信部51は、主に、ネットワークI/F511及び近距離通信I/F508に対するCPU501の処理によって実現され、通信ネットワーク100を介して音声記録管理装置3、入力端末8及び閲覧用端末9との間で各種データ(又は情報)の送受信を行う。本実施形態において、送受信部51は、送信手段及び受信手段のうち少なくとも一方の手段の一例として機能する。
【0095】
取得部53は、主に、CPU501の処理によって実現され、音声記録管理装置3による音声データの定期的な問合せ(取得要求)に応じて、入力端末8により送信され、記憶部5000の所定領域に保存された音声データを取得する。本実施形態において、取得部53は、取得手段の一例として機能する。
【0096】
情報管理部56は、主に、CPU501の処理によって実現され、入力端末8が送信した利用者識別情報に基づいて、ユーザ情報管理DB5001に登録、管理されたユーザ情報を管理、確認する。本実施形態において、情報管理部56は、管理手段の一例として機能する。
【0097】
記憶読出部59は、主に、ROM502、EEPROM504及びHD505のうち少なくとも一つに対するCPU501の処理によって実現され、記憶部5000に各種データ(又は情報)を記憶したり、記憶部5000から各種データ(又は情報)を読み出したりする。本実施形態において、記憶読出部59は、記憶読出手段の一例として機能する。
【0098】
〔実施形態の処理又は動作〕
次に、図15乃至図25を用いて、実施形態に係る音声記録管理システムにおける各処理又は動作を説明する。なお、以降に説明する各シーケンス図において、各装置間での通信は、所定の手順による各種認証処理、セッション確立のための処理等が成功し、互いに通信可能な状態であることを前提とする。更に、各装置においては、通信ネットワーク100を介した通信におけるブラウザの起動処理、所定のアプリの起動処理等も実行済みであることを前提とする。
【0099】
<認識パターンの登録処理>
まず、認識パターンの登録処理について説明する。図15は、認識パターンの登録処理の一例を示すシーケンス図である。登録管理用端末2の操作受付部22は、例えば管理者によってキーボード212及びポインティングデバイス213の少なくとも一方を用いて入力された、認識パターン登録指示を受け付ける(ステップS11)。具体的には、操作受付部22は、管理者の操作によってxml, csv等のファイルフォーマットが付与された認識パターン登録用ファイルのアップロード操作の受付、所定のURLの入力等による操作の受付を行う。上述した認識パターン登録用ファイルは、図5で示した認識パターン項目管理テーブルに記載された項目名を含み、この項目名の登録順序を変えた内容が、それぞれ記載パターン識別情報と対応付けて管理されることになる。なお、認識パターン登録用ファイルは、上述したファイル形式に限らず、例えば図5で示したようなデータテーブルの形式で保存、管理されてもよい。
【0100】
次に、送受信部21は、ステップS11で受け付けた認識パターンを音声記録管理装置3に対して送信する(ステップS12)。これにより、音声記録管理装置3の送受信部31は、登録管理用端末2が送信した認識パターン登録用ファイルの内容としての認識パターンを受信する。このとき認識パターンには、認識パターン識別情報、並びに、認識パターンを構成する記録種別、作業対象、作業項目及び作業結果が含まれる。これらの認識パターンの内容は、介護記録、申し送り等の介護、医療等の現場で行われるさまざまな行為に関係する内容が含まれる。
【0101】
次に、音声記録管理装置3の送受信部31は、音声解析サーバ4に対して認識パターン登録要求を送信する(ステップS13)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した認識パターン登録要求を受信する。このとき、認識パターン登録要求には、ステップS12で受信した認識パターンを構成する記録種別、作業対象、作業項目及び作業結果が含まれる。
【0102】
次に、音声解析サーバ4の登録部46は、ステップS13で受信した認識パターンを記憶部4000の所定領域に登録する(ステップS14)。
【0103】
続いて、送受信部41は、認識パターン登録要求に対する応答として、音声記録管理装置3に対して認識パターン登録応答を送信する(ステップS15)。これにより、音声記録管理装置3は、音声解析サーバ4が送信した認識パターン登録応答を受信する。この認識パターン登録応答は、一般的に使用される応答メッセージ、応答フラグ等を含み、認識パターン登録要求に対して正常に処理が行われたことを示す情報であれば特に制約は設けない。
【0104】
次に、音声記録管理装置3の登録部36は、ステップS12で受信した認識パターンに基づいて、認識パターン項目を登録する(ステップS16)。具体的には、登録部36は、認識パターン項目管理DB3001(図5参照)に対して、認識パターン識別情報に対応させて、受信した認識パターンを登録順序ごとに各項目名に分けて登録する。このステップS16で登録される認識パターン項目は、音声解析サーバ4が解析した結果に対して実行する際のキーワード定義と同義である。
【0105】
続いて、登録部36は、認識パターン識別情報を登録する(ステップS17)。具体的には、登録部36は、認識パターン識別管理DB3002(図6参照)に対して、テナント識別情報及びグループ識別情報に対応させて、登録した認識パターンに対応付けられた認識パターン識別情報を登録する。認識パターン識別管理DB3002では、例えば、テナント識別情報「T0001」及びグループ識別情報「G0001」に対応して認識パターン識別情報「R0001」、「R0002」の二つが登録されている。これは、テナント識別情報「T0001」を有するテナント、及びグループ識別情報「G0001」を有するグループに所属する利用者が、「R0001」、「R0002」の二つの認識パターン識別情報を有する各認識パターンのいずれかを利用して、介護、看護等の現場における発話を解析させ、音声記録情報を登録することが可能となっていることを意味している。
【0106】
次に、送受信部31は、ステップS12に対する通知として、登録管理用端末2に対して完了通知を送信する(ステップS18)。これにより、登録管理用端末2の送受信部21は、音声記録管理装置3が送信した完了通知を受信する。
【0107】
本実施形態に係る通信システムでは、例えば、上述したステップS12及びS18の処理が実行される場合、登録管理用端末2と音声記録管理装置3との間に他の装置等が存在してもよい。つまり、登録管理用端末2と音声記録管理装置3との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、登録管理用端末2と音声記録管理装置3との間に他の処理ステップが存在しても適用可能である。
【0108】
本実施形態に係る通信システムでは更に、例えば、上述したステップS13及びS15の処理が実行される場合、音声記録管理装置3と音声解析サーバ4との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と音声解析サーバ4との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と音声解析サーバ4との間に他の処理ステップが存在しても適用可能である。
【0109】
<類義語の登録処理>
次に、類義語の登録処理について説明する。図16は、類義語の登録処理の一例を示すシーケンス図である。認識パターンの登録処理と同様に、登録管理用端末2の操作受付部22は、例えば管理者によってキーボード212及びポインティングデバイス213の少なくとも一方を用いて入力された類義語登録指示を受け付ける(ステップS21)。具体的には、操作受付部22は、管理者の操作によってxml, csv等のファイルフォーマットが付与された類義語登録用ファイルのアップロード操作の受付、所定のURLの入力等による操作の受付を行う。上述した類義語登録用ファイルは、図7で示した類義語項目管理テーブルに記載された項目識別情報ごとに対応付けられた項目名キーワードに対して、その項目名キーワードに似た類義語が複数含まれる。なお、類義語登録用ファイルは、上述したファイル形式に限らず、例えば図7で示したようなデータテーブルの形式で保存、管理されてもよい。
【0110】
次に、送受信部21は、ステップS21で受け付けた類義語に係る類義語情報を音声記録管理装置3に対して送信する(ステップS22)。これにより、音声記録管理装置3の送受信部31は、登録管理用端末2が送信した類義語情報を受信する。このとき類義語情報には、各項目名キーワードに似た複数の類義語が含まれる。これらの類義語の内容は、介護記録、申し送り等の介護、医療等の現場で行われるさまざまな行為に関係し、上述した認識パターンを構成する項目名に似た内容が含まれる。
【0111】
次に、音声記録管理装置3の送受信部31は、音声解析サーバ4に対して類義語登録要求を送信する(ステップS23)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した類義語登録要求を受信する。このとき、類義語情報登録要求には、ステップS22で受信した類義語情報が含まれる。
【0112】
次に、音声解析サーバ4の登録部46は、ステップS23で受信した類義語を記憶部4000の所定領域に登録する(ステップS24)。
【0113】
続いて、送受信部41は、類義語情報登録要求に対する応答として、音声記録管理装置3に対して類義語情報登録応答を送信する(ステップS25)。これにより、音声記録管理装置3は、音声解析サーバ4が送信した類義語情報登録応答を受信する。この類義語情報登録応答は、一般的に使用される応答メッセージ、応答フラグ等を含み、認識パターン登録要求に対して正常に処理が行われたことを示す情報であれば特に制約は設けない。
【0114】
次に、音声記録管理装置3の登録部36は、ステップS22で受信した類義語に基づいて、類義語を登録する(ステップS26)。具体的には、登録部36は、類義語管理DB3003(図7参照)に対して、項目識別情報ごとに与えられた項目名キーワードに対応させて、受信した複数の類義語を登録する。このステップS26の処理が実行される理由は、後述する解析結果を検索する際に、音声記録管理装置3自身が使用するためである。
【0115】
次に、送受信部31は、ステップS22に対する通知として、登録管理用端末2に対して完了通知を送信する(ステップS27)。これにより、登録管理用端末2の送受信部21は、音声記録管理装置3が送信した完了通知を受信する。
【0116】
<音声解析処理>
次に、音声解析処理について説明する。図17は、音声情報(データ)の格納までの処理の一例を示すシーケンス図である。まず、入力端末8の操作受付部82は、利用者による音声指示を受け付ける(ステップS101)。具体的には、操作受付部82は、入力端末8を構成するユーザ端末6又はインカム等の通話機7に対して利用者が発話した、発話音声による音声指示(コマンド)を受け付ける。なお、本実施形態において、利用者は登録した認識パターンにしたがったパターンで発話をする必要がある。仮に、利用者が認識パターンに従わない発話を行うと、後述する認識パターンに合致しない処理において、利用者が使用する入力端末にエラー通知が送信されてしまうためである。但し、本実施形態ではそのような不都合を解消するために、テナント、グループ等に対応させたさまざまな認識パターンを事前に登録させておくことが可能なシステムが構築されている。
【0117】
次に、送受信部81は、受け付けた音声指示を表す音声データ(音声情報ともいう)を音声通信管理装置5に対して送信する(ステップS102)。これにより、音声通信管理装置5の送受信部51は、入力端末8が送信した音声データ(音声情報)を受信する。このとき、音声データ(音声情報)には、利用者が所属するテナントのテナント識別情報、更に利用者が所属するグループのグループ識別情報、利用者を識別する利用者識別情報及び利用者が発話した音声に係る音声データ(音声情報)が含まれる。ここで、テナント識別情報、グループ識別情報、利用者識別情報は、入力端末8にインストールされた音声通信アプリに予め登録済みである(ログイン認証の際に入力済みである)ことが前提である。なお、入力端末8は、音声通信アプリにログインした利用者識別情報を含むグループ(ルーム)の全ての利用者識別情報を音声記録管理装置3に対して送信してもよいし、グループ識別情報を送信してもよい。
【0118】
続いて、音声通信管理装置5の情報管理部56は、ユーザ情報の確認を行う(ステップS103)。具体的には、情報管理部56は、ステップS102で受信したテナント識別情報及びグループ識別情報を検索キーとしてユーザ情報管理DB5001(図13参照)を検索することにより、対応する利用者識別情報ごとのパスワード、メールアドレス等の情報を読み出す。
【0119】
次に、記憶読出部59は、ステップS102で受信した音声データを利用者識別情報に対応付けて音声情報管理DB5002(図14参照)に保存する(ステップS104)。このとき、音声通信管理装置5の送受信部51は、セッションが確立している音声記録管理装置3に対して、ステップS102で受信した利用者識別情報を送信しておいてもよい。
【0120】
ここで、音声記録管理装置3の記憶読出部39は、音声通信管理装置5に保存された音声データを取得するために、テナントグループ管理DB3004(図8参照)から、それぞれテナント識別情報及びグループ識別情報を読み出す(ステップS105)。
【0121】
次に、音声記録管理装置3による音声データの取得処理について説明する。以下に説明するステップS106-S108までの処理は、音声記録管理装置3及び音声通信管理装置5との間でのループ処理、音声記録管理装置3による音声通信管理装置5へのポーリング処理等が行われる。つまり、音声記録管理装置3が定期的に、音声通信管理装置5に対して音声データを取得しにいく。
【0122】
まず、音声記録管理装置3の送受信部31は、音声通信管理装置5に対して音声データの問合せに係る問合せ情報を送信する(ステップS106)。これにより、音声通信管理装置5の送受信部51は、音声記録管理装置3が送信した音声データの問合せに係る問合せ情報を受信する。このとき、音声データの問合せに係る問合せ情報には、ステップS105で読み出されたテナント識別情報、グループ識別情報及び利用者識別情報が含まれる。
【0123】
次に、音声通信管理装置5の取得部53は、音声情報管理DB5002(図14参照)に保存された音声データを取得する(ステップS107)。具体的には、取得部53は、記憶読出部59と協働して、利用者識別情報を検索キーとして音声情報管理DB5002(図14参照)を検索することにより、対応する音声データのパス、発話日時を読み出す。
【0124】
次に、送受信部51は、音声データの問合せ応答として、音声記録管理装置3に対して音声データを送信する(ステップS108)。これにより、音声記録管理装置3の送受信部31は、音声通信管理装置5が送信した音声データを受信する。このとき、音声データの問合せ応答に係る問合せ応答情報として、利用者録識別情報、発話日時、音声データ又は音声データのパス情報が含まれる。
【0125】
また、上述したステップS106-S108までの処理では、音声記録管理装置3は、音声通信管理装置5に対して、音声データを受信したら直ちに次の音声データの問合せを送信するようにしてもよい。このとき、ステップS106で説明した音声データの問合せに係る問合せ情報に含まれる情報のうち、テナント識別情報及びグループ識別情報のうちいずれかによって検索するような処理方法であってもよい。更に、ステップS106のように音声記録管理装置3が音声データの問合せを行うのではなく、音声通信管理装置5が音声データを受信したら、音声データの問合せを受信する前に音声記録管理装置3に対して受信した音声データを送信するようにしてもよい。
【0126】
次に、音声記録管理装置3の記憶読出部39は、ステップS108で受信した音声データを記憶部3000の所定領域に格納(保存)する(ステップS109)。
【0127】
本実施形態に係る通信システムでは、例えば、上述したステップS106及びS108の処理が実行される場合、音声通信管理装置5と音声記録管理装置3との間に他の装置等が存在してもよい。つまり、音声通信管理装置5と音声記録管理装置3との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声通信管理装置5と音声記録管理装置3との間に他の処理ステップが存在しても適用可能である。
【0128】
<合致する認識パターンが無い場合の音声解析処理>
次に、音声解析サーバ4による音声データの解析において、解析結果に合致する認識パターンが無い場合について説明する。図18は、合致する認識パターンが無い場合の音声解析処理の一例を示すシーケンス図である。まず、音声記録管理装置3の登録部36は、ステップS108で受信した音声データ又は音声データのパスを、音声記録管理DB3005(図9参照)で管理されている利用者識別情報に対応させて登録する(ステップS111)。
【0129】
次に、記憶読出部39は、テナント識別情報又はグループ識別情報を検索キーとして認識パターン識別管理DB3002(図6参照)を検索することにより、対応する一以上の認識パターン識別情報を読み出す(ステップS112)。この処理は、音声記録管理装置3が、テナント識別情報に対応した認識パターン識別情報を読み出す必要があるためである。
【0130】
次に、送受信部31は、音声解析サーバ4に対して音声解析要求を送信する(ステップS113)。これにより、音声解析サーバ4の送受信部41は、音声記録管理装置3が送信した音声解析要求を受信する。このとき、音声解析要求には、発話音声を発した利用者が所属するテナントのテナント識別情報及びその利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた認識パターン識別情報と、ステップS108で受信し、ステップS109で格納した音声データ(発話音声に基づく音声情報)が含まれる。このときに音声記録管理装置3が音声解析サーバ4に対して送信する音声データ(発話音声に基づく音声情報)は、例えば、
「介護記録 理光さん 血圧 114の60」
である。
【0131】
次に、音声解析サーバ4の解析部45は、ステップS113で受信した認識パターン識別情報及び音声データに対して、ステップS14の処理において保存した、認識パターン識別情報に対応する認識パターンを参照して、受信した音声データの音声解析を行う(ステップS114)。具体的には、例えば、解析部45は、入力した発話音声を構成する一つの音声情報を全てテキスト情報に変換し、登録した認識パターンのうち、どの認識パターンに合致するかを一つずつ解析する。
【0132】
次に、送受信部41は、音声解析応答を音声記録管理装置3に対して送信する(ステップS115)。これにより、音声記録管理装置3の送受信部31は、音声解析サーバ4が送信した音声解析応答を受信する。このとき、音声解析応答には、音声解析結果を示す音声解析結果情報、認識パターン識別情報が含まれる。更に、音声解析応答には、テキストデータ及び予め登録された認識パターンで抽出され、順番情報が付与されたキーワードのセットが含まれる。但し、音声解析結果情報には、認識パターン項目管理DB3001(図5参照)で管理されている「項目名」は含まれず、単語若しくは簡単な文字列が含まれる。ここで、音声解析サーバ4が音声記録管理装置3に対して送信する音声解析結果情報は、例えば、
{介護記録,理光,血圧,114の60}
である。
【0133】
なお、音声記録管理装置3は、音声解析要求を送信する際に認識パターン識別情報を記憶しておき、音声解析要求に対する音声解析応答を受信したタイミングで記憶しておいた認識パターン識別情報に対応付けられた認識パターン(認識パターン項目管理DB3001(図5参照))に基づいて対応付けを行ってもよい。その場合は、音声解析サーバ4が解析のために使用した認識パターン識別情報を音声解析応答に含めなくてもよい。
【0134】
続いて、音声記録管理装置3の判断部35は、ステップS115で受信した音声解析結果情報に対して、合致する認識パターンがあったかを判断する(ステップS116)。合致する認識パターンが無い場合(ステップS116:NO)、送受信部31は、音声通信管理装置5に対して、登録失敗通知を送信する(ステップS117)。これにより、音声通信管理装置5は、音声記録管理装置3が送信した登録失敗通知を受信する。このとき、登録失敗通知には、テナント識別情報、グループ識別情報、利用者識別情報及び登録失敗を表す登録失敗通知情報が含まれる。なお、登録失敗通知の内容は予め用意されたメッセージ等でもよい。
【0135】
次に、音声通信管理装置5の送受信部51は、ステップS117で受信した登録失敗通知に含まれる音声データ(音声情報)を入力端末8に対して送信(転送)する(ステップS118)。これにより、入力端末8の送受信部81は、音声通信管理装置5が送信した音声データを受信する。このとき、音声通信管理装置5は、入力端末8に対してプッシュ通知(送信)によりデータ(情報)を通知(送信)してもよい。その場合、音声通信管理装置5は、例えば、プッシュ通知サーバの一例であるFCM(Firebase Cloud Messaging)を利用してプッシュ通知することで実現することが可能である。
【0136】
次に、入力端末8の表示制御部84は、ディスプレイ807に登録失敗通知情報を表示する。さらに入力端末8の音声再生部86は、スピーカ819を介して登録失敗通知を音声で再生してもよい(ステップS119)。なお、入力端末8にエラー通知が表示された場合は、入力端末8を利用する利用者は、他の認識パターンにしたがった発話音声を、入力端末8に対して再度入力してもよい。
【0137】
本実施形態に係る通信システムでは、例えば、上述したステップS102及びS119の処理が実行される場合、入力端末8と音声通信管理装置5との間に他の装置等が存在してもよい。つまり、入力端末8と音声通信管理装置5との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、入力端末8と音声通信管理装置5との間に他の処理ステップが存在しても適用可能である。
【0138】
本実施形態に係る通信システムでは更に、例えば、上述したステップS113及びS115の処理が実行される場合、音声記録管理装置3と音声解析サーバ4との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と音声解析サーバ4との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と音声解析サーバ4との間に他の処理ステップが存在しても適用可能である。
【0139】
●画面表示例●
次に、入力端末8に表示される画面表示例を説明する。図20(a)は、入力端末における指示入力の失敗通知の画面表示例、(b)は、入力端末における指示入力の成功通知の画面表示例である。図20(a)に示されるように、入力端末8のディスプレイ807には、表示制御部84によって、登録失敗通知画面8101が表示される。登録失敗通知画面8101には、例えば、音声記録の記録種別である「介護記録」と、入力した音声情報に対する解析が失敗したことを示す「入力エラー通知」のテキスト情報が表示される。更に、合致する認識パターンがなかったことを示すメッセージと、別の認識パターンによる指示、若しくは新たな認識パターンの再登録を促すメッセージが表示される。
【0140】
<合致する認識パターンがある場合の音声解析処理>
次に、音声解析サーバ4による音声データの解析において、解析結果に合致する認識パターンがある場合について説明する。図19は、合致する認識パターンがある場合の音声解析処理の一例を示すシーケンス図である。上述したステップS116の判断処理において、判断部35により合致する認識パターンがあると判断された場合(ステップS116:YES)、検索部37は、以下の処理を実行する。具体的には、検索部37は、ステップS115で受信した音声解析応答に含まれる音声解析結果情報に対して、受信した認識パターン識別情報を検索キーとして認識パターン項目管理DB3001(図5参照)を検索する。その後、検索部37は、認識パターン識別情報に対応する項目名と登録順序とを参照して、受信した音声解析結果情報の各項目名と項目値とを対応付ける(ステップS121)。具体的には、音声記録管理装置3は、認識パターン項目管理DB3001(図5参照)と上述した利用者の発話音声に対応発話音声データ(発話音声情報)をもとに、解析結果管理DB3006(図10参照)で管理される結果を対応付ける。具体的には、検索部37は、以下の処理を行う。すなわち、検索部37は、ステップS115で受信した、
{介護記録,理光,血圧,114の60}
の音声解析結果情報に対して、
・まず、1番目の「介護記録」を認識パターン識別情報:「R0001」に対応付けられた1番目の項目名の「記録種別」と対応付ける。つまり、「記録種別」→「介護記録」として対応付ける。
・次に、2番目の「理光」を認識パターン識別情報:「R0001」に対応付けられた2番目の項目名の「作業対象」と対応付ける。つまり、「作業対象」→「理光」として対応付ける。
・次に、3番目の「血圧」を認識パターン識別情報:「R0001」に対応付けられた3番目の項目名の「作業項目」と対応付ける。つまり、「作業項目」→「血圧」として対応付ける。
・最後に、4番目の「114の60」を認識パターン識別情報:「R0001」に対応付けられた4番目の項目名の「作業結果」と対応付ける。つまり、「作業結果」→「114の60」として対応付ける。
【0141】
このようにして、検索部37は、音声解析サーバ4が送信した音声解析結果情報に対して、音声記録管理装置3で登録、管理している認識パターンに対応させることができる。但し、上述した対応付け処理は一例であり、システムの仕様、プログラムの構成等に応じて、対応付けの順番を入れ替えてもよい。
【0142】
続いて、登録部36は、ステップS121で対応付けをした解析結果を、解析結果管理DB3006(図10参照)で管理されている「記録種別」、「作業対象」、「作業項目」、「作業結果」に対応付け、最後に音声記録識別情報を付与して登録する(ステップS122)。登録部36は更に、音声記録識別情報に対応付けられて管理されている、作業日時及び作業者を表す利用者識別情報もあわせて登録する。なお、音声記録識別情報を付与する時期は、作業日時及び利用者識別情報を対応付けた後でもかまわない。
【0143】
次に、記憶読出部39は、通知情報を読み出す(ステップS123)。具体的には、記憶読出部39は、音声記録識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、音声記録識別情報が登録されているテナント識別情報及びグループ識別情報のタブで管理された、音声データのパス、利用者識別情報、登録日時を含む通知情報を読み出す。続いて、記憶読出部39は、記録種別を検索キーとして通知情報管理DB3007(図11参照)を検索することにより、対応する通知情報の音声データを読み出す。
【0144】
次に、生成部38は、入力端末8に表示させる表示画面を生成する(ステップS124)。具体的には、生成部38は記憶読出部39と協働して、音声記録識別情報を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する「記録種別」、「作業対象」、「作業項目」、「作業結果」、「作業日時」及び「利用者識別情報」で示される各内容を読み出す。これにより、生成部38は、読み出された各項目と各内容とを対応付けて表示画面を生成する。その際、表示画面のテンプレートは、記憶部3000の所定領域に予め用意したものを使用してよい。
【0145】
次に送受信部31は、音声通信管理装置5に対して登録完了通知を送信する(ステップS125)。これにより、音声通信管理装置5の送受信部51は、音声記録管理装置3が送信した登録完了通知を受信する。このとき、登録完了通知には、テナント識別情報、グループ識別情報、利用者識別情報、音声記録情報が登録されたことを示す登録完了通知情報及びステップS124で生成した入力端末8に表示させる画面の画面データが含まれる。さらに、登録完了通知には、ステップS123で読み出した通知情報の音声データがふくまれてもよい。
【0146】
次に、音声通信管理装置5の送受信部51は、入力端末8に対して音声データ及び画面データを送信する(ステップS126)。
【0147】
次に、入力端末8の音声再生部86は、ステップS126で受信した音声データを、スピーカ819を介して音声出力(再生)する。また、表示制御部84は、ステップS126で受信した画面データを、ディスプレイ807に表示させる(ステップS127)。なお、入力端末8において、音声データの再生及び画面データの表示は、いずれか一方でもかまわない。また、音声データの再生時に、利用者(作業者)が発話したキーワードの数と同じ数の音を鳴動させるなどのアンサーバック機能を用いてもよい。
【0148】
●画面表示例●
次に、入力端末8に表示される画面表示例を説明する。図20(b)は、入力端末における指示入力の成功通知の画面表示例である。図20(b)に示されるように、入力端末8のディスプレイ807には、表示制御部84によって、登録完了通知画面8102が表示される。登録完了通知画面8102には、例えば、音声記録の記録種別である「介護記録」と、入力した音声情報に対する解析が完了したことを示す「入力完了通知」のテキスト情報が表示される。更に、指示された認識パターンで介護記録の登録が完了したことを示すメッセージが表示される。
【0149】
●画面表示例●
次に、閲覧用端末9に表示される画面表示例を説明する。図21は、閲覧用端末における介護記録確認通知の画面表示例である。図21に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、介護記録確認通知画面9101が表示される。介護記録確認通知画面9101には、例えば、介護の「作業対象」を示す「理光」の名前、「作業日時」を示す日付、「作業項目」を示す「血圧」及び「作業結果」を示す血圧値がそれぞれ表示される。この場合は、朝7:00と夜18:00の2回のデータが表示され、朝のデータの表示欄にはコピーボタン9151、夜のデータの表示欄にはコピーボタン9152がそれぞれ表示される。閲覧用端末9を閲覧する閲覧者は、これらの各コピーボタンを操作することで、「介護記録ソフトに転記」と表示されている処理が実行され、作業者(利用者)によって発話された介護記録に関する発話音声を音声記録情報として、介護記録ソフトに残すことができる。
【0150】
●画面表示例●
次に、閲覧用端末9に表示される画面表示例を説明する。図22は、閲覧用端末における申し送り確認通知の画面表示例である。図22に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、申し送り確認通知画面9111が表示される。申し送り確認通知画面9111には、例えば、申し送りの内容として、「作業対象」を示す「理光」の名前、及び申し送り内容が表示される。この場合は、点滴をしたためシャワーにする内容が表示され、あわせてコピーボタン9161が表示される。閲覧用端末9を閲覧する閲覧者は、このコピーボタン9161を操作することで、「介護記録ソフトに転記」と表示されている処理が実行され、作業者(利用者)によって発話された申し送りに関する発話音声を音声記録情報として、介護記録ソフトに残すことができる。
【0151】
<検索処理>
次に、音声解析結果を検索する検索処理について説明する。図23は、検索処理及び音声記録処理の一例を示すシーケンス図である。まず、閲覧用端末9の操作受付部92は、利用者(閲覧者)の操作による検索条件入力を受け付ける(ステップS131)。
【0152】
次に、送受信部91は、音声記録管理装置3に対して、検索要求を送信する(ステップS132)。これにより、音声記録管理装置3の送受信部31は、検索要求を受信する。このとき、検索要求には、検索条件としての「記録種別」、「作業対象」、「作業項目」、「作業日時」が含まれる。
【0153】
次に、音声記録管理装置3の検索部37は、検索を実行する(ステップS133)。具体的には、検索部37は、ステップS132で受信した検索条件を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する解析結果を検索して読み出す。このとき、検索部37は更に、類義語管理DB3003(図7参照)を利用することで、検索条件の幅を広げるようにしてもよい。
【0154】
次に、送受信部31は、検索応答を閲覧用端末9に送信する(ステップS134)。これにより、閲覧用端末9は、音声記録管理装置3が送信した検索応答を受信する。このとき、検索応答には、ステップS133で実行した検索に係る検索結果としての検索結果画面データが含まれる。つまり、検索部37は、生成部38と協働して検索結果を含む検索結果画面データを生成する。
【0155】
次に、閲覧用端末9の表示制御部94は、ステップS134で受信した検索結果画面データに基づいて、ディスプレイ907に検索結果画面を表示する(ステップS135)。
【0156】
次に、操作受付部92は、音声記録選択を受け付ける(ステップS141)。例えば、操作受付部22は、ディスプレイ907に表示された音声記録のうち、閲覧者が選択した特定の音声記録の選択を受け付けることで、この処理が実行されてもよい。
【0157】
次に、送受信部91は、音声データ取得要求を音声記録管理装置3に対して送信する(ステップS142)。これにより、音声記録管理装置3の送受信部31は、閲覧用端末9が送信した音声データ取得要求を受信する。このとき、音声データ取得要求には、記録された音声データに対応する音声記録識別情報が含まれる。
【0158】
次に、音声記録管理装置3の記憶読出部39は、音声データを読み出す(ステップS143)。具体的には、記憶読出部39は、ステップS142で受信した音声記録識別情報を検索キーとして解析結果管理DB3006(図10参照)を検索することにより、対応する利用者識別情報を読み出す。続いて、記憶読出部39は、利用者識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、対応する音声データのパスを読み出す。これにより、記憶読出部39は、音声データのパスに基づいて所望の音声データを検索することができる。なお、記憶読出部39は、音声記録識別情報を検索キーとして音声記録管理DB3005(図9参照)を検索することにより、対応する音声データのパスを直接読み出してもよい。
【0159】
次に、送受信部31は、閲覧用端末9に対して音声データ取得応答を送信する(ステップS144)。これにより、閲覧用端末9の送受信部91は、音声記録管理装置3が送信した音声データ取得応答を受信する。
【0160】
次に、閲覧用端末9の表示制御部94は、ステップS144で受信した音声データを、スピーカ919を介して出力(再生)する(ステップS145)。このとき、表示制御部94は、スピーカ919を介して出力(再生)した音声に対応するテキスト情報を、ディスプレイ907に表示してもよい。以上説明したステップS131-S145までの処理により、閲覧者は、閲覧用端末9に対して入力した検索条件をもとに検索された音声記録を示す音声及び対応するテキスト情報を、閲覧用端末9で確認することができる。これにより、閲覧者が発話音声を行った利用者自身である場合は、自身で発話した作業内容を音声及びテキスト情報で確認することが可能になる。
【0161】
本実施形態に係る通信システムでは更に、例えば、上述したステップS132及びS134、ステップS142及びS144の各処理が実行される場合、音声記録管理装置3と閲覧用端末9との間に他の装置等が存在してもよい。つまり、音声記録管理装置3と閲覧用端末9との間で送受信される各情報(データ)は、一度他の装置を介して送受信されるような構成であってもよい。上述した構成は、音声記録管理装置3と閲覧用端末9との間に他の処理ステップが存在しても適用可能である。
【0162】
●画面表示例●
次に、閲覧用端末9に表示される検索画面表示例を説明する。図24(a)は、閲覧用端末における申し送り検索時の画面表示例である。図24(a)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索キー入力画面9121が表示される。検索キー入力画面9121には、複数の入力欄が設けられている。閲覧者は、これらの入力欄に「作業日時」を検索するための期間情報、「作業対象」、「記録種別」及び「作業項目」を入力することができ、これらの入力欄に入力された情報が音声記録管理装置3に送信され、音声記録管理装置3で管理されている各種データテーブルを参照して検索した検索結果が返される。
【0163】
図24(b)は閲覧用端末における申し送り確認通知の他の画面表示例である。図24(b)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索結果表示画面9122が表示される。検索結果表示画面9122には、検索結果としての「作業対象」を示す「理光」の名前、及び検索した期間情報における「作業対象」に対する申し送り内容として、5月22日7時と18時における二つの申し送り内容が表示される。
●画面表示例●
次に、他の閲覧用端末9に表示される画面表示例を説明する。図25(a)は、他の閲覧用端末における申し送り検索時の画面表示例である。図25(a)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索キー入力画面9131が表示される。検索キー入力画面9131では、図24の検索キー入力画面9121に示した閲覧用端末9がタブレット端末を一例とするものであったのに対して、検索キー入力画面9131ではスマートフォンを一例とする通信端末に表示される画面例を示したものである。そのため、図25(a)の内容は、図24(a)に示した内容と同様となるため、詳細の説明を省略する。
【0164】
図25(b)は他の閲覧用端末における申し送り確認通知の他の画面表示例である。図25(b)に示されるように、閲覧用端末9のディスプレイ907には、表示制御部94によって、検索結果表示画面9132が表示される。検索結果表示画面9132では、図24(b)で示した申し送り内容に加えて、さらに利用者(作業者)が「作業対象」の「理光」様に対して実施した処置に関する情報がディスプレイ907に表示される。さらに、音声再生部96によって、検索結果表示画面9132に表示されたテキスト情報がスピーカ919を介して音声情報として再生される。
【0165】
〔実施形態の主な効果〕
以上説明したように本実施形態によれば、音声記録管理装置3は、利用者の発話音声に基づく音声情報と、発話音声を発した利用者が所属するテナントのテナント識別情報及びその利用者が所属するグループのグループ識別情報の少なくとも一方に対応付けられた音声情報を解析するための認識パターンを識別する認識パターン識別情報と、を音声解析サーバ4に対して送信し(S113)、解析サーバ4が音声情報及び認識パターン識別情報に基づいて解析した解析結果を、解析結果管理DB3006で管理されている「記録種別」、「作業対象」、「作業項目」、「作業結果」に対応付けて登録する(S122)。これにより、発話音声に基づく音声情報から音声記録情報を登録する場合に、利用者が所属するテナント、グループ等に対応した認識パターンで発話音声を与えることができるので、利用者に対する柔軟性を向上させることが可能になるという効果を奏する。
【0166】
更に、本実施形態によれば、利用者が所属するテナント、グループ等に対応した複数の認識パターンに加えて類義語情報を予め登録し、解析サーバ4に対して類義語情報も送信して解析が行われるので、介護、看護等の場における利用者(作業者)の出身地、アクセント等を気にせずに通常用いることばをそのまま発話して、介護記録、申し送り等の作業(業務)報告を行うことが可能になる。これにより、利用者(作業者)の作業効率をさらに向上させることが可能になるという効果を奏する。
【0167】
〔実施形態の補足〕
なお、本実施形態では、介護施設における介護士(作業者)による被介護者(作業対象)に対する作業、病院における看護師(作業者)による患者(作業対象)に対する作業を一例として説明したが、上述した実施の形態は、例えば、工事現場における作業員(作業者)による対象工事(作業対象)に対する作業、自動車整備工場における整備士(作業者)による自動車(作業対象)に対する作業、オフィスにおけるスタッフ(作業者)による書類(作業対象)に対する作業等、一以上の作業対象に対して一以上の作業者によって実施される他の作業に適用されてもよい。
【0168】
更に、本実施形態では、日本語を用いた認識パターンを例に説明したが、認識パターンを外国語にも適用し、外国語の音声情報を解析可能な外部サーバを用いたシステムを構築してもよい。
【0169】
また、上述した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウエアによって各機能を実行するようプログラミングされたデバイスを含むものとする。このデバイスとは、例えば、プロセッサ、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)、SOC(System on a chip)、GPU(Graphics Processing Unit)、及び従来の回路モジュール等をいう。
【0170】
更に、上述した実施形態により得られる各種テキスト及びテキスト情報は、人工知能(AI)を利用した機械学習の学習効果によって取得されたものでもよい。この場合、音声解析サーバが機械学習を用いて音声情報から各種テキスト及びテキスト情報を取得してもよいし、音声解析サーバと異なるデータベース等が機械学習を用いて音声情報から各種テキスト及びテキスト情報を取得してもよい。ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを事前に取り込まれる学習データから自律的に作成、新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよい、更に、機械学習のための学習方法は、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
【0171】
これまで本発明の一実施形態に係る音声記録管理システム、音声記録管理装置、音声記録管理方法及びプログラムについて説明してきたが、本発明は、上述した実施形態に限定されるものではなく、他の実施形態の追加、変更又は削除等、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
【符号の説明】
【0172】
1 通信システム
2 登録管理用端末
3 音声記録管理装置
4 音声解析サーバ(クラウドサービス)
5 音声通信管理装置(クラウドサービス)
6 ユーザ端末(利用者端末の一例)
7 通話機
8 入力端末
9 閲覧用端末
10 音声記録管理システム
21 送受信部(送信手段の一例、受信手段の一例)
31 送受信部(受信手段の一例、送信手段の一例)
3001 認識パターン項目管理DB(認識パターン項目管理手段の一例)
3002 認識パターン識別管理DB(認識パターン識別管理手段の一例)
3003 類義語管理DB(類義語管理手段の一例)
3006 解析結果管理DB(解析結果管理手段の一例)
35 判断部(判断手段の一例)
36 登録部(登録手段の一例)
【先行技術文献】
【特許文献】
【0173】
【特許文献1】特開2015-049254号公報
図1
図2
図3
図4A
図4B
図4C
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25