IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特許7388997音声情報加工システム及び音声情報加工方法
<>
  • 特許-音声情報加工システム及び音声情報加工方法 図1
  • 特許-音声情報加工システム及び音声情報加工方法 図2
  • 特許-音声情報加工システム及び音声情報加工方法 図3
  • 特許-音声情報加工システム及び音声情報加工方法 図4
  • 特許-音声情報加工システム及び音声情報加工方法 図5
  • 特許-音声情報加工システム及び音声情報加工方法 図6
  • 特許-音声情報加工システム及び音声情報加工方法 図7
  • 特許-音声情報加工システム及び音声情報加工方法 図8
  • 特許-音声情報加工システム及び音声情報加工方法 図9
  • 特許-音声情報加工システム及び音声情報加工方法 図10
  • 特許-音声情報加工システム及び音声情報加工方法 図11
  • 特許-音声情報加工システム及び音声情報加工方法 図12
  • 特許-音声情報加工システム及び音声情報加工方法 図13
  • 特許-音声情報加工システム及び音声情報加工方法 図14
  • 特許-音声情報加工システム及び音声情報加工方法 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】音声情報加工システム及び音声情報加工方法
(51)【国際特許分類】
   G06F 21/62 20130101AFI20231121BHJP
【FI】
G06F21/62 345
【請求項の数】 4
(21)【出願番号】P 2020149984
(22)【出願日】2020-09-07
(65)【公開番号】P2022044387
(43)【公開日】2022-03-17
【審査請求日】2023-01-12
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜弁理士法人
(72)【発明者】
【氏名】小室 勝郎
(72)【発明者】
【氏名】中島 由隆
(72)【発明者】
【氏名】堀 健太郎
(72)【発明者】
【氏名】大塚 敬太
【審査官】岸野 徹
(56)【参考文献】
【文献】特開2011-170635(JP,A)
【文献】国際公開第2019/220791(WO,A1)
【文献】特開2005-215717(JP,A)
【文献】特開2006-178203(JP,A)
【文献】特開2019-168738(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/62
(57)【特許請求の範囲】
【請求項1】
顧客とオペレータとの会話の音声情報を書き起こした複数の個人情報を含むテキストデータを管理するデータ管理部と、
マスキング処理により前記テキストデータを加工するデータ加工部と、
情報を表示するユーザ端末と、を有し、
前記データ管理部は、
複数の前記個人情報に対応させて、前記個人情報を特定不能な前記個人情報のカテゴリを予め複数種類登録しておき、
前記テキストデータを前記データ加工部に送り、
前記データ加工部は、
前記テキストデータから、前記個人情報をマスキングするマスキング対象個所を判定し、
予め登録された複数種類の前記カテゴリの中から前記個人情報に対応する前記カテゴリを判定し、
前記マスキング対象個所に対して、判定された前記カテゴリを付与してマスキング済データを生成して前記音声情報を加工し、
前記ユーザ端末は、
前記マスキング済データとして、前記マスキング対象個所に対し前記カテゴリを表示し、
前記個人情報に関連しかつ前記個人情報を特定不能な付加情報を判定する付加情報判定部を更に有し、
前記付加情報判定部は、
前記マスキング対象個所の前記カテゴリを判定し、
前記データ管理部は、
前記カテゴリに対応する前記付加情報を取り出して、前記ユーザ端末に送り、
前記ユーザ端末は、
前記マスキング済データとして、前記カテゴリに対して前記付加情報を付加して表示し、
前記データ加工部は、
判定された前記カテゴリとして、前記顧客に対して顧客名という単語を付与し、前記オペレータに対してオペレータ名という単語を付与し、前記顧客の現在の住所に対して住所という単語を付与し、
前記データ管理部は、
判定された前記カテゴリが前記顧客名の場合には、前記付加情報として前記顧客の性別と年齢を取り出し、
判定された前記カテゴリが前記住所の場合には、前記付加情報として前記住所の都道府県名を取り出すことを特徴とする音声情報加工システム。
【請求項2】
前記データ加工部は、
復号ワードを発行し、
前記データ管理部は、
前記復号ワードを登録し、
前記付加情報判定部は、
前記ユーザ端末から入力された前記復号ワードの正否を判定し、
前記データ管理部は、
正しいと判定された前記復号ワードに基づいて、前記マスキング対象個所の前記マスキングを解除して生成した前記個人情報を含む復号後データを前記ユーザ端末に送り、
前記ユーザ端末は、
前記復号後データを表示することを特徴とする請求項1に記載の音声情報加工システム。
【請求項3】
データ管理部により、顧客とオペレータとの会話の音声情報を書き起こした複数の個人情報を含むテキストデータを管理するデータ管理ステップと、
データ加工部により、マスキング処理により前記テキストデータを加工するデータ加工ステップと、
ユーザ端末に情報を表示する表示ステップと、を有し、
前記データ管理ステップは、前記データ管理部により、
複数の前記個人情報に対応させて、前記個人情報を特定不能な前記個人情報のカテゴリを予め複数種類登録しておき、
前記データ加工ステップは、前記データ加工部により、
前記テキストデータから、前記個人情報をマスキングするマスキング対象個所を判定し、
予め登録された複数種類の前記カテゴリの中から前記個人情報に対応する前記カテゴリを判定し、
前記マスキング対象個所に対して、判定された前記カテゴリを付与してマスキング済データを生成して前記音声情報を加工し、
前記表示ステップは、
前記ユーザ端末に、前記マスキング済データとして、前記マスキング対象個所に対し前記カテゴリを表示し、
付加情報判定部により、前記個人情報に関連しかつ前記個人情報を特定不能な付加情報を判定する付加情報判定ステップを更に有し、
前記付加情報判定ステップは、前記付加情報判定部により、
前記マスキング対象個所の前記カテゴリを判定し、
前記データ管理ステップは、前記データ管理部により、
前記カテゴリに対応する付加情報を取り出して、前記ユーザ端末に送り、
前記表示ステップは、
前記ユーザ端末に、前記マスキング済データとして、前記カテゴリに対して前記付加情報を付加して表示し、
前記データ加工ステップは、前記データ加工部により、
判定された前記カテゴリとして、前記顧客に対して顧客名という単語を付与し、前記オペレータに対してオペレータ名という単語を付与し、前記顧客の現在の住所に対して住所という単語を付与し、
前記データ管理ステップは、前記データ管理部により、
判定された前記カテゴリが前記顧客名の場合には、前記付加情報として前記顧客の性別と年齢を取り出し、
判定された前記カテゴリが前記住所の場合には、前記付加情報として前記住所の都道府県名を取り出すことを特徴とする音声情報加工方法。
【請求項4】
前記データ加工ステップは、前記データ加工部により、
復号ワードを発行し、
前記データ管理ステップは、前記データ管理部により、
前記復号ワードを登録し、
前記付加情報判定ステップは、前記付加情報判定部により、
前記ユーザ端末から入力された前記復号ワードの正否を判定し、
前記データ管理ステップは、前記データ管理部により、
正しいと判定された前記復号ワードに基づいて、前記マスキング対象個所のマスキングを解除して生成した前記個人情報を含む復号後データを前記ユーザ端末に送り、
前記表示ステップは、
前記ユーザ端末に、前記復号後データを表示することを特徴とする請求項に記載の音声情報加工方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声情報加工システム及び音声情報加工方法に関する。
【背景技術】
【0002】
オペレータ及び顧客の通話内容のテキスト化データを第三者が閲覧できる環境下においては、個人情報に該当する顧客の氏名や口座番号などを、閲覧権限に応じて秘匿する必要がある。
【0003】
通常は、該当箇所を人力でマスキングする必要があり、多大なコストを費やしてしまう。また、人力でのマスキングによりミスが発生した場合、情報漏洩となる危険性がある。
【0004】
また、テキスト化した通話の一部をマスキングすることで、通話評価や分析の精度が落ちてしまう。
【0005】
これに関連する技術として、例えば、特許文献1がある。特許文献1では、顧客とオペレータとの会話の音声データや音声を書き起こしたテキストを関係部門で共有する際に、秘密情報の漏洩を防止できるようにする。
【0006】
機密情報に該当するキーワードや出現パターン(文脈など)をあらかじめ記憶し、テキスト化結果に機密情報が含まれると判断されたものに対して、当該箇所の削除又は別の音声(例えば、「ピー」という音声)への差し替えを行う。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2006-178203号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1では、当該箇所のテキストそのもの削除又は別の意味を有さない音声(例えば、「ピー」という音声)に差し替えてしまうため、分析等の用途において、分析精度が落ちてしまう。
【0009】
また、スーパーバイザなどの管理者が通話評価する際、削除された箇所で何が会話されていたかを確認できず、誤った評価をしてしまう。よって、分析や通話評価の用途にまで踏み込んだマスキング処理ができていない。
【0010】
そこで、テキスト化した通話の個人情報に該当する箇所のみを、通話評価や分析の精度を落とすことなく個人情報を秘匿する技術が求められている。
【0011】
本発明の目的は、音声情報加工システムにおいて、通話評価や分析の精度を落とすことなく個人情報を秘匿することにある。
【課題を解決するための手段】
【0012】
本発明の一態様の音声情報加工システムは、個人情報を含むテキストデータを管理するデータ管理部と、マスキング処理により前記テキストデータを加工するデータ加工部と、情報を表示するユーザ端末と、を有し、前記データ管理部は、前記テキストデータを前記データ加工部に送り、前記データ加工部は、前記テキストデータから、前記個人情報をマスキングするマスキング対象個所を判定し、前記マスキング対象個所に対して、前記個人情報を特定不能な前記個人情報のカテゴリを付与して前記マスキング済データを生成し、前記ユーザ端末は、前記マスキング済データとして、前記マスキング対象個所に対し前記カテゴリを表示することを特徴とする。
【0013】
本発明の一態様の音声情報加工システムは、個人情報を含むテキストデータを管理するデータ管理部と、マスキング処理により前記テキストデータを加工するデータ加工部と、情報を表示するユーザ端末と、を有し、前記データ管理部は、前記テキストデータを前記データ加工部に送り、前記データ加工部は、前記テキストデータから、前記個人情報をマスキングするマスキング対象個所を判定し、前記マスキング対象箇所に対して、閲覧者の閲覧権限レベルを付与し、前記閲覧権限レベルに応じて異なる前記マスキング処理を行って、前記個人情報を特定不能なマスキング済データを生成し、前記ユーザ端末は、前記マスキング済データを表示することを特徴とする。
【0014】
本発明の一態様の音声情報加工方法は、個人情報を含むテキストデータを管理するデータ管理ステップと、マスキング処理により前記テキストデータを加工するデータ加工ステップと、ユーザ端末に情報を表示する表示ステップと、を有し、前記データ加工ステップは、前記テキストデータから、前記個人情報をマスキングするマスキング対象個所を判定し、前記マスキング対象個所に対して、前記個人情報を特定不能な前記個人情報のカテゴリを付与して前記マスキング済データを生成し、前記表示ステップは、前記ユーザ端末に、前記マスキング済データとして、前記マスキング対象個所に対し前記カテゴリを表示する。
【発明の効果】
【0015】
本発明の一態様によれば、音声情報加工システムにおいて、通話評価や分析の精度を落とすことなく個人情報を秘匿することができる。
【図面の簡単な説明】
【0016】
図1】実施例の音声情報加工システムのシステム構成を示す図である。
図2】実施例の音声情報加工システムの機能ブロックを示す図である。
図3】実施例の音声情報加工システムの動作を示すフロー図である。
図4】閲覧権限レベル付与フローを示す図である。
図5】テキストデータ閲覧フローを示す図である。
図6】カテゴリ付加情報取り出しフローを示す図である。
図7】キーワード管理テーブルの例を示す図である。
図8】キーワード付帯情報テーブルの例を示す図である。
図9】付加情報テーブルの例を示す図である。
図10】年齢テーブルの例を示す図である。
図11】住所管理テーブルの例を示す図である。
図12】画面イメージ(マスキング箇所のカテゴリ表示)を示す図である。
図13】画面イメージ(マスキング箇所の付加情報表示)を示す図である。
図14】画面イメージ(マスキング処理済みテキスト表示)を示す図である。
図15】画面イメージ(マスキング箇所復号)を示す図である。
【発明を実施するための形態】
【0017】
以下、図面を用いて、実施例について説明する。
【実施例
【0018】
図1を参照して、実施例の音声情報加工システムの構成について説明する。
音声情報加工システムは、顧客データを含む全文テキストデータ及びマスキング情報を管理するデータ管理部10、付加情報を判定する付加情報判定部20、マスキング処理を実施し、閲覧権限レベル、カテゴリ(種別)及び復号ワードの情報を付加することによりデータを加工するデータ加工部30、データ配信部40及びユーザ端末50を有する。
【0019】
図2を参照して、音声情報加工システムの機能ブロックについて説明する。
データ管理部10は、データベース(DWH)11とマスキング情報管理部12を有する。ここで、DWH(データウェアハウス)とは、企業の業務において発生したさまざまな情報を時系列に保管したデータベースである。
【0020】
データベース11は、全文テキストデータと顧客データを格納する。マスキング情報管理部12は、キーワード及び管理IDを管理し(キーワード管理)、管理ID、閲覧権限レベル、カテゴリ及び複合ワード等のキーワード付帯情報を付与する。ここで、キーワードとは、例えば、顧客の個人情報を表す。
【0021】
マスキング情報管理部12は、キーワードを管理IDで管理するキーワード管理テーブル(図7参照)と、管理IDを用いてキーワードの付帯情報を管理するキーワード付帯情報テーブル(図8参照)を有する。
【0022】
付加情報判定部20は、閲覧権限レベル判定部21、カテゴリ判定部22及び復号ワード判定部23を有する。付加情報判定部20は、閲覧権限レベル、カテゴリ及び復号ワードを判定し、データ管理部10からデータを取り出す。
【0023】
データ加工部30は、全文テキスト抽出部31、マスキング箇所判定部32、閲覧権限レベル付与部33、カテゴリ付与部34、マスキング情報格納部35、復号ワード発行部36及び管理ID発行部37を有する。データ加工部30は、データベース11から取り出したテキストデータのマスキング個所を判定し、マスキング箇所が存在する場合は、対象のキーワードに紐づく管理IDを発行する。
【0024】
データ配信部40は、テキスト出力指示部41、テキスト出力受付部42、マスキング後データ抽出部43、マスキング後データ配信部44、カテゴリ付加情報抽出部45、カテゴリ付加情報配信部46、復号箇所データ抽出部47、復号受付部48、復号箇所データ抽出部49及び復号後データ配信部49aを有する。
【0025】
データ配信部40は、ユーザからのテキスト出力指示を受け付け、データ管理部10にデータ出力を要求し、全文テキストデータとマスキング情報を照らし合わせ、マスキング処理した全文テキストを作成する。
【0026】
また、データ配信部40は、閲覧権限レベルに従ってマスキング箇所に表示する内容を抽出し、マスキング箇所の復号処理を実施し、ユーザ固有の復号ワードの入力を受け付けて、正解の場合に復号後のデータを配信する。
【0027】
また、データ配信部40は、監督者の場合にはマスキング箇所にカテゴリを表示し、分析者の場合にはマスキング箇所にカテゴリと共に付加情報を表示する。
【0028】
図3を参照して、音声情報加工システムの動作について説明する。
テキストデータマスキングの際は、データ管理部10は、全文テキストデータ作成して(301)、データ加工部30に送る。データ加工部30は、テキストデータを取り出す(302)。マスキング個所判定部32は、マスキング個所を判定する(303)。
【0029】
閲覧権限レベル付与部33は、閲覧権限レベルを付与する(304)。カテゴリ付与部34は、マスキング箇所にカテゴリを付与する(305)。管理ID発行部37は、管理IDを付与する(306)。復号ワード発行部36は、復号ワードを発行する(307)。復号ワードは、データ管理部10に送られてマスキング情報として登録される(308)。
【0030】
テキストデータ閲覧の際は、通話録音テキスト化システムや応対履歴管理システムを経由して、ユーザ端末50から出力を要求する。データ配信部40は、ユーザからの出力指示を受付けて(309)、付加情報判定部20に送る。付加情報判定部20は、閲覧権限レベルを判定して(310)、データ管理部10に送る。データ管理部10は、テキストデータ全文を取り出し(311)、テキストデータをマスキングして(312)、付加情報判定部20とデータ配信部40に送る。付加情報判定部20は、マスキング個所のカテゴリを判定し(313)、データ管理部10に送る。データ配信部40は、マスキング済データを配信する(314)。
【0031】
データ管理部10は、カテゴリの付加情報を取り出し(315)、データ配信部40に送る。データ配信部40は、カテゴリの付加情報を配信する(316)。
【0032】
テキストデータ復号の際は、データ配信部40は、ユーザからの復号指示を受付け(317)、付加情報判定部20に送る。付加情報判定部20は、復号ワードの正否を判定し(318)、データ管理部10に送る。データ管理部10は、当該箇所のマスキングを解除して(319)、データ配信部40に送る。データ配信部40は、復号後データを配信する(320)。
【0033】
図4を参照して、閲覧権限レベル付与フローについて説明する。
最初に、全文テキストデータ作成を完了させる(S401)。次に、全文テキストデータ抽出する(S402)。次に、1文目のテキストを参照する(S403)。
【0034】
次に、文章中に「住所」「電話番号」が含まれるかを判定する(S404)。判定の結果、文章中に「住所」「電話番号」が含まれる場合は、対象キーワードに閲覧権限レベル「分析者」を付与する(S405)。
【0035】
次に、対象キーワードにカテゴリ「住所」「電話番号」を付与する(S406)。次に、対象キーワードに管理IDを付与する(S407)。次に、対象キーワードに復号ワードを付与する(S408)。
【0036】
次に、次の文のテキストを参照する(S409)。次に、次の文が存在するかを判定する(S410)。判定の結果、次の文が存在する場合は、次の文のテキストを参照する(S411)。判定の結果、次の文が存在しない場合は、処理は終了する(S412)。
【0037】
文章中に「住所」「電話番号」が含まれるかの判定(S404)の結果、文章中に「住所」「電話番号」が含まれない場合は、文章中に「氏名」が含まれるかを判定する(S413)。
【0038】
判定の結果、文章中に「氏名」が含まれる場合は、対象キーワードに閲覧権限レベル「監督者」を付与する(S414)。次に、対象キーワードにカテゴリとして「氏名」を付与する(S415)。次に、対象キーワードに管理IDを付与する(S416)。次に、対象キーワードに復号ワードを付与する(S417)。
【0039】
次に、次の文が存在するかを判定する(S410)。判定の結果、次の文が存在する場合は、次の文のテキストを参照する(S411)。判定の結果、次の文が存在しない場合は、処理は終了する(S412)。
【0040】
文章中に「氏名」が含まれるかの判定(S413)の結果、文章中に「氏名」が含まれない場合は、文章中に「契約番号」が含まれるかを判定する(418)。
【0041】
判定の結果、文章中に「契約番号」が含まれる場合は、対象キーワードに閲覧権限レベル「対応者」を付与する(S419)。次に、対象キーワードにカテゴリ「契約番号」を付与する(S420)。次に、対象キーワードに管理IDを付与する(S421)。次に、対象キーワードに復号ワードを付与する(S422)。
【0042】
次に、次の文が存在するかを判定する(S410)。判定の結果、次の文が存在する場合は、次の文のテキストを参照する(S411)。判定の結果、次の文が存在しない場合は、処理は終了する(S412)。
【0043】
文章中に「契約番号」が含まれるかの判定の結果、文章中に「契約番号」が含まれない場合は、次の文が存在するかを判定する(S410)。次の文が存在する場合は、次の文のテキストを参照する(S411)。判定の結果、次の文が存在しない場合は、処理は終了する(S412)。
【0044】
ここで、閲覧権限レベルの定義として、レベルが高いほどマスキング箇所のカテゴリ開示範囲、付加情報表示が多い。具体的には、分析者、監督者、対応者、その他の順にレベルは低くなる。
【0045】
図5を参照して、テキストデータ閲覧フローについて説明する。
ここで、前記閲覧権限レベルは、分析者、監督者、対応者の順にレベルが低くなる。
【0046】
最初に、ユーザからの画面出力要求が行われる(S501)。次に、ユーザ閲覧権限が送信される(S502)。次に、付加情報判定部20は、閲覧権限レベルがその他のレベルか判定する(S503)。
【0047】
判定の結果、閲覧権限レベルがその他のレベルと判定し場合、マスキングキーワードを取得する(S504)。次に、テキストデータ全文を取り出す(S505)。次に、マスキング処理として、すべてのマスキング箇所を非表示にする(S506)。次に、マスキング済みデータを配信する(S507)。
【0048】
閲覧権限レベルがその他のレベルかの判定(S503)の結果、閲覧権限レベルがその他のレベルではないと判定し場合、付加情報判定部20は、閲覧権限レベルが対応者かを判定する(S508)。
【0049】
判定の結果、閲覧権限レベルが対応者の場合、マスキングキーワードを取得する(S509)。次に、キーワードカテゴリを取得する(S510)。次に、テキストデータの全文を取り出す(S511)。次に、テキストマスキング処理を行って、マスキング箇所に、閲覧権限対応者以下の箇所をカテゴリ表示する(S512)。次に、マスキング済みデータを配信する(S507)。
【0050】
閲覧権限レベルが対応者かの判定(S508)の結果、閲覧権限レベルが対応者のレベルではないと判定し場合、付加情報判定部20は、閲覧権限レベルが監督者かを判定する(S513)。
【0051】
判定の結果、閲覧権限レベルが監督者の場合、マスキングキーワードを取得する(S514)。次に、キーワードカテゴリ取得する(S515)。次に、テキストデータの全文を取り出す(S516)。次に、テキストマスキング処理を行って、マスキング箇所に、閲覧権限監督者以下の箇所をカテゴリ表示する(S517)。次に、マスキング済みデータを配信する(S507)。
【0052】
閲覧権限レベルが監督者かの判定(S513)の結果、閲覧権限レベルが監督者でない場合、マスキングキーワード取得する(S518)。次に、キーワードカテゴリを取得する(S519)。次に、テキストデータの全文を取り出す(S520)。次に、テキストマスキング処理を行って、マスキング箇所に、カテゴリ表示する(S521)。次に、付加情報(顧客データ)取り出す(S522)。次に、マスキング箇所の付加情報に紐づける(S523)。最後に、マスキング済みデータを配信する(S507)。
【0053】
図6を参照して、カテゴリ付加情報取り出しフローについて説明する。
最初に、ユーザからの画面出力を要求する(S601)。次に、全文テキストデータを抽出する(S602)。次に、マスキング箇所に「氏名」が含まれるかを判定する(S603)。
【0054】
判定の結果、マスキング箇所に「氏名」が含まれる場合、マスキング箇所の氏名を抽出する(S604)。次に、抽出した氏名でCRM(Customer Relationship Management:顧客関係管理)情報を検索する(S605)。
【0055】
次に、CRMに登録された付加情報、「顧客管理ID」、「電話番号」、「住所」が全文テキストに含まれるかを判定する(S606)。同姓同名の氏名が存在する可能性があるため、氏名に紐づくほかの情報を参照し、CRMに登録された情報と適合する場合のみ、付加情報を配信する。
【0056】
判定の結果、CRMに登録された付加情報、「顧客管理ID」、「電話番号」、「住所」が全文テキストに含まれる場合、CRMに登録された付加情報である「性別」を抽出する(S607)。次に、CRMに登録された付加情報である「年齢」を抽出する(S608)。次に、抽出した「年齢」を十の位で切り上げする(S609)。次に、抽出した付加情報をユーザに配信する(S610)。
【0057】
マスキング箇所に「氏名」が含まれるかの判定(S603)の結果、マスキング箇所に「氏名」が含まれない場合、及び、CRMに登録された付加情報、「顧客管理ID」、「電話番号」、「住所」が全文テキストに含まれるかを判定(S606)の結果、CRMに登録された付加情報、「顧客管理ID」、「電話番号」、「住所」が全文テキストに含まれない場合、マスキング箇所に「住所」が含まれるかを判定する(S611)。
【0058】
判定の結果、マスキング箇所に「住所」が含まれる場合、マスキング箇所の住所を抽出する(S612)。次に、抽出した住所の都道府県を判定する(S613)。次に、判定した都道府県情報をユーザに配信する(S614)。
【0059】
マスキング箇所に「住所」が含まれるかの判定(S611)の結果、マスキング箇所に「住所」が含まれない場合、処理は終了する(S615)。
【0060】
図7を参照して、キーワード管理テーブルの例について説明する。
すべてのマスキングすべきキーワード(個人情報)にユニークな管理IDが付与される。例えば、管理ID「11111111」には個人情報である「田中A子」が付与されている。
【0061】
図8を参照して、キーワード付帯情報テーブルの例について説明する。
キーワード管理テーブル(図7参照)で管理IDを付与し、キーワード付帯情報テーブルではキーワードの代わりに管理IDを登録する。管理ID毎に、閲覧権限レベル、カテゴリ、複合ワードが付与される。複合ワードは、キーワードの復号に使用するパスワードである。
【0062】
キーワード毎にカテゴリを設定し、閲覧権限レベルを満たす場合は該当箇所をカテゴリに置き換えて表示する。閲覧者がテキストを確認する際、キーワード毎に設定された閲覧権限レベルを満たさない場合は、該当箇所が「マスキング済み」で表示される。
【0063】
図9を参照して、付加情報テーブルの例について説明する。
CRM固有の顧客管理IDを有する。キーワード管理のIDとは別である。顧客管理ID毎に、氏名、電話番号、性別、年齢、住所等が付与される。
【0064】
ここで、年齢は十の位の年代を付帯情報として別途年齢テーブル(図10参照)から取り出す。住所は都道府県までを付帯情報として、別途住所管理テーブル(図11参照)から取り出す。
【0065】
マスキング対象の氏名、顧客管理ID、電話番号等の情報がセットで確認された場合のみ、氏名に紐づく付加情報を抽出する。
【0066】
図10を参照して、年齢テーブルの例について説明する。
年齢テーブルは、年齢と付帯情報年代を有する。例えば、年齢が31歳の場合には、付帯情報年代は30代である。
【0067】
図11を参照して、住所管理テーブルの例について説明する。住所管理テーブルは、住所と付帯情報住所を有する。
【0068】
図12を参照して、画面イメージ(マスキング箇所のカテゴリ表示)について説明する。
監督者用画面は、監督者が全体の文脈を把握したい場合の画面イメージである。
【0069】
「受付」として「オペレータ名」という単語が表示され、「私」として「顧客名」という単語が表示され、「住所」として「住所」という単語が表示される。このように、個人情報の代わりに、個人情報を特定できないカテゴリを表示する。
【0070】
図13を参照して、画面イメージ(マスキング箇所の付加情報表示)について説明する。
分析者用画面は、個人情報が特定できない範囲で、分析の用途で付加情報を含めたテキストを使用したい場合の画面イメージである。カテゴリ「顧客名」の付加情報として、「性別:男性」、「年齢:30代」が表示される。カテゴリ「住所」の付加情報として、「東京都」が表示される。
【0071】
図14を参照して、画面イメージ(マスキング処理済みテキスト表示)について説明する。
権限無しユーザ用画面は、在宅勤務などコールセンタ以外での業務において、第三者による個人情報の盗み見を防止する場合の画面イメージである。
【0072】
マスキング対象箇所が削除されたのち、空白を詰める。このため、どこで個人情報を発話したか推測されにくくなる。
【0073】
図15を参照して、画面イメージ(マスキング箇所復号)について説明する。
復号ワードを入力することでマスキング箇所の復号が可能である。復号ワード(例えば、12345678)を入力することにより、マスキング箇所に、「田中A子」、「山田B男」、「東京都千代田区丸の内1の1の1」等の個人情報がそれぞれ表示される。
【0074】
上記実施例では、テキスト化の結果を単純にマスキングするのではなく、当該箇所をカテゴリ名称に置き換える。これにより、分析の精度を落とすことなく個人情報を秘匿することができる。また、管理者からは秘匿情報の一部を参照可能にし、通話評価の精度を向上する。
【0075】
具体的には、マスキングの際、あらかじめ設けられたカテゴリの内、どのカテゴリに分類するかを判別し、当該箇所をマスキング処理で削除してしまうのではなく、カテゴリ表示に置き換える。
【0076】
また、上記実施例では、カテゴリ表示に置き換えられた箇所のテキストは、別途データベースにて保管し、通話の当事者であるオペレータ及び管理者権限を持つユーザから当該箇所の元テキストを可逆的に閲覧できるように、閲覧権限レベルを付与する。この結果、人力のマスキング処理が不要になり、且つ通話評価及び分析用途の精度を落とさずに、情報を秘匿することができる。
【0077】
実施例において、プログラムを実行して処理を行う場合がある。ここで、計算機は、プロセッサ(例えばCPU、GPU)によりプログラムを実行し、記憶資源(例えばメモリ)やインターフェースデバイス(例えば通信ポート)等を用いながら、プログラムで定められた処理を行う。そのため、プログラムを実行して行う処理の主体を、プロセッサとしてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、演算部であれば良く、特定の処理を行う専用回路を含んでいてもよい。ここで、専用回路とは、例えばFPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)、CPLD(Complex Programmable Logic Device)等である。
【0078】
プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、実施例において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
【符号の説明】
【0079】
10 データ管理部
20 付加情報判定部
30データ加工部
40 データ配信部
50 ユーザ端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15