IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立超エル・エス・アイ・システムズの特許一覧

特開2024-123474音声評価システム、音声評価方法、音声評価システムを有するユーザ端末
<>
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図1
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図2
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図3
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図4
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図5
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図6
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図7
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図8
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図9
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図10
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図11
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図12
  • 特開-音声評価システム、音声評価方法、音声評価システムを有するユーザ端末 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024123474
(43)【公開日】2024-09-12
(54)【発明の名称】音声評価システム、音声評価方法、音声評価システムを有するユーザ端末
(51)【国際特許分類】
   H04M 1/00 20060101AFI20240905BHJP
   H04M 3/56 20060101ALI20240905BHJP
【FI】
H04M1/00 H
H04M3/56 Z
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023030918
(22)【出願日】2023-03-01
(71)【出願人】
【識別番号】000233169
【氏名又は名称】株式会社日立ソリューションズ・テクノロジー
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】葉玉 大智
(72)【発明者】
【氏名】坂上 陽香
(72)【発明者】
【氏名】新 遼吾
(72)【発明者】
【氏名】小峰 拓也
【テーマコード(参考)】
5K127
5K201
【Fターム(参考)】
5K127CB21
5K127GB72
5K127MA05
5K201BB09
5K201CA01
(57)【要約】
【課題】ユーザ音声を評価し、その評価結果の改善に繋がる行動を促す所定の内容を含む所定のメッセージをユーザ端末へ通知して表示させること。
【解決手段】音声評価システム100は、ユーザ端末1へ入力される音声を評価するシステムであって、ユーザ端末へ入力された音を所定の指標に基づいて評価する評価部110と、あらかじめ用意されたメッセージの中から評価部の評価結果に基づいて選択された所定のメッセージをユーザ端末に通知して端末画像30に表示させる通知部と、を備え、所定のメッセージは、ユーザ端末を使用するユーザに対して、評価結果の改善に繋がる行動を促す所定の内容を含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
ユーザ端末へ入力される音声を評価する音声評価システムであって、
前記ユーザ端末へ入力された音声を所定の指標に基づいて評価する評価部と、
あらかじめ用意されたメッセージの中から前記評価部の評価結果に基づいて選択された所定のメッセージを前記ユーザ端末に通知して端末画像に表示させる通知部と、
を備え、
前記所定のメッセージは、前記ユーザ端末を使用するユーザに対して、前記評価結果の改善に繋がる行動を促す所定の内容を含む
音声評価システム。
【請求項2】
請求項1記載の音声評価システムであって、
前記所定の指標には、音量と音質が含まれる
音声評価システム。
【請求項3】
請求項2に記載の音声評価システムであって、
前記音質についての指標には、S/N比、または前記ユーザ端末の周囲の雑音の大きさのうち少なくともいずれか一つが含まれる
音声評価システム。
【請求項4】
請求項3に記載の音声評価システムであって、
前記ユーザ端末の周囲の雑音の大きさは、前記ユーザの顔を撮影した画像データの解析結果と、前記ユーザ端末へ入力された音とに基づいて算出される
音声評価システム。
【請求項5】
請求項1に記載の音声評価システムであって、
前記所定の指標が複数ある場合に、前記ユーザ端末への指示によって所定の指標の一部が無効に設定される
音声評価システム。
【請求項6】
請求項1に記載の音声評価システムであって、
前記所定の指標が複数ある場合に、前記ユーザ端末の処理負荷または通信ネットワークの通信速度に応じて選択される
音声評価システム。
【請求項7】
ユーザ端末であって、
入力される音声を評価する音声評価システムを有し、
前記音声評価システムは、
入力された音声を所定の指標に基づいて評価する評価部と、
あらかじめ用意されたメッセージの中から前記評価部の評価結果に基づいて選択された所定のメッセージを端末画像に表示させる通知部と、
を備え、
前記所定のメッセージは、ユーザに対して、前記評価結果の改善に繋がる行動を促す所定の内容を含む
音声評価システムを有するユーザ端末。
【請求項8】
ユーザ端末から入力される音声を音声評価システムにより評価する音声評価方法であって、
前記ユーザ端末へ入力された音声を所定の指標に基づいて評価する評価ステップと、
あらかじめ用意されたメッセージの中から前記評価ステップの評価結果に基づいて選択された所定のメッセージを前記ユーザ端末に通知させる通知ステップとを
前記音声評価システムにより実行させ、
前記所定のメッセージは、前記ユーザ端末を使用するユーザに対して、前記評価結果の改善に繋がる行動を促す所定の内容を含む
音声評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声評価システム、音声評価方法、音声評価システムを有するユーザ端末に関する。
【背景技術】
【0002】
参加者がパーソナルコンピュータまたはスマートフォンなどを用いてオンライン会議サーバへアクセスし、資料を共有したり、互いの顔を確認したりしながら会議をすることが増えている。オンライン会議は、高価なテレビ会議システムとは異なり、ユーザの自宅など様々な環境から様々なデバイスを用いて利用される。オンライン会議サービスでは、ユーザ同士の音声が良好に聞こえることが重要である(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004-032296号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、会議に参加する複数ユーザ間で音声の音量を自動的に調整するが、音質に問題がある場合に対応できない。また、特許文献1では、ユーザの音声に問題がある場合に、当該ユーザにはその問題の発生を通知せず、SIP(Session Initiation Protocol)サーバ内で音量を自動調整する。したがって、音声の音量に問題のあるユーザは、自分の問題に気付きにくい。
【0005】
そこで、本発明は、ユーザ音声を評価し、評価結果の改善に繋がる行動を促す所定の内容を含む所定のメッセージをユーザ端末へ通知して表示させる音声評価システム、音声評価方法、音声評価システムを有するユーザ端末を提供する。
【課題を解決するための手段】
【0006】
上記課題を解決すべく、本発明の一つの観点に従う音声評価システムは、ユーザ端末へ入力される音声を評価する音声評価システムであって、ユーザ端末へ入力された音を所定の指標に基づいて評価する評価部と、あらかじめ用意されたメッセージの中から評価部の評価結果に基づいて選択された所定のメッセージをユーザ端末に通知して端末画像に表示させる通知部と、を備え、所定のメッセージは、ユーザ端末を使用するユーザに対して、評価結果の改善に繋がる行動を促す所定の内容を含む。
【発明の効果】
【0007】
本発明によれば、ユーザ端末から入力される音声を評価し、その評価結果の改善に繋がる行動を促す所定の内容を含む所定のメッセージを、ユーザ端末を使用するユーザへ通知することができる。
【図面の簡単な説明】
【0008】
図1】音声評価システムの全体構成図。
図2】音声評価システムの評価項目などを示す説明図。
図3】音声評価処理のフローチャート。
図4図3中の音量評価の詳細を示すフローチャート。
図5図3中の音質評価(SN比評価)の詳細を示すフローチャート。
図6図3中の音質評価(周囲の音声評価)の詳細を示すフローチャート。
図7図3中の回線評価の詳細を示すフローチャート。
図8】ユーザへ評価結果を通知する画像の例。
図9】第2実施例に係り、音声評価処理のフローチャート。
図10】評価対象としない項目を選択する画像の例。
図11】第3実施例に係り、音声評価処理のフローチャート。
図12】第4実施例に係り、音声評価システムの全体構成図。
図13】第5実施例に係り、音声評価システムの全体構成図。
【発明を実施するための形態】
【0009】
以下、図面に基づいて、本発明の実施の形態を説明する。本実施形態に係る音声評価システムは、ユーザから入力された音声を評価し、ユーザ自身の音声について当該ユーザに気づきを与える。本実施形態に係る音声評価システムは、音声の評価結果に応じたメッセージをユーザへ通知し、自発的な行動をユーザへ促す。
【実施例0010】
図1図8を用いて第1実施例を説明する。本実施例の音声評価システム100は、オンライン会議サービスを利用する際に用いられる。図1は、音声評価システム100の全体構成図である。図2は、音声評価の項目などを示す説明図である。
【0011】
複数のユーザ端末(1)~1(n)と一つのオンラインサービスサーバ2とは、通信ネットワークCNを介して双方向通信可能に接続されている。オンラインサービス提供サーバ2は、例えば、画像および音声を用いるオンライン会議サービスを提供する。
【0012】
ユーザ端末1(1)~1(n)は、例えば、パーソナルコンピュータ、スマートフォン、タブレット端末、ウェアラブル端末などである。ウェアラブル端末は、例えば、眼鏡型端末、ゴーグル型端末、腕時計型端末、腕輪型端末などのいずれでもよい。ユーザ端末1(1)~1(n)は、例えば、演算部101、メモリ102、通信部103、ユーザインターフェース(図中、UI)部104を備えるコンピュータである。
【0013】
演算部101は、マイクロプロセッサのような演算回路である。メモリ102は、主記憶装置および補助記憶装置を含む。通信部103は、有線または無線で通信ネットワークCNに接続する回路であり、オンラインサービス提供サーバ2と双方向通信する。ユーザインターフェース部104は、ユーザU1とユーザ端末1との間で情報を交換するための装置またはコンピュータプログラムである。ユーザインターフェース部104は、モニタディスプレイ30に限らず、例えば、プリンタ、スピーカーなどに情報を出力することもできる。ユーザインターフェース部104は、例えば、キーボード、タッチパネル、音声入力装置(マイク10)、視線検出装置などから情報を受け取ることもできる。
【0014】
ユーザ端末1(1)~1(n)上に、音声評価システム100が構築される。各ユーザ端末1(1)~1(n)は、それぞれ異なる種類のユーザ端末でもよい。以下、特に区別しない場合、ユーザ端末1(1)~1(n)をユーザ端末1と呼ぶ。オンラインサービス提供サーバ2にアクセスする全てのユーザ端末1が音声評価システム100を備えてもよいし、一部のユーザ端末1のみが音声評価システム100を備えてもよい。
【0015】
例えば、ユーザ端末1は、通信ネットワークCN上に設けられたプログラム配信サーバ3から所定のコンピュータプログラムをメモリ102へダウンロードし、演算部101により所定のコンピュータプログラムを実行して、音声評価システム100を実現させることができる。または、ユーザ端末1は、非一時的にコンピュータプログラムを記憶する記憶媒体MMから所定のコンピュータプログラムをメモリ102へ読み込み、所定のコンピュータプログラムを演算部101で実行することにより、音声評価システム100を実現させることもできる。
【0016】
音声評価システム100は、例えば、音声評価部110、オーディオミキサ120、サービス利用部130、通知部140を備える。
【0017】
音声評価部110は、複数の観点(複数の評価指標)で、ユーザ端末1を使用するユーザの音声を評価し、その評価結果をユーザへ通知し、評価結果改善のための行動をユーザへ促す。
【0018】
音声評価部110は、例えば、音量評価部111、音質評価部112、画像分析部113、回線評価部114を備える。図2で後述するように、音声評価部110は、評価リスト管理部115を備えることもできる。
【0019】
音量評価部111は、ユーザの音声の音量を評価する機能を持つ。ユーザの音声はマイク10で収集され、オーディオミキサ120を介して音声評価部110へ入力される。音質評価部112は、ユーザの音声の音質を評価する機能を持つ。音質評価部112は、図2で後述のように、SN比を評価する機能1121と、周囲の音声を評価する機能1122とを備える。
【0020】
画像分析部113は、ユーザの顔を含む画像を解析し、ユーザの唇の動きからユーザが発話(発声)しているか判定する機能を持つ。ユーザの顔は、カメラ20により撮像されて音声評価部110の画像分析部113へ入力される。カメラ20は、ユーザ端末1に内蔵されたカメラでもよいし、ユーザ端末1と有線または無線で接続されたカメラでもよい。複数のカメラ20でユーザの顔を撮影してもよい。なお、マイク(マイクロフォン)10も同様に、ユーザ端末1に内蔵されたマイクでもよいし、ユーザ端末1と有線または無線で接続されたマイクでもよい。ディスプレイ30も同様に、ユーザ端末1に内蔵されたディスプレイでもよいし、ユーザ端末1と有線または無線で接続されたディスプレイでもよい。
【0021】
回線評価部114は、ユーザ端末1とオンラインサービス提供サーバ2とを接続する通信ネットワークCNの通信状態を評価する機能を持つ。通信状態の評価項目には、例えば、回線速度(通信速度)、パケット損失率などがある。
【0022】
サービス利用部130は、オンラインサービス提供サーバ2の提供するオンラインサービスを利用する機能を持つ。オンラインサービスは、少なくともユーザの音声を用いるサービスであり、例えば、オンライン会議サービス、音声で制御システムへ指示を与えるサービスなどがある。
【0023】
通知部140は、音声評価部110による評価結果をユーザへ通知する機能を持つ。通知部140は、音声評価部110による評価結果に応じて所定のメッセージを生成し、生成された所定のメッセージをユーザインターフェース部104からディスプレイ30へ出力させて表示させる。ディスプレイ30を用いてオンライン会議サービスを利用中のユーザは、ディスプレイ30に表示された所定のメッセージを視認し、自分自身の音声についての評価(問題点)を知る。
【0024】
所定のメッセージは、ユーザ端末1を使用するユーザに対して、音声評価部110による評価結果の改善に繋がる行動を促す所定の内容を含む。例えば、音量が所定値よりも小さい場合、所定のメッセージには、「声が小さいので、もっと大きく発言してください」といった所定の内容が含まれる。例えば、音声の音質が所定値よりも低い場合、所定のメッセージには、「音質が悪いので、別のマイクを使用するか、または使用中のマイクを着脱してください」といった所定の内容が含まれる。このように、所定のメッセージには、音声評価の結果と、音声評価の改善に繋がる行動をユーザへ促す内容とが含まれる。
【0025】
図2に示すように、さらに、音声評価部110は、評価リスト116を管理する評価リスト管理部115を備える。
【0026】
評価リスト116は、音声評価部110がユーザ音声を評価する際に使用するリストである。評価リスト116は、例えば、日時1161、オンラインサービスID1162、評価項目1163、および評価結果1164を備える。
【0027】
日時1161は、ユーザの音声を評価した日時を示す情報である。ユーザの音声は、ユーザ端末1がオンラインサービス提供サーバ2へアクセス利用している間に、所定時間ごとに評価される。オンラインサービスID1162は、ユーザ端末1が使用するオンラインサービスを識別する情報である。
【0028】
評価項目1163は、ユーザの音声を評価する項目の情報である。評価項目1163は、上述のように例えば、音量評価、音質評価(SN比に基づく音質評価)、音質評価(周囲の音声に基づく音質評価)、回線評価がある。評価結果1164は、評価項目1163に含まれる項目ごとの評価結果を示す。
【0029】
評価結果1164は、例えば「OK」と「NG」のように正否を示す2値でもよいし、「A」「B」「C」のように3段階以上の値でもよいし、「1.2」「2.5」のように数値でもよい。評価リスト116は、評価時にのみ生成され、評価終了と同時に消去されてもよいし、または、評価リスト116は所定時間保持されてもよい。各評価項目に優先度を設定し、所定の評価項目の評価結果を重視することもできる。評価リスト116が所定時間保持される場合、保持された複数の評価リスト116を統計処理し、その統計処理の結果をユーザ端末1へ通知することもできる。
【0030】
図3は、音声評価処理のフローチャートである。ユーザ端末1がオンラインサービスを利用している間、ストリームごとに後述の各ステップS10~S90が実行される。
【0031】
音声評価システム100は、評価リスト116を作成してメモリ102へ記憶させる(S10)。音声評価システム100は、マイク10から音を取得する(S20)。
【0032】
音声評価システム100は、取得された音(音声)に基づいて、その音量を評価し、その評価結果を評価リスト116に記録する(S30)。音声評価システム100は、取得された音声のSN比を評価し、その評価結果を評価リストへ記録する(S40)。音声評価システム100は、取得された音声に含まれる周囲の音声を評価し、その評価結果を評価リスト116へ記録する(S50)。音声評価システム100は、通信回線の通信状態を評価し、その評価結果を評価リスト116へ記録する(S60)。
【0033】
音声評価システム100は、評価リスト116に記載されている全ての項目について評価すると、評価結果が「NG」である表か項目が一つでもあるか判定する(S70)。つまり、音声評価システム100は、ユーザの音声があらかじめ定められた評価基準を満たしているか否か判定する(S70)。
【0034】
音声評価システム100は、いずれか一つでも「NG」の評価項目がある場合(S70:YES)、そのNG項目についての所定メッセージをディスプレイ30に表示させて、ユーザU1へ通知する(S80)。評価結果「NG」の評価項目だけをディスプレイ30に表示させるのではなく、評価結果「OK」の評価項目も併せてディスプレイ30へ表示させてもよい。
【0035】
音声評価システム100は、オンラインサービスの利用終了を判定すると(S90:YES)、本処理を終了する。評価リスト116にNG項目が一つも無い場合(S70:YES)、音声評価システム100は、ステップS80をスキップし、ステップS90へ移行する。
【0036】
図4は、図3中の音量評価(S30)の詳細を示す。音量評価部111は、オーディオミキサ120から入力されたユーザ音声の1フレームごとの平均音量(平均dB)を計算する(S31)。音量評価部111は、ユーザ音声の平均音量が所定の音量範囲にあるか判定する(S32)。所定の音量範囲とは、最小閾値Th1より大きく、かつ最大閾値Th2よりも小さい範囲である。
【0037】
音量評価部111は、ユーザ音声の平均音量が所定の音量範囲にあると判定すると(S32:YES)、評価項目1163中の「音量評価」の評価結果1164に「OK」と記録する(S33)。
【0038】
音量評価部111は、ユーザ音声の平均音量が所定の音量範囲に無いと判定すると(S32:NO)、「音量評価」の評価結果1164に「NG」と記録する(S34)。
【0039】
図5は、図3中のSN比に基づく音質評価(S40)の詳細を示す。ユーザ音声のSN比が所定値ThSNよりも大きい場合、ユーザの音声の音質は良好であると評価することができる。
【0040】
音質評価部112は、オーディオミキサからストリームで入力されるユーザ音声を一定長のフレームに区切って、SN比を評価する。
【0041】
音質評価部112は、図4のステップS31で算出された、ユーザ音声1フレームの平均音量を取得し(S41)、1フレームのSN比を算出する(S42)。音質評価部112は、算出されたSN比が閾値ThSNよりも大きいか判定する(S43)。ユーザ音声のSN比が閾値ThSNよりも大きい場合(S43:YES)、音質評価部112は、「音質評価(SN比)」の評価結果に「OK」を記録する(S44)。これに対し、ユーザ音声のSN比が閾値ThSN以下の場合(S43:NO)、音質評価部112は、「音質評価(SN比)」の評価結果に「NG」を記録する(S45)。
【0042】
図6は、図3中の周囲の音声に基づく音質評価(S50)の詳細を示す。周囲の音声とは、ユーザの周囲の他人の音声、ユーザの周囲にある機械の作動音などの、ユーザの周囲の騒音である。周囲の音と言い換えてもよい。ユーザの周囲の音声が大きい場合、すなわちユーザの周囲の騒音が大きい場合、ユーザの音声はオンラインサービスを使用する相手方に聞こえにくいと評価することができる。ユーザの唇の動きからユーザが発声中であるか判定し、ユーザが発声していないときの音声のSN比が最小閾値Th1より大きい場合、周囲の騒音がうるさく、ユーザ音声に影響を与えていると判定する。
【0043】
音質評価部112は、画像解析部113に指示し、カメラ20でユーザの顔を撮影させる(S51)。画像解析部113は、撮影された顔画像を解析し、ユーザの唇の動きを抽出し、その抽出結果を音質評価部112へ送る(S52)。音質評価部112は、ユーザの唇の動きに基づいて、ユーザが発言(発声)しているか判定する(S53)。
【0044】
音質評価部112は、図4のステップS31で算出された1フレームの平均音量を取得し(S54)、ユーザ音声の平均音量が所定条件を満たすか判定する(S55)。所定条件とは、例えば、平均音量が最小閾値Th1よりも大きく、かつユーザが発言(発声)中であると判定された場合である。つまり、ユーザ音声が所定条件を満たす場合とは、オンラインサービスを利用するユーザが発言している場合である。
【0045】
音質評価部112は、ユーザ音声の平均音量が所定条件を満たすと判定した場合(S55:YES)、評価リスト116の「周囲の音声に基づく音質評価」の評価結果に「OK」を記録する(S56)。
【0046】
これに対し、音質評価部112は、ユーザ音声の平均音量が所定条件を満たさないと判定する場合(S55:NO)、「周囲の音声に基づく音質評価」の評価結果に「NG」と記録する(S57)。ユーザ音声の平均音量が所定条件を満たさない場合とは、ユーザは発言していないのに音量が大きい場合であり、すなわちユーザの周囲の音声(例えば、工事や道路の騒音、周囲の人間の声など)が大きい場合である。
【0047】
図7は、図3中の回線評価(S60)の詳細を示す。回線評価部114は、ユーザ端末1とオンラインサービス提供サーバ2を接続する通信ネットワークCNの通信状況を評価する。通信状況が悪い場合、ユーザの音声が分断されてしまい、正常に相手方へ届かないことがあるためである。
【0048】
回線評価部114は、オンラインサービスを利用するための送信先IP(Internet Protocol)アドレスを取得する(S61)。ここでは、オンラインサービス提供サーバ2がユーザ端末1と通信するために用いるIPアドレスである。
【0049】
回線評価部114は、通信品質(通信状況)を計算し(S62)、通信品質が所定の範囲にあるか判定する(S63)。通信品質には、例えば、通信速度(アップロード速度、ダウンロード速度のいずれかまたは両方)と、パケット損失率などがある。所定の範囲とは、例えば、アップロード速度が所定の閾値ThUPよりも大きく、かつダウンロード速度が所定の閾値ThDOWNよりも大きく、かつパケット損失率が所定の閾値ThPKよりも小さいこと、である。
【0050】
回線評価部114は、オンラインサービスの利用に使用する通信ネットワークCNの通信品質が所定の範囲に入っている場合(S63:YES)、評価リスト116の「回線評価」の評価結果に「OK」と記録する(S64)。
【0051】
これに対し、回線評価部114は、通信品質が所定の範囲に入っていない場合(S63:NO)、「回線評価」の評価結果に「NG」を記録する(S65)。
【0052】
図8は、ユーザへ評価結果を通知する画像の例を示す。ユーザ端末1のディスプレイ30には、オンラインサービス(例えばオンライン会議サービス)の画面G1が表示されている。定期的にまたは不定期に、図3の処理によりユーザ音声が評価され、その評価結果が通知画面G11としてディスプレイ30に表示される。
【0053】
通知画面G11は、所定のメッセージMを含む。所定のメッセージMは、例えば、評価結果が「NG」だった評価項目を通知する音声状況通知部C1と、評価結果が「NG」だった評価項目の改善に繋がる行動をユーザに促す助言部C2とを含む。
【0054】
ユーザ音声が小さい場合、音声状況通知部C1には、例えば「音量が低いようです」と表示され、助言部C2には、例えば「マイクに口を近づけてください。またはマイクの入力レベルを上げてください。」と表示される。
【0055】
ユーザ音声のSN比が低い場合、音声状況通知部C1には、例えば「音質(SN比)が悪いようです」と表示され、助言部C2には、例えば「マイクを抜き差ししてください。」と表示される。マイク10をユーザ端末1へ抜き差しすることで接触不良が解消し、SN比が改善する可能性があるためである。助言部C2は、あるいは「マイクを交換してください。」と表示してもよい。周囲の音声が大きい場合、音声状況通知部C1には、例えば「周囲が騒がしいようです。」と表示され、助言部C2には「静かな場所へ移動しましょう。」と表示される。通信品質が悪い場合、音声状況通知部C1には、例えば「通信速度が遅いようです。」と表示され、助言部C2には、例えば「しばらく待ってから再度アクセスしましょう。」と表示される。
【0056】
このように構成される本実施例によれば、オンラインサービスを利用するユーザの音声の音質に問題がある場合に、その問題をユーザに指摘して改善を促すことができる。したがって、オンラインサービスを利用する他のユーザ(相手方)が受けるサービス品質を向上させることができる。
【0057】
本実施例によれば、ユーザ音声に音量または音質の問題がある場合に、その問題を当該ユーザへ通知するため、ユーザに問題の所在を気づかせることができる。オンライン会議サービスのように複数ユーザが集まって利用する場合、いわゆる強い立場のユーザの音声が小さかったり不明瞭であったりしても、相手方である他のユーザはその問題を指摘しにくい。このため、オンライン会議サービスの品質が低下し、参加者全員にとって使い勝手が悪くなる。これに対し、本実施例では、問題を抱えるユーザに対してその問題を指摘するだけでなく(C1)、改善に繋がる行動を促すため(C2)、参加者全員にとっての使い勝手を向上できる。
【0058】
なお、音量評価S30、SN比に基づく音質評価S40、周囲音声に基づく音質評価S50、回線評価S60の実行順序は問わない。音量評価S30で算出される平均音量は、他の評価処理でも使用されるため、音量評価S30を先に実行する方が処理効率が向上するが、処理効率を問わない場合は処理の順番を問わない。
【実施例0059】
図9および図10を用いて第2実施例を説明する。本実施例の音声評価システム100Aは、複数の評価項目のうちユーザの選択した評価項目以外の評価項目だけで評価リスト116を生成する。
【0060】
図9は、音声評価処理のフローチャートである。図9の音声評価処理と図3で述べた音声評価処理とを比べると、本処理では、ユーザの指定した評価項目を取得するステップS1と、選択された評価項目を除いて評価リスト116を生成するステップS10Aとが、ステップS20の前に実施される。
【0061】
図10は、評価対象としない項目を選択する画像の例である。ユーザ端末1のディスプレイ30には、オンラインサービスを利用する画面G1と除外項目選択画面G12とが表示される。
【0062】
ユーザは、除外項目選択画面G12に表示された各評価項目(ステップ30,S40,S50,S60に対応する項目)の中から、評価対象としない項目を一つ以上選択することができる。ユーザは、一つも項目を選択せずに、全ての評価項目を評価対象として指示することもできる。
【0063】
このように構成される本実施例による音声評価システム100Aも第1実施例で述べた音声評価システム100と同様の作用効果を奏する。さらに本実施例によれば、ユーザは評価対象としない項目を選択することができるため、ユーザの自助努力だけでは解決できない問題がある場合に、音声評価システム100Aから通知される回数を少なくでき、ユーザにとっての使い勝手が向上する。例えば、集合住宅などで回線が混雑している時間帯の場合、通信品質を改善することは難しい。このような場合、ユーザは回線評価を評価対象から外すことで、通知画面G11の表示回数を少なくできる。
【実施例0064】
図11を用いて第3実施例を説明する。図11は、本実施例の音声評価システム100Bが実行する音声評価処理のフローチャートである。本実施例の音声評価システム100Bは、ユーザ端末1の処理負荷および/または通信ネットワークCNの通信速度を取得し(S2)、処理負荷および/または通信速度に応じて評価リスト116を生成する(S10B)。
【0065】
図11は、音声評価処理のフローチャートである。図11の音声評価処理と図3で述べた音声評価処理とを比べると、本処理では、ユーザ端末1の処理負荷および/または通信ネットワークCNの通信速度を取得するステップS2と、処理負荷および/または通信速度選に応じて評価リスト116を生成するステップS10Bとが、ステップS20の前に実施される。
【0066】
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに本実施例によれば、ユーザ端末1の処理負荷および/または通信ネットワークCNの通信速度に応じて評価リスト116を生成するため、ユーザ端末1の処理負荷を増大させたり、通信状況を現状よりも悪化させたりする可能性を低減できる。例えば、複数の評価項目(ステップ30,S40,S50,S60に対応する項目)のうち、処理負荷の少ない評価項目から評価リスト116を生成してもよいし、あるいは、通信速度に影響を与えない評価項目だけで評価リスト116を生成してもよい。
【実施例0067】
図12を用いて第4実施例を説明する。図12は、音声評価システム100Cの全体構成図である。本実施例の音声利用システムでは、ユーザ端末1からの音声を、オンラインサービスを提供するオンラインサービス提供サーバ2と議事録を自動作成する議事録作成サーバ4とに入力させる。
【0068】
議事録作成サーバ4は、オンライン会議サービスを提供するオンラインサービス提供サーバ2と連動しており、入力されたユーザ音声を認識してテキストデータへ変換し、議事録を作成する。
【0069】
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに本実施例では、共通のユーザ音声を利用する複数のシステム(オンラインサービス提供サーバ2と議事録作成サーバ4)の使い勝手を向上できる。
【実施例0070】
図13を用いて第5実施例を説明する。本実施例では、制御機器51を制御するアプリケーションシステム5に対して、音声評価システム100Dで評価されたユーザ音声を入力する。
【0071】
アプリケーションシステム5は、例えば、ユーザ端末1からの音声で制御機器51の少なくとも一部を制御する音声指示システムである。制御機器51は、例えば、生産設備、輸送機器、エレベータ、自動車、建設機械、航空機、船舶、製造ロボット、介護ロボット、手術ロボット、ドローン、情報処理機器などである。
【0072】
このように構成される本実施例も第1実施例と同様の作用効果を奏する。
【0073】
なお、本発明は上記各実施例に限定されず、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0074】
また、上記の各構成は、それらの一部又は全部が、ハードウェアで構成されても、プロセッサでプログラムが実行されることにより実現されるように構成されてもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【0075】
上述した開示には、例えば、コンピュータプログラムの発明が含まれる。
【0076】
(例)コンピュータを、ユーザ端末から入力される音声を評価する音声評価システムとして機能させるコンピュータプログラムであって、
前記コンピュータ上に、
前記ユーザ端末へ入力された音声を所定の指標に基づいて評価する評価部と、
あらかじめ用意されたメッセージの中から前記評価部の評価結果に基づいて選択された所定のメッセージを前記ユーザ端末に通知して端末画像に表示させる通知部と、
を実現し、
前記所定のメッセージは、前記ユーザ端末を使用するユーザに対して、前記評価結果の改善に繋がる行動を促す所定の内容を含む
コンピュータプログラム。
【符号の説明】
【0077】
1:ユーザ端末、2:オンラインサービス提供サーバ、3:プログラム配信サーバ、4:議事録作成サーバ、5:アプリケーションシステム、100,100A,100B,100C,100D:音声評価システム、110:音声評価部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13