(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-15
(45)【発行日】2025-04-23
(54)【発明の名称】推定装置、推定方法、およびプログラム
(51)【国際特許分類】
H04M 3/00 20240101AFI20250416BHJP
【FI】
H04M3/00 E
(21)【出願番号】P 2021014699
(22)【出願日】2021-02-02
【審査請求日】2024-01-12
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100178216
【氏名又は名称】浜野 絢子
(74)【代理人】
【識別番号】100149618
【氏名又は名称】北嶋 啓至
(72)【発明者】
【氏名】佐久間 亮
【審査官】山中 実
(56)【参考文献】
【文献】特開2019-165359(JP,A)
【文献】国際公開第2012/117549(WO,A1)
【文献】国際公開第2008/023570(WO,A1)
【文献】特開2011-041043(JP,A)
【文献】特開2020-136723(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 3/00
H04L 43/00
H04L 65/00
(57)【特許請求の範囲】
【請求項1】
音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する抽出手段と、
前記抽出手段によって抽出された前記複数のパケットの
各々の送信時刻と
、前記観測点ごとの前記パケットの取得時刻を用いて、
複数の前記パケットの各々について、前記観測点ごとの前記パケットの取得時刻から前記パケットの送信時刻を引いた差分である遅延時間を計算し、前記遅延時間の平均値である平均遅延時間を前記観測点ごとに計算し、複数の前記パケットの各々の前記遅延時間と前記平均遅延時間との差分であるゆらぎ度を前記観測点ごとに計算する計算手段と、
隣接する前記観測点の
組における前記平均遅延時間の差と前記ゆらぎ度の差の関係に基づいて、隣接する前記観測点の組を分類する分類手段と、
前記分類手段による分類に基づいて、隣接する前記観測点の間における音声品質を推定する推定手段と、を備え
、
前記分類手段は、
前記平均遅延時間の差と前記ゆらぎ度の差を二軸とする直交座標における、隣接する前記観測点の組ごとの前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置に応じて、隣接する前記観測点の間における音声品質を分類し、
前記推定手段は、
前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置が劣化判定領域の範囲内にある前記観測点の組の間において、音声品質が劣化していると推定する推定装置。
【請求項2】
前記計算手段は、
前記抽出手段によって抽出された前記パケットの送信時刻と
、前記観測点ごとの前記パケットの取得時刻
とを用いて、前記ゆらぎ度と
前記遅延時間を前記観測点ごとに計算し、
前記観測点ごとに算出された前記ゆらぎ度と前記遅延時間とを用いて、隣接する前記観測点の間における前記ゆらぎ度の差と前記平均遅延時間の差を計算する請求項1に記載の推定装置。
【請求項3】
前記計算手段は、
同一の前記音声データから分割された前記複数のパケットの各々の前記遅延時間と、同一の前記音声データから分割された前記複数のパケットの前記平均遅延時間との差分を前記ゆらぎ度として計算する請求項2に記載の推定装置。
【請求項4】
前記分類手段は、
前記ゆらぎ度の差、前記平均遅延時間の差、および音声品質が劣化しているか否かを示す音声品質情報を教師データとして学習し、音声品質の劣化箇所を推定する推定モデルを生成する請求項1乃至
3のいずれか一項に記載の推定装置。
【請求項5】
前記推定手段は、
少なくとも一つの前記観測点における前記パケットの送信時刻と取得時刻を前記推定モデルに入力し、
前記推定モデルからの出力に応じて、前記観測点の間における音声品質を推定する請求項
4に記載の推定装置。
【請求項6】
前記推定手段は、
前記音声通信ネットワークにおける音声品質に関する情報を表示装置に出力する請求項1乃至
5のいずれか一項に記載の推定装置。
【請求項7】
コンピュータが、
音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出し、
抽出された前記複数のパケットの
各々の送信時刻と
、前記観測点ごとの前記パケットの取得時刻を用いて、
複数の前記パケットの各々について、前記観測点ごとの前記パケットの取得時刻から前記パケットの送信時刻を引いた差分である遅延時間を計算し、
前記遅延時間の平均値である平均遅延時間を前記観測点ごとに計算し、
複数の前記パケットの各々の前記遅延時間と前記平均遅延時間との差分であるゆらぎ度を前記観測点ごとに計算し、
隣接する前記観測点の
組における前記平均遅延時間の差と前記ゆらぎ度の差の関係に基づいて、隣接する前記観測点の組を分類し、
前記分類に基づいて、隣接する前記観測点の間における音声品質を推定し
、
前記分類において、
前記平均遅延時間の差と前記ゆらぎ度の差を二軸とする直交座標における、隣接する前記観測点の組ごとの前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置に応じて、隣接する前記観測点の間における音声品質を分類し、
前記推定において、
前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置が劣化判定領域の範囲内にある前記観測点の組の間において、音声品質が劣化していると推定する推定方法。
【請求項8】
コンピュータに、
音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する処理と、
抽出された前記複数のパケットの
各々の送信時刻と
、前記観測点ごとの前記パケットの取得時刻を用いて、
複数の前記パケットの各々について、前記観測点ごとの前記パケットの取得時刻から前記パケットの送信時刻を引いた差分である遅延時間を計算する処理と、
前記遅延時間の平均値である平均遅延時間を前記観測点ごとに計算する処理と、
複数の前記パケットの各々の前記遅延時間と前記平均遅延時間との差分であるゆらぎ度を前記観測点ごとに計算する処理と、
隣接する前記観測点の
組における前記平均遅延時間の差と前記ゆらぎ度の差の関係に基づいて、隣接する前記観測点の組を分類する処理と、
前記分類に基づいて、隣接する前記観測点の間における音声品質を推定する処理と、
前記分類する処理において、
前記平均遅延時間の差と前記ゆらぎ度の差を二軸とする直交座標における、隣接する前記観測点の組ごとの前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置に応じて、隣接する前記観測点の間における音声品質を分類する処理と、
前記推定する処理において、
前記平均遅延時間の差と前記ゆらぎ度の差によって定まる点の位置が劣化判定領域の範囲内にある前記観測点の組の間において、音声品質が劣化していると推定する処理と、を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音声通信における音声品質を推定する推定装置等に関する。
【背景技術】
【0002】
音声通信サービスの維持および改善のために、サービス提供時の音声品質(サービスレベルとも呼ぶ)を把握することが求められている。音声品質の低下が発生した場合に、音声品質劣化箇所を特定することによって、継続的なサービスが実現される。音声品質の評価基準としては、例えば、平均オピニオン評点(MOS:Mean Opinion Score)のような主観的評価指標による音声通信品質評価モデルなどの音響モデルを用いる手法や、音声サンプルを用いて直感的に評価する手法がある。しかしながら、それらの手法では、音声通信ごとの音声品質を評価することはできるが、音声品質の劣化原因箇所を特定することはできなかった。
【0003】
特許文献1には、通信経路上で音声データの品質が劣化する箇所を推定することを目的とした音声品質劣化箇所推定装置について開示されている。特許文献1の装置は、通信装置に設定された観測点から、音声端末から送信された通信パケットを収集する。特許文献1の装置は、収集された通信パケットに基づいて、音声端末から観測点までの遅延時間を算出する。特許文献1の装置は、通信パケットおよび遅延時間に基づいて、観測点における通信パケットの取得時刻のばらつき具合(ゆらぎ度合いとも呼ぶ)を算出する。特許文献1の装置は、隣接する観測点における遅延時間およびゆらぎ度合いの差が予め定めた基準よりも大きい箇所を、音声品質劣化箇所と特定する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1には、音声品質劣化箇所を特定するための判定基準の定め方が明確に開示されていない。そのため、特許文献1の手法では、判定基準を予め設定しておかない限り、音声品質劣化箇所を精度よく特定することが難しかった。
【0006】
本開示の目的は、音声通信ネットワークにおける音声品質劣化箇所を精度よく推定できる推定装置等を提供することにある。
【課題を解決するための手段】
【0007】
本開示の一態様の推定装置は、音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する抽出部と、抽出部によって抽出された複数のパケットの送信時刻と取得時刻を用いて、隣接する観測点の間におけるパケットの取得時刻のばらつき具合を示すゆらぎ度の差と平均遅延時間の差とを計算する計算部と、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類する分類部と、分類部による分類に基づいて、隣接する観測点の間における音声品質を推定する推定部と、を備える。
【0008】
本開示の一態様の推定方法においては、コンピュータが、音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出し、抽出された複数のパケットの送信時刻と取得時刻を用いて、隣接する観測点の間におけるパケットの取得時刻のばらつき具合を示すゆらぎ度の差と平均遅延時間の差とを計算し、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類し、分類に基づいて、隣接する観測点の間における音声品質を推定する。
【0009】
本開示の一態様のプログラムは、コンピュータに、音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する処理と、抽出された複数のパケットの送信時刻と取得時刻を用いて、隣接する観測点の間におけるパケットの取得時刻のばらつき具合を示すゆらぎ度の差と平均遅延時間の差とを計算する処理と、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類する処理と、分類に基づいて、隣接する観測点の間における音声品質を推定する処理と、を実行させる。
【発明の効果】
【0010】
本開示によれば、音声通信ネットワークにおける音声品質劣化箇所を精度よく推定できる推定装置等を提供することが可能になる。
【図面の簡単な説明】
【0011】
【
図1】第1の実施形態に係る推定装置による音声品質の推定対象の音声通信ネットワークの構成の一例を示す概念図である。
【
図2】第1の実施形態に係る推定装置の構成の一例を示すブロック図である。
【
図3】第1の実施形態に係る推定装置が算出するゆらぎ度について説明するためのグラフである。
【
図4】第1の実施形態に係る推定装置による分類について説明するためのグラフである。
【
図5】第1の実施形態に係る推定装置による推定について説明するためのグラフである。
【
図6】第1の実施形態に係る推定装置が推定モデルを用いて音声品質を推定する一例を示す概念図である。
【
図7】第1の実施形態に係る推定装置による音声品質の推定対象の音声通信ネットワークの構成の一例を示す概念図である。
【
図8】第1の実施形態に係る推定装置によって収集されるフローデータが格納されたフローデータテーブルの一例を示す表である。
【
図9】第1の実施形態に係る推定装置による推定結果の表示例を示す概念図である。
【
図10】第1の実施形態に係る推定装置の動作について説明するためのフローチャートである。
【
図11】第1の実施形態に係る推定装置による抽出処理について説明するためのフローチャートである。
【
図12】第1の実施形態に係る推定装置による計算処理について説明するためのフローチャートである。
【
図13】第2の実施形態に係る推定装置の構成の一例を示すブロック図である。
【
図14】各実施形態に係る推定装置を実現するハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0012】
以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。なお、以下の実施形態の説明に用いる全図においては、特に理由がない限り、同様箇所には同一符号を付す。また、以下の実施形態において、同様の構成・動作に関しては繰り返しの説明を省略する場合がある。
【0013】
(第1の実施形態)
まず、第1の実施形態に係る推定装置について図面を参照しながら説明する。本実施形態の推定装置は、音声通信ネットワークにおける音声品質劣化を推定する。音声通信における音声品質劣化の要因としては、例えば、パケットの到着時刻のばらつき(「ゆらぎ」とも呼ぶ)や、遅延時間、パケット損失等があげられる。本実施形態の推定装置は、それらの要因のうち、ゆらぎと遅延時間に基づいて、音声通信ネットワークにおける音声品質劣化を推定する。
【0014】
(構成)
図1は、本実施形態の推定装置10と、その推定装置10による音声品質の推定対象の音声通信ネットワーク100の構成の一例を示す概念図である。推定装置10と音声通信ネットワーク100は、インターネットやイントラネットなどのネットワーク150を介して接続される。なお、推定装置10は、音声通信ネットワーク100に含まれてもよい。音声通信ネットワーク100は、複数の端末110および複数の通信装置130を含む。端末110および通信装置130の数については、特に限定を加えない。
【0015】
端末110は、音声通信機能を有する。各端末110は、他の端末110との間で音声通信を行うために使用される。端末110は、入力されたアナログ音声をデジタルデータ(音声データとも呼ぶ)に変換する。端末110は、音声データを圧縮し、一定長のフレームに分割する。端末110は、分割された複数のフレームにヘッダを付与することによって、複数のパケットを生成する。例えば、複数のパケットの各々には、送信元IPアドレスや宛先IPアドレスが含まれるIPヘッダが付与される(IP:Internet Protocol)。各端末110は、複数の通信装置130を介して、音声通信対象の端末110との間で複数のパケットを送受信する。
【0016】
通信装置130は、複数の端末110の間における音声通信を仲介する。例えば、通信装置130は、スイッチやルータ、コンピュータなどのようにパケットを送受信できる装置によって実現される。通信装置130には、少なくとも二つのインターフェース(以下、IFと記載)が設定される(IF:Interface)。各通信装置130のIFは、ネットワーク150を介して、推定装置10に接続される。各通信装置130のIFは、他の通信装置130のIFや、端末110に接続される。以下においては、互いのIFが接続された二つの通信装置130を、隣接する通信装置130と呼ぶ。なお、隣接する通信装置130の間に、他の通信装置130が介在してもよい。また、以下において、IFのことを観測点とも記載する。
【0017】
通信装置130は、各端末110から送信されたパケットをサンプリングする。通信装置130は、サンプリングされたパケットに関するフローデータをIFごとに生成する。フローデータには、通信装置130の名称や、IFの名称、送信元IPアドレス、宛先IPアドレス、宛先ポートなどの情報が含まれる。また、フローデータには、パケットのシーケンス番号、パケットの送信時刻(送信タイムスタンプとも呼ぶ)、パケットがサンプリングされた時刻(取得時刻)が含まれる。
【0018】
〔推定装置〕
図2は、推定装置10の構成の一例を示すブロック図である。推定装置10は、収集部11、データ記憶部12、抽出部13、計算部14、分類部15、判定基準記憶部16、および推定部17を備える。なお、推定装置10には、収集部11、データ記憶部12、抽出部13、分類部15、判定基準記憶部16、および推定部17以外の構成が含まれてもよい。
【0019】
収集部11は、音声通信ネットワーク100に含まれる少なくともいずれかの通信装置130に接続される。収集部11は、各通信装置130の観測点(IF)ごとのフローデータを収集できれば、いずれの通信装置130に接続されてもよい。収集部11は、接続された通信装置130を介して、各通信装置130の観測点(IF)ごとのフローデータを収集する。収集部11は、収集したフローデータをデータ記憶部12に記憶させる。
【0020】
収集部11は、音声通信ネットワーク100の経路上における複数の観測点(IF)から、サンプリングベースでパケットを収集する。例えば、sFlowやNetFlowなどのように、サンプリングベースのフロー監視技術を備えた通信装置130であれば、ネットワーク構成を変更せずに観測点を確保できる。通信パケットをサンプリングベースで収集すれば、パケットキャプチャによる音声品質測定と比べてデータ量を低減できるため、多数の観測点においてフローデータを収集/解析できる。
【0021】
データ記憶部12は、収集されたフローデータを記憶する。例えば、データ記憶部12は、ハードディスクドライブを内蔵したハードディスクドライブ型磁気ディスク装置や、磁器ディスクパックを含むパック型磁気ディスク装置等の補助記憶装置によって実現される。
【0022】
データ記憶部12は、フローデータベースおよびトポロジデータベースを含む。フローデータベースには、観測点(IF)における各フローを特定するための情報が格納される。例えば、フローデータベースには、各通信装置130の観測点(IF)ごとに、送信元IPアドレス、宛先IPアドレス、および宛先ポートが対応付けられたフローが格納される。トポロジデータベースには、ネットワークトポロジに関する情報(ネットワークトポロジ情報とも呼ぶ)が格納される。例えば、トポロジデータベースには、音声通信ネットワーク100の管理者などによって予め登録されたネットワークトポロジ情報が格納される。
【0023】
抽出部13は、データ記憶部12に記憶されたネットワークトポロジ情報に基づいて、音声通信ネットワーク100に含まれる観測点(IF)を特定する。抽出部13は、特定された観測点(IF)ごとに、各観測点(IF)を経由する音声データに関するフローデータを抽出する。
【0024】
計算部14は、抽出された観測点(IF)ごとのフローデータに基づいて、各観測点(IF)を通過したパケットの取得時刻のばらつき具合を示すゆらぎ度と、遅延時間とを計算する。計算部14は、算出された各観測点(IF)におけるゆらぎ度と遅延時間を用いて、隣接する観測点(IF)間におけるゆらぎ度の差と遅延時間の差を計算する。例えば、計算部14は、下記の手順によって、隣接する観測点(IF)間におけるゆらぎ度の差と遅延時間の差を計算する。
【0025】
まず、計算部14は、音声通信ネットワーク100に含まれる各観測点(IF)で収集されたフローデータから、パケットの送信時刻と、各観測点(IF)におけるパケットの取得時刻とを抽出する。計算部14は、抽出されたパケットの送信時刻と、各観測点(IF)におけるパケットの取得時刻とを用いて、パケットごとの遅延時間を観測点(IF)ごとに計算する。計算部14は、パケットごとの送信時刻と取得時刻の差分を遅延時間として計算する。
【0026】
例えば、計算部14は、下記の式1を用いて、パケットごとの遅延時間tdを計算する。
td=tr-ts・・・(1)
ただし、上記の式1において、trはパケットの取得時刻であり、tsはパケットの送信時刻である。
【0027】
計算部14は、同一の音声データから分割された複数のパケットの各々について算出された、観測点(IF)ごとの遅延時間の平均値(平均遅延時間とも呼ぶ)を計算する。そして、計算部14は、同一の音声データから分割された複数のパケットの各々の遅延時間と平均遅延時間との差分(ゆらぎ度)を観測点(IF)ごとに計算する。ゆらぎ度は、同一の音声データから分割された複数のパケットの各々の遅延時間と、同一の音声データから分割された全てのパケットの遅延時間の平均値(平均遅延時間とも呼ぶ)との差分である。
【0028】
図3は、ある観測点(IF)におけるパケットの取得時刻のばらつき具合を示すゆらぎ度について説明するためのグラフである。
図3のグラフは、同一の音声データから分割された複数のパケットの各々のシーケンス番号と、各パケットのゆらぎ度の関係の一例を示す。例えば、計算部14は、下記の式2を用いて、IFiにおける、ある音声データから分割されたシーケンス番号jのパケット(パケットjとも呼ぶ)のゆらぎ度f
ijを計算する(i、jは自然数)。
f
ij=t
d_ij-t
ad_i・・・(2)
ただし、上記の式2において、t
d_ijは、IFiにおける、ある音声データから分割されたパケットjの遅延時間である。また、上記の式1において、t
ad_iは、IFiにおける、ある音声データから分割された全てのパケットの平均遅延時間である。
【0029】
計算部14は、隣接する観測点(IF)間のゆらぎ度の差を計算する。例えば、計算部14は、下記の式3を用いて、通信装置130aのIFmと通信装置130bのIFnとの間における、パケットjに関するゆらぎの差Df(m-n)を計算する(a、b、m、nは自然数)。
【0030】
ただし、上記の式3において、fmjは、IFmにおけるパケットjのゆらぎ度である。また、上記の式3において、fnjは、IFnにおけるパケットjのゆらぎ度である。
【0031】
計算部14は、隣接する観測点(IF)間における平均遅延時間の差を計算する。例えば、計算部14は、下記の式4を用いて、通信装置130aのIFmと通信装置130bのIFnとの間における平均遅延時間の差Tadを計算する。
Tad=tad_m-tad_n・・・(4)
ただし、上記の式4において、tad_mは、IFmにおける遅延時間である。また、上記の式4において、tad_nは、IFnにおける遅延時間である。
【0032】
分類部15は、計算部14によって算出された、隣接する観測点(IF)間における平均遅延時間の差とゆらぎの差に基づいて、各観測点(IF)の関係を分類する。例えば、分類部15は、隣接する観測点(IF)間における平均遅延時間の差に対するゆらぎ度の差を二次元の直交座標にプロットする。分類部15は、直交座標上にプロットされた各観測点(IF)間のプロットの座標上の位置に応じて、各観測点(IF)間の関係を分類する。
【0033】
例えば、分類部15は、クラスター分析や分類(Classification)等の手法を用いて、各観測点(IF)間の関係を分類する。分類部によって分類された各観測点(IF)間の関係の分類結果は、音声通信ネットワーク100における音声品質の劣化箇所を特定するための判定基準として、判定基準記憶部16に記憶される。例えば、分類部15は、機械学習の手法を用いて、音声品質の劣化箇所を推定するモデルを生成してもよい。例えば、分類部15は、過去に蓄積されたゆらぎの差や遅延時間の差、音声品質が劣化しているか否かの情報(音声品質情報とも呼ぶ)を教師データとして学習し、音声品質の劣化箇所を推定するモデルを生成する。
【0034】
図4は、隣接する観測点(IF)間における平均遅延時間の差に対するゆらぎの差を二次元の直交座標にプロットした一例に関するグラフである。
図4の例において、四角形のマーカーは、音声品質が正常なインターフェース間に関する。分類部15は、音声品質が正常なインターフェース間のマーカー(四角形)に基づいて、二次元の直交座標上に正常判定領域(実線の範囲内)を設定する。また、
図4の例において、円形のマーカーは、音声品質が劣化しているインターフェース間に関する。分類部15は、音声品質が劣化しているインターフェース間のマーカー(円形)に基づいて、二次元の直交座標上に異常判定領域(破線の範囲内)を設定する。
【0035】
判定基準記憶部16は、分類部15による分類結果に基づく判定基準を記憶する。例えば、判定基準記憶部16は、ハードディスクドライブを内蔵したハードディスクドライブ型磁気ディスク装置や、磁器ディスクパックを含むパック型磁気ディスク装置等の補助記憶装置によって実現される。判定基準記憶部16は、データ記憶部12と同じ補助記憶装置に構成されてもよいし、データ記憶部12とは異なる補助記憶装置に構成されてもよい。
【0036】
推定部17は、分類部15による分類に基づいて、観測点(IF)間における音声品質の劣化箇所を推定する。また、推定部17は、判定基準記憶部16に記憶された判定基準を用いて、観測点(IF)間における音声品質の劣化箇所を推定してもよい。例えば、推定部17は、新たに取得されたパケットに関して、隣接する観測点(IF)間における平均遅延時間の差に対するゆらぎの差を二次元の直交座標にプロットする。推定部17は、その直交座標系にプロットされたマーカーの直交座標上の位置に応じて、音声品質の劣化の有無の推定や、劣化箇所の推定を行う。
【0037】
図5は、音声品質の推定対象の観測点(IF)間における平均遅延時間の差に対するゆらぎ度の差を、
図4の二次元の直交座標にプロットした一例に関するグラフである。
図5の例において、正常判定領域(実線の範囲内)にプロットされた要素を四角形のマーカーで示す。
図5の例において、劣化判定領域(実線の範囲内)にプロットされた要素を円形のマーカーで示す。
【0038】
例えば、劣化判定領域に含まれる要素Aは、遅延時間が要因となって音声品質の劣化が発生したケースである。要素Aのケースは、ゆらぎのみに着目した手法では、音声品質の劣化箇所として検出されない。例えば、劣化判定領域に含まれる要素Bは、遅延時間とゆらぎが複合要因となって音声品質の劣化が発生したケースである。要素Bのケースは、遅延時間とゆらぎを個別に着目した手法では、音声品質の劣化箇所として検出されない。本実施形態の手法によれば、遅延時間とゆらぎの関係を分類することによって、要素Aや要素Bのケースを、音声品質劣化として推定できる。
【0039】
図6は、過去に蓄積された平均遅延時間の差、ゆらぎの差、および音声品質情報を教師データとして学習させたモデル(推定モデル160)を用いて、音声品質を推定する例について説明するための概念図である。
図6の例では、同一の音声通信に関するフローデータを推定モデル160に入力することによって、音声品質情報が出力される。推定モデル160は、蓄積された過去のフローデータを用いて生成される。推定モデル160は、音声品質の推定対象の音声通信ネットワーク100に関して生成されたものであってもよいし、その他の音声通信ネットワーク100に関して生成されたものであってもよい。推定モデル160は、一般的な音声通信ネットワーク100に関して生成された汎用的なものであってもよい。また、推定モデル160は、新たなフローデータを用いて推定された結果を含めて、更新されてもよい。例えば、推定モデル160の更新は、予め設定されたタイミングや、音声品質の劣化箇所があると推定されたタイミングなどに行われればよい。
【0040】
〔ネットワーク構成例〕
次に、本実施形態の音声通信ネットワーク100の構成例について図面を参照しながら説明する。
図7は、音声通信ネットワーク100の構成例(音声通信ネットワーク100A)について説明するための概念図である。音声通信ネットワーク100Aは、複数の端末と複数の通信装置を備える。音声通信ネットワーク100Aは、ネットワーク150を介して、推定装置10に接続される。
【0041】
複数の端末は、端末110X、端末110Y、および端末110Zを含む。複数の通信装置は、複数のスイッチ131(スイッチS1、スイッチS2、スイッチS3、スイッチS4)とルータ133(ルータR1)を含む。スイッチS1、スイッチS2、スイッチS3、およびスイッチS4の各々は、パケットのサンプリング機能を有する。スイッチS1、スイッチS2、スイッチS3、およびスイッチS4の各々には、少なくとも二つのIFが設定される。スイッチS1、スイッチS2、スイッチS3、およびスイッチS4のIFは、フローデータの観測点になる。
【0042】
スイッチS1は、IF1とIF2を含む。IF1は、端末110Xに接続される。IF1は、ルータR1に接続される。スイッチS2は、IF3とIF4を含む。IF3は、ルータR1に接続される。IF4は、端末110Yに接続される。スイッチS3は、IF8とIF9を含む。IF8は、ルータR1に接続される。IF9は、端末110Zに接続される。スイッチS4は、IF5、IF6、およびIF7を含む。IF5は、ルータR1に接続される。IF6とIF7は、図示しない端末または通信装置に接続される。
【0043】
図8は、音声通信ネットワーク100Aから収集されたフローデータが格納されたテーブルの一例(フローデータテーブル120)である。フローデータテーブル120は、観測点(IF)ごとに収集された複数のフローデータが格納される。複数のフローデータの各々には、フローデータの収集元の通信装置の名称(装置名)、観測点(IF)の名称(インターフェース名)、送信元IPアドレス、宛先IPアドレス、および送信時刻が含まれる。
【0044】
図9は、推定装置10による推定結果の表示例を示す概念図である。
図9の例では、推定装置10の推定結果を表示装置170の画面に表示させる。なお、実際の画面表示においては、符号を表示させなくてよい。例えば、端末110Xと端末110Yとの音声通信において、IF2とIF3の間に音声通信の劣化があると推定されたものとする。この場合、表示装置170の画面において、音声通信の劣化要因の可能性があるIF2、IF3、およびルータR1を、他の要素とは異なる表示状態で表示させる。例えば、音声通信の劣化要因の可能性があるIF2、IF3、およびルータR1を、他の要素とは異なる色に変更して目立たせる。例えば、音声通信の劣化要因の可能性があるIF2、IF3、およびルータR1を点滅させて目立たせる。例えば、音声品質の劣化箇所があると推定された場合、図示しない音源から警告音を発するようにしてもよい。例えば、警告音に気づいた管理者は、表示装置170の画面を視認することによって、音声品質の劣化箇所を特定できる。音声品質の劣化箇所を特定できれば、その劣化箇所で発生している問題を解消することによって、音声品質を回復できる。
【0045】
(動作)
次に、本実施形態の推定装置10の動作の一例について図面を参照しながら説明する。
図10は、推定装置10の動作の一例について説明するためのフローチャートである。
図10のフローチャートに沿った説明においては、
図1~
図8に図示された構成等の名称を用いる。
【0046】
図10において、まず、推定装置10は、音声通信ネットワーク100に含まれる各通信装置130の観測点(IF)から、フローデータを収集する(ステップS11)。
【0047】
次に、推定装置10は、抽出処理を実行する(ステップS12)。抽出処理において、推定装置10は、ステップS11で収集されたフローデータから、同一の音声通信のパケットを抽出する。ステップS12の抽出処理の詳細については後述する。
【0048】
次に、推定装置10は、計算処理を実行する(ステップS13)。計算処理において、推定装置10は、ステップS12で抽出されたパケットに基づいて、隣接する通信装置間におけるゆらぎ度の差と遅延時間の差を計算する。ステップS13の処理の詳細については後述する。
【0049】
次に、推定装置10は、平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類する(ステップS14)。例えば、推定装置10は、隣接する観測点間における平均遅延時間の差とゆらぎ度の差の関係を、二次元の直交座標にプロットする。推定装置10は、その直交座標上において、隣接する観測点の組をグループ分けする。例えば、推定装置10は、過去に蓄積された、ゆらぎの差、遅延時間の差、および実際に音声品質が劣化した箇所であったか否かを示す情報(音質情報とも呼ぶ)に基づいて、隣接する観測点の組をグループ分けしてもよい。
【0050】
次に、推定装置10は、分類で外れ値となった隣接する観測点間に劣化箇所があると推定する(ステップS15)。例えば、推定装置10による推定結果は、図示しない表示装置等に出力される。
【0051】
次に、推定装置10は、ゆらぎの差、遅延時間の差、および音質情報を保存する(ステップS16)。保存されたこれらのデータは、次回以降における音声品質の劣化箇所の推定の基準データとして用いられる。
【0052】
〔抽出処理〕
次に、推定装置10による抽出処理(
図10のステップS12)について図面を参照しながら説明する。
図11は、推定装置10による抽出処理について説明するためのフローチャートである。
図11のフローチャートに沿った説明においては、推定装置10の抽出部13を動作主体として説明する。
【0053】
図11において、まず、抽出部13は、収集されたフローデータから音声データを抽出する(ステップS121)。
【0054】
次に、抽出部13は、宛先IPアドレスと送信元IPアドレスに基づいて、音声通信の経路を特定する(ステップS122)。
【0055】
次に、抽出部13は、特定された音声通信の経路に基づいて、同一の音声データから分割されたパケットを抽出する(ステップS123)。例えば、抽出部13は、フローデータテーブル120に格納されたフローデータから、送信元IPアドレス、宛先IPアドレス、および送信時刻をキーとして、キーが同じフローデータの組を抽出する。このフローデータの組は、同一の音声通信におけるフローデータの集合である。
図8のフローデータテーブル120においては、破線や一点鎖線の枠で囲ったフローデータの集合が、同じ音声通信におけるフローデータに相当する。
【0056】
〔計算処理〕
次に、推定装置10による計算処理(
図10のステップS13)について図面を参照しながら説明する。
図12は、推定装置10による計算処理について説明するためのフローチャートである。
図12のフローチャートに沿った説明においては、推定装置10の計算部14を動作主体として説明する。
【0057】
計算部14は、同じ音声通信におけるフローデータを用いて、各観測点(IF)におけるゆらぎ度を計算する(ステップS131)。
【0058】
次に、計算部14は、算出された各観測点(IF)におけるゆらぎ度を用いて、隣接する観測点(IF)間におけるゆらぎ度の差を計算する(ステップS132)。例えば、
図7において、端末110Xと端末110Yの間の音声通信に関しては、IF1とIF2、IF2とIF3、IF3とIF4が隣接する。
図7の例の場合、端末110Xと端末110Yの間の音声通信に関して、計算部14は、IF1とIF2の間、IF2とIF3の間、IF3とIF4の間におけるゆらぎ度の差を計算する。
【0059】
次に、計算部14は、同一の音声通信におけるフローデータを用いて、各観測点(IF)における遅延時間を計算する(ステップS133)。
【0060】
推定装置10は、算出された各観測点(IF)における遅延時間に基づいて、各観測点(IF)間における平均遅延時間の差を計算する(ステップS134)。ステップS131~ステップS132と、ステップS133~ステップS134の順番は、入れ替わってもよいし、同時であってもよい。
【0061】
以上のように、本実施形態の推定装置は、収集部、データ記憶部、抽出部、計算部、分類部、判定基準記憶部、および推定部を備える。収集部は、音声通信ネットワークに含まれる通信装置に設定された観測点からフローデータを収集する。データ記憶部は、収集部によって収集されたフローデータを記憶する。抽出部は、音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する。計算部は、抽出部によって抽出された複数のパケットの送信時刻と取得時刻を用いて、隣接する観測点の間におけるパケットの取得時刻のばらつき具合を示すゆらぎ度の差と平均遅延時間の差とを計算する。分類部は、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類する。判定基準記憶部は、分類部によって分類された判定基準を記憶する。推定部は、分類部による分類に基づいて、隣接する観測点の間における音声品質を推定する。
【0062】
本実施形態の推定装置は、音声通信ネットワークに含まれる観測点から収集されるフローデータに基づいて、観測点間における音声品質を分類する。言い換えると、本実施形態の推定装置は、フローデータを用いて算出されるゆらぎと平均遅延時間に基づいて、音声品質の劣化箇所の推定を行う。そのため、本実施形態によれば、分類された観測点間における音声品質に応じて、音声通信ネットワークにおける音声品質劣化箇所を精度よく推定できる。
【0063】
本実施形態の一態様において、計算部は、抽出部によって抽出されたパケットの送信時刻と取得時刻を用いて、ゆらぎ度と遅延時間を観測点ごとに計算する。計算部は、観測点ごとに算出されたゆらぎ度と遅延時間とを用いて、隣接する観測点の間におけるゆらぎ度の差と平均遅延時間の差を計算する。例えば、計算部は、同一の音声データから分割された複数のパケットの各々の遅延時間と、同一の音声データから分割された複数のパケットの平均遅延時間との差分をゆらぎ度として計算する。本態様によれば、観測点ごとのフローデータから抽出されるパケットに基づいてゆらぎ度や平均遅延時間を計算し、算出されたゆらぎ度や平均遅延時間に基づいて音声品質を推定できる。
【0064】
本実施形態の一態様において、分類部は、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差との関係に応じて、平均遅延時間の差とゆらぎ度の差を二軸とする直交座標に、複数の観測点の組の点をプロットする。分類部は、直交座標における複数の観測点の組の点の位置に応じて、観測点の間における音声品質を分類する。本態様によれば、蓄積されたデータに基づいて、音声品質の劣化箇所を推定するための判定基準を決定できる。例えば、推定部は、直交座標における観測点の組の点の位置に応じて、観測点の間における音声品質を推定する。
【0065】
本実施形態の一態様において、分類部は、ゆらぎ度の差、平均遅延時間の差、および音声品質が劣化しているか否かを示す音声品質情報を教師データとして学習し、音声品質の劣化箇所を推定する推定モデルを生成する。本態様によれば、蓄積されたデータに基づいて、音声品質の劣化箇所を推定するための判定基準を決定できる。例えば、推定部は、少なくとも一つの観測点におけるパケットの送信時刻と取得時刻を推定モデルに入力し、推定モデルからの出力に応じて、観測点の間における音声品質を推定する。
【0066】
本実施形態の一態様において、推定部は、音声通信ネットワークにおける音声品質に関する情報を表示装置に出力する。本態様によれば、推定部から出力された情報が表示された表示装置の画面を視認することによって、音声通信ネットワークにおける音声品質を認識できる。
【0067】
本実施形態の手法では、音声通信経路上に配置された複数の通信装置のインターフェースを観測点として、ネットワークフロー情報を収集する。ネットワークを介した音声通信を行うシステムにおいては、例えばsFlowやNetFlow等のサンプリング情報を用いて、ゆらぎ度や遅延時間を計算できる。本実施形態の手法では、隣接する観測点間でのゆらぎ度の差と遅延時間の差に基づいて、音声品質が劣化した箇所を推定する。具体的には、本実施形態の手法では、観測点間に関して算出されたゆらぎの差と遅延時間の差を変数として類似箇所をグループ分けすることによって、音声品質が劣化した箇所を特定する。
【0068】
音声通信ネットワークにおける音声品質劣化は、ネットワーク機器やケーブルの老朽化、故障、およびキャパシティオーバー等の要因によって発生する。音声通信サービスの維持/改善のためには、それらの要因を早期に発見し、リプレース等の対処を行うことが重要である。本実施形態の手法によれば、音声品質劣化箇所を精度よく推定することによって、音声通信サービスの維持/改善を実現できる。
【0069】
(第2の実施形態)
次に、第2の実施形態に係る推定装置について図面を参照しながら説明する。本実施形態の推定装置は、第1の実施形態の推定装置を簡略化した構成である。
【0070】
図13は、本実施形態の推定装置20の構成の一例を示すブロック図である。推定装置20は、抽出部23、計算部24、分類部25、および推定部27を備える。
【0071】
抽出部23は、音声通信ネットワークに含まれる通信装置に設定された観測点から収集されるフローデータから、同一の音声データから分割された複数のパケットを抽出する。計算部24は、抽出部23によって抽出された複数のパケットの送信時刻と取得時刻を用いて、隣接する観測点の間におけるパケットの取得時刻のばらつき具合を示すゆらぎ度の差と平均遅延時間の差とを計算する。分類部25は、隣接する観測点の間における平均遅延時間の差とゆらぎ度の差の関係に基づいて、隣接する観測点の組を分類する。推定部27は、分類部25による分類に基づいて、隣接する観測点の間における音声品質を推定する。
【0072】
以上のように、本実施形態の推定装置は、音声通信ネットワークに含まれる観測点から収集されるフローデータに基づいて、隣接する観測点の間における音声品質を分類する。そのため、本実施形態の推定装置によれば、分類された観測点間における音声品質に応じて、音声通信ネットワークにおける音声品質劣化箇所を精度よく推定できる。
【0073】
(ハードウェア)
ここで、本開示の各実施形態に係る推定装置の処理を実行するハードウェア構成について、
図14の情報処理装置90を一例として挙げて説明する。なお、
図14の情報処理装置90は、各実施形態の推定装置の処理を実行するための構成例であって、本開示の範囲を限定するものではない。
【0074】
図14のように、情報処理装置90は、プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95、および通信インターフェース96を備える。
図14においては、インターフェースをI/F(Interface)と略記する。プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95、および通信インターフェース96は、バス98を介して、互いにデータ通信可能に接続される。また、プロセッサ91、主記憶装置92、補助記憶装置93、および入出力インターフェース95は、通信インターフェース96を介して、インターネットやイントラネットなどのネットワークに接続される。
【0075】
プロセッサ91は、補助記憶装置93等に格納されたプログラムを、主記憶装置92に展開する。プロセッサ91は、主記憶装置92に展開されたプログラムを実行する。本実施形態においては、情報処理装置90にインストールされたソフトウェアプログラムを用いる構成とすればよい。プロセッサ91は、本実施形態に係る推定装置による処理を実行する。
【0076】
主記憶装置92は、プログラムが展開される領域を有する。主記憶装置92には、プロセッサ91によって、補助記憶装置93等に格納されたプログラムが展開される。主記憶装置92は、例えばDRAM(Dynamic Random Access Memory)などの揮発性メモリによって実現される。また、主記憶装置92として、MRAM(Magnetoresistive Random Access Memory)などの不揮発性メモリが構成/追加されてもよい。
【0077】
補助記憶装置93は、プログラムなどの種々のデータを記憶する。補助記憶装置93は、ハードディスクやフラッシュメモリなどのローカルディスクによって実現される。なお、種々のデータを主記憶装置92に記憶させる構成とし、補助記憶装置93を省略することも可能である。
【0078】
入出力インターフェース95は、規格や仕様に基づいて、情報処理装置90と周辺機器とを接続するためのインターフェースである。通信インターフェース96は、規格や仕様に基づいて、インターネットやイントラネットなどのネットワークを通じて、外部のシステムや装置に接続するためのインターフェースである。入出力インターフェース95および通信インターフェース96は、外部機器と接続するインターフェースとして共通化してもよい。
【0079】
情報処理装置90には、必要に応じて、キーボードやマウス、タッチパネルなどの入力機器が接続されてもよい。それらの入力機器は、情報や設定の入力に使用される。なお、タッチパネルを入力機器として用いる場合は、表示機器の表示画面が入力機器のインターフェースを兼ねる構成としてもよい。プロセッサ91と入力機器との間のデータ通信は、入出力インターフェース95に仲介させればよい。
【0080】
また、情報処理装置90には、情報を表示するための表示機器を備え付けてもよい。表示機器を備え付ける場合、情報処理装置90には、表示機器の表示を制御するための表示制御装置(図示しない)が備えられていることが好ましい。表示機器は、入出力インターフェース95を介して情報処理装置90に接続すればよい。
【0081】
また、情報処理装置90には、ドライブ装置が備え付けられてもよい。ドライブ装置は、プロセッサ91と記録媒体(プログラム記録媒体)との間で、記録媒体からのデータやプログラムの読み込み、情報処理装置90の処理結果の記録媒体への書き込みなどを仲介する。ドライブ装置は、入出力インターフェース95を介して情報処理装置90に接続すればよい。
【0082】
以上が、本発明の各実施形態に係る推定装置を可能とするためのハードウェア構成の一例である。なお、
図14のハードウェア構成は、各実施形態に係る推定装置の演算処理を実行するためのハードウェア構成の一例であって、本発明の範囲を限定するものではない。また、各実施形態に係る推定装置に関する処理をコンピュータに実行させるプログラムも本発明の範囲に含まれる。さらに、各実施形態に係るプログラムを記録したプログラム記録媒体も本発明の範囲に含まれる。記録媒体は、例えば、CD(Compact Disc)やDVD(Digital Versatile Disc)などの光学記録媒体で実現できる。記録媒体は、USB(Universal Serial Bus)メモリやSD(Secure Digital)カードなどの半導体記録媒体によって実現されてもよい。また、記録媒体は、フレキシブルディスクなどの磁気記録媒体、その他の記録媒体によって実現されてもよい。プロセッサが実行するプログラムが記録媒体に記録されている場合、その記録媒体はプログラム記録媒体に相当する。
【0083】
各実施形態の推定装置の構成要素は、任意に組み合わせてもよい。また、各実施形態の推定装置の構成要素は、ソフトウェアによって実現されてもよいし、回路によって実現されてもよい。
【0084】
以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0085】
10、20 推定装置
11 収集部
12 データ記憶部
13、23 抽出部
14、24 計算部
15、25 分類部
16 判定基準記憶部
17 推定部
100 音声通信ネットワーク
110 端末
130 通信装置