(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0015】
まず、本発明の実施形態に係る音質評価装置の概略について説明する。音質評価装置は、評価対象となる被評価音声信号と、被評価音声信号を評価するための基準音声信号とを入力し、両者を比較することにより、被評価音声信号の音質を示す音質評価指標を出力する。音質評価指標は、被評価音声信号の音質を正確に評価可能な指標であればその種類は問われない。基準音声信号は、被評価音声信号と同じ内容の音声であり、且つ被評価音声信号よりも品質の良い音声信号とする。例えば、被評価音声信号をAM又はFMの放送電波を受信し復調したラジオ放送の音声信号とし、基準音声信号をインターネットで受信した、被評価音声信号と同内容をサイマル配信しているインターネットラジオの音声とする。
【0016】
図1は、本発明の実施形態に係る音質評価装置の概略の構成例を示すブロック図である。
図1に示すように、音質評価装置1は、遅延制御部11と、音質評価部12とを備える。
【0017】
遅延制御部11は、被評価音声信号を遅延させ、基準音声信号と同期した被評価音声信号(以下、「同期被評価音声信号」という。)を音質評価部12に出力する。例えば、被評価音声信号がラジオ放送の音声信号であり、基準音声信号が該ラジオ放送をサイマル配信するインターネットラジオの音声信号をバッファに溜めた後に出力する信号である場合、被評価音声信号を基準音声信号と同期するように遅延させる。
【0018】
音質評価部12は、同期被評価音声信号と基準音声信号とを入力し、両者を比較することにより、被評価音声信号の音質を示す音質評価指標を生成し、外部に出力する。音質評価部12の具体例については、以下の実施形態で説明する。
【0019】
(第1の実施形態)
つぎに、本発明の第1の実施形態に係る音質評価装置について説明する。
図2は、本発明の第1の実施形態に係る音質評価装置1における音質評価部12の構成例を示すブロック図である。
図2に示す例では、音質評価部12は、ノイズ付加部121と、ノイズ量調整部122とを備える。
【0020】
ノイズ付加部121は、基準音声信号に対してノイズを付加する。
【0021】
ノイズ量調整部122は、ノイズ付加部121が付加するノイズ量を調整する。ノイズ量は基準音声信号が同期被評価音声信号に近づくように調整される。この調整は測定者が基準音声信号及び同期被評価音声信号を聴きながら手動により調整してもよいし、基準音声信号及び同期被評価音声信号の差が閾値以下、又は相関度が閾値以上となるように演算により自動調整してもよい。
【0022】
ノイズ量調整部122は、基準音声信号に対して付加したノイズの大きさを示す値を音質評価指標として外部に出力する。ここで、ノイズの大きさを示す値とは、付加したノイズのレベルの値そのものであってもよいし、付加したノイズに基づいて複数段階で示される評価値であってもよい。ノイズ量調整部122は、評価値を出力する場合、例えば付加したノイズの大きさに応じて、表1に示すように7段階で評価値を決定する。ノイズ量が小さいほど良い評価値となる。
【0023】
つぎに、本発明の第1の実施形態に係る音質評価装置1における音質評価方法について説明する。
図3は、本発明の第1の実施形態に係る音質評価装置1における音質評価方法を示すフローチャートである。
【0024】
ステップS101では、被評価音声信号を基準音声信号に同期させる。例えば、遅延制御部11によりこの処理を行う。
【0025】
ステップS102では、基準音声信号にノイズを付加する。例えば、ノイズ付加部121によりこの処理を行う。
【0026】
ステップS103では、付加するノイズ量を調整する。例えば、ノイズ量調整部122によりこの処理を行う。
【0027】
ステップS104では、ステップS103で付加したノイズの大きさを示す値を出力する。例えば、ノイズ量調整部122によりこの処理を行う。
【0028】
上述したように、第1の実施形態では、基準音声信号に対して同期被評価音声信号に近づけるようにノイズを付加し、該ノイズの大きさを示す値を音質評価指標として出力する。そのため、被評価音声信号の音質評価を正確に行うことが可能となる。
【0029】
(第2の実施形態)
つぎに、本発明の第2の実施形態に係る音質評価装置について説明する。第1の実施形態と比較して、音質評価装置1における音質評価部12の構成が相違する。
図4は、第2の実施形態に係る音質評価装置1における音質評価部12の構成例を示すブロック図である。
図4に示す例では、音質評価部12は、無音判定部123と、レベル測定部124とを備える。
【0030】
無音判定部123は、基準音声信号の信号レベルを測定し、基準音声信号のレベルが閾値を超える場合には無音でないと判定し、基準音声信号のレベルが閾値以下となった場合には無音であると判定する。そして、判定結果を示す信号、すなわち、無音であるか否かを示す信号をレベル測定部124に出力する。
【0031】
レベル測定部124は、無音判定部123から判定結果を示す信号を受け取り、無音であることを示している場合に、同期被評価音声信号のレベル(すなわち、ノイズレベル)を測定し、記憶する。そして、測定したレベルの大きさを示す値を音質評価指標として外部に出力する。ここで、レベルの大きさを示す値とは、測定したレベルの平均値、最小値、最大値などであってもよいし、測定したレベルに基づいて複数段階で示される評価値であってもよい。ノイズ量調整部122は、評価値を出力する場合、例えば測定したレベルの大きさに応じて、表1に示すように7段階で評価値を決定する。レベルが小さいほど良い評価値となる。
【0032】
また、レベル測定部124は同期被評価音声信号のレベルを測定する際に、同期被評価音声信号で使用されている音声の周波数帯域(音声帯域)以外の周波数帯域、すなわち使用されていない音声帯域のレベルを測定するようにしてもよい。例えば、被評価音声信号がAM放送電波を受信し復調したラジオ放送の音声信号である場合には、AM放送で使用される音声帯域は100Hz〜7.5kHzであるので、被評価音声信号のうち例えば8〜11kHzの周波数帯域の信号のみ抽出して測定してもよい。また、被評価音声信号がFM放送電波を受信し復調したラジオ放送の音声信号である場合には、FM放送で使用される音声帯域は50Hz〜15kHzであるので、被評価音声信号のうち例えば16〜18kHzの周波数帯域の信号のみ抽出して測定してもよい。使用されている音声帯域以外の周波数帯域のレベルを測定することにより、測定精度を安定化させることができる。
【0033】
図5は、本実施形態の音質評価部12の処理を説明する図である。基準音声信号と同期被評価音声信号とは、遅延制御部11により同期がとられているため、基準音声信号が無音となったとき同期被評価音声信号も無音となる。ただし、完全に同期をとるのは困難であるため、基準音声信号の所定時間(例えば、0.7秒)以上の無音区間のうち、冒頭と末尾の所定の時間(例えば、0.1秒)を除いた区間を同期被評価音声信号の無音区間とし、レベル測定部124はこの無音区間の同期被評価音声信号のレベルを測定するのが好適である。
【0034】
また、レベル測定部124は、無音区間の同期被評価音声信号のレベルの最大値と、平均値又は最小値との差が閾値を超える場合には、
図5に示すように同期被評価音声信号に混信波が重畳されているものと判定することができる。レベル測定部124は、混信波が重畳されていると判定した場合には、特定の処理を行う。例えば、混信波が重畳されていることを示す信号を出力してもよいし、測定したレベルの大きさを示す値を出力しないようにしてもよい。
【0035】
つぎに、本発明の第2の実施形態に係る音質評価装置1における音質評価方法について説明する。
図6は、本発明の第2の実施形態に係る音質評価装置1における音質評価方法を示すフローチャートである。
【0036】
ステップS201では、被評価音声信号を基準音声信号に同期させる。例えば、遅延制御部11によりこの処理を行う。
【0037】
ステップS202では、基準音声信号の無音区間を判定する。例えば、無音判定部123によりこの処理を行う。
【0038】
ステップS203では、同期被評価音声信号の無音区間のレベルを測定する。例えば、レベル測定部124によりこの処理を行う。
【0039】
ステップS204では、ステップS203で測定したレベルの大きさを示す値を出力する。例えば、レベル測定部124によりこの処理を行う。
【0040】
上述したように、第2の実施形態では、基準音声信号のレベルが閾値以下となった場合に、同期被評価音声信号のレベルを測定し、該レベルの大きさを示す値を音質評価指標として出力する。これは、音質が劣化した音声信号は無音時のノイズレベルが上昇する傾向に着目したものである。したがって、無音時の同期被評価音声信号のレベルを測定することで、被評価音声信号の音質評価を正確に行うことが可能となる。
【0041】
(第3の実施形態)
つぎに、本発明の第3の実施形態に係る音質評価装置について説明する。第1の実施形態と比較して、音質評価装置1における音質評価部12の構成が相違する。
図7は、第3の実施形態に係る音質評価装置1における音質評価部12の構成例を示すブロック図である。
図7に示す例では、音質評価部12は、フーリエ変換処理部125−1及び125−2と、相関係数算出部126とを備える。
【0042】
フーリエ変換処理部125−1は、基準音声信号について、所定の時間間隔で複数回フーリエ変換を行い、周波数成分ごとのレベルを複数回分、相関係数算出部126に出力する。
【0043】
フーリエ変換処理部125−2は、同期被評価音声信号について、所定の時間間隔で複数回フーリエ変換を行い、周波数成分ごとのレベルを複数回分、相関係数算出部126に出力する。
【0044】
相関係数算出部126は、フーリエ変換処理部125−1から入力されるレベルについて周波数成分ごとに平均値x
iを算出し、フーリエ変換処理部125−2から入力されるレベルについて周波数成分ごとに平均値y
iを算出し、平均値x
iと平均値y
iの相関係数rを求める。相関係数rはx
iとy
iとの関連性の強さを表すものであり、式(1)により算出され、−1≦r≦1の値をとる。
【0046】
そして相関係数算出部126は、算出した相関係数rの大きさを示す値を音質評価指標として外部に出力する。ここで、相関係数rの大きさを示す値とは、相関係数rの値そのものであってもよいし、相関係数rに基づいて複数段階で示される評価値であってもよい。相関係数算出部126は、評価値を出力する場合、例えば相関係数rの大きさに応じて表1に示すように7段階で評価値を決定する。相関係数rが大きいほど良い評価値となる。
【0047】
図8は、本実施形態の音質評価部12の処理を説明する図である。
図8に示す例では、基準音声信号及び同期被評価音声信号のそれぞれについて、0.1秒ごとに0〜60秒までの間フーリエ変換処理を行い、100Hz単位で周波数成分を算出している。そして、100Hz単位で基準音声信号及び同期被評価音声信号の平均値を算出している。
【0048】
図9は、各周波数成分の平均値をグラフ化した例を示す図であり、基準音声信号と、4種類の同期被評価音声信号の各周波数成分の平均値を示している。この例では、基準音声信号の時報音からの相対レベル差を示している。4種類の同期被評価音声信号の各周波数成分の平均値と基準音声信号の各周波数成分の平均値との相関係数は、それぞれ0.978,0.974,0.962,0.955である。また、相関係数に基づき表1に示す7段階の評価値を決定しており、相関係数の高い準に評価値を4,3+,3−,2としている。
【0049】
つぎに、本発明の第3の実施形態に係る音質評価装置の変形例について説明する。
図10は、第3の実施形態に係る音質評価装置の変形例を示すブロック図である。
図10に示す例では、音質評価部12は、
図7で示した構成に対してさらに無音周波数レベル測定部127を備える。
【0050】
FMラジオでは使用される音声帯域が50Hz〜15kHzであるため、該帯域以外の周波数成分のレベルはノイズ成分である。ノイズ成分のみを比較することによっても、精度の高い音質評価ができると考えられる。
【0051】
そのため、無音周波数レベル測定部127は、フーリエ変換処理部125−2から入力される同期被評価音声信号の周波数成分ごとのレベルのうち、同期被評価音声信号に含まれる音声帯域以外の周波数成分(無音周波数成分)のレベルの大きさを示す値を音質評価指標として外部に出力する。ここで、レベルの大きさを示す値とは、測定したレベルの平均値、最小値、最大値などであってもよいし、測定したレベルに基づいて複数段階で示される評価値であってもよい。無音周波数レベル測定部127は、評価値を出力する場合、例えば測定したレベルの大きさに応じて7段階で評価値を決定する。レベルが小さいほど良い評価値となる。
【0052】
なお、FMラジオではステレオ放送では、
図9に示すように19kHzにパイロット信号が付加されることがある。この場合には、無音周波数レベル測定部127は、19kHzを除き、例えば16kHzから18kHzの周波数成分においてレベルを測定する。なお、音質評価部12は、相関係数算出部126により求まる値と無音周波数レベル測定部127により求まる値のうち、いずれか一方のみ出力するか双方を出力するかをあらかじめ選択可能としてもよい。
【0053】
つぎに、本発明の第3の実施形態に係る音質評価装置1における音質評価方法について説明する。
図11は、本発明の第3の実施形態に係る音質評価装置1における音質評価方法を示すフローチャートである。
【0054】
ステップS301では、被評価音声信号を基準音声信号に同期させる。例えば、遅延制御部11によりこの処理を行う。
【0055】
ステップS302では、基準音声信号及び同期被評価音声信号をフーリエ変換する。例えば、フーリエ変換処理部125−1及び125−2によりこの処理を行う。
【0056】
ステップS303では、基準音声信号及び同期被評価音声信号の各周波数成分のレベルの平均値を算出する。例えば、フーリエ変換処理部125−1及び125−2、又は相関係数算出部126によりこの処理を行う。
【0057】
ステップS304では、各周波数成分の平均値の相関係数を算出する。例えば、相関係数算出部126によりこの処理を行う。
【0058】
ステップS305では、ステップS304で算出した相関係数の大きさを示す値を出力する。例えば、相関係数算出部126によりこの処理を行う。
【0059】
さらに、ステップS306を設け、同期被評価音声信号の無音周波数成分のレベルを測定するようにしてもよい。例えば、無音周波数レベル測定部127によりこの処理を行う。
【0060】
ステップS307では、ステップS306で測定した無音周波数成分のレベルの大きさを示す値を出力する。例えば、無音周波数レベル測定部127によりこの処理を行う。
【0061】
上述したように、第3の実施形態では、基準音声信号をフーリエ変換して得られる周波数成分と、同期被評価音声信号をフーリエ変換して得られる周波数成分との相関係数を求め、該相関係数の大きさを示す値を音質評価指標として出力する。そのため、基準音声信号との類似度に基づき、正確に音声評価を行うことが可能となる。
【0062】
また、第3の実施形態の変形例では、同期被評価音声信号をフーリエ変換して得られる周波数成分のうち、使用されていない音声帯域のレベルの大きさを示す値を音質評価指標として出力する。そのため、同期被評価音声信号の無音周波数成分に基づき、被評価音声信号の音質評価を正確に行うことが可能となる。
【0063】
(第4の実施形態)
つぎに、本発明の第4の実施形態に係る音質評価装置について説明する。第1の実施形態と比較して、音質評価装置1における音質評価部12の構成が相違する。
図12は、第4の実施形態に係る音質評価装置1における音質評価部12の構成例を示すブロック図である。
図12に示す例では、音質評価部12は、レベル測定部128−1及び128−2と、相関係数算出部129とを備える。
【0064】
レベル測定部128−1は、基準音声信号について、所定の時間間隔で複数回レベルを測定し、複数回分のレベルを相関係数算出部129に出力する。
【0065】
レベル測定部128−2は、同期被評価音声信号について、所定の時間間隔で複数回レベルを測定し、複数回分のレベルを相関係数算出部129に出力する。
【0066】
相関係数算出部129は、レベル測定部128−1から入力されるレベル及びレベル測定部128−2から入力されるレベルの一方を時間方向に移動させながら(時間軸上でずらしながら)、両者の相関係数を複数算出する。レベル測定部128−1から入力されるレベルx
iとレベル測定部128−2から入力されるレベルy
iの相関係数は、上記の式(1)で表される。
【0067】
そして相関係数算出部129は、算出した複数の相関係数のうち最大となる相関係数rの大きさを示す値を音質評価指標として外部に出力する。ここで、相関係数rの大きさを示す値とは、相関係数rの値そのものであってもよいし、相関係数rに基づいて複数段階で示される評価値であってもよい。相関係数算出部129は、評価値を出力する場合、例えば相関係数rの大きさに応じて表1に示すように7段階で評価値を決定する。相関係数rが大きいほど良い評価値となる。
【0068】
図13は、本実施形態の音質評価部12の処理を説明する図である。
図13に示す例では、基準音声信号及び同期被評価音声信号のそれぞれについて、0.01秒ごとに0〜60秒までの間レベル測定を行い(
図13(a))、測定したレベルを0.01秒ずつずらしている(
図13(b))。そして、ずらすごとに相関係数を算出する。+0.1秒から−0.1秒の間で0.01秒間隔でずらすと、21個の相関係数が求まる(
図13(c))。最後に、21個の相関係数の中で最大となる相関係数を採用する。例えば、
図13(c)に示すように遅延時間が−0.09秒のときに相関係数が0.9で最大であった場合には、音質評価指標を相関係数r=0.9に基づく値とする。
【0069】
つぎに、本発明の第4の実施形態に係る音質評価装置1における音質評価方法について説明する。
図14は、本発明の第4の実施形態に係る音質評価装置1における音質評価方法を示すフローチャートである。
【0070】
ステップS401では、被評価音声信号を基準音声信号に同期させる。例えば、遅延制御部11によりこの処理を行う。
【0071】
ステップS402では、基準音声信号及び同期被評価音声信号のレベルを測定する。例えば、レベル測定部128−1及び128−2によりこの処理を行う。
【0072】
ステップS403では、測定した基準音声信号及び同期被評価音声信号のレベルの一方を時間方向に移動させる。すなわち、一方の測定時刻を遅延させる。例えば、レベル測定部128−1及び128−2、又は相関係数算出部129によりこの処理を行う。
【0073】
ステップS404では、ステップS403で移動させるごとに基準音声信号及び同期被評価音声信号のレベルの相関係数を算出し、そのうちの最大となる相関係数を採用する。例えば、相関係数算出部129によりこの処理を行う。
【0074】
ステップS405では、ステップS404で採用した相関係数の大きさを示す値を出力する。例えば、相関係数算出部129によりこの処理を行う。
【0075】
上述したように、第4の実施形態では、前記基準音声信号のレベル及び前記同期被評価音声信号のレベルを測定し、一方を時間方向に移動させながら相関係数を求め、最大となる相関係数の大きさを示す値を前記音質評価指標として出力する。そのため、瞬時値のレベルを計算して比較することができ、正確に音声評価を行うことが可能となる。
【0076】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックやステップを1つに組み合わせたり、あるいは1つの構成ブロックやステップを分割したりすることが可能である。