IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特開2024-86794信号処理方法、信号処理装置、及びプログラム
<>
  • 特開-信号処理方法、信号処理装置、及びプログラム 図1
  • 特開-信号処理方法、信号処理装置、及びプログラム 図2
  • 特開-信号処理方法、信号処理装置、及びプログラム 図3
  • 特開-信号処理方法、信号処理装置、及びプログラム 図4
  • 特開-信号処理方法、信号処理装置、及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024086794
(43)【公開日】2024-06-28
(54)【発明の名称】信号処理方法、信号処理装置、及びプログラム
(51)【国際特許分類】
   G10K 15/02 20060101AFI20240621BHJP
【FI】
G10K15/02
【審査請求】有
【請求項の数】21
【出願形態】OL
(21)【出願番号】P 2024061057
(22)【出願日】2024-04-04
(62)【分割の表示】P 2022522496の分割
【原出願日】2020-06-12
(31)【優先権主張番号】63/022,591
(32)【優先日】2020-05-11
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】100161207
【弁理士】
【氏名又は名称】西澤 和純
(74)【代理人】
【識別番号】100134359
【弁理士】
【氏名又は名称】勝俣 智夫
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100206391
【弁理士】
【氏名又は名称】柏野 由布子
(72)【発明者】
【氏名】前澤 陽
(57)【要約】
【課題】一般に普及している通話アプリを利用して、高品質な音を伝送する。
【解決手段】同一の音源が収音された第1音響信号、及び第2音響信号の信号処理方法であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理方法であって、第1受信部が、第1伝送路を経由して伝送される前記第1音響信号を受信し、第2受信部が、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信し、遅延量算出部が、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出し、遅延量付加部が、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、信号処理方法である。
【選択図】図1
【特許請求の範囲】
【請求項1】
同一の音源が収音された第1音響信号、及び第2音響信号の信号処理方法であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理方法であって、
第1受信部が、第1伝送路を経由して伝送される前記第1音響信号を受信し、
第2受信部が、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信し、
遅延量算出部が、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出し、
遅延量付加部が、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
信号処理方法。
【請求項2】
同一の音源が収音された第1音響信号、及び第2音響信号の信号処理方法であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理方法であって、
第1受信部が、第1伝送路を経由して伝送される前記第1音響信号を受信し、
第2受信部が、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して、映像信号と共に伝送される前記第2音響信号を受信し、
遅延量算出部が、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出し、
遅延量付加部が、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
信号処理方法。
【請求項3】
前記遅延量算出部が、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部が、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項1または請求項2に記載の信号処理方法。
【請求項4】
前記遅延量算出部が、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部が、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量が第1閾値以上であるか否かを判定し、今回算出された前記伝送遅延量が前記第1閾値以上である場合、今回算出された前記伝送遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項1または請求項2に記載の信号処理方法。
【請求項5】
前記遅延量算出部が、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部が、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量が第1閾値以上であるか否かを判定し、今回算出された前記伝送遅延量が前記第1閾値以上でない場合、所定の遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項1または請求項2、請求項4のいずれか一項に記載の信号処理方法。
【請求項6】
前記第1閾値は、所定の算出タイミングが到来する度に算出された前記伝送遅延量の平均である、
請求項4又は請求項5に記載の信号処理方法。
【請求項7】
前記遅延量算出部が、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部が、前記伝送遅延量が算出される度に、前回算出された前記伝送遅延量と今回算出された前記伝送遅延量とに基づいて、段階的に前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項1、請求項2、請求項4、又は請求項5のいずれか一項に記載の信号処理方法。
【請求項8】
前記遅延量算出部が、所定の時間区間に受信された、前記第1音響信号の時系列変化と前記第2音響信号の時系列変化との相互相関値が最大となる遅延量を算出し、当該算出した遅延量が第2閾値以上である場合、当該算出した遅延量を前記伝送遅延量とする、
請求項1から請求項6のいずれか一項に記載の信号処理方法。
【請求項9】
前記遅延量算出部が、所定の時間区間に受信された前記第1音響信号の最大レベルが前記第2閾値未満であり、前記第2音響信号の最大レベルが前記第2閾値以上の場合、前記伝送遅延量を算出しない、
請求項8に記載の信号処理方法。
【請求項10】
前記遅延量算出部は、所定の時間区間に受信された前記第1音響信号の最大レベルが前記第2閾値以上であり、前記第2音響信号の最大レベルが前記第2閾値未満の場合、前記伝送遅延量を算出しない、
請求項8に記載の信号処理方法。
【請求項11】
同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であって、
第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信部と、
伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信する第2受信部と、
前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出部と、
前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加部と、
を備える信号処理装置。
【請求項12】
同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であって、
第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信部と、
伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して、映像と共に伝送される前記第2音響信号を受信する第2受信部と、
前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出部と、
前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加部と、
を備える信号処理装置。
【請求項13】
前記遅延量算出部は、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部は、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項11または請求項12に記載の信号処理装置。
【請求項14】
前記遅延量算出部は、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部は、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量が第1閾値以上であるか否かを判定し、今回算出された前記伝送遅延量が前記第1閾値以上である場合、今回算出された前記伝送遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項11または請求項12に記載の信号処理装置。
【請求項15】
前記遅延量算出部は、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部は、前記伝送遅延量が算出される度に、今回算出された前記伝送遅延量が第1閾値以上であるか否かを判定し、今回算出された前記伝送遅延量が前記第1閾値以上でない場合、所定の遅延量により前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項11、請求項12、請求項14のいずれか一項に記載の信号処理装置。
【請求項16】
前記第1閾値は、所定の算出タイミングが到来する度に算出された前記伝送遅延量の平均である、
請求項14又は請求項15に記載の信号処理装置。
【請求項17】
前記遅延量算出部は、所定の算出タイミングが到来する度に、前記伝送遅延量を算出し、
前記遅延量付加部は、前記伝送遅延量が算出される度に、前回算出された前記伝送遅延量と今回算出された前記伝送遅延量とに基づいて、段階的に前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、
請求項11、請求項12、請求項14、又は請求項15のいずれか一項に記載の信号処理装置。
【請求項18】
前記遅延量算出部は、所定の時間区間に受信された、前記第1音響信号の時系列変化と前記第2音響信号の時系列変化との相互相関値が最大となる遅延量を算出し、当該算出した遅延量が第2閾値以上である場合、当該算出した遅延量を前記伝送遅延量とする、
請求項11から請求項16のいずれか一項に記載の信号処理装置。
【請求項19】
前記遅延量算出部は、所定の時間区間に受信された前記第1音響信号の最大レベルが前記第2閾値未満であり、前記第2音響信号の最大レベルが前記第2閾値以上の場合、前記伝送遅延量を算出しない、
請求項18に記載の信号処理装置。
【請求項20】
前記遅延量算出部は、所定の時間区間に受信された前記第1音響信号の最大レベルが前記第2閾値以上であり、前記第2音響信号の最大レベルが前記第2閾値未満の場合、前記伝送遅延量を算出しない、
請求項18に記載の信号処理装置。
【請求項21】
同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であるコンピュータに、
第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信ステップ、
伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信する第2受信ステップ、
前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出ステップ、
前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加ステップ、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号処理方法、信号処理装置、及びプログラムに関する。
本願は、2020年5月11日に、米国に出願された63/022,591号に基づき優先権を主張し、その内容をここに援用する。
【背景技術】
【0002】
遠隔地間をネットワークで接続して、オンライン音楽レッスンや遠隔会議を行ないたいという要求がある。スカイプ(登録商標)など、オンライン通話サービスを提供する、既存のアプリケーションプログラム(以下、通話アプリという)を利用して、映像と音とを連動させることにより、オンライン音楽レッスン等を行うことが考えられる。
【0003】
オンライン音楽レッスンなど、音を主体とするコミュニケーションを行う場合においては、遅延を抑えつつ、特に高品質な音の伝送が求められる。一方、映像については、音と映像とが同期していればよく、それほど高度な画質は求められない。例えば、特許文献1には、遅延を抑えつつ音楽セッションの参加人数を拡張する技術が開示されている。特許文献2には、高品質かつリアルタイムにオンライン演奏を実現する技術が開示されている。特許文献3には、複数の画像を同期させる技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015-138040号公報
【特許文献2】米国特許第10182093号明細書
【特許文献3】特開2008-193561号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、既存の通話アプリの内部仕様は一般には開示されておらず、ブラックボックス化されている。このため、既存の通話アプリに、特許文献1-3に開示されている技術を適用しようとしても一般的には困難である。
【0006】
市場にはすでに複数の通話アプリが存在していることから、音楽レッスンに適したアプリを選択することも考えられる。スカイプ(登録商標)などの汎用の通話アプリが広く普及しており、大抵の人がこのような汎用の通話アプリの操作に慣れているため導入がスムーズである。しかし、このような汎用の通話アプリでは、音や画像の伝送状態が帯域の状況によって変動し、必ずしも高品質な音が伝送されるものではない。これに対し、伝送遅延を極力抑えながら、互いの演奏を高品質な音で伝送することが可能な、音響専用のセッションアプリが存在する。しかし、音響伝送に特化されており一般の通話に用いられることが少ないため、一般の人がアプリの操作に慣れておらず、導入が困難である。また、音響のみで映像がないためレッスンには不向きである。
【0007】
すなわち、既存の通話アプリやセッションアプリには、これから音楽を始めようとする初心者にとって導入が容易で、かつ高品質な音を伝送できるものがない。このため、オンライン音楽レッスンに利用し難いという問題があった。
【0008】
本発明は、このような事情に鑑みてなされたものである。その目的は、一般に普及している通話アプリを利用して、高品質な音を伝送することができる信号処理方法、信号処理装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0009】
上述した課題を解決するために、本発明の信号処理方法は、同一の音源が収音された第1音響信号、及び第2音響信号の信号処理方法であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理方法であって、第1受信部が、第1伝送路を経由して伝送される前記第1音響信号を受信し、第2受信部が、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信し、遅延量算出部が、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出し、遅延量付加部が、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、信号処理方法である。
また、本発明の信号処理方法は、同一の音源が収音された第1音響信号、及び第2音響信号の信号処理方法であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理方法であって、第1受信部が、第1伝送路を経由して伝送される前記第1音響信号を受信し、第2受信部が、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して、映像信号と共に伝送される前記第2音響信号を受信し、遅延量算出部が、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出し、遅延量付加部が、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する、信号処理方法である。
【0010】
また、本発明の信号処理装置は、同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であって、第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信部と、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信する第2受信部と、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出部と、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加部と、を備える信号処理装置である。
また、本発明の信号処理装置は、同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であって、第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信部と、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して、映像と共に伝送される前記第2音響信号を受信する第2受信部と、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出部と、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加部と、を備える信号処理装置である。
【0011】
また、本発明のプログラムは、同一の音源が収音された第1音響信号、及び第2音響信号の信号処理を行う信号処理装置であり、前記第1音響信号は、前記第2音響信号よりも遅延が少ない伝送路を経由して伝送される信号処理装置であるコンピュータに、第1伝送路を経由して伝送される前記第1音響信号を受信する第1受信ステップ、伝送に係る遅延時間が前記第1伝送路より大きい第2伝送路であり前記第1伝送路とは異なる第2伝送路を経由して伝送される前記第2音響信号を受信する第2受信ステップ、前記第1音響信号と前記第2音響信号における相対的な遅延量である伝送遅延量を算出する遅延量算出ステップ、前記伝送遅延量に基づいて前記第1音響信号を遅延させ、当該遅延させた前記第1音響信号を出力する遅延量付加ステップ、を実行させるためのプログラムである。
【発明の効果】
【0012】
以上説明したように、本発明によれば、一般に普及している通話アプリを利用して、高品質な音を伝送することができる。
【図面の簡単な説明】
【0013】
図1】第1の実施形態に係る伝送システム1の構成例を示すブロック図である。
図2】第1の実施形態に係る制御部23が行う処理を説明する図である。
図3】第1の実施形態に係る伝送システム1の処理の流れを示すシーケンス図である。
図4】第2の実施形態に係る伝送システム1Aの構成例を示すブロック図である。
図5】第2の実施形態に係る伝送システム1Aの処理の流れを示すシーケンス図である。
【発明を実施するための形態】
【0014】
以下、実施形態による伝送システムについて図面を参照して説明する。
【0015】
(第1の実施形態)
図1は、第1の実施形態に係る伝送システム1の構成例を示すブロック図である。伝送システム1は、例えば、送信側端末10と、受信側端末20と、マイク30と、スピーカ40とを備える。送信側端末10と受信側端末20とは、例えば、インターネットなどの汎用の通信回線を介して通信可能に接続されている。
【0016】
伝送システム1は、例えば、オンライン音楽レッスンなどの遠隔で行う音楽コミュニケーションを行う際に適用される。この場合、伝送システム1において、送信側端末10と受信側端末20が音響信号を相互に伝送し合う。以下の説明では、送信側端末10から受信側端末20に音響信号x(t)が伝送される場合を例に説明する。受信側端末20から送信側端末10に音響信号が伝送される場合にも、同様の方法を適用することができる。
【0017】
本実施形態では、送信側端末10、及び受信側端末20の両方に、セッションアプリと通話アプリとの2つのアプリがインストールされている。セッションアプリ(以下、専用アプリという)は、音響専用のセッションアプリである。専用アプリでは、伝送による遅延を極力抑えながら、高品質な音を伝送することが可能である。通話アプリ(以下、汎用アプリという)は、スカイプ(登録商標)のように一般に広く普及している汎用の通話アプリである。しかしながら、汎用アプリでは、伝送状態が帯域の状況によって変動し、高品質な音が伝送されるものではない。
【0018】
送信側端末10は、セッションアプリと通話アプリの両方を用いて、同一の音源が収音された音響信号x(t)を受信側端末20に送信する。受信側端末20は、セッションアプリと通話アプリのそれぞれから伝送された音響信号x(t)を受信する。
【0019】
具体的に、受信側端末20は、専用アプリを介して伝送された音響信号x(t)(以下、受信音響信号xN(t)という)を受信する。また、汎用アプリを介して伝送された音響信号x(t)(以下、受信音響信号xS(t)という)を受信する。
【0020】
ここで、専用アプリでは伝送路NDを介した伝送が行われる。汎用アプリでは、伝送路SDを介した伝送が行われる。伝送路NDと、SDとでは、一般的に、伝送の経路が異なる。このため、受信側端末20には、受信音響信号xN(t)と、受信音響信号xS(t)とが互いに異なるタイミングで受信される。
【0021】
ここで、専用アプリでは遅延を極力抑えた伝送が行われることから、受信音響信号xS(t)と比較して、受信音響信号xN(t)の方がより少ない遅延で受信側端末20に受信されるものとする。この場合、受信音響信号xN(t)は、「第1音響信号」の一例である。伝送路NDは「第1伝送路」の一例である。また、受信音響信号xS(t)は、「第2音響信号」の一例である。伝送路SDは「第2伝送路」の一例である。
【0022】
受信側端末20は、異なるタイミングで受信した二つの音響信号を同期させて出力する。受信側端末20は、二つの音響信号の相対的な伝送遅延量を算出する。以下の説明では、伝送遅延量のことを単に遅延量と記載する。
【0023】
受信側端末20は、算出した遅延量τを用いて、遅延が少ない方の音響信号である受信音響信号xN(t)を遅延量τだけ遅らせた受信音響信号xN(t-τ)を生成する。そして、受信側端末20は、受信音響信号xS(t)に代えて、受信音響信号xN(t-τ)をスピーカ40に出力する。これにより、汎用アプリが受信側で音を出力するタイミングに合わせて、高品質な音響を出力させることが可能である。したがって、汎用アプリを介した通話が、高品質な音で行われるようすることができる。
【0024】
送信側端末10は、送信者側のコンピュータ装置であり、例えば、スマートフォン、パーソナルコンピュータ、携帯電話、タブレット端末、ウェアラブル端末などである。送信側端末10は、例えば、通信部11と、記憶部12と、制御部13と、入出力部14とを備える。
【0025】
通信部11は、受信側端末20と通信を行う。例えば、通信部11は、専用アプリの制御にしたがって音響信号x(t)を、受信側端末20に送信する。また、通信部11は、汎用アプリの制御にしたがって音響信号x(t)を、受信側端末20に送信する。
【0026】
記憶部12は、記憶媒体、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、RAM(Random Access read/write Memory)、ROM(Read Only Memory)、または、これらの記憶媒体の任意の組み合わせによって構成される。記憶部12は、送信側端末10の各種の処理を実行するためのプログラム、及び各種の処理を行う際に利用される一時的なデータを記憶する。
【0027】
制御部13は、送信側端末10が備えるハードウェアとしてのCPU(Central Processing Unit)、GPU(Graphics Processing Unit)等のProcessing Unit(プロセッシングユニット)が記憶部12に記憶されたプログラムを実行することにより、機能が実現される。
【0028】
制御部13は、例えば、専用アプリ130と、汎用アプリ131と、装置制御部132とを備える。専用アプリ130は、汎用アプリの機能を実現する機能部であり、マイク30から取得される音響信号x(t)を、予め設定された通信先の装置(ここでは、受信側端末20)に伝送する。汎用アプリ131は、汎用アプリの機能を実現する機能部であり、マイク30から取得される音響信号x(t)を、予め設定された通信先の装置(ここでは、受信側端末20)に伝送する。装置制御部132は、送信側端末10を統括的に制御する。例えば、装置制御部132は、マイク30から入力される音響信号x(t)を専用アプリ130、及び汎用アプリ131に出力する。また、装置制御部132は、専用アプリ130及び汎用アプリ131から出力される、通信先の装置との通信を確立させるための制御信号を通信部11に出力することによって、受信側端末20に送信する。
【0029】
入出力部14は、送信側端末10に接続される外部機器との信号の入出力を仲介する機能部である。ここでは、入出力部14には、マイク30によって収音された音響信号x(t)が入力される。
【0030】
受信側端末20は、受信者側のコンピュータ装置であり、例えば、スマートフォン、パーソナルコンピュータ、携帯電話、タブレット端末、ウェアラブル端末などである。ここでは、受信側端末20は、送信側端末10と同等の構成を備えるものとする。以下の説明では、受信側端末20の機能のうち、送信側端末10とは異なる機能のみを説明し、送信側端末10と同等の機能については詳細な説明を省略する場合がある。
【0031】
受信側端末20は、例えば、通信部21と、記憶部22と、制御部23と、入出力部24とを備える。通信部21は、送信側端末10と通信を行う。例えば、通信部21は、送信側端末10から受信音響信号xN(t)を受信する。通信部21は、送信側端末10から受信音響信号xS(t)を受信する。
【0032】
記憶部22は、記憶媒体、例えば、HDD、フラッシュメモリ、EEPROM、RAM、ROM、または、これらの記憶媒体の任意の組み合わせによって構成される。記憶部22は、受信側端末20の各種の処理を実行するためのプログラム、及び各種の処理を行う際に利用される一時的なデータを記憶する。
【0033】
制御部23は、受信側端末20が備えるハードウェアとしてのCPU、GPU等のProcessing Unit(プロセッシングユニット)が記憶部22に記憶されたプログラムを実行することにより、機能が実現される。
【0034】
入出力部24は、受信側端末20に接続される外部機器との信号の入出力を仲介する機能部である。ここでは、入出力部24は、受信音響信号xN(t-τ)をスピーカ40に出力する。
【0035】
制御部23は、例えば、遅延推定部230と、ディレイ部231と、装置制御部232と、専用アプリ233と、汎用アプリ234とを備える。遅延推定部230は、「遅延量算出部」の一例である。ディレイ部231は、「遅延量付加部」の一例である。装置制御部232は、受信側端末20を統合的に制御する。専用アプリ233は、専用アプリ130と同等の機能部である。汎用アプリ234は、汎用アプリ131と同等の機能部である。
【0036】
図2は、制御部23が行う処理を説明する図である。遅延推定部230は、受信音響信号xN(t)と、受信音響信号xS(t)とを取得して両信号の相対的な遅延量τを算出する。遅延推定部230は、算出した遅延量τをディレイ部231に出力する。
【0037】
ディレイ部231は、遅延推定部230から取得した遅延量τを用いて受信音響信号xN(t)を遅延させた受信音響信号xN(t-τ)を生成し、生成した受信音響信号xN(t-τ)を出力する。
【0038】
ここで、遅延推定部230が遅延量を算出する具体的な方法について説明する。遅延推定部230は、例えば、受信音響信号xN(t)を一定の時間区間(例えば、1秒間)相当分バッファリングする。すなわち、遅延推定部230は、通信部21によって受信された受信音響信号xN(t)を順次記憶させ、一定の時間区間に相当する信号を、例えば記憶部22に、一時的に記憶させる。
【0039】
また、遅延推定部230は、例えば、受信音響信号xS(t)を一定の時間区間(例えば、1秒間)相当分バッファリングする。すなわち、遅延推定部230は、通信部21によって受信された受信音響信号xS(t)を順次記憶させ、一定の時間区間に相当する信号を、例えば記憶部22に、一時的に記憶させる。
【0040】
遅延推定部230は、バッファリングした一定の時間区間Tの受信音響信号xN(t)と、受信音響信号xS(t)との相互相関値を取る。例えば、遅延推定部230は、以下の(1)式を用いて、相互相関値Rを算出する。(1)式において、R(n)は、遅延量をnとした場合における相互相関値を示す。Tは一定の時間区間を示す。tは時間を示す。
【0041】
【数1】
【0042】
例えば、遅延推定部230は、nを変更しながら相互相関値R(n)を算出する。遅延推定部230は、算出した相互相関値R(n)のうち、絶対値|R(n)|が最大となる遅延量nを、受信音響信号xN(t)と受信音響信号xS(t)との相対的な遅延量とする。
【0043】
また、遅延推定部230は、以下の(2)式に示すように、相互相関値R´(n)の重みづけ和を、相互相関値R(n)としてもよい。ここでの相互相関値R´(n)は、直近(例えば、一つ前の時間区間)で得られた相互相関値である。(2)式において、R´(n)は直近の相互相関値であって遅延量をnとした場合における相互相関値を示す。Tは一定の時間区間を示す。tは時間を示す。
【0044】
【数2】
【0045】
ここで、伝送路NDや伝送路SDによる遅延量は、常に一定の値をとるものではなく、帯域の状況やで送受信される信号の込み具合などによって時々刻々と変動するのが通常である。このため、算出した遅延量を用いて受信音響信号xN(t)を遅延させても、徐々に、受信音響信号xN(t)と受信音響信号xS(t)の同期が外れてしまう場合があり得る。
【0046】
この対策として、遅延推定部230は、適宜、遅延量を更新する。例えば、遅延推定部230は、所定の算出タイミングが到来する度に遅延量を算出する。遅延推定部230は、算出した遅延量を、例えば、遅延量n(1)、n(2)、…、n(N)として、記憶部22に記憶させる。遅延量nの引数(1、2、…、N)は算出タイミングを示している。遅延推定部230は、各算出タイミングk(k=1~N)で得られた遅延量n(k)を、その時点における遅延量とする。これにより、伝送に係る遅延量が時々刻々と変化する場合であっても、その変化に追従させた受信音響信号xN(t)を出力させることができる。
【0047】
なお、算出タイミングは任意に設定されてよい。例えば、受信音響信号xN(t)、あるいは受信音響信号xS(t)を受信する度に遅延量を算出するようにしてもよい。あるいは、バッファリングする時間区間T(あるいは、1/2Tや、1/4T等)ごとに算出タイミングが到来するようにしてもよいし、ランダムに算出タイミングが到来するようにしてもよい。
【0048】
上記では、遅延量が算出される度に、その算出した遅延量で受信音響信号xN(t)を遅延させる場合を例に説明したが、これに限定されない。例えば、ディレイ部231は、遅延推定部230によって算出された遅延量に基づいて、その算出した遅延量で、受信音響信号xN(t)を遅延させるか否か、つまり、遅延量を更新させるか否かを判定するようにしてもよい。
【0049】
例えば、ディレイ部231は、予め記憶部22などに記憶された基準の遅延量である基準値nfを取得する。ディレイ部231は、取得した基準値nfと、算出した遅延量n(k)とを用いて、その算出した遅延量n(k)で、受信音響信号xN(t)の遅延量を更新させるか否かを判定する。ディレイ部231は、例えば、基準値nfと遅延量n(k)の差分の絶対値|nf-n(k)|が、所定の閾値(後述する許容範囲)以上である場合、遅延量を更新させると判定する。ディレイ部231は、絶対値|nf-n(k)|が、所定の閾値未満である場合、遅延量を更新させないと判定する。あるいは、ディレイ部231は、絶対値|nf-n(k)|が、所定の閾値未満となる場合、遅延量を基準値nfとするようにしてもよい。
【0050】
換言すると、ディレイ部231は、遅延量n(k)が、(基準値nf+許容範囲)よりも大きいか、あるいは(基準値nf-許容範囲)よりも小さい場合には、遅延量を更新させると判定する。ディレイ部231は、遅延量n(k)が、(基準値nf+許容範囲)よりも小さく、かつ(基準値nf-許容範囲)よりも大きいには、遅延量を更新させないと判定する。この場合における、(基準値nf+許容範囲)は、「第1閾値」の一例である。これにより、算出された遅延量n(k)が、現在設定されている値から許容範囲を超えている場合にのみ、遅延量を更新することができる。したがって、微小な遅延量の変化を抑えて音響的な違和感の発生を軽減させつつ、実際の遅延量の変化に追従させていくことができる。
【0051】
上記では、基準値nfが固定値である場合を例に説明した。しかしながら、これに限定されない。基準値nfを可変値としてもよい。遅延推定部230は、例えば、基準値nfを、各算出タイミングで算出された遅延量n(1)、n(2)、…、n(N)の平均としてもよい。平均は、算出タイミング1~Nまでの単純加算平均値であってもよいし、重みづけ平均値であってもよい。或いは、直近の移動平均であってもよい。直近の移動平均とは、最新の遅延量がn(N)である場合、遅延量n(N)と直近の複数の遅延量(例えば、算出タイミングN-1、N-2の遅延量n(N-1)、n(N-2))の平均値のことである。
【0052】
また、ディレイ部231は、遅延量を更新(変化)させる場合において、その変化が滑らかとなるように、段階的に変化させるようにしてもよい。例えば、ディレイ部231は、遅延量を更新する際に、まず、現状の遅延量と、更新後の遅延量との差分を変化量として算出する。ディレイ部231は、算出した変化量に基づいて、変化速度(単位時間当たりの変化量)が所定の閾値を超えないようにする。これにより、ディレイ部231は、徐々に、遅延量を変化させることができ、音切れや音飛びなどの発生を抑制することが可能である。
【0053】
なお、上記では、遅延推定部230が、相互相関値の絶対値|R(n)|のピーク値(最大値)となる場合における遅延量nを、受信音響信号xN(t)と受信音響信号xS(t)との相対的な遅延量とする場合を例に説明した。
【0054】
しかしながら、無音に近い音響信号が伝送された場合などにおいては、受信した音響信号は、無音でない場合と比較して、全体的な信号振幅が小さくなる。この場合、相互相関値R(n)に突出したピーク値が出現せず、遅延量nの値によらず同じような相互相関値をとることが考えられる。このような場合、相互相関値R(n)が最大となるnの値が、実際の遅延量として信頼できない可能性が高い。
【0055】
この対策として、遅延推定部230は、相互相関値R(n)のピーク値が所定の閾値未満である場合、対応する遅延量nを、実際の遅延量として採用しないと判定する。つまり、遅延推定部230は、相互相関値R(n)のピーク値が所定の閾値以上である場合に、対応する遅延量nを、実際の遅延量として採用する。これにより、遅延推定部230は、精度よく遅延量を算出することができる。
【0056】
また、何らかの理由により、伝送路SD、または伝送路NDのいずれか一方の伝送路を介した信号の伝送が途切れてしまう場合があり得る。このような場合、相互相関値R(n)を用いて算出た遅延量は信頼することができない。この対策として、遅延推定部230は、伝送路が途切れているか否かを判定し、いずれか一方の伝送路が途切れたと判定される場合には、相互相関値R(n)の算出を行わないようにする。
【0057】
例えば、遅延推定部230は、バッファリングした受信音響信号xS(t)、及び受信音響信号xN(t)のそれぞれのパワー(最大レベル)を算出する。ここでのパワーは、バッファリングされた信号の強さを示す指標である。パワーは、例えば、バッファリングされた信号における信号振幅の絶対値の和であってもよいし、バッファリングされた信号のうち信号振幅の絶対値が最大となる信号の信号振幅値であってもよい。
【0058】
遅延推定部230は、算出した受信音響信号xS(t)、及び受信音響信号xN(t)のそれぞれのパワーのうち、一方が所定の閾値を超え、他方がその閾値を下回っている場合、閾値が下回った方の伝送路が途切れていると判定する。ここでの閾値は、「第2閾値」の一例である。
【0059】
具体的に、遅延推定部230は、受信音響信号xN(t)のパワーが閾値未満であり、受信音響信号xS(t)のパワーが閾値以上の場合、相互相関値R(n)の算出を行わず、遅延量を算出しないと判定する。また、遅延推定部230は、受信音響信号xN(t)のパワーが閾値以上であり、受信音響信号xS(t)のパワーが閾値未満の場合、相互相関値R(n)の算出を行わず、遅延量を算出しないと判定する。
【0060】
なお、遅延推定部230は、伝送路SD、または伝送路NDのいずれか一方の伝送路を介した信号の伝送が途切れたと判定した場合、途切れていない方の音響信号を再生するようにしてもよい。具体的に、遅延推定部230は、受信音響信号xN(t)のパワーが閾値未満であり、受信音響信号xS(t)のパワーが閾値以上の場合、受信音響信号xS(t)を、入出力部24を介してスピーカ40に出力させる。また、遅延推定部230は、受信音響信号xN(t)のパワーが閾値以上であり、受信音響信号xS(t)のパワーが閾値未満の場合、受信音響信号xN(t-τ)を、入出力部24を介してスピーカ40に出力させる。ここでの遅延量τは、現在設定されている遅延量である。これにより、遅延推定部230は、一方の伝送路が途切れた場合であっても音の再生を継続させることができる。
【0061】
図3は、第1の実施形態における伝送システム1の処理の流れを示すシーケンス図である。送信側端末10は音響信号x(t)をマイク30から取得する(ステップS10)。送信側端末10は、専用アプリ、及び汎用アプリのそれぞれによって音響信号x(t)を受信側端末20に送信する(ステップS11)。専用アプリを介した音響信号x(t)は、伝送路NDを経て、受信音響信号xN(t)として受信側端末20に到達する。汎用アプリを介した音響信号x(t)は、伝送路SDを経て、受信音響信号xS(t)として受信側端末20に到達する。
【0062】
受信側端末20は、受信音響信号xN(t)を受信する(ステップS12)。受信側端末20は、受信音響信号xS(t)を受信する(ステップS13)。受信側端末20は、受信した受信音響信号xN(t)と受信音響信号xS(t)とを用いて、遅延量τを推定(算出)する(ステップS14)。受信側端末20は、推定した遅延量τを用いて受信音響信号xN(t)を遅延させ、遅延させた受信音響信号xN(t-τ)をスピーカ40に出力する(ステップS16)。
【0063】
以上、説明したように、第1の実施形態の伝送システム1による伝送方法は、同一の音源である音響信号x(t)が収音された受信音響信号xN(t)、及び受信音響信号xS(t)の伝送方法である。伝送方法は、「信号処理方法」の一例である。受信音響信号xN(t)は、「第1音響信号」の一例である。受信音響信号xS(t)は「第2音響信号」の一例である。
【0064】
伝送システム1による伝送方法では、通信部21が、伝送路NDを経由して伝送される受信音響信号xN(t)を受信する。通信部21は、「第1受信部」の一例である。伝送路NDは、「第1伝送路」の一例である。通信部21が、伝送路SDを経由して伝送される受信音響信号xS(t)を受信する。通信部21は「第2受信部」の一例である。伝送路SDは、伝送に係る遅延時間が伝送路NDより大きい伝送路であり、「第2伝送路」の一例である。遅延推定部230が受信音響信号xN(t)と受信音響信号xS(t)における相対的な遅延量τを算出する。遅延推定部230は「遅延量算出部」の一例である。遅延量τは「伝送遅延量」の一例である。ディレイ部231は、算出された遅延量τに基づいて受信音響信号xN(t)を遅延させ、当該遅延させた受信音響信号xN(t-τ)を出力する。
【0065】
これによって、第1の実施形態の伝送システム1では、汎用アプリから出力される音に同期させたタイミングで、高品質の音響を出力させることができる。したがって、一般に普及している通話アプリを利用して、高品質な音を伝送することができる。
【0066】
また、第1の実施形態の伝送システム1による伝送方法では、遅延推定部230が所定の算出タイミングkが到来する度に、遅延量τを算出する。ディレイ部231が、遅延量τが算出される度に、今回算出された遅延量τにより受信音響信号xN(t)を遅延させる。ディレイ部231は、当該遅延させた受信音響信号xN(t-τ)を出力する。これにより実施形態の伝送システム1による伝送方法では、遅延量が時々刻々と変化する場合であっても、その変化に追従することができ、受信音響信号xS(t)に同期する受信音響信号xN(t)を出力し続けることが可能である。
【0067】
また、第1の実施形態の伝送システム1による伝送方法では、ディレイ部231が、遅延量が算出される度に、今回算出された遅延量τが閾値(第1閾値)以上であるか否かを判定する。ディレイ部231は、今回算出された遅延量τが閾値以上である場合、今回算出された遅延量τにより受信音響信号xN(t)を遅延させる。ディレイ部231は、当該遅延させた受信音響信号xN(t-τ)を出力する。これにより、遅延量に大きな変化が発生した際に、その変化に追従させていくことができる。
【0068】
また、第1の実施形態の伝送システム1による伝送方法では、ディレイ部231が、遅延量τが算出される度に、今回算出された遅延量τが閾値(第1閾値)以上であるか否かを判定する。ディレイ部231は、今回算出された遅延量τが閾値以上でない場合、所定の遅延量(例えば、基準値nf)により受信音響信号xN(t)を遅延させる。ディレイ部231は、当該遅延させた受信音響信号xN(t-nf)を出力する。これにより、微小な遅延量の変化を抑えて音響的な違和感の発生を軽減させることができる。
【0069】
また、第1の実施形態の伝送システム1による伝送方法では、閾値(第1閾値)は、所定の算出タイミングkが到来する度に算出された遅延量n(k)の平均である。これにより、今までの遅延量の平均と比べて、今回算出した遅延量に大きな変化がある場合にその変化に追従し、今回算出した遅延量が今までの遅延量と同程度であった場合には、微小な変化として遅延量を現状維持させることができる。したがって、上述した効果と同様の効果を奏することができる。
【0070】
また、第1の実施形態の伝送システム1による伝送方法では、ディレイ部231は、遅延量τが算出される度に、前回算出された遅延量と今回算出された遅延量とに基づいて、段階的に受信音響信号xN(t)を遅延させる。これにより徐々に、遅延量を変化させることができ、音切れや音飛びなどの発生を抑制することが可能である。
【0071】
また、第1の実施形態の伝送システム1による伝送方法では、遅延推定部230が、所定の時間区間Tに受信された、受信音響信号xN(t)の時系列変化と受信音響信号xS(t)の時系列変化との相互相関値R(n)が最大となる遅延量nを算出する。遅延推定部230は、当該算出した遅延量が閾値(第2閾値)以上である場合、当該算出した遅延量nを遅延量τとする。これにより、無音の状態が続く場合など、算出した遅延量が信頼できない場合に、その信頼できない遅延量を適用させないようにすることができる。
【0072】
また、第1の実施形態の伝送システム1による伝送方法では、遅延推定部230は、算出した遅延量が閾値(第2閾値)以上である場合に、当該算出した遅延量nを遅延量τとする。遅延推定部230は、算出した遅延量が閾値(第2閾値)未満である場合に、当該算出した遅延量nを遅延量τとしない。これにより、無音の状態が続く場合など、算出した遅延量が信頼できない場合に、その信頼できない遅延量を適用させないようにすることができる。
【0073】
また、第1の実施形態の伝送システム1による伝送方法では、遅延推定部230は、所定の時間区間Tに受信された受信音響信号xN(t)の最大レベルが閾値(第2閾値)以上であり、受信音響信号xS(t)の最大レベルが閾値(第2閾値)未満の場合、遅延量を算出しない。遅延推定部230は、所定の時間区間Tに受信された受信音響信号xN(t)の最大レベルが閾値(第2閾値)未満であり、受信音響信号xS(t)の最大レベルが閾値(第2閾値)以上の場合、遅延量を算出しない。これにより、一方の伝送路が途絶えた場合など算出した遅延量が信頼できない場合に、その信頼できない遅延量を適用させないようにすることができる。
【0074】
(第2の実施形態)
次に、第2の実施形態について説明する。本実施形態では、汎用アプリで、音響信号x(t)と共に、映像信号y(t)を送信する点において、上述した実施形態と相違する。
【0075】
図4は、第2の実施形態に係る伝送システム1Aの構成例を示すブロック図である。伝送システム1Aにおいて、送信側端末10にはカメラ50が接続されている。また、伝送システム1において、受信側端末20にはディスプレイ60が接続されている。
【0076】
送信側端末10は、入出力部14を介して、マイク30から音響信号x(t)を取得する。また、送信側端末10は、入出力部14を介して、カメラ50から映像信号y(t)を取得する。送信側端末10は、専用アプリ130によって専用アプリを介した音響信号x(t)を受信側端末20に送信する。また、送信側端末10は、汎用アプリ131によって汎用アプリを介した音響信号x(t)と映像信号y(t)を、受信側端末20に送信する。
【0077】
受信側端末20は、伝送路NDを介して受信音響信号xN(t)を受信する。また、受信側端末20は、伝送路SDを介して、受信音響信号xS(t)、及び受信映像信号yS(t)を受信する。受信音響信号xN(t)は、遅延推定部230によって、受信音響信号xN(t)と受信音響信号xS(t)の相対的な遅延量τを算出する。受信側端末20は、算出した遅延量τだけ遅らせた受信音響信号xN(t-τ)を、入出力部24を介してスピーカ40に出力する。受信側端末20は、受信映像信号yS(t)を、入出力部24を介してディスプレイ60に出力する。
【0078】
図5は、第2の実施形態に係る伝送システム1Aの処理の流れを示すシーケンス図である。送信側端末10は、音響信号x(t)をマイク30から取得すると共に、映像信号y(t)をカメラ50から取得する(ステップS20)。送信側端末10は、専用アプリによって音響信号x(t)を受信側端末20に送信すると共に、汎用アプリによって音響信号x(t)及び映像信号y(t)を受信側端末20に送信する(ステップS21)。専用アプリを介した音響信号x(t)は、伝送路NDを経て、受信音響信号xN(t)として受信側端末20に到達する。汎用アプリを介した音響信号x(t)及び映像信号y(t)は、伝送路SDを経て、受信音響信号xS(t)及び受信映像信号yS(t)として受信側端末20に到達する。
【0079】
受信側端末20は、受信音響信号xN(t)を受信する(ステップS22)。受信側端末20は、受信音響信号xS(t)及び受信映像信号yS(t)を受信する(ステップS23)。受信側端末20は、受信した受信音響信号xN(t)と受信音響信号xS(t)とを用いて、遅延量τを推定(算出)する(ステップS24)。受信側端末20は、推定した遅延量τを用いて受信音響信号xN(t)を遅延させ、遅延させた受信音響信号xN(t-τ)をスピーカ40に出力すると共に、受信映像信号yS(t)をディスプレイ60に出力する(ステップS26)。
【0080】
以上、説明したように、第2の実施形態の伝送システム1Aによる伝送方法は、同一の音源である音響信号x(t)が収音された受信音響信号xN(t)、及び受信音響信号xS(t)の伝送方法である。
【0081】
伝送システム1Aによる伝送方法では、通信部21が、伝送路NDを経由して伝送される受信音響信号xN(t)を受信する。通信部21が、伝送路SDを経由して伝送される受信音響信号xS(t)、及び受信映像信号yS(t)を受信する。遅延推定部230が受信音響信号xN(t)と受信音響信号xS(t)における相対的な遅延量τを算出する。ディレイ部231は、算出された遅延量τに基づいて受信音響信号xN(t)を遅延させ、当該遅延させた受信音響信号xN(t-τ)を出力する。
【0082】
これによって、第2の実施形態の伝送システム1Aでは、汎用アプリによって伝送された映像に同期させて、高品質な音響を再生することができる。したがって、一般に普及している通話アプリを利用して、高品質な音を伝送することができる。
【産業上の利用可能性】
【0083】
以上に例示した実施形態によれば、オンライン音楽レッスンなどに適用される伝送システムを提供することができる。
【符号の説明】
【0084】
1…伝送システム、10…送信側端末、11…通信部、12…記憶部、13…制御部13、130…専用アプリ、131…汎用アプリ、20…受信側端末(信号処理装置)、21…通信部、22…記憶部、23…制御部、230…遅延推定部(遅延量算出部)、231…ディレイ部(遅延付与部)、30…マイク、40…スピーカ、50…カメラ、60…ディスプレイ
図1
図2
図3
図4
図5