IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

特表2024-533208モバイルキャプチャのためのオーディオエンハンスメント
<>
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図1
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図2
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図3
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図4
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図5
  • 特表-モバイルキャプチャのためのオーディオエンハンスメント 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】モバイルキャプチャのためのオーディオエンハンスメント
(51)【国際特許分類】
   H04R 29/00 20060101AFI20240905BHJP
   H04R 3/00 20060101ALI20240905BHJP
【FI】
H04R29/00 320
H04R3/00 320
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024514344
(86)(22)【出願日】2022-09-07
(85)【翻訳文提出日】2024-03-04
(86)【国際出願番号】 US2022042671
(87)【国際公開番号】W WO2023038911
(87)【国際公開日】2023-03-16
(31)【優先権主張番号】PCT/CN2021/117685
(32)【優先日】2021-09-10
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】63/244,261
(32)【優先日】2021-09-15
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】21207498.3
(32)【優先日】2021-11-10
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【弁理士】
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】リー,カイ
(72)【発明者】
【氏名】ルオ,ハオ
(72)【発明者】
【氏名】ガン,レイ
(72)【発明者】
【氏名】リー,シュイ
(72)【発明者】
【氏名】ウエン,ウエイウエイ
(72)【発明者】
【氏名】マー,ユエンシーン
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA30
(57)【要約】
ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタするシステム、及び関連する方法が、開示される。いくつかの実施形態で、システムは、リアルタイムで、スマートフォンなどの第1モバイルデバイスによって生成されたオーディオデータを受け取るようプログラムされる。システムは、リアルタイムで、オーディオデータから、オーディオ異常が発生しているかどうかを決定するようプログラムされる。システムは、オーディオ異常の発生の検出に応答して、リアルタイムで、同じスマートフォンであってもよい第2モバイルデバイスへのアラートの提示を引き起こすようプログラムされる。
【特許請求の範囲】
【請求項1】
1つ以上のコンピューティングデバイスによって実行される場合に、前記1つ以上のコンピューティングデバイスに、ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタする方法を実行させる命令を含むプログラムであって、
前記方法は、
リアルタイムで、第1モバイルデバイスによって生成されたオーディオデータを受け取ることと、
リアルタイムで、前記オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常の中のあるタイプのオーディオ異常の発生の開始を検出することと、
リアルタイムで、前記発生のアラートを第2デバイスへ伝えることであり、前記アラートは、前記あるタイプのオーディオ異常の前記発生に注意を向けるもの又は前記発生について説明するものである、ことと
を有する、プログラム。
【請求項2】
前記第1モバイルデバイスは、1つ以上の内蔵式マイクロホンを備えたスマートフォンである、
請求項1に記載のプログラム。
【請求項3】
前記伝えることは、前記アラートを視覚形態で画面に表示するか又は聴覚形態でスピーカで再生することを含み、
前記画面又は前記スピーカは、前記第2デバイスに含まれるか又は前記第2デバイスに結合されている、
請求項1に記載のプログラム。
【請求項4】
前記マイクロホン異常は、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されているマイクロホンのオクルージョン、機能不良、又は置き違えによって引き起こされ、
前記発生は、マイクロホン異常の発生である、
請求項1に記載のプログラム。
【請求項5】
前記検出することは、現在時間に至るまでの期間にわたって、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されている各マイクロホンからの信号の高周波数成分を特定すること、各マイクロホンからの前記信号の振幅値を決定すること、あるいは、各マイクロホンに含まれるか又は各マイクロホンに結合されている加速度センサ又は骨振動センサから測定値を受け取ることを含む、
請求項4に記載のプログラム。
【請求項6】
前記伝えることは、前記マイクロホン異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記発生の源としてのマイクロホンを特定し、該マイクロホンに対する障害物の除去、修理、又は再配置を指示することを含む、
請求項4に記載のプログラム。
【請求項7】
前記複数タイプのオーディオ異常は、非人的源からのバックグラウンドノイズ又は反射によって引き起こされる環境異常を更に含み、
前記発生は、環境異常の発生である、
請求項1に記載のプログラム。
【請求項8】
前記伝えることは、前記環境異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記第1モバイルデバイスによって実装されているノイズ抑制機能をオンすることを含む、
請求項7に記載のプログラム。
【請求項9】
前記複数タイプのオーディオ異常は、録音された音声の特定の品質指標の低い値によって表される音声異常を更に含み、
前記特定の品質指標は、ボリューム又はシャープネスを含み、
前記発生は、音声異常の発生である、
請求項1に記載のプログラム。
【請求項10】
前記伝えることは、前記音声異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記特定の品質指標の品質指標の値を改善するよう話者の音声を調整することを含む、
請求項9に記載のプログラム。
【請求項11】
前記方法は、リアルタイムで、前記あるタイプのオーディオ異常の前記発生を停止するための救済的なアプローチを実施すること、又は前記救済的なアプローチを実施するよう要請することを含む、
請求項1に記載のプログラム。
【請求項12】
前記伝えることは、前記あるタイプのオーディオ異常の前記発生の一部分を含むオーディオコンテンツを削除するよう要請することを含む、
請求項1に記載のプログラム。
【請求項13】
前記方法は、
リアルタイムで、前記あるタイプのオーディオ異常の前記発生の終了が検出されるかどうかを連続的に決定することと、
リアルタイムで、前記発生の前記終了が検出されるまで、前記第1モバイルデバイスによるオーディオコンテンツの生成を無効化することと
を更に含む、
請求項1に記載のプログラム。
【請求項14】
前記方法は、
時間軸に沿った前記オーディオデータのグラフィック表現を表示することと、
前記グラフィック表現に異常情報をオーバーレイすることと
を更に有し、
前記異常情報は、前記あるタイプのオーディオ異常の前記発生について説明するものであり、前記あるタイプのオーディオ異常の前記発生を表現している前記グラフィック表現の部分の上に示される、
請求項1に記載のプログラム。
【請求項15】
前記オーバーレイは選択可能であり、前記異常情報は、前記オーディオデータの質を高めるよう前記あるタイプのオーディオ異常の前記発生を解決するためのリコメンデーションを示し、
前記方法は、
前記オーバーレイの選択を受け取ることと、
質を高められたオーディオデータを得るよう前記リコメンデーションを実施することと
を更に含む、
請求項14に記載のプログラム。
【請求項16】
前記複数タイプのオーディオ異常は、反射によって引き起こされるノイズを含む、
請求項1に記載のプログラム。
【請求項17】
前記検出することは、前記第1モバイルデバイスの加速度計によって生成された加速度計信号を受信し、該加速度計信号に基づき、前記第1モバイルデバイスの加速度を決定することを含む、
請求項1に記載のプログラム。
【請求項18】
前記複数タイプのオーディオ異常は、前記第1モバイルデバイスの置き違えを含む、
請求項17に記載のプログラム。
【請求項19】
請求項1乃至18のうちいずれか一項に記載のプログラムを記憶する1つ以上の非一時記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、オーディオデータの実時間エンハンスメントに関係がある。より具体的には、以下で記載される例示的な実施形態は、ユーザが生成したオーディオコンテンツにおけるオーディオ異常の実時間の検出及びアラートに関係がある。
【背景技術】
【0002】
本項目で記載されるアプローチは、追求される可能性があるアプローチであるが、必ずしも、従前検討又は追求されてきたアプローチではない。従って、別段示されない限り、この項目で記載されるアプローチのいずれも、それらがこの項目に含まれることのみをもって先行技術と見なされるわけではない。
【0003】
ユーザが写真を撮ったりビデオを撮影したりするためにスマートフォンを使用しているとき、スマートフォンの画面には、スマートフォンのカメラによってキャプチャされたものが直ちに示される。従って、ユーザは、リアルタイムで写真やビデオのオクルージョン(occlusions)及び他の異常を認識することができる。しかし、オーディオコンテンツをキャプチャする際には、一般的に、スマートフォンのスピーカは、スマートフォンのマイクロホンによってキャプチャされたものを直ちに再生しない。その結果、ユーザは、キャプチャされたオーディオコンテンツにおけるオーディオ品質の問題にリアルタイムで気付くことができない。例えば、スマートフォンは複数のマイクロホンを備えている場合があり、そのうちの少なくとも1つが遮られて、キャプチャされたオーディオコンテンツの品質を低下させる可能性がある。更には、音声レベルが高すぎたり低すぎたり、あるいは、屋外環境に存在する風切り音などの環境ノイズが大きすぎたりすることがあり、キャプチャされたオーディオコンテンツの品質を更に低下させる。
【0004】
オーディオコンテンツがキャプチャされたずっと後の別の再生までユーザを待たせるのではなく、キャプチャされたオーディオコンテンツを調べて、ユーザがオーディオコンテンツの質を高めることを支援したり、如何なるオーディオ異常もリアルタイムで解消したりすることをユーザに可能にするシステムを有することが有益である。
【発明の概要】
【0005】
ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタするシステム並びに関連する方法及び記憶媒体が開示される。システムは、メモリ及びメモリに結合される1つ以上のプロセッサを含み、リアルタイムで、第1モバイルデバイスによって生成されたオーディオデータを受け取ることと、リアルタイムで、オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常の中のあるタイプのオーディオ異常の発生の開始を検出することと、リアルタイムで、発生のアラートを第2デバイスへ伝えることとを実行するよう構成され、アラートは、あるタイプのオーディオ異常の発生に注意を向けるもの又はその発生について説明するものである。
【0006】
本発明の例示的な実施形態は、添付の図面の図において、限定としてではなく、例として表されている。図中、同じ参照番号は類似の要素を参照するものである。
【図面の簡単な説明】
【0007】
図1】様々な実施形態が実施され得るネットワーク化されたコンピュータシステムの例を表す。
図2】開示される実施形態に係るオーディオ管理コンピュータシステムのコンポーネントの例を表す。
図3】マイクロホンのオクルージョンが起こる期間にわたるオーディオインジケータのリストの例を表す。
図4】オーディオ異常のアラートを示すスマートフォンの画面の例を表す。
図5】ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタするプロセスの例を表す。
図6】本発明の実施形態が実装され得るコンピュータシステムを表すブロック図である。
【発明を実施するための形態】
【0008】
以下の記載では、説明を目的として、多数の具体的な詳細が、本開示の完全な理解をもたらすように、説明されている。なお、例となる実施形態は、これらの具体的な詳細によらずとも実施されてもよいことは明らかである。他の事例では、よく知られている構造及びデバイスは、例となる実施形態を不必要に不明りょうにすることを避けるために、ブロック図形態で示されている。
【0009】
実施形態は、次の骨子に従って以下の項目で記載される:
1.概要
2.例となるコンピューティング環境
3.例となるコンピュータコンポーネント
4.機能説明
4.1.ユーザが生成したオーディオコンテンツのリアルタイムモニタリング
4.1.1.マイクロホン異常検出
4.1.2.環境異常検出
4.1.3.音声異常検出
4.2.ユーザが生成したオーディオコンテンツの質を高めるリアルタイムのリコメンデーション
4.3.ユーザが生成したオーディオコンテンツの後処理
5.例となるプロセス
6.ハードウェア実施
7.拡張及び代案
【0010】
1.概要
ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタするシステム及び関連する方法が開示される。いくつかの実施形態で、システムは、リアルタイムで、スマートフォンなどの第1モバイルデバイスによって生成されたオーディオデータを受け取るようプログラムされる。システムは、リアルタイムで、オーディオデータから、オーディオ異常が発生しているかどうかを決定するようプログラムされる。システムは、オーディオ異常の発生の検出に応答して、リアルタイムで第2モバイルデバイス(同じスマートフォンであってもよい。)へアラートを定時するようプログラムされる。
【0011】
いくつかの実施形態で、システムは、スマートフォン、又はスマートフォン内のプロセッサである。システムは、屋内又は屋外環境でシステムに含まれるか又はシステムに結合されている1つ以上のマイクロホンによって生成されたオーディオデータを連続的に受け取るようプログラムされる。システムはまた、オーディオ異常の如何なる発生についてもオーディオデータを連続的にモニタするようプログラムされる。多数のタイプのオーディオ異常、例えば、スマートフォンのマイクロホンに関するもの、オーディオがキャプチャされる環境に関するもの、又は環境内の話者の音声に関するもの、をモニタすることが可能である。オーディオ異常が発生しているかどうかの決定は、オーディオデータ、あるいは、システムに含まれるか又はシステムに結合されているセンサによって行われる追加の測定に基づくことができる。
【0012】
いくつかの実施形態で、システムは、オーディオ異常の発生を検出すると、リアルタイムでオーディオ異常のアラートを提示するようプログラムされる。例えば、アラートは、システムに含まれるか又はシステムに結合されている画面に表示され得るか、あるいは、システムに含まれるか又はシステムに結合されているスピーカで再生され得る。アラートはまた、正常なオーディオコンテンツの生成を再開するようオーディオ異常を解消したり、又はオーディオ異常が発生した既に生成されているオーディオコンテンツの質を高めたりするためのリコメンデーションも含むことができる。システムは、自動的に又はユーザの承認に応答してリコメンデーションを実施するようプログラムされ得る。録音後、システムは、オーディオ異常の発生に関する注釈を付けて、録音されたオーディオの即時に視覚提示を引き起こすようプログラムされ得る。注釈は、発生が検出されたときに記録される。
【0013】
システムはいくつかの技術的利点を有する。システムは、モバイルデバイスによって生成されたオーディオコンテンツに関するリアルタイムのフィードバックを提供することを可能にし、これにより、可能な限り直ぐに、望ましくないオーディオコンテンツの更なる生成は阻止される。システムはまた、包括的な方法でオーディオ品質を維持するのを助けるように、マイクロホン異常を含む複数タイプのオーディオ異常の検出も可能にする。システムはまた、リアルタイムのエンハンスメントを含む、オーディオ異常が起きているオーディオコンテンツの自動エンハンスメントも可能にする。更に、システムは、可能な限り直ぐに品質を改善するように、録音されたばかりのオーディオコンテンツの品質の即時の視覚化を可能にする。
【0014】
2.例となるコンピューティング環境
図1は、様々な実施形態が実施され得るネットワーク化されたコンピュータシステムの例を表す。図1は、明りょうな例示のために、簡略化された概略的形態で示されており、他の実施形態は、より多い、より少ない、又は異なる要素を含んでもよい。
【0015】
いくつかの実施形態で、ネットワーク化されたコンピュータシステムは、オーディオ管理コンピュータシステム102(「システム」)、1つ以上のセンサ104又は入力デバイス、及び1つ以上の出力デバイス110を含み、これらは、直接的な物理接続を通じて、又は1つ以上のネットワーク118を介して、通信可能に結合されている。
【0016】
いくつかの実施形態で、システム102は、ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタすることに関する機能をホスト又は実行するよう配置されているデータ構造及び/又はデータ記録を用いてプログラム又は構成されている1つ以上のコンピュータ、仮想コンピューティングインスタンス、及び/又はアプリケーションのインスタンスを広く表す。システム102は、サーバファーム、クラウドコンピューティングプラットフォーム、パラレルコンピュータ、又は上記の機能のためにデータ処理、データ記憶、及びネットワーク通信で十分な計算能力を持った任意の他のコンピューティングファシリティを有することができる。
【0017】
いくつかの実施形態で、システム102は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、又はウェアラブルデバイスなどのクライアントデバイスを広く表す。そのようなクライアントデバイスは、1つ以上のセンサ104又は1つ以上の出力デバイス110と一体化され得る。そのようなクライアントデバイスはまた、ケーブルなどの物理コンポーネント、又は1つ以上のネットワーク118を介して、1つ以上のセンサ104又は1つ以上の出力デバイス110に結合されることもできる。
【0018】
いくつかの実施形態で、1つ以上のセンサ104又は入力デバイスの夫々は、音響を電気信号に変換するマイクロホン又は他のデジタル記録デバイスを含むことができる。各センサはプロセッサを含んでもよく、あるいは、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、又はウェアラブルデバイスなどの典型的なクライアントデバイスに組み込まれてもよい。
【0019】
いくつかの実施形態で、1つ以上の出力デバイス110の夫々は、電気信号を音響に戻すスピーカ又は他のデジタル再生デバイスを含むことができる。各出力デバイスは、システム102から受け取られたオーディオデータを再生するようプログラムされる。センサと同様に、出力デバイスはプロセッサを含んでもよく、あるいは、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、又はウェアラブルデバイスなどの典型的なクライアントデバイスに組み込まれてもよい。
【0020】
1つ以上のネットワーク118は、図1の様々な要素の間のデータの交換をもたらす任意の媒体又はメカニズムによって実施され得る。ネットワーク118の例には、制限なしに、セルラーアンテナを介してコンピューティングデバイスへのデータ接続と通信可能に結合されるセルラーネットワーク、近距離通信(NFC)ネットワーク、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、地上又は衛星リンク、などのうちの1つ以上がある。
【0021】
いくつかの実施形態で、システム102は、音響の生成に対してリアルタイムで、1つ以上のセンサ104から所与の環境での音響に対応する入力オーディオデータを受け取るようプログラムされる。システム102は、次に、入力オーディオデータの受け取りに対してリアルタイムで、音声及びノイズの混合に通常対応する入力オーディオデータを処理して、入力オーディオデータからあるタイプのオーディオ異常の任意の発生を検出するようプログラムされる。システム102は、更に、発生の検出に対してリアルタイムで、検出された任意の発生のアラートを1つ以上の出力デバイスへ伝えるようプログラムされる。システム102はまた、質を高められたオーディオデータを得るよう発生を終了するか又は入力オーディオデータを更新するためのリコメンデーションを伝送又は実施することもできる。
【0022】
3.例となるコンピュータコンポーネント
図2は、開示される実施形態に係るオーディオ管理コンピュータシステムのコンポーネントの例を表す。図は、例示のみを目的としており、システム102は、より少ない又はより多い機能又は記憶コンポーネントを有することができる。機能コンポーネントの夫々は、ソフトウェアコンポーネント、汎用若しくは特別目的のハードウェアコンポーネント、ファームウェアコンポーネント、又はそれらの任意の組み合わせとして実施され得る。機能コンポーネントの夫々はまた、1つ以上の記憶コンポーネント(図示せず。)と結合され得る。記憶コンポーネントは、関連データベース、オブジェクトデータベース、フラットファイルシステム、又はJSONストアのいずれかを用いて実施され得る。記憶コンポーネントは、プログラム呼び出し、遠隔手続き呼び出し(RPC)設備又はメッセージングバスを用いてネットワークを通じて又はローカルで機能コンポーネントに接続され得る。コンポーネントは内蔵型であってもなくてもよい。実施特有の又は他の懸案事項に応じて、コンポーネントは、機能的又は物理的に中央集権化されても又は分散されてもよい。
【0023】
いくつかの実施形態で、システム102は、データ収集命令202、異常検出命令204、異常通知命令206、及び異常解消又はオーディオエンハンスメント命令208を有する。システム102はまた、データベース220も有する。
【0024】
いくつかの実施形態で、データ収集命令202は、1つ以上の入力デバイス、通常はマイクロホンからのオーディオデータのリアルタイム収集、加速度センサなどの他のセンサの測定、又はユーザインターフェース要素の選択などのユーザ入力を可能にする。
【0025】
いくつかの実施形態で、異常検出命令204は、オーディオデータを生成するマイクロホン、オーディオデータが生成される環境、及びマイクロホンによって記録される音声に関係することができる複数タイプのオーディオ異常の定義を可能にする。異常検出命令204はまた、入力オーディオデータ又は他のセンサ測定からのあるタイプのオーディオ異常の発生のリアルタイム検出も可能にする。
【0026】
いくつかの実施形態で、異常通知命令206は、あるタイプの異常の発生のリアルタイム通知を可能にする。通知は、発生のアラート又は発生を停止するためのリコメンデーションを提示することを含むことができ、少なくとも視覚形態又は聴覚形態で提示され得る。
【0027】
いくつかの実施形態で、異常解消又はオーディオエンハンスメント命令208は、正常なオーディオコンテンツの将来の生成のためにオーディオ異常を取り除くこと、又はオーディオ異常が起きた以前に生成されたオーディオコンテンツの質を高めることを可能にする。オーディオ除去又はエンハンスメントは、自動的にリアルタイムで又はユーザ命令に応答して実行され得る。
【0028】
いくつかの実施形態で、データベース220は、入力オーディオデータ、質を高められたオーディオデータ、異常検出及び通知モジュール、オーディオ異常定義、アラート定義、リコメンデーション定義、センサ測定、又はデバイスデータなどの関連データの記憶及び該関連記憶へのアクセスを管理するようプログラム又は構成される。
【0029】
4.機能説明
4.1.ユーザが生成したオーディオコンテンツのリアルタイムモニタリング
4.1.1.マイクロホン異常検出
図3は、マイクロホンのオクルージョンが発生する期間にわたるオーディオインジケータのリストの例を表す。この例では、スマートフォンのマイクロホンの数は2つであり、1つのマイクロホンは、期間のいくつかの区間中、偶発的に覆われる。
【0030】
マイクロホンのオクルージョンは、一般的に、モバイルでキャプチャされたオーディオ信号において高周波エネルギの強いロールオフを引き起こす。よって、いくつかの実施形態で、システム102は、2つのマイクロホンの間で高周波数成分に関する1つ以上のオーディオインジケータの値を評価することによって、マイクロホンのオクルージョンを検出し、マイクロホンオクルージョンフラグを立てることができる。マイクロホンオクルージョンフラグなどのオーディオ異常フラグを立てることは、一般的に、オーディオ異常の発生の説明及び開始時間を含む当該発生に関する情報を記録することを意味する。そのようなオーディオインジケータは、インジケータ304などの、2つのマイクロホンによって生成された2つの信号の間の高周波数における対数パワー差分和(log power difference sum,LPDS)、又はマイクロホンによって生成された各信号の高周波エネルギと低周波エネルギとの間の相対比率を示すスペクトル勾配若しくはスペクトルバランス(図示せず)を含む。図3で、マイクロホンのオクルージョンの検出の結果はライン302として示されており、非ゼロの値はオクルージョンのインスタンスに対応する。システム102は、様々なパラメータからリアルタイムでLPDSを計算し、次いで、LPDSから次のように、マイクロホンのオクルージョンが発生しているかどうかを決定することができる。これは、2よりも多いマイクロホンに容易に拡張できる:

function p=SoundDogDetectorInit(g,p)
%gは周波数領域でのオーディオ信号を表し、pはパラメータの組を表す
%g.Fsはサンプル周波数レートを表し、8000、16000又は32000にセットされ得る
%g.Block=g.Fs*frameLength(前もってセットされた値)
%SoundDogDetectorInit

p=SetParam(p,‘SmoothTime’,0.5,‘State’);%(sec)レベル差の平滑化
p=SetParam(p,‘SmoothTime’,1,‘State’);%(sec)検出時間の閾値

%導出されたパラメータ
p=SetParam(p,‘SmoothAlpha’,1-exp(-g.Block/g.Fs/p.SmoothTime),‘Derived’);
p=SetParam(p,‘CountThreshold’,p.CountTime*g.Fs/g.Block,‘Derived’);

%状態パラメータ
p=SetParam(p,‘LevelDiff’,25,‘State’);
p=SetParam(p,‘AnomalyLike’,0,‘State’);
p=SetParam(p,‘Count’,0,‘State’);
p=SetParam(p,‘MaxCount’,60,‘State’);
p=SetParam(p,‘MicBlocked’,0,‘State’);
%MicBlockedは、関心のあるマイクロホンが遮られている又は閉塞されているかどうかを示す

end

function p=SoundDogDetectorProcess(g,p,StereoBands)
%StereoBandsは周波数帯域の組を表す
%SoundDogDetectorProcess

%高周波帯域でのステレオチャネルのレベル差
LogBands_Left=10*log10(StereoBands(16:end,1)+eps);
LogBands_Right=10*log10(StereoBands(16:end,2)+eps);
%p.LevelDiff=sum(abs(LogBands_Left-LogBands_Right))/20;
p.LevelDiff=(1-p.SmoothAlpha)*p.LevelDiff+p.SmoothAlpha*(sum(abs(LogBands_Left-LogBands_Right))/10);

%どれくらい長くレベル差が異常であるかを決定する
p.AnomalyLike=(p.LevelDiff>30);

%長いブロック>500ms及び1秒よりも長い間隔を探す
p.Count=min(p・MaxCount,p.Count+p.AnomalyLike);

if(p.LevelDiff<20)
p.Cout=0;%レベル差が低い場合にリセット
end

p.MicBlocked=p.Count>p.CountThreshold;

end
【0031】
スマートフォンのマイクロホンが機能しなくなる場合、信号は常にゼロ値を有する。いくつかの実施形態で、システム102は、マイクロホンによって生成された各信号についてゼロ値フレームの数のカウンタを保持する。システム102は、カウンタ値が特定の閾値(例えば、2秒で100フレーム)を超えるときにマイクロホンの不具合と結論を下し、マイクロホン不具合フラグを立てることができる。カウンタは、マイクロホンの不具合が直されるときにリセットされ得る。
【0032】
ときどき、スマートフォンは内蔵型マイクロホンに頼らずに、スマートフォンに接続されている完全ワイヤレスイヤホン(earbuds)に埋め込まれているマイクロホンに頼ることがある。完全ワイヤレスイヤホン、よって、マイクロホンは、スマートフォンに対して可変な位置を有することができる。スマートフォンに接続されている完全ワイヤレスイヤホンの一方を落とすか又はさもなれば置き忘れられる場合、落としたイヤホンが正しい位置に再配置されるまでバイノーラルシーンは不正確になる。いくつかの実施形態で、システム102は、イヤホンが落下しているか又は別なふうに動いているときに同じくイヤホンに埋め込まれている加速度計によって生成された信号に基づき、突然の落下などのイヤホンの置き違えを検出し、イヤホン落下フラグを立てる。具体的に、システム102は、加速度計によって生成された信号を受信し、イヤホンの加速度を決定することができる。他の実施形態で、システムは、同じくイヤホンに埋め込まれている骨振動センサによって生成された信号に基づき、イヤホンの置き違えを検出し、イヤホン置き違えフラグを立てる。具体的に、システム102は、骨振動センサによって生成された信号を受信し、耳の中の振動又は耳から外れることを決定することができる。
【0033】
4.1.2.環境異常検出
いくつかの実施形態で、システム102は、(異常が起きたオーディオデータの生成に関して)リアルタイムで、当業者に知られている既存の技術を用いて、ユーザが生成したオーディオコンテンツに存在する種々の種類の環境ノイズを検出する。システム102は、オーディオコンテンツにおいて、ノイズ(周囲、空室ノイズ、又は人間以外の他の源によって生成された任意の音響)のレベル又はシャープネス、推定される信号対雑音比(SNR)、音声のリバーブ又は拡散の推定量、あるいは、風、銃声、又は公共放送などで発生するノイズなどの特定の屋外ノイズの推定量を計算又は追跡することができる。システム102は更に、これらの追跡された値のいずれかが対応する閾値を超える場合に、ユーザが生成したオーディオコンテンツにおいて環境異常が発生していることを決定する。例えば、SNR推定では、検出された信号が10dBよりも低い場合、システム102は、環境異常が発生していると結論を下すことができる。決定に応答して、システム102は、環境異常フラグ、又はノイズのタイプの特有のフラグを立てることができる。
【0034】
4.1.3.音声異常検出
いくつかの実施形態で、システム102は、リアルタイムで、当業者に知られている既存の技術を用いて、ユーザが生成したオーディオコンテンツにおいて種々のタイプの音声特性を検出する。システム102は、オーディオコンテンツにおいて、音声レベルが低すぎるかどうか、音声レベルが高すぎたためにクリップされていること、又は音声が他の好ましくない属性を示すかどうかを決定又は追跡することができる。システム102はまた、リアルタイム評価のためのITU-T Rec. P.563などの非侵襲的な音声メトリクスも使用することができる。そのような非侵襲的な音声メトリクスは、信号が評価されるべき終点又は中間点での信号のみを必要とし、ユーザが生成したオーディオコンテンツに十分に適し得る。決定に応答して、システム102は、音声異常フラグ、又は音声の好ましくない属性に特有のフラグを立てることができる。
【0035】
4.2.ユーザが生成したオーディオコンテンツの質を高めるリアルタイムのリコメンデーション
いくつかの実施形態で、第4.1節で議論されているようにオーディオ異常フラグが立てられると、システム102は、(オーディオ異常が検出された時に対して)リアルタイムで、オーディオ異常フラグに基づいて、検出されたオーディオ異常のアラートをユーザデバイス又はユーザへ送る。アラートは、ユーザの注意を引くための方法であるか、又は実際にオーディオ異常について説明することができる。システムは、アラートとともに、又はアラートに対するユーザ応答を受信すると、追加情報を送ることができる。追加情報は、オーディオ異常の原因を取り除く方法、既に生成されたオーディオコンテンツの質を高める方法、又は正常な、異常のないオーディオコンテンツの将来の生成を可能にする方法に関するリコメンデーションを含むことができる。
【0036】
いくつかの実施形態で、システム102は、スマートフォンの画面によるアラートメッセージ提示などの、アラートメッセージの視覚表示を引き起こす。図4は、オーディオ異常のアラートを示すスマートフォンの画面の例を表す。この例で、システム102は、スマートフォンがオーディオデータを記録しているときに周囲ノイズが大きすぎることを検出している。従って、ユーザが生成したオーディオコンテンツにおけるオーディオ異常をユーザに知らせるために、スマートフォンの画面400にアラート402が即時に表示される。同様のアラートは、例えば、左のマイクロホンが遮られていること、風切り音が強すぎること、人の声が低すぎること、又は人の音声レベルがクリップされていること、などを示すために、検出された如何なるオーディオ異常についても表示され得る。
【0037】
いくつかの実施形態で、システム102は、スマートフォンのスピーカによるアラートメッセージの提示などの、アラートメッセージ聴覚再生を引き起こす。スマートフォンの画面に即時に表示され得る同じアラートメッセージが、スマートフォンのスピーカにより即時に再生され得る。完全なアラートメッセージの代わりに、又はそれに加えて、システム102はまた、オーディオ異常フラグの性質に依らないアラート信号の再生も引き起こすことができる。アラート信号の例には、ユーザの注意をひくための1つ以上の鋭いピープ音又は鳴動音がある。完全なアラートメッセージ若しくはアラート信号の代わりに、又はそれらに加えて、システム102は、オーディオ異常が起きたオーディオコンテンツの区間の再生を引き起こすことができる。例えば、記録を中止するようユーザに促すよう短いアラート信号又は完全なアラートメッセージを再生した後、システム102は、オーディオ異常の更なる理解をユーザにもたらすために、オーディオ異常が起きたオーディオコンテンツの区間の再生を続けることができる。
【0038】
いくつかの実施形態で、オーディオ異常のアラートを送ることに代えて、又はそれに加えて、システム102は、(オーディオ異常の検出に関して)リアルタイムでオーディオ異常を処理するためのリコメンデーションを送るか、又はリコメンデーションを自動的に実施する。各リコメンデーションは、先と同じく、少なくとも視覚的又は聴覚的に送られ得る。例えば、オーディオ異常の最初のアラートが表示されたスマートフォンの同じ画面に、オーディオ異常を処理するためのリコメンデーションの説明が表示され得る。代替的に、リコメンデーションを見るための選択肢を同じ画面に表示することができ、選択肢の選択に応答して、リコメンデーションの説明を別の画面に表示することができる。別の例として、アラートメッセージは、リコメンデーションを聞くためのユーザへのリクエストの有無によらず、スマートフォンのスピーカで再生され得る。次いで、システム102は、リクエストに含まれる音声プロンプト、又は「もっと教えてください」などのデフォルトの音声プロンプトを聞き、リコメンデーションの説明を再生させることができる。
【0039】
いくつかの実施形態で、オーディオ異常がマイクロホンに関係する場合、システム102は、オーディオ異常の原因を取り除いたり又は正常なオーディオコンテンツの将来の生成を可能にしたりするための様々な動作を薦めることができる。マイクロホンのオクルージョン又は機能不良が検出される場合に、オーディオ異常を処理するためのリコメンデーションは、マイクロホンを特定し、マイクロホンに対する障害物の除去又は修理をユーザに要求するメッセージを含むことができる。機能不良は、例えば、電力の不足に起因する可能性がある。マイクロホン又はイヤホンの置き違えが検出される場合、リコメンデーションは、同様に、イヤホンを特定し、イヤホンを置き直すようユーザに要求するメッセージを含むことができる。高音の連続などのアラート信号を、落としたイヤホンで再生することもでき、ユーザがどのイヤホンを落としたかを認識し、それを然るべく再配置することが期待されるとき、リコメンデーションは不要であり得る。
【0040】
いくつかの実施形態で、システム102はまた、既に生成されたオーディオコンテンツの質を高めるための様々な動作を薦めることもできる。マイクロホンのオクルージョン又は置き違えが検出される場合、システム102は、オクルージョンの量(マイクロホンは完全には遮られていないと仮定)又は置き違えの位置に基づいて、既に生成されたオーディオコンテンツを調整する量及び方法を決定することができる。オーディオ異常を処理するためのリコメンデーションは、その場合に、特定の量及び方法で調整を行うというメッセージを含むことができる。システム102はまた、閉塞されたマイクロホンによって記録されたオーディオコンテンツを、閉塞されていなかった他のマイクロホンによって記録されたオーディオコンテンツで置換することを薦めることもできる。システム102は、既に生成されたオーディオコンテンツの質を自動的に又はユーザ入力に基づいて特定の時点で高めるためのリコメンデーションを実施することができる。
【0041】
いくつかの実施形態で、オーディオ異常が環境(部屋又は屋外であることができる。)に関係する場合、システム102は、オーディオ異常の原因を取り除いたり又は正常なオーディオコンテンツの将来の生成を可能にしたりするための様々な動作を薦めることができる。第1閾値よりも大きいノイズレベルが検出される場合に、又は第2閾値よりも大きいSNRが検出される場合に、オーディオ異常を処理するためのリコメンデーションは、音響記録セットアップの少なくとも一部を移動すること、又はシステム102によって実施される特定のオーディオ処理機能をオンすることを含むことができる。オーディオ処理機能は、当業者に知られている既存のノイズ抑制技術を含むことができる。
【0042】
いくつかの実施形態で、オンされるべきオーディオ処理機能は、検出されたノイズのタイプに依存することもできる。ノイズは、音楽再生、鳥のさえずり、犬の鳴き声、空調振動、風の吹き込み、アンプ放送、又は他の予期せぬ環境事象に由来する可能性があり、ノイズはまた、反射により生じる可能性もある。検出されたノイズのタイプに特有のノイズ抑制技術がその場合に適用され得る。例えば、RT60で表したリバーブ時間、直接残響比(DRR)で表したリバーブ効果、又は推定された音の拡散レベルが夫々の閾値を超え、屋内環境に強い残響又は反射があることを示している場合、リコメンデーションは、リバーブ抑制技術をオンすること、又はマイクロホンを対象の話者の近くに移動することを含むことができる。
【0043】
いくつかの実施形態で、ノイズが予期せぬ事象に由来する場合、ユーザは、ノイズに関連した潜在的な危険を認識していないことがある。例えば、はるか後方から急接近する車からブーブーという音が聞こえたり、あるいは、少し離れたところから発砲した音が同様に他の音のプールに埋もれていたりすることがある。このようなタイプのノイズが検出される場合、リコメンデーションは、記録を停止し、現在の場所から直ちに離れるようにというメッセージを含むことができる。更に、ノイズが予期せぬ事象に由来する場合、システム102は、ノイズが大きすぎて使用可能なオーディオコンテンツを生成できないが、短時間内に終了する、と自動的に判断することができる。その場合、リコメンデーションは、記録を一時停止することであることができる。例えば、公共放送が行われていることが検出される場合、又はスプリンクラーが作動している場合、そのようなノイズの終了が検出されるまで、ユーザの確認に応答して、記録は自動的に一時停止され得る。
【0044】
いくつかの実施形態で、システム102は、既に生成されたオーディオコンテンツの質を高めるための様々な動作も薦めることができる。環境異常の検出に応答して生成されるオーディオコンテンツのリアルタイムの処理で使用される同じノイズ抑制技術が、既に生成されたオーディオコンテンツに適用され得る。よって、オーディオ異常を処理するためのリコメンデーションは、特定のノイズ抑制技術を適用するというメッセージを含むことができる。システム102は、既に生成されたオーディオコンテンツの質を自動的に又はユーザ入力に基づいて特定の時点で高めるためのリコメンデーションを実施することができる。
【0045】
いくつかの実施形態で、オーディオ異常が人間の声に関係する場合、システム102は、オーディオ異常の原因を取り除いたり又は正常なオーディオコンテンツの将来の生成を可能にしたりするための様々な動作を薦めることができる。第1閾値よりも低い音声レベルが検出される場合に、リコメンデーションは、音声を特定の範囲まで上げることを含むことができる。同様に、第2閾値よりも低い音声レベルが検出される場合に、第2閾値は、マイクロホンに関連したクリッピング閾値であることができ、リコメンデーションは、音声を特定の範囲まで下げることを含むことができる。同様に、前もってセットされた標準を満足しない何らかの音声品質指標が検出される場合に、リコメンデーションは、音声品質を高めるよう特定の方法で音声を調整すること、例えば、ユーザにささやいたり叫び始めたりするよう要求すること、を含むことができる。
【0046】
いくつかの実施形態で、システム102はまた、既に生成されたオーディオコンテンツの質を高めるための様々な動作も薦めることができる。音声異常の検出に応答して生成されるオーディオコンテンツのリアルタイムの処理で使用される同じ音声調整技術が、既に生成されたオーディオコンテンツに適用され得る。よって、リコメンデーションは、特定の音声調整技術を適用するというメッセージを含むことができる。システム102は、既に生成されたオーディオコンテンツの質を自動的に又はユーザ入力に基づいて特定の時点で高めるためのリコメンデーションを実施することができる。
【0047】
いくつかの実施形態で、システム102は、ユーザが生成したオーディオコンテンツをリアルタイムでモニタし、検出された任意のオーディオ異常が解消されて、その時点でシステム102がオーディオ異常フラグをクリアすることができるまで、アラート又はリコメンデーションの繰り返しの提示を引き起こし続ける。オーディオ異常フラグをクリアすることは、一般的に、オーディオ異常の記録された説明を見つけ、オーディオ異常の発生の終了時間を更に記録することを意味する。例えば、システム102は、イヤホンが適切に再配置されるまでイヤホンの位置を追跡したり、ノイズ抑制技術が適用されるまでノイズレベルを追跡したり、又は音声レベルが正常範囲に戻るまで音声レベルを追跡したりすることができる。
【0048】
いくつかの実施形態で、オーディオ異常がリアルタイムで解消されている間、システム102は、既に生成されたオーディオコンテンツの扱い方、又はオーディオコンテンツの将来の生成の進め方を決定することができる。システム102は、オーディオ異常が解消されるまで更なる生成を無効化すること、又はそのような無効化を承認するようユーザに要求すること自動的に行うことができる。システム102は、オーディオ異常が発生し始めた時点から何が起こったかを再現するようユーザに要求し、そして、オーディオ異常の発生に対応するオーディオコンテンツの区間の削除を承認するようユーザに要求することができる。オーディオコンテンツの区間は、削除を承認すべきかどうかをユーザが判断するのを助けるために、叙述されたように、再生され得る。
【0049】
4.3.ユーザが生成したオーディオコンテンツの後処理
いくつかの実施形態で、ユーザが生成したオーディオコンテンツの再生において、システム102は、表示デバイスで提示されるグラフィカルユーザインターフェース(GUI)を生成することができる。GUIは、時間軸に沿った波形のパネルなどの、ユーザが生成したオーディオコンテンツの表示を含み得る。GUIは、オーディオ異常フラグの発生及びクリアに基づいてオーディオコンテンツのグラフィック表現へのオーディオ異常情報のオーバーレイを更に含み得る。オーディオ異常情報は、いつ異常の発生が開始又は終了したか、オーディオ異常のタイプ、オーディオコンテンツにおけるオーディオ異常を処理するためのリコメンデーション、リコメンデーションが実施されたかどうか、などを示すことができる。リコメンデーションは、オーディオ異常の発生に対応するオーディオコンテンツの区間を削除することを含むことができる。リコメンデーションの表現は選択可能であることができ、システム102は、選択を受け取るとリコメンデーションを実施することができる。GUIはまた、全てのリコメンデーションを実施するというオプションも含むことができ、システム102は、質を高められたオーディオコンテンツを生成し、その質を高められたオーディオコンテンツの更新された表示を引き起こすために、調べられているユーザが生成したオーディオコンテンツにおいて全てのリコメンデーションを実施することができる。
【0050】
5.例となるプロセス
図5は、本明細書で記載されるいくつかの実施形態に係るオーディオ管理コンピュータシステムにより実行されるプロセスの例を表す。図5は、明りょうな例示のために、簡略化された概略的形態で示されており、他の実施形態は、様々な様式で接続されているより多い、より少ない、又は異なる要素を含んでもよい。図5は、実行される場合に、本明細書で記載される機能的な改善及び技術的利点の実行を引き起こす1つ以上のコンピュータプログラム又は他のソフトウェア要素を実施するために使用できるアルゴリズム、プラン、又はアウトラインを開示するよう夫々意図されている。更に、本願のフロー図は、当業者が自身の蓄積した技術及び知識を用いてコード化又は実施するつもりであるソフトウェアプログラムの基礎を形成するアルゴリズム、プラン、又は仕様に関して互いに通信するために使用するのと同程度の詳細で記載される。
【0051】
いくつかの実施形態で、ステップ502で、システム102は、リアルタイムで、第1モバイルデバイスによって生成されたオーディオデータを受け取るようプログラムされる。第1モバイルデバイスは、1つ以上の内蔵型マイクロホンを備えたスマートフォンであることができる。
【0052】
いくつかの実施形態で、ステップ504で、システム102は、リアルタイムで、オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常のうちのあるタイプのオーディオ異常の発生の開始を検出するようプログラムされる。
【0053】
いくつかの実施形態で、ステップ506で、システム102は、リアルタイムで、発生のアラートを第2デバイスへ伝えるようプログラムされ、アラートは、あるタイプのオーディオ異常の発生に注意を向けるもの又は発生について説明するものである。伝えることは、あるタイプのオーディオ異常の発生の一部分を含むオーディオコンテンツを削除するよう要請することを含むことができる。
【0054】
いくつかの実施形態で、システム102は、アラートを視覚形態で画面に表示するか又は聴覚形態でスピーカで再生するようプログラムされ、画面又はスピーカは、第2デバイスに含まれるか又は第2デバイスに結合されている。
【0055】
いくつかの実施形態で、マイクロホン異常は、第1モバイルデバイスに含まれるか又は第1モバイルデバイスに結合されているマイクロホンのオクルージョン(occlusion)、機能不良(malfunction)、又は置き違え(misplacement)によって引き起こされ、発生は、マイクロホン異常の発生である。システム102は、現在時間に至るまでの期間にわたって、第1モバイルデバイスに含まれるか又は第1モバイルデバイスに結合されている各マイクロホンからの信号の高周波数成分を特定し、各マイクロホンからの信号の振幅値を決定するか、あるいは、各マイクロホンに含まれるか又は各マイクロホンに結合されている加速度センサ又は骨振動センサから測定値を受け取るようプログラムされる。システム102は、マイクロホン異常の発生を停止するリコメンデーションを更に送信するようプログラムされ、リコメンデーションは、発生の源としてのマイクロホンを特定し、そのマイクロホンに対する障害物の除去(unblocking)、修理(repairing)、又は再配置(repositioning)を指示することを含む。
【0056】
いくつかの実施形態で、複数タイプのオーディオ異常は、非人的源からのバックグラウンドノイズ又は反射によって引き起こされる環境異常を更に含み、発生は、環境異常の発生である。システム102は、環境異常の発生を停止するリコメンデーションを送信するようプログラムされ、リコメンデーションは、第1モバイルデバイスによって実装されているノイズ抑制機能をオンすることを含む。
【0057】
いくつかの実施形態で、複数タイプのオーディオ異常は、録音された音声(voice)の特定の品質指標の低い値によって表される音声異常を更に含み、特定の品質指標は、ボリューム又はシャープネスを含み、発生は、音声異常の発生である。システム102は、音声異常の発生を停止するリコメンデーションを送信するようプログラムされ、リコメンデーションは、特定の品質指標の品質指標の値を改善するよう話者の音声を調整することを含む。
【0058】
いくつかの実施形態で、システム102は、リアルタイムで、あるタイプのオーディオ異常の発生を停止するための救済的なアプローチを実施すること、又は救済的なアプローチを実施するよう要請することを更に引き起こすようプログラムされる。いくつかの実施形態で、システム102は、リアルタイムで、あるタイプのオーディオ異常の発生の終了が検出されるかどうかを連続的に決定し、リアルタイムで、発生の終了が検出されるまで、第1モバイルデバイスによるオーディオコンテンツの生成を無効化するようプログラムされる。
【0059】
いくつかの実施形態で、システム102は、時間軸に沿ったオーディオデータのグラフィック表現を表示し、グラフィック表現に異常情報をオーバーレイするようプログラムされ、異常情報は、あるタイプのオーディオ異常の発生について説明するものであり、あるタイプのオーディオ異常の発生を表現しているグラフィック表現の部分の上に示される。いくつかの実施形態で、オーバーレイは選択可能であることができ、異常情報は、オーディオデータの質を高めるよう、あるタイプのオーディオ異常の発生を解決するためのリコメンデーションを示すことができる。システム102は、オーバーレイの選択を受け取り、質を高められたオーディオデータを得るようリコメンデーションを実施するようプログラムされる。
【0060】
6.ハードウェア実施
一実施形態に従って、本明細書で記載されている技術は、少なくとも1つのコンピューティングデバイスによって実施される。技術は、全体として又は部分的に、パケットデータネットワークなどのネットワークを用いて結合されている少なくとも1つのサーバコンピュータ及び/又は他のコンピューティングデバイスの組み合わせを用いて実施されてもよい。コンピューティングデバイスは、技術を実行するようハードワイヤ接続されてもよく、あるいは、技術を実行するよう持続的にプログラムされている少なくとも1つの特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子デバイスを含んでもよく、あるいは、ファームウェア、メモリ、他のストレージ、又は組み合わせにおけるプログラム命令に従って技術を実行するようプログラムされた少なくとも1つの汎用ハードウェアプロセッサを含んでもよい。そのようなコンピューティングデバイスは、カスタムハードワイヤードロジック、ASIC、又はFPGAをカスタムプログラミングと組み合わせて、記載されている技術を達成してもよい。コンピューティングデバイスは、サーバコンピュータ、ワークステーション、パーソナルコンピュータ、ポータブルコンピュータシステム、ハンドヘルドデバイス、モバイルコンピューティングデバイス、ウェアラブルデバイス、身体装着型又は埋め込み型デバイス、スマートフォン、スマート家電、インターネットワーキングデバイス、ロボット又は無人地上若しくは航空車両などの自律型又は準自律型デバイス、記載されている技術を実施するようハードワイヤード及び/又はプログラムロジックを組み込む任意の他のデバイス、データセンター内の1つ以上の仮想コンピューティングマシン又はインスタンス、及び/又はサーバコンピュータ及び/又はパーソナルコンピュータのネットワークであってもよい。
【0061】
図6は、実施形態が実施され得るコンピュータシステムの例を表すブロック図である。図6の例で、開示されている技術をハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの組み合わせで実施するコンピュータシステム600及び命令は、コンピュータアーキテクチャ及びコンピュータシステムの実施に関してやりとりするために本開示が関係している技術において通常の知識を有する者によって広く使用されているのと同程度の詳細で、例えばボックス及びサークルで、概略的に提示されている。
【0062】
コンピュータシステム600は、電子信号パスを介してコンピュータシステム600のコンポーネント間で情報及び/又は命令をやりとりするためのバス及び/又は他の通信メカニズムを含み得る入力/出力(I/O)サブシステム602を含む。I/Oサブシステム602は、I/Oコントローラ、メモリコントローラ、及び少なくとも1つのI/Oポートを含み得る。電子信号パスは、例えば直線、単方向の矢印、又は双方向の矢印として、図面に概略的に提示されている。
【0063】
少なくとも1つのハードウェアプロセッサ604が、情報及び命令を処理するためにI/Oサブシステム602に結合されている。ハードウェアプロセッサ604は、例えば、汎用マイクロプロセッサ若しくはマイクロコントローラ、及び/又は埋め込みシステム若しくはグラフィクス処理ユニット(GPU)若しくはデジタル信号プロセッサ若しくはARMプロセッサなどの特別目的のマイクロプロセッサを含んでもよい。プロセッサ604は、集積算術ロジックユニット(ALU)を有してもよく、あるいは、別個のALUに結合されてもよい。
【0064】
コンピュータシステム600は、プロセッサ604によって実行されるデータ及び命令を電子的にデジタルで記憶するためにI/Oサブシステム602に結合されている、メインメモリなどのメモリ606の1つ以上のユニットを含む。メモリ606は、様々な形態のランダムアクセスメモリ(RAM)又は他の動的記憶デバイスなどの揮発性メモリを含んでもよい。メモリ606はまた、プロセッサ604によって実行される命令の実行中に一時変数又は他の中間情報を記憶するためにも使用されてよい。そのような命令は、プロセッサ604がアクセスできる非一時的なコンピュータ可読記憶媒体に記憶されている場合に、コンピュータシステム600を、命令において指定された動作を実行するようカスタマイズされている特別目的のマシンにならしめることができる。
【0065】
コンピュータシステム600は、プロセッサ604のための情報及び命令を記憶するためにI/Oサブシステム602に結合されている、リードオンリーメモリ(ROM)608又は他の静的記憶デバイスなどの不揮発性メモリを更に含む。ROM608は、消去可能PROM(EPROM)又は電気的消去可能PROM(EEPROM)などの様々な形態のプログラマブルROM(PROM)を含み得る。永続ストレージ610のユニットは、FLASHメモリなどの様々な形態の不揮発性RAM(NVRAM)、又はソリッドステートストレージ、磁気ディスク若しくはCD-ROMやDVD-ROMなどの光ディスクを含んでもよく、情報及び命令を記憶するためにI/Oサブシステム602に結合され得る。ストレージ610は、プロセッサ604によって実行される場合に、本明細書の技術を実行するようコンピュータ実装方法の実行を引き起こす命令及びデータを記憶するために使用され得る非一時的なコンピュータ可読媒体の一例である。
【0066】
メモリ606、ROM608又はストレージ610内の命令は、モジュール、メソッド、オブジェクト、関数、ルーチン、又は呼び出しとして体系化されているひと組以上の命令を有し得る。命令は、1つ以上のコンピュータプログラム、オペレーティングシステムサービス、又はモバイルアプリケーションを含むアプリケーションプログラムとして体系化され得る。命令は、オペレーティングシステム及び/又はシステムソフトウェア;マルチメディア、プログラミング又は他の機能をサポートする1つ以上のライブラリ;TCP/IP、HTTP又は他の通信プロトコルを実装するためのデータプロトコル命令又はスタック;HTML、XML、JPEG、MPEG又はPNGを用いてコード化されているファイルを解釈及びレンダリングするためのファイルフォーマット処理命令;グラフィカルユーザインターフェース(GUI)、コマンドラインインターフェース又はテキストユーザインターフェースのためのコマンドをレンダリング又は解釈するためのユーザインターフェース命令;オフィススイート、インターネットアクセスアプリケーション、設計及び製造アプリケーション、グラフィクスアプリケーション、オーディオアプリケーション、ソフトウェアエンジニアリングアプリケーション、教育アプリケーション、ゲーム又はその他アプリケーションなどのアプリケーションソフトウェアを有してもよい。命令は、ウェブサーバ、ウェブアプリケーションサーバ又はウェブクライアントを実施してもよい。命令は、構造化されたクエリ言語(SQL)若しくはNoSQL、オブジェクトストア、グラフデータベース、フラットファイルシステム、又は他のデータストレージを使用する関係データベースシステムなどの、プレゼンテーションレイヤ、アプリケーションレイヤ及びデータストレージレイヤとして体系化されてもよい。
【0067】
コンピュータシステム600は、I/Oサブシステム602を介して少なくとも1つの出力デバイス612に結合され得る。一実施形態で、出力デバイス612はデジタルコンピュータディスプレイである。様々な実施形態で使用され得るディスプレイの例には、タッチスクリーンディスプレイ又は発光ダイオード(LED)ディスプレイ又は液晶ディスプレイ(LCD)又は電子ペーパーディスプレイがある。コンピュータシステム600は、代替的に、又はディスプレイデバイスに加えて、他のタイプの出力デバイス612を含んでもよい。他の出力デバイス612の例には、プリンタ、チケットプリンタ、プロッタ、プロジェクタ、サウンドカード又はビデオカード、スピーカ、ブザー若しくは圧電デバイス又は他の音響デバイス、ランプ又はLED又はLCDインジケータ、ハプティックデバイス、アクチュエータ又はサーボがある。
【0068】
少なくとも1つの入力デバイス614は、信号、データ、コマンド選択又はジェスチャをプロセッサ604へ送るために、I/Oサブシステム602に結合されている。入力デバイス614の例には、タッチスクリーン、マイクロホン、静止デジタルカメラ及びビデオデジタルカメラ、英数字キー及び他のキー、キーパッド、キーボード、グラフィクスタブレット、画像スキャナ、ジョイスティック、クロック、スイッチ、ボタン、ダイヤル、スライド、及び/又は力センサ、動きセンサ、熱センサ、加速度計、ジャイロスコープ、及び慣性計測装置(IMU)センサなどの様々なタイプのセンサ、及び/又はセルラー若しくはWi-Fiなどのワイヤレストランシーバ、無線周波数(RF)トランシーバ、又は赤外線(IR)トランシーバ及びグローバルポジショニングシステム(GPS)トランシーバなどの様々なタイプのトランシーバがある。
【0069】
他のタイプの入力デバイスはコントロールデバイス616であり、これは、入力機能に代えて又はそれに加えて、ディスプレイ画面上のグラフィカルインターフェースなどのナビゲーションなどのカーソル制御または他の自動化された制御機能を実行し得る。コントロールデバイス616は、直接的な情報及びコマンドの選択をプロセッサ604へ送り、かつ、ディスプレイ612でのカーソル移動を制御するためのタッチパッド、マウス、トラックボール、又はカーソル方向キーであってもよい。入力デバイスは、平面内の位置を指定することをデバイスに可能にする2つの軸(第1軸(例えば、x)及び第2軸(例えば、y))における少なくとも2自由度を有し得る。他のタイプの入力デバイスは、ジョイスティック、ワンド、コンソール、ステアリングホイール、ペダル、ギアシフトメカニズム、又は他のタイプのコントロールデバイスなどの有線式、無線式、又は光学式コントロールデバイスである。入力デバイス614は、ビデオカメラ及びデプスセンサなどの多種多様な入力デバイスの組み合わせを含んでもよい。
【0070】
他の実施形態では、コンピュータシステム600は、出力デバイス612、入力デバイス614、及びコントロールデバイス616のうちの1つ以上が省略され得るインターネット・オブ・シングス(IoT)デバイスを有してもよい。あるいは、かような実施形態で、入力デバイス614は、1つ以上のカメラ、動き検出器、温度計、マイクロホン、地震検出器、他のセンサ又は検出器を有してもよく、出力デバイス612は、単列LED又はLCDディスプレイ、1つ以上のインジケータ、ディスプレイパネル、メーター、バルブ、ソレノイド、アクチュエータ又はサーボなどの特別目的のディスプレイを有してもよい。
【0071】
コンピュータシステム600がモバイルコンピューティングデバイスであるとき、入力デバイス614は、複数のGPS衛星に対して三角測量を行い、コンピュータシステム600の地理的位置について緯度経度値などのジオロケーション又は位置データを決定及び生成することができるGPSモジュールに結合されたグローバルポジショニングシステム(GPS)受信器を有しもてよい。出力デバイス612は、ホスト624又はサーバ630の方に向けられて、単独で又は他のアプリケーション特有のデータと組み合わせて、コンピュータシステム600の位置を指定する位置報告パケット、通知、脈拍若しくは心拍信号、又は他のリカーリング(recurring)データ伝送を発生させるためのハードウェア、ソフトウェア、ファームウェア及びインターフェースを含んでもよい。
【0072】
コンピュータシステム600は、カスタマイズされたハードワイヤードロジック、少なくとも1つのASIC若しくはFPGA、ロードされ、コンピュータシステムと組み合わせて使用又は実行されるときに、コンピュータシステムを特別目的のマシンとして動作させるファームウェア及び/又はプログラムロジックを用いて、本明細書で記載されている技術を実施し得る。一実施形態に従って、本明細書で記載されている技術は、プロセッサ604がメインメモリ606に収容されている少なくとも1つの命令の少なくとも1つのシーケンスを実行することに応答して、コンピュータシステム600によって実行される。そのような命令は、ストレージ610などの他の記憶媒体からメインメモリ606に読み込まれてもよい。メインメモリ606に収容されている命令のシーケンスの実行は、プロセッサ604に、本明細書で記載されているプロセスステップを実行させる。代替の実施形態では、ハードワイヤ接続された回路が、ソフトウェア命令の代わりに又はそれとともに使用されてもよい。
【0073】
本明細書で使用される「記憶媒体」という用語は、マシンを特定の方法で動作させるデータ及び/又は命令を記憶する任意の非一時的な媒体を指す。そのような記憶媒体には、不揮発性媒体及び/又は揮発性媒体が含まれ得る。不揮発性媒体には、例えば、ストレージ610などの光又は磁気ディスクが含まれる。揮発性媒体には、メインメモリ606などの動的メモリが含まれる。記憶媒体の共通する形態には、例えば、ハードディスク、ソリッドステートドライブ、フラッシュドライブ、磁気テープ記憶媒体、任意の光学又は物理データ記憶媒体、メモリチップ、などがある。
【0074】
記憶媒体は、伝送媒体とは異なるものであるか、それとともに使用されてもよい。伝送媒体は、記憶媒体間で情報を転送することに関与する。例えば、伝送媒体には、I/Oサブシステム602のバスを有する配線を含め、同軸ケーブル、銅線、及び光ファイバが含まれる。伝送媒体はまた、電波又は赤外線データ通信の間に生成されるもののような音波又は光波の形をとることもできる。
【0075】
様々な形式の媒体が、少なくとも1つの命令の少なくとも1つのシーケンスを実行のためにプロセッサ604に搬送することに関与し得る。例えば、命令は最初に、遠隔のコンピュータの磁気ディスク又はソリッドステートドライブで担持され得る。遠隔のコンピュータは命令をその動的メモリにロードし、モデムを使用して光ファイバ又は同軸ケーブル又は電話回線などの通信リンクを経由して命令を送信することができる。コンピュータシステム600にローカルなモデム又はルータは、通信リンク線上のデータを受信し、コンピュータシステム600によって読み出されるようデータを変換することができる。例えば、無線周波数アンテナ又は赤外線検出器などの受信器が、無線又は光信号で運ばれたデータを受信することができ、適切な回路が、バス上にデータを置くなどして、データをI/Oサブシステム602に供給することができる。I/Oサブシステム602はデータをメモリ606に運び、プロセッサ604はそこから命令を取り出して実行する。メモリ606によって受信された命令は、任意に、プロセッサ604による実行の前又は後のいずれかにストレージ610に記憶されてもよい。
【0076】
コンピュータシステム600は、バス602に結合されている通信インターフェース618も含む。通信インターフェース618は、ネットワーク622又はインターネット上のパブリック若しくはプライベートクラウドなどの少なくとも1つの通信ネットワークに直接的又は間接的に接続されているネットワークリンク620への双方向データ通信結合を提供する。例えば、通信インターフェース618は、Ethernet(登録商標)ネットワーキングインターフェース、サービス統合デジタルネットワーク(ISDN)カード、ケーブルモデム、衛星モデム、又は対応するタイプの通信リンク、例えば、Ethernetケーブル又は任意の種類の金属ケーブル又は光ファイバ回線若しくは電話回線へのデータ通信接続を提供するモデムであってよい。ネットワーク622は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、キャンパスネットワーク、インターネットワーク、又はこれらの任意の組み合わせを広く表している。通信インターフェース618は、互換性のあるLANへのデータ通信接続を提供するLANカード、又はセルラー無線電話ワイヤレスネットワーキング標準に従ってセルラーデータを送信若しくは受信するよう配線されているセルラー無線電話インターフェース、又は衛星ワイヤレスネットワーキング標準に従ってデジタルデータを送信若しくは受信するよう配線されている衛星無線インターフェースを有してもよい。かような実施のいずれでも、通信インターフェース618は、様々なタイプの情報を表すデジタルデータストリームを搬送する信号パス上で電気信号、電磁信号、又は光信号を送受信する。
【0077】
ネットワークリンク620は、通常、例えば衛星、セルラー、Wi-Fi、又はBluetooth(登録商標)技術を用いて、直接的に又は少なくとも1つのネットワークを介して他のデータデバイスへの電気、電磁、又は光データ通信を提供する。例えば、ネットワークリンク620は、ネットワーク622を介してホストコンピュータ624への接続を提供し得る。
【0078】
更に、ネットワークリンク620は、ネットワーク622を通る接続、あるいは、インターネットワーキングデバイス及び/又はインターネットサービスプロバイダ(ISP)626によって作動するコンピュータを経由した他のコンピューティングデバイスへの接続を提供し得る。ISP626は、インターネット628として表されている世界規模のパケットデータ通信ネットワークを通じてデータ通信サービスを提供する。サーバコンピュータ630がインターネット628へ結合されてもよい。サーバ630は、ハイパーバイザ、又はDOCKER若しくはKUBERNETESなどのコンテナ化されたプログラムシステムを実行するコンピュータがあろうとなかろうと、任意のコンピュータ、データセンター、仮想マシン又は仮想コンピューティングインスタンスを広く表している。サーバ630は、1よりも多いコンピュータ又はインスタンスを用いて実装され、ウェブサービス要求、HTTPペイロード内にパラメータを含むユニフォームリソースロケータ(URL)ストリング、APIコール、アプリケーションサービスコール、又は他のサービスコールを伝送するによってアクセス及び使用される電子デジタルサービスを表し得る。コンピュータシステム600及びサーバ630は、タスクを実行するよう又はアプリケーション若しくはサービスを実行するよう協働する他のコンピュータ、プロセッシングクラスタ、サーバファーム又はコンピュータの他の編成を含む分散コンピューティングシステムの要素を形成し得る。サーバ630は、モジュール、メソッド、オブジェクト、関数、ルーチン、又は呼び出しとして体系化されているひと組以上の命令を有してもよい。命令は、1つ以上のコンピュータプログラム、オペレーティングシステムサービス、又はモバイルアプリケーションを含むアプリケーションプログラムとして体系化され得る。命令は、オペレーティングシステム及び/又はシステムソフトウェア;マルチメディア、プログラミング又は他の機能をサポートする1つ以上のライブラリ;TCP/IP、HTTP又は他の通信プロトコルを実装するためのデータプロトコル命令又はスタック;HTML、XML、JPEG、MPEG又はPNGを用いてコード化されているファイルを解釈及びレンダリングするためのファイルフォーマット処理命令;グラフィカルユーザインターフェース(GUI)、コマンドラインインターフェース又はテキストユーザインターフェースのためのコマンドをレンダリング又は解釈するためのユーザインターフェース命令;オフィススイート、インターネットアクセスアプリケーション、設計及び製造アプリケーション、グラフィクスアプリケーション、オーディオアプリケーション、ソフトウェアエンジニアリングアプリケーション、教育アプリケーション、ゲーム又はその他アプリケーションなどのアプリケーションソフトウェアを有してもよい。サーバ630は、構造化されたクエリ言語(SQL)若しくはNoSQL、オブジェクトストア、グラフデータベース、フラットファイルシステム、又は他のデータストレージを使用する関係データベースシステムなどの、プレゼンテーションレイヤ、アプリケーションレイヤ及びデータストレージレイヤをホストするウェブアプリケーションサーバを有してもよい。
【0079】
コンピュータシステム600は、ネットワーク、ネットワークリンク620、及び通信インターフェース618を介して、メッセージを送信し、プログラムコードを含むデータ及び命令を受信することができる。インターネットの例では、サーバ630は、アプリケーションプログラムに対して要求されたコードを、インターネット628、ISP626、ローカルネットワーク622、及び通信インターフェース618を介して伝送してもよい。受信されたコードは、それが受信されると、プロセッサ604によって実行され、及び/又は後で実行するためにストレージ610若しくは他の不揮発性ストレージに記憶されてもよい。
【0080】
この項で記載されている命令の実行は、実行されており、プログラムコード及びその現在のアクティビティから成るコンピュータプログラムのインスタンスの形式でプロセスを実装することができる。オペレーティングシステム(OS)によっては、プロセスは、命令を同時に実行する複数の実行スレッドで構成される場合がある。この文脈では、コンピュータプログラムは命令の受動的なコレクションであり、一方で、プロセスはそれらの命令の実際の実行であることができる。複数のプロセスが同じプログラムに関連付けられている場合があり、例えば、同じプログラムの複数のインスタンスを開くということは、1よりも多いプロセスが実行されていることをしばしば意味する。複数のプロセスがプロセッサ604を共有できるように、マルチタスクが実装されることがある。各プロセッサ604又はプロセッサのコアが一度に単一のタスクを実行するとき、コンピュータシステム600は、各タスクの終了を待つことなく、各プロセッサが実行中のタスク間を切り替えることができるようにマルチタスクを実装するようプログラムされ得る。実施形態で、切り替えは、タスクが入出力操作を実行する場合に、タスクが切り替え可能であることを示す場合に、又はハードウェア割り込み時に、実行され得る。タイムシェアリングを実装すると、コンテキストの切り替えを迅速に実行して、複数のプロセスが同時に実行されているように見せることで、対話型ユーザアプリケーションの高速な応答が可能になる。実施形態で、安全性及び信頼性のために、オペレーティングシステムは、独立したプロセス間の直接通信を防止し、厳密に仲介及び制御されたプロセス間通信機能を提供することができる。
【0081】
7.拡張及び代案
前述の明細書では、本発明の実施形態を、実装ごとに異なる可能性がある多くの特定の詳細を参照して説明してきた。従って、明細書及び図面は、限定の意味ではなく、例示として見なされる。本開示の範囲及び本開示の範囲であるよう出願人によって意図されているものの唯一かつ排他的な指標は、本願から発表される一連の特許請求の範囲が発表する、その後の修正も含む特定の形式で、そのような特許請求の範囲の文字通りの同等な範囲である。
【0082】
本発明の様々な態様は、以下の例示的な実施形態の列挙(enumerate example embodiments)(EEE)から認識され得る。
【0083】
EEE1.
1つ以上のコンピューティングデバイスによって実行される場合に、ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタする方法の実行を引き起こす命令を記憶する1つ以上の非一時記憶媒体であって、
前記方法は、
リアルタイムで、第1モバイルデバイスによって生成されたオーディオデータを受け取ることと、
リアルタイムで、前記オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常の中のあるタイプのオーディオ異常の発生の開始を検出することと、
リアルタイムで、前記発生のアラートを第2デバイスへ伝えることであり、前記アラートは、前記あるタイプのオーディオ異常の前記発生に注意を向けるもの又は前記発生について説明するものである、ことと
を有する、1つ以上の非一時記憶媒体。
【0084】
EEE2.
前記第1モバイルデバイスは、1つ以上の内蔵式マイクロホンを備えたスマートフォンである、
EEE1に記載の1つ以上の非一時記憶媒体。
【0085】
EEE3.
前記伝えることは、前記アラートを視覚形態で画面に表示するか又は聴覚形態でスピーカで再生することを含み、
前記画面又は前記スピーカは、前記第2デバイスに含まれるか又は前記第2デバイスに結合されている、
EEE1又は2に記載の1つ以上の非一時記憶媒体。
【0086】
EEE4.
前記マイクロホン異常は、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されているマイクロホンのオクルージョン、機能不良、又は置き違えによって引き起こされ、
前記発生は、マイクロホン異常の発生である、
EEE1~3のいずれかに記載の1つ以上の非一時記憶媒体。
【0087】
EEE5.
前記検出することは、現在時間に至るまでの期間にわたって、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されている各マイクロホンからの信号の高周波数成分を特定すること、各マイクロホンからの前記信号の振幅値を決定すること、あるいは、各マイクロホンに含まれるか又は各マイクロホンに結合されている加速度センサ又は骨振動センサから測定値を受け取ることを含む、
EEE4に記載の1つ以上の非一時記憶媒体。
【0088】
EEE6.
前記伝えることは、前記マイクロホン異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記発生の源としてのマイクロホンを特定し、該マイクロホンに対する障害物の除去、修理、又は再配置を指示することを含む、
EEE4又は5に記載の1つ以上の非一時記憶媒体。
【0089】
EEE7.
前記複数タイプのオーディオ異常は、非人的源からのバックグラウンドノイズ又は反射によって引き起こされる環境異常を更に含み、
前記発生は、環境異常の発生である、
EEE1~6のいずれかに記載の1つ以上の非一時記憶媒体。
【0090】
EEE8.
前記伝えることは、前記環境異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記第1モバイルデバイスによって実装されているノイズ抑制機能をオンすることを含む、
EEE7に記載の1つ以上の非一時記憶媒体。
【0091】
EEE9.
前記複数タイプのオーディオ異常は、録音された音声の特定の品質指標の低い値によって表される音声異常を更に含み、
前記特定の品質指標は、ボリューム又はシャープネスを含み、
前記発生は、音声異常の発生である、
EEE1~8のいずれかに記載の1つ以上の非一時記憶媒体。
【0092】
EEE10.
前記伝えることは、前記音声異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記特定の品質指標の品質指標の値を改善するよう話者の音声を調整することを含む、
EEE9に記載の1つ以上の非一時記憶媒体。
【0093】
EEE11.
前記方法は、リアルタイムで、前記あるタイプのオーディオ異常の前記発生を停止するための救済的なアプローチを実施すること、又は前記救済的なアプローチを実施するよう要請することを含む、
EEE1~10のいずれかに記載の1つ以上の非一時記憶媒体。
【0094】
EEE12.
前記伝えることは、前記あるタイプのオーディオ異常の前記発生の一部分を含むオーディオコンテンツを削除するよう要請することを含む、
EEE1~11のいずれかに記載の1つ以上の非一時記憶媒体。
【0095】
EEE13.
前記方法は、
リアルタイムで、前記あるタイプのオーディオ異常の前記発生の終了が検出されるかどうかを連続的に決定することと、
リアルタイムで、前記発生の前記終了が検出されるまで、前記第1モバイルデバイスによるオーディオコンテンツの生成を無効化することと
を更に含む、
EEE1~12のいずれかに記載の1つ以上の非一時記憶媒体。
【0096】
EEE14.
前記方法は、
時間軸に沿った前記オーディオデータのグラフィック表現を表示することと、
前記グラフィック表現に異常情報をオーバーレイすることと
を更に有し、
前記異常情報は、前記あるタイプのオーディオ異常の前記発生について説明するものであり、前記あるタイプのオーディオ異常の前記発生を表現している前記グラフィック表現の部分の上に示される、
EEE1~13のいずれかに記載の1つ以上の非一時記憶媒体。
【0097】
EEE15.
前記オーバーレイは選択可能であり、前記異常情報は、前記オーディオデータの質を高めるよう前記あるタイプのオーディオ異常の前記発生を解決するためのリコメンデーションを示し、
前記方法は、
前記オーバーレイの選択を受け取ることと、
質を高められたオーディオデータを得るよう前記リコメンデーションを実施することと
を更に含む、
EEE14に記載の1つ以上の非一時記憶媒体。
【0098】
EEE15a.
前記複数タイプのオーディオ異常は、反射によって引き起こされるノイズを含む、
EEE1~15のいずれかに記載の1つ以上の非一時記憶媒体。
【0099】
EEE15b.
前記検出することは、前記第1モバイルデバイスの加速度計によって生成された加速度計信号を受信し、該加速度計信号に基づき、前記第1モバイルデバイスの加速度を決定することを含む、
EEE1~15aのいずれかに記載の1つ以上の非一時記憶媒体。
【0100】
EEE15c.
前記複数タイプのオーディオ異常は、前記第1モバイルデバイスの置き違えを含む、
EEE15bに記載の1つ以上の非一時記憶媒体。
【0101】
EEE16.
ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタするシステムであって、
メモリと、
前記メモリに結合される1つ以上のプロセッサと、を有し、
前記プロセッサは、
リアルタイムでオーディオデータを受け取り、
リアルタイムで、前記オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常の中のあるタイプのオーディオ異常の発生の開始を検出し、
リアルタイムで前記発生のアラートを提示する、よう構成され、
前記アラートは、前記あるタイプのオーディオ異常の前記発生に注意を向けるもの又は前記発生について説明するものである、
システム。
【0102】
EEE17.
前記オーディオデータをキャプチャするよう構成される1つ以上のマイクロホンと、
前記アラートを表示するよう構成される1つ以上の画面と、
前記アラートを再生するよう構成される1つ以上のスピーカと
を更に有する、EEE16に記載のシステム。
【0103】
EEE18.
前記アラートの提示は、前記1つ以上の画面の画面上に前記アラートを表示することを含み、
前記アラートは、前記1つ以上のマイクロホンの中から前記あるタイプのオーディオ異常の前記発生を引き起こしている特定のマイクロホンを特定し、該特定のマイクロホンに対する障害物の除去、修理、又は再配置を要求する、
EEE17に記載のシステム。
【0104】
EEE19.
当該システムは、マイクロホン及びスピーカを夫々含む1つ以上の完全ワイヤレスイヤホンに結合され、
前記発生は、前記1つ以上のマイクロホンのうちの特定のマイクロホンのオクルージョン、機能不良、又は置き違えにより生じるマイクロホン異常の発生である、
EEE16~18のいずれかに記載のシステム。
【0105】
EEE20.
前記アラートの提示は、
置き違えられている第1マイクロホンを含む、前記1つ以上の完全ワイヤレスイヤホンの中の第1イヤホンの第1スピーカで前記アラート再生して、前記発生に注意を向けさせること、又は
前記1つ以上のマイクロホンの中の、置き違えられていない第2マイクロホンを含む、前記1つ以上の完全ワイヤレスイヤホンの中の第2イヤホンの第2スピーカで前記アラート再生して、前記発生について説明すること
を含む、
EEE18又は19に記載のシステム。
【0106】
EEE20a.
当該システムはモバイルデバイスである、
EEE16~20のいずれかに記載のシステム。
【0107】
EEE21.
ユーザが生成したオーディオコンテンツをオーディオ異常に関してリアルタイムでモニタする方法であって、
リアルタイムで、第1モバイルデバイスによって生成されたオーディオデータを受け取ることと、
リアルタイムで、前記オーディオデータから、マイクロホン異常を含む複数タイプのオーディオ異常の中のあるタイプのオーディオ異常の発生の開始を検出することと、
リアルタイムで、前記発生のアラートを第2デバイスへ伝えることであり、前記アラートは、前記あるタイプのオーディオ異常の前記発生に注意を向けるもの又は前記発生について説明するものである、ことと
を有する方法。
【0108】
EEE22.
前記第1モバイルデバイスは、1つ以上の内蔵式マイクロホンを備えたスマートフォンである、
EEE21に記載の方法。
【0109】
EEE23.
前記伝えることは、前記アラートを視覚形態で画面に表示するか又は聴覚形態でスピーカで再生することを含み、
前記画面又は前記スピーカは、前記第2デバイスに含まれるか又は前記第2デバイスに結合されている、
EEE21又は22に記載の方法。
【0110】
EEE24.
前記マイクロホン異常は、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されているマイクロホンのオクルージョン、機能不良、又は置き違えによって引き起こされ、
前記発生は、マイクロホン異常の発生である、
EEE21~23のいずれかに記載の方法。
【0111】
EEE25.
前記検出することは、現在時間に至るまでの期間にわたって、前記第1モバイルデバイスに含まれるか又は前記第1モバイルデバイスに結合されている各マイクロホンからの信号の高周波数成分を特定すること、各マイクロホンからの前記信号の振幅値を決定すること、あるいは、各マイクロホンに含まれるか又は各マイクロホンに結合されている加速度センサ又は骨振動センサから測定値を受け取ることを含む、
EEE24に記載の方法。
【0112】
EEE26.
前記伝えることは、前記マイクロホン異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記発生の源としてのマイクロホンを特定し、該マイクロホンに対する障害物の除去、修理、又は再配置を指示することを含む、
EEE24又は25に記載の方法。
【0113】
EEE27.
前記複数タイプのオーディオ異常は、非人的源からのバックグラウンドノイズ又は反射によって引き起こされる環境異常を更に含み、
前記発生は、環境異常の発生である、
EEE21~26のいずれかに記載の方法。
【0114】
EEE28.
前記伝えることは、前記環境異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記第1モバイルデバイスによって実装されているノイズ抑制機能をオンすることを含む、
EEE27に記載の方法。
【0115】
EEE29.
前記複数タイプのオーディオ異常は、録音された音声の特定の品質指標の低い値によって表される音声異常を更に含み、
前記特定の品質指標は、ボリューム又はシャープネスを含み、
前記発生は、音声異常の発生である、
EEE21~28のいずれかに記載の方法。
【0116】
EEE30.
前記伝えることは、前記音声異常の発生を停止するリコメンデーションを送信することを含み、
前記リコメンデーションは、前記特定の品質指標の品質指標の値を改善するよう話者の音声を調整することを含む、
EEE29に記載の方法。
【0117】
EEE31.
リアルタイムで、前記あるタイプのオーディオ異常の前記発生を停止するための救済的なアプローチを実施すること、又は前記救済的なアプローチを実施するよう要請することを更に含む、
EEE21~30のいずれかに記載の方法。
【0118】
EEE32.
前記伝えることは、前記あるタイプのオーディオ異常の前記発生の一部分を含むオーディオコンテンツを削除するよう要請することを含む、
EEE21~31のいずれかに記載の方法。
【0119】
EEE33.
リアルタイムで、前記あるタイプのオーディオ異常の前記発生の終了が検出されるかどうかを連続的に決定することと、
リアルタイムで、前記発生の前記終了が検出されるまで、前記第1モバイルデバイスによるオーディオコンテンツの生成を無効化することと
を更に含む、
EEE21~32のいずれかに記載の方法。
【0120】
EEE34.
時間軸に沿った前記オーディオデータのグラフィック表現を表示することと、
前記グラフィック表現に異常情報をオーバーレイすることと
を更に有し、
前記異常情報は、前記あるタイプのオーディオ異常の前記発生について説明するものであり、前記あるタイプのオーディオ異常の前記発生を表現している前記グラフィック表現の部分の上に示される、
EEE21~33のいずれかに記載の方法。
【0121】
EEE35.
前記オーバーレイは選択可能であり、前記異常情報は、前記オーディオデータの質を高めるよう前記あるタイプのオーディオ異常の前記発生を解決するためのリコメンデーションを示し、
当該方法は、
前記オーバーレイの選択を受け取ることと、
質を高められたオーディオデータを得るよう前記リコメンデーションを実施することと
を更に含む、
EEE34に記載の方法。
【0122】
EEE35a.
前記複数タイプのオーディオ異常は、反射によって引き起こされるノイズを含む、
EEE21~35のいずれかに記載の方法。
【0123】
EEE35b.
前記検出することは、前記第1モバイルデバイスの加速度計によって生成された加速度計信号を受信し、該加速度計信号に基づき、前記第1モバイルデバイスの加速度を決定することを含む、
EEE21~35aのいずれかに記載の方法。
【0124】
EEE35c.
前記複数タイプのオーディオ異常は、前記第1モバイルデバイスの置き違えを含む、
EEE35bに記載の方法。
【0125】
EEE36.
コンピューティングデバイス又はシステムによって実行される場合に、前記コンピューティングデバイス又はシステムに、EEE21~35のいずれかに記載の方法を実行させる命令を有するコンピュータプログラム。
【0126】
[関連出願への相互参照]
本願は、2021年9月10日に出願された国際特許出願第PCT/CN2021/117685号、2021年9月15日に出願された米国特許仮出願第63/244261号、及び2021年11月10日に出願された欧州特許出願第21207498.3号の優先権を主張するものである。これらの出願の夫々は、それらの全文を参照により本願に援用される。
図1
図2
図3
図4
図5
図6
【国際調査報告】