IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧 ▶ シャンハイ シャオドゥ テクノロジー カンパニー リミテッドの特許一覧

特許7033156音量調整方法、端末装置、記憶媒体及び電子機器
<>
  • 特許-音量調整方法、端末装置、記憶媒体及び電子機器 図1
  • 特許-音量調整方法、端末装置、記憶媒体及び電子機器 図2
  • 特許-音量調整方法、端末装置、記憶媒体及び電子機器 図3
  • 特許-音量調整方法、端末装置、記憶媒体及び電子機器 図4
  • 特許-音量調整方法、端末装置、記憶媒体及び電子機器 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-01
(45)【発行日】2022-03-09
(54)【発明の名称】音量調整方法、端末装置、記憶媒体及び電子機器
(51)【国際特許分類】
   G10L 21/0364 20130101AFI20220302BHJP
   G10L 21/034 20130101ALI20220302BHJP
【FI】
G10L21/0364
G10L21/034
【請求項の数】 10
(21)【出願番号】P 2020019053
(22)【出願日】2020-02-06
(65)【公開番号】P2021015265
(43)【公開日】2021-02-12
【審査請求日】2020-02-06
(31)【優先権主張番号】201910634983.7
(32)【優先日】2019-07-15
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110002952
【氏名又は名称】特許業務法人鷲田国際特許事務所
(72)【発明者】
【氏名】チャオ タオタオ
【審査官】中村 天真
(56)【参考文献】
【文献】特開2020-127066(JP,A)
【文献】特開2010-141468(JP,A)
【文献】特開平10-020885(JP,A)
【文献】特開2019-032387(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-25/93
H04R 1/00- 3/14
(57)【特許請求の範囲】
【請求項1】
端末装置に適用される音量調整方法であって、
現在の環境の環境音を取得することと、
前記環境音に含まれたメイン音を決定することであって、前記メイン音は、前記環境音に含まれた全ての音の種類のうち、予め設定された音特性の最も強い音であり、前記音の種類は、オーディオ音、人の音声及び機器音を含み、前記オーディオ音は、前記端末装置により再生される、メイン音を決定することと、
前記メイン音と予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することとを含み、
前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音が前記機器音である場合、前記機器音がモニタリングされた持続時間を算出することと、
前記持続時間が第3の所定時間を超えると、前記オーディオ音の音量を小さくすることと、を含むことを特徴とする音量調整方法。
【請求項2】
前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音が前記人の音声である場合、前記人の音声がモニタリングされた持続時間を算出することと、
前記持続時間が第1の所定時間を超えると、前記オーディオ音の音量を小さくすることと、を含むことを特徴とする請求項1に記載の音量調整方法。
【請求項3】
前記持続時間が第1の所定時間を超えると、前記オーディオ音の音量を小さくすることの後に、
前記人の音声の停止時間が予め設定された第2の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することをさらに含むことを特徴とする請求項2に記載の音量調整方法。
【請求項4】
前記持続時間が第3の所定時間を超えると、前記オーディオ音の音量を小さくすることの後に、
前記機器音の停止時間が第4の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することをさらに含むことを特徴とする請求項1に記載の音量調整方法。
【請求項5】
前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音を決定できないと、前記オーディオ音の音量を小さくすることを含むことを特徴とする請求項1に記載の音量調整方法。
【請求項6】
前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記環境音のうちの調整指令音に基づいて発話対象のアイデンティティ情報を決定することと、
前記アイデンティティ情報と前記予め設定された音調整規則に基づいて音調整幅を決定することとを含むことを特徴とする請求項1から請求項5のいずれか1項に記載の音量調整方法。
【請求項7】
前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することを行った後に、
第5の所定時間内に前記調整指令音が受信され、前記端末装置に前回の音調整と反対方向に調整することを指示するための調整指令音である場合、前記端末装置による前記オーディオ音に対する自動調整を停止することをさらに含むことを特徴とする請求項6に記載の音量調整方法。
【請求項8】
端末装置であって、
現在の環境の環境音を取得することに用いられる取得モジュールと、
前記環境音に含まれたメイン音を決定する処理モジュールであって、前記メイン音は、前記環境音に含まれた全ての音の種類のうち、予め設定された音特性の最も強い音であり、前記音の種類は、オーディオ音、人の音声及び機器音を含み、前記オーディオ音は、前記端末装置により再生される、処理モジュールと、
前記メイン音及び予め設定された音調整規則に基づいて前記オーディオ音の音量を調整する調整モジュールと、を備えることを特徴とする端末装置。
【請求項9】
コンピュータ可読記憶媒体であって、
プロセッサにより実行されるとき、請求項1から請求項7のいずれか1項に記載の音量調整方法を実現するためのコンピュータプログラムが記憶されていることを特徴とするコンピュータ可読記憶媒体。
【請求項10】
電子機器であって、
プロセッサと、
前記プロセッサの実行可能命令を記憶するためのメモリと、を備え、
前記プロセッサは、前記実行可能命令を実行することにより、請求項1から請求項7のいずれか1項に記載の音量調整方法を実行するように構成されていることを特徴とする電子機器。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は音量制御技術分野に関し、特に、音量調整方法、端末装置、記憶媒体及び電子機器に関する。
【背景技術】
【0002】
電子技術の発展に伴い、スマートスピーカーは人々の日常生活において広く普及しており、ユーザーはスマートスピーカーを用いて音楽を再生するだけでなく、音声によってスマートスピーカーと対話することができる。
【0003】
現在、スマートスピーカーは、リクエスト曲、オンラインショッピング、または天気予報の購読などの機能を実現でき、加えて、カーテンを開く、冷蔵庫の温度を設定する、給湯器を予め立ち上げるなどのスマートホーム機器の制御を行うことができる。
【0004】
しかしながら、スマートスピーカーは、案内音声やリソースを再生する際に、一定の音量でしか再生できない場合が多く、スマートスピーカーは、ユーザーがスマートスピーカーに対して調整指示を出した場合に限り音量を調整でき、スマートでなく、ユーザーの体験に影響を与える。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、端末装置が異なる使用環境において、ユーザーの現在のニーズに合致する音量をユーザーに出力するため、適応的な調整方式で音量を制御することができるようにする音量調整方法、端末装置、記憶媒体及び電子機器を提供する。
【課題を解決するための手段】
【0006】
第1の態様では、本発明は、端末装置に適用される音量調整方法を提供し、前記方法は、
現在の環境の環境音を取得することと、
前記環境音に含まれたメイン音を決定することであって、前記メイン音は、前記環境音に含まれた全ての音の種類のうち、予め設定された音特性の最も強い音であり、前記音の種類は、オーディオ音、人の音声及び機器音を含み、前記オーディオ音は、前記端末装置により再生される、メイン音を決定することと、
前記メイン音と予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することとを含む。
【0007】
1つの可能な設計では、前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音が前記人の音声である場合、前記人の音声がモニタリングされた持続時間を算出することと、
前記持続時間が第1の所定時間を超えると、前記オーディオ音の音量を小さくすることと、を含む。
【0008】
1つの可能な設計では、前記オーディオ音の音量を小さくすることの後に、
前記人の音声の停止時間が予め設定された第2の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することをさらに含むことを特徴とする請求項2に記載の音量調整方法。
【0009】
1つの可能な設計では、前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音が前記機器音である場合、前記機器音がモニタリングされた持続時間を算出することと、
前記持続時間が第3の所定時間を超えると、前記オーディオ音の音量を小さくすることとを含む。
【0010】
1つの可能な設計では、前記オーディオ音の音量を小さくすることの後に、
前記機器音の停止時間が第4の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することをさらに含む。
【0011】
1つの可能な設計では、前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記メイン音を決定できないと、前記オーディオ音の音量を小さくすることを含む。
【0012】
1つの可能な設計では、前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することは、
前記環境音のうちの調整指令音に基づいて発話対象のアイデンティティ情報を決定することと、
前記アイデンティティ情報と前記予め設定された音調整規則に基づいて音調整幅を決定することとを含む。
【0013】
1つの可能な設計では、前記メイン音と前記予め設定された音調整規則に基づいて前記オーディオ音の音量を調整することを行った後に、
第5の所定時間内に前記調整指令音が受信され、前記端末装置に前回の音調整と反対方向に調整することを指示するための調整指令音である場合、前記端末装置による前記オーディオ音に対する自動調整を停止することをさらに含む。
【0014】
第2の態様では、本発明は端末装置をさらに提供し、
現在の環境の環境音を取得することに用いられる取得モジュールと、
前記環境音に含まれたメイン音を決定する処理モジュールであって、前記メイン音は、前記環境音に含まれた全ての音の種類のうち、予め設定された音特性の最も強い音であり、前記音の種類は、オーディオ音、人の音声及び機器音を含み、前記オーディオ音は、前記端末装置により再生される、処理モジュールと、
前記メイン音及び予め設定された音調整規則に基づいて前記オーディオ音の音量を調整する調整モジュールと、を備える。
【0015】
1つの可能な設計では、前記調整モジュールは、具体的に、
前記メイン音声が前記人の音声である場合、前記人の音声がモニタリングされた持続時間を算出し、
前記持続時間が第1の所定時間を超えると、前記オーディオ音の音量を小さくするように構成されている。
【0016】
1つの可能な設計では、前記調整モジュールは、さらに前記人の音声の停止時間が第2の所定時間を超えると、前記オーディオ音の音量を元の音量に調整するように構成されている。
【0017】
1つの可能な設計では、前記調整モジュールは、具体的に、
前記メイン音が前記機器音である場合、前記機器音がモニタリングされた持続時間を算出し、
前記持続時間が第3の所定時間を超えると、前記オーディオ音の音量を小さくするように構成されている。
【0018】
1つの可能な設計では、前記調整モジュールは、さらに前記機器音の停止時間が第4の所定時間を超えると、前記オーディオ音の音量を元の音量に調整するように構成されている。
【0019】
1つの可能な設計では、前記調整モジュールは、具体的に、
前記メイン音を決定できないと、前記オーディオ音の音量を小さくするように構成されている。
【0020】
1つの可能な設計では、前記処理モジュールは、具体的に、
前記環境音のうちの調整指令音に基づいて発話対象のアイデンティティ情報を決定し、
前記アイデンティティ情報と前記予め設定された音調整規則に基づいて音調整幅を決定するように構成されている。
【0021】
1つの可能な設計では、前記調整モジュールは、さらに第5の所定時間内に、前記調整指令音が受信され、前記端末装置に前回の音調整と反対方向に調整することを指示するための調整指令音である場合、前記オーディオ音に対する自動調整を停止するように構成されている。
【0022】
第3の態様では、本発明は、コンピュータ可読記憶媒体をさらに提供し、それにコンピュータプログラムが記憶され、当該コンピュータプログラムがプロセッサにより実行されるとき、第1の態様のいずれか1項に記載の音量調整方法を実現するためのコンピュータプログラムが記憶されている。
【0023】
第4の態様では、本発明は、電子機器をさらに提供し、
プロセッサと、
前記プロセッサの実行可能命令を記憶するためのメモリと、を備え、
前記プロセッサは、前記実行命令を実行することにより、第1の態様のいずれか1項に記載の音量調整方法を実行するように構成されている。
【0024】
本発明による音量調整方法、端末装置、記憶媒体及び電子機器は、端末装置が取得した環境音に含まれたメイン音を判断し、メイン音と予め設定された音調整規則に基づいてオーディオ音の音量を適応的に調整することで、端末装置が異なる動作環境で、ユーザーにユーザーの現在の要求に合致する音量を出力するように、適応的な調整方式で音量を制御することができる。
【図面の簡単な説明】
【0025】
本発明の実施例又は従来技術の技術的解決手段をより明確に説明するために、以下、実施例又は従来技術の説明で用いられる図面について簡単に説明する。明らかに、以下の説明における図面は、本発明のいくつかの実施例であり、当業者であれば、これらの図面に基づいて創造的な労力を要せずに、これらの図面から他の図面を得ることができる。
図1】本発明の一例示的な実施例による音量調整方法の応用場面を示す図である。
図2】本発明の一例示的な実施例による音量調整方法を示すフローチャートである。
図3】本発明の他の一例示的な実施例による音量調整方法を示すフローチャートである。
図4】本発明の一例示的な実施例による端末装置を概略的に示す模式図である。
図5】本発明の一例示的な実施例による電子装置を概略的に示す模式図である。
【発明を実施するための形態】
【0026】
本発明の実施例の目的、技術的解決手段及び利点をより明確にするために、以下、本発明の実施例による図面を参照しながら、本発明の実施例の技術的解決手段について明確、且つ完全に説明し、当然のことながら、記載される実施例は本発明の実施例の一部にすぎず、そのすべての実施例ではない。当業者が、本発明における実施例に基づき創造的な労力を要することなく、取得されたその他のすべての実施例は、いずれも本発明の保護範囲に属する。
【0027】
図1は、本発明の一例示的な実施例による音量調整方法の応用場面を示す図である。図1に示すように、本実施例による音量調整方法は、音のピックアップ機能及びサウンド再生機能を有する電子機器、例えば、スマートスピーカー、スマートフォン、パーソナルコンピュータ及びスマートロボット等の端末装置に適用される。なお、本実施例において、端末装置の具体的な形態に対して限定しない。しかしながら、本願の実現原理を詳細に説明するために、スマートスピーカーボックス101を選択して例示できる。スマートスピーカー101は、静かな家や騒がしい売り場など、様々な場面に設置されることを考慮すると、スマートスピーカー101によって取得される環境音は、通常、様々な音の混合であり、例えば、スマートスピーカー101自体が発するオーディオ音、ユーザー102が発する人の音声、及びその他の外部機器(例えば、テレビ103、パーソナルコンピュータ104など)が発する機器音などを含む。
【0028】
ただし、スマートスピーカー101には、現在の環境の環境音を取得するためのマイク1011も設けられている。
【0029】
マイク1011が音のピックアップに成功した後、環境音に含まれたメイン音を決定し、ここで、メイン音とは、環境音に含まれたすべての音の種類のうち、予め設定された音特性の最も強い音であり、例えば、ラウドネスが最も大きい音、周波数が最も大きい音、または音の持続時間が最も長い音とすることができる。1つの実施例では、上記の音の種類は、オーディオの音、人の音声、装置の音などを含んでもよいし、ここで、オーディオの音とは、スマートスピーカー101が再生する音であり、例えば、スマートスピーカー101が現在再生している音楽の音である。
【0030】
最後に、メイン音と予め設定された音調整規則に応じてオーディオ音の音量を調整する。なお、日常生活において、人と人が対話しているとき、話す音は、一般的に一定の範囲を維持し、話している環境が静かであると、話す音量がより小さく、話している環境が騒がしく、様々な干渉があると、話す音量がやや高くなり、その基本的な原則は、話す相手に聞こえるようにすることである。しかしながら、スマートスピーカー101は、案内音声やリソースを再生する際、一定の音量でしか再生できない場合がよく見られる。本実施例では、スマートスピーカー101は、オーディオを再生する前に、現在の環境の環境音のうちのメイン音を決定した後、メイン音と予め設定された音調整規則に基づいて、スマートスピーカー101が再生するオーディオ音の音量を適応的に調整する。
【0031】
図2は、本発明の一例示的な実施例による音量調整方法を示すフローチャートである。図2に示すように、本実施例による音量調整方法はステップ201~ステップ203を含み、
ステップ201では、現在の環境の環境音を取得する。
【0032】
具体的には、スマートスピーカーにおけるマイクのような端末装置でユーザーが発する環境音を取得してもよい。ここで、環境音とは、一般的に、様々な種類の音を含み、例えば、スマートスピーカー自体が発するオーディオ声、ユーザーが発する人の音声、その他の外部機器が発する機器音を含む。
【0033】
ここで、前記人の音声は、具体的には、人が話しているか、または、複数の人が話しているときに発する音声であってもよく、1つの実施例では、そのときの人の音声の音量の大きさを保存してもよい。他の外部機器が発する機器音は、例えばテレビの音やその他の機器が再生するオーディオ音であってもよいし、1つの実施例では、その際の機器音の音量の大小を保存してもよい。また、スマートスピーカー自体が発するオーディオ音は、スマートスピーカーが動作しているときに、外部に対して案内音声を再生する音や、オーディオ・ビデオリソースを再生する音であってもよい。
【0034】
1つの実施例では、スマートスピーカーが動作状態にあるとき、スマートスピーカーにおける音量モニタリングモジュール、例えばマイクは、現在の動作環境をモニタリングし、現在の再生環境での全てを音量収録する。その後、収集された環境音に対してリアルタイムで分析し、まずはスマートスピーカー自体のオーディオ音をフィルタリングし、そのときに再生環境内の他の音を残し、ここで、スマートスピーカーがオーディオを再生するとき、スマートスピーカーは、再生されるオーディオ音の情報を予め取得し、予め取得された音の情報により、スマートスピーカー自体のオーディオ音を複雑な環境音から削除することができることが理解される。
【0035】
また、異なる装置、異なるユーザーの音声サンプルを収集し、収集した音声サンプルをニューラルネットワークモデルに入力して学習とトレーニングし、ニューラルネットワークモデルにより環境音における音の種類を区分することもできる。
【0036】
また、上記のような人の音声については音声認識の方式により取得してもよく、音声認識の方式により音声情報が認識された場合、人の音声であるとする。また、テレビなどの機器も音声を発するため、音の周波数を通じて区分してもよいし、人が発する音声の周波数と電子機器が発する音の周波数との差によって、人の音声と機器音を区別する。
【0037】
ステップ202では、環境音に含まれたメイン音を決定する。
【0038】
具体的には、スマートスピーカーのマイクが音のピックアップに成功した後に、環境音に含まれたメイン音を決定し、ここで、メイン音とは、環境音に含まれたすべての音の種類のうち、予め設定された音特性の最も強い音であり、例えば、ラウドネスが最も大きい音、周波数が最も大きい音、または音の持続時間が最も長い音とすることができる。
【0039】
ステップ203では、メイン音と予め設定された音調整規則に基づいて、オーディオ音の音量を調整する。
【0040】
最後に、メイン音と予め設定された音調整規則に応じてオーディオ音の音量を調整する。ここで、1つの実施例では、具体的な音調整規則は、以下の通りである。
【0041】
1つの可能な形態として、メイン音が人の音声である場合、人の音声がモニタリングされた持続時間を算出し、持続時間が第1の所定時間を超えると、オーディオ音の音量を下げる。また、人の音声の停止時間が第2の所定時間を超えると、オーディオ音の音量を元の音量に調整する。
【0042】
具体的には、対話の音声などの人の音声がモニタリングされ始めてから算出を始めてもよく、人の音声が2分間持続した場合、能動的にスマートスピーカーの音量を下げ、人々はより快適に対話を行うことができる。また、人が話していないことがモニタリングされ、且つ1分間持続した後、このとき、背景音がほぼミュート環境であると、スマートスピーカーの音量は徐々に調整前の状態に戻る。
【0043】
もう1つの可能な形態として、メイン音が機器音である場合、機器音がモニタリングされた持続時間を算出し、持続時間が第3の所定時間を超えると、オーディオ音の音量を下げる。また、機器音の停止時間が第4の所定時間を超えると、オーディオ音の音量を元の音量に調整する。
【0044】
具体的には、他の機器の機器音がモニタリングされ始めてから算出を始めてもよいし、他の機器が再生する機器音が2分間持続すると、能動的にスマートスピーカーの音量を下げ、人が他の機器音をより明瞭に聞くことができ、ここで、スマートスピーカーの音を背景音に弱化してもよい。しかしながら、他の機器の音がオフになり、且つ他の機器の音がモニタリングされない時間が1分間持続すると、スマートスピーカーが再生するオーディオ音の音量を調整して、徐々に調整前の状態に戻す。
【0045】
もう1つの可能な形態として、メイン音を決定できない場合、オーディオ音の音量を下げる。例えば、スマートスピーカーに取得された環境音が騒がしい音であると、この場合には、背景音が乱れ、どの音が支配的であるかを判断できない。当該環境では、音が非常に複雑であるため、スマートスピーカーの音により環境音がより騒がしくなることを避けるため、このとき、スマートスピーカーは直ちに音量を下げ、環境音の騒がしさを軽減してもよい。
【0046】
また、第5の所定時間内に調整指令音が受信され、端末装置に前回の音調整と反対方向に指示する調整指令音である場合、端末装置はオーディオ音に対する自動調整を停止する。例えば、音量を上げる又は下げた後、ユーザーが5分間以内に自ら逆方向の調整を行った場合、その後は、当該機器に対して上記の音量調整ストラテジーを適用しなくなり、ユーザーの異なる使用シーンで、音量調整ストラテジーが当該シーンに適合しないことを避ける。
【0047】
本実施例では、端末装置が取得した環境音に含まれたメイン音を決定し、メイン音と予め設定された音調整規則に基づいてオーディオ音の音量を適応的に調整することで、端末装置が様々な使用環境において適応的な調整方法で音量を制御することができ、ユーザーに現在のニーズに応じた音量を出力する。
【0048】
図3は、本発明の他の一例示的な実施例による音量調整方法を示すフローチャートである。図3に示すように、本実施例による音量調整方法は、ステップ301~ステップ304を含み、
ステップ301では、現在環境の環境音を取得する。
【0049】
ステップ302では、環境音に含まれたメイン音を決定する。
【0050】
なお、本実施例におけるステップ301~ステップ302の具体的な説明は、図2に示す実施例におけるステップ201~ステップ202の説明を参照することができ、ここではその説明を省略する。
【0051】
ステップ303では、環境音における調整指令音に基づいて、発話対象のアイデンティティ情報を決定する。
【0052】
ユーザーごとの音声のセンシング程度が異なることを考慮して、ユーザーの指示に応じて音調整を行う前に、発話対象のアイデンティティ情報を取得する必要があり、ここで、1つの実施例では、ユーザーの年齢層に応じてアイデンティティ情報を区分してもよく、例えば、アイデンティティ情報は、子供種類、若者種類、老人種類を含んでもよい。
【0053】
また、ウェイクアップ音声指令に基づいてユーザーのアイデンティティ種別を決定する方式では、まず、ウェイクアップ音声指令の音色情報、ラウドネス情報及び周波数情報を決定し、その後、予め設定された分類規則、音色情報、ラウドネス情報及び周波数情報に基づいてアイデンティティ種類を決定してもよい。なお、異なる年齢層のユーザーは、一般に発した音声の特性が異なり、例えば、高齢者は音声のラウドネスが一般的により低く、若者は音声のラウドネスがより高く、子供は音声の周波数がより高い。
【0054】
また、異なる年齢層の音声サンプルを収集し、収集した音声サンプルをニューラルネットワークモデルに入力して学習とトレーニングし、ニューラルネットワークモデルを用いて入力されたウェイクアップ音声指令の発話対象のアイデンティティ種類を決定してもよい。
【0055】
ステップ304では、アイデンティティ情報と予め設定された音調整規則に基づいて音の調整幅を決定する。
【0056】
ユーザーのアイデンティティ情報を決定した後、異なるアイデンティティ情報に応じて異なる音声調整方式を採用することにより、採用される調整方式を異なる種類のユーザー特性に使用することができる。ここで、例えば、ユーザーのアイデンティティ情報が高齢者ユーザーであると決定すると、高齢者からの「音楽を再生してください」というウェイクアップ音声指令に応答して音楽を再生する場合、再生する音楽の音量をより大きく調整し、例えばレベル30であってもよいし、子供からの「音楽を再生してください」というウェイクアップ音声指令に応答して音楽を再生する場合、再生する音楽の音量をより小さく調整し、例えばレベル20であってもよい。なお、本実施例では、音声レベルの数値、例えば20や30は単に例示的説明のためのものであり、実際の端末装置の音量設定規則に応じて適合させることができる。
【0057】
また、高齢者からの「音を上げてください」というウェイクアップ音声指令に応答して音量を上げる場合、毎回の音量調整幅を大きくし、例えば毎回にレベル5ずつ調整してよく、子供からの「音を上げてください」というウェイクアップ音声指令に応答して音量を上げる場合、毎回の音量調整幅を小さくし、例えば毎回レベル2ずつ調整してよい。なお、本実施例では、5や2などの音声レベルの数値は、例示的説明のためのものであり、実際の端末装置の音量設定規則に応じて適合させることができる。
【0058】
本実施例では、ユーザーにより入力された調整指令音声を取得した後、調整指令音声に基づいてユーザーの異なる年齢層別のアイデンティティ情報を決定し、最後に、アイデンティティ種類及び予め設定された音調整規則に基づいて、端末装置から出力されるオーディオ音の再生音量を調整することで、端末装置の音量調整を音に対する感度が異なるユーザーに適用することができ、ユーザーによる音量調整の効率を高めることができる。
【0059】
図4は、本発明の一例示的な実施例による端末装置を概略的に示す模式図である。図4に示すように、本実施例による端末装置は、
現在の環境の環境音を取得することに用いられる取得モジュール401と、
前記環境音に含まれたメイン音を決定する処理モジュール402であって、前記メイン音は、前記環境音に含まれた全ての音の種類のうち、予め設定された音特性の最も強い音であり、前記音の種類は、オーディオ音、人の音声及び機器音を含み、前記オーディオ音は、前記端末装置が再生する音である、処理モジュール402と、
前記メイン音及び予め設定された音調整規則に基づいて前記オーディオ音の音量を調整する調整モジュール403と、を備える。
【0060】
1つの可能な設計では、前記調整モジュール403は、具体的に、
前記メイン音声が前記人の音声である場合、前記人の音声がモニタリングされた持続時間を算出することと、
前記持続時間が第1の所定時間を超えると、前記音の音量を小さくすることとに用いられる。
【0061】
1つの可能な設計では、前記調整モジュールは、さらに前記人の音声の停止時間が第2の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することに用いられる。
【0062】
1つの可能な設計では、前記調整モジュール403は、具体的に、
前記メイン音が前記機器音である場合、前記機器音がモニタリングされた持続時間を算出することと、
前記持続時間が第3の所定時間を超えると、前記オーディオ音の音量を小さくすることとに用いられる。
【0063】
1つの可能な設計では、前記調整モジュール403は、さらに前記機器音の停止時間が第4の所定時間を超えると、前記オーディオ音の音量を元の音量に調整することに用いられる。
【0064】
1つの可能な設計では、前記調整モジュール403は、具体的に、
前記メイン音を決定できないと、前記オーディオ音の音量を小さくすることに用いられる。
【0065】
1つの可能な設計では、前記処理モジュール402は、具体的に、
前記環境音のうちの調整指令音に基づいて発話対象のアイデンティティ情報を決定することと、
前記アイデンティティ情報と前記予め設定された音調整規則に基づいて音調整幅を決定することとに用いられる。
【0066】
1つの可能な設計では、前記調整モジュール403は、第5の所定時間内に、前記調整指令音が受信され、前記端末装置に前回の音調整と反対方向に指示するための調整指令音である場合、前記端末装置が前記オーディオ音に対する自動調整を停止することに用いられる。
【0067】
上記後端処理モジュール402は、上記方法を実施する1つ以上の集積回路、例えば、1つ以上の特定の集積回路(Application Specific Integrated Circuit、ASICと略称)、または1つ以上のマイクロプロセッサ(digital signal processor、DSPと略称)、または1つ以上のフィールドプログラマブルゲートアレイ(Field Programmable Gate Array、FPGAと略称)などに構成されてもよい。また、上記あるモジュールが、プロセッサエレメントによってプログラムコードをスケジューリングする形態で実現される場合、当該プロセッサエレメントは、例えば、中央処理装置(Central Processing Unit、CPUと略称)またはプログラムコードをスケジューリングすることができる他のプロセッサなどの汎用プロセッサであり得る。また、これらのモジュールは、一体化されてシステムオンチップ(system-on-a-chip、SOCと略称)の形態で実現されてもよい。
【0068】
また、本発明の各実施例における各機能ユニットは、1つの処理ユニットに集積されてもよいし、各ユニットが別個に物理的に存在してもよいし、2つ以上のユニットが1つのユニットに集積されてもよい。上記の集積されたユニットは、ハードウェアの形態で実現されてもよいし、ハードウェア及びソフトウェア機能ユニットの形態で実現されてもよい。
【0069】
なお、図4に示す実施例の端末装置は、上述した図2図3に示す実施例の方法を実行するために使用することができ、具体的な実現方法及び技術的効果は同様であり、ここではその説明を省略する。
【0070】
本発明は、コンピュータ可読記憶媒体をさらに提供し、それにコンピュータプログラムが記憶され、当該コンピュータプログラムがプロセッサによって実行されるとき、上記ある1つの方法実施例の技術的解決手段を実現し、その実現原理と技術効果が同様であり、ここではその説明を省略する。
【0071】
図5は、本発明の一例示的な実施例による電子装置を概略的に示す模式図である。図5に示すように、本実施例が提供する電子機器500は、
プロセッサ501及びメモリ502を備え、
メモリ502は、コンピュータプログラムを記憶するためのものであり、当該メモリはフラッシュメモリであってもよい。
【0072】
プロセッサ501は、メモリに記憶された実行命令を実行して、上記の方法における様々なステップを実現するためのものである。具体的には、前述の方法の実施例における関連説明を参照されたい。
【0073】
1つの実施例では、メモリ502は、独立していてもよく、プロセッサ501と一体に集積されてもよい。
【0074】
前記メモリ502がプロセッサ501とは別のデバイスである場合、前記電子装置は、
前記メモリ502とプロセッサ501を接続させるためのバス503をさらに備えてもよい。
【0075】
本実施例は、可読記憶媒体に記憶されたコンピュータプログラムを含むプログラム製品をさらに提供する。電子機器の少なくとも1つのプロセッサは、可読記憶媒体から当該コンピュータプログラムを読み取ることができ、少なくとも1つのプロセッサが当該コンピュータプログラムを実行することにより、電子機器に、上述した様々な実施形態によって提供される方法を実施させる。
【0076】
当業者であれば、上述の各方法の実施例を実現するステップの全部または一部を、プログラムの指令に関連するハードウェアにより実現してもよいことを理解できる。また、上記プログラムは、コンピュータ可読記憶媒体に格納されてもよい。当該プログラムは、実行されるとき、上述の方法の実施例を含むステップを実行する。また、前記記憶媒体としては、プログラムコードを記憶できる媒体、例えば、読み出し専用メモリ(read only memory、ROM)、ランダムアクセスメモリ(random access memory、RAM)、磁気ディスク、光ディスク等が挙げられる。
【0077】
最後に説明すべきものとして、以上の各実施例は、本発明の技術的解決手段を説明するためのものであって、これを制限するものではなく、前述の各実施例を参照しながら本発明を詳細に説明するが、当業者であれば、依然として前述の各実施例に記載の技術的解決手段を修正するか、又はそのうちの一部又はすべての技術的特徴に対して同等置換を行うことができ、これらの修正又は置換は、対応する技術的解決手段の本質を本発明の各実施例の技術的解決手段の範囲から逸脱しないと理解すべきである。
図1
図2
図3
図4
図5