(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6692983
(24)【登録日】2020年4月17日
(45)【発行日】2020年5月13日
(54)【発明の名称】ロボット及びそのオーディオデータ処理方法
(51)【国際特許分類】
H04R 3/00 20060101AFI20200427BHJP
H04R 1/40 20060101ALI20200427BHJP
【FI】
H04R3/00 320
H04R1/40 320A
【請求項の数】10
【全頁数】13
(21)【出願番号】特願2019-208175(P2019-208175)
(22)【出願日】2019年11月18日
【審査請求日】2019年11月18日
(31)【優先権主張番号】201811620508.6
(32)【優先日】2018年12月28日
(33)【優先権主張国】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】515215346
【氏名又は名称】深セン市優必選科技股▲ふん▼有限公司
【氏名又は名称原語表記】UBTECH POBOTICS CORP LTD
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際特許業務法人
(72)【発明者】
【氏名】熊 友軍
(72)【発明者】
【氏名】▲しん▼ 芳琳
【審査官】
鈴木 圭一郎
(56)【参考文献】
【文献】
特開2007−221300(JP,A)
【文献】
特開2008−278399(JP,A)
【文献】
特開2007−241157(JP,A)
【文献】
特開2011−069901(JP,A)
【文献】
特開2007−295085(JP,A)
【文献】
特開2011−237621(JP,A)
【文献】
特表2018−511962(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 1/00−3/14
(57)【特許請求の範囲】
【請求項1】
ロボットであって、少なくとも1つの身体部分と収音モジュールと主制御モジュールとを含み、
前記収音モジュールと前記主制御モジュールは互いに電気的に接続され、前記収音モジュールはマイクロホンアレイを含み、前記マイクロホンアレイはN個のマイクロホンを含み、N≧3且つNは整数であり、
前記N個のマイクロホンは、前記ロボットの少なくとも1つの身体部分の周りに分布し、前記N個のマイクロホンの一部は音源からの音が直接到達でき、前記N個のマイクロホンの他の一部は前記身体部分により前記音源が遮断されて前記音源からの音が直接到達できず、反射された音のみが到達され、
前記主制御モジュールは、前記マイクロホンアレイのN個のマイクロホンにより収集された前記音源から伝送されたオーディオデータを取得し、前記オーディオデータに基づいて音源位置決めを行い、前記N個のマイクロホンのうち前記音源からの音が直接到達できるマイクロホンにより収集されたオーディオデータに基づいて収音及び音声識別を行う、ことを特徴とするロボット。
【請求項2】
前記収音モジュールはMIC小型基板をさらに含み、
前記MIC小型基板は、前記マイクロホンアレイと前記主制御モジュールにそれぞれ電気的に接続され、
前記MIC小型基板は、前記マイクロホンアレイにより収集されたNチャンネルのアナログオーディオデータをデジタルオーディオデータに変換し、かつコード化して、前記デジタルオーディオデータ及びコードを前記主制御モジュールに転送する、ことを特徴とする請求項1に記載のロボット。
【請求項3】
前記MIC小型基板は、前記マイクロホンアレイ及び前記主制御モジュールに電気的に接続されたアナログデジタル変換器を含み、前記アナログデジタル変換器は、Nチャンネルのオーディオデータに対してアナログデジタル変換を行う、ことを特徴とする請求項2に記載のロボット。
【請求項4】
前記マイクロホンアレイは6個のマイクロホンを含み、前記6個のマイクロホンは前記ロボットの首部に配置され、前記6個のマイクロホンは、前記首部の縦軸線上の任意の点を円心とした円周に分布し、前記円周は前記縦軸線に対して垂直である、ことを特徴とする請求項1に記載のロボット。
【請求項5】
前記主制御モジュールは、ロボットのパワーアンプから参照オーディオデータを取得してMIC小型基板に入力し、前記MIC小型基板はさらに、上記参照オーディオデータをアナログデジタル変換及びコード化した後に前記主制御モジュールに転送するために使用される、ことを特徴とする請求項2に記載のロボット。
【請求項6】
前記主制御モジュールに電気的に接続されたパワーアンプを更に含み、
主制御モジュールは制御されて、前記パワーアンプにより出力されたオーディオデータを取得し、前記パワーアンプにより出力されたオーディオデータに基づいて参照オーディオデータを生成する、ことを特徴とする請求項5に記載のロボット。
【請求項7】
前記主制御モジュールはデータバッファプールを含み、前記データバッファプールは、前記Nチャンネルのオーディオデータを記憶するために使用される、ことを特徴とする請求項1に記載のロボット。
【請求項8】
請求項1に記載のロボットに基づいて実現されるオーディオデータ処理方法であって、
収音モジュールのN個のマイクロホンによりオーディオデータを収集するステップと、
前記N個のマイクロホンにより収集されたNチャンネルのオーディオデータを主制御モジュールに送信するステップと、
前記主制御モジュールは前記Nチャンネルのオーディオデータをデータバッファプール内に記憶し、オーディオデータに基づいて音源位置決め及び収音を行うステップとを含む、ことを特徴とするオーディオデータ処理方法。
【請求項9】
前記主制御モジュールは前記Nチャンネルのオーディオデータをデータバッファプール内に記憶し、オーディオデータに基づいて音源位置決め及び収音を行うステップは、
2チャンネルの参照オーディオデータ及び前記Nチャンネルのオーディオデータを前記データバッファプールに記憶するステップと、
前記データバッファプールから第1グループのオーディオデータを取得し、第1プリセットアルゴリズムにより音源を位置決めするステップと、
前記データバッファプールから第2グループのオーディオデータを取得し、第2プリセットアルゴリズムにより前記第2グループのオーディオデータに対してビームフォーミング及びオーディオノイズ低減処理を行うステップとを含む、ことを特徴とする請求項8に記載のオーディオデータ処理方法。
【請求項10】
前記Nチャンネルのオーディオデータは6チャンネルのオーディオデータであり、
第1マイクロホンによって取得されたオーディオデータを第1オーディオデータとして番号付けし、第2マイクロホンによって取得されたオーディオデータを第2オーディオデータとして番号付けし、第3マイクロホンによって取得されたオーディオデータを第3オーディオデータとして番号付けし、第4マイクロホンによって取得されたオーディオデータを第4オーディオデータとして番号付けし、第5マイクロホンによって取得されたオーディオデータを第5オーディオデータとして番号付けし、第6マイクロホンによって取得されたオーディオデータを第6オーディオデータとして番号付けし、第1チャンネルの参照オーディオデータを第7オーディオデータとして番号付けし、第2チャンネルの参照オーディオデータを第8オーディオデータとして番号付けし、
前記第1グループのオーディオデータは、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第4オーディオデータ、第5オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータを含み、
前記第2グループのオーディオデータは、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータを含み、
前記第1マイクロホン、前記第2マイクロホン、前記第5マイクロホン及び前記第6マイクロホンは、前記音源からの音が直接到達できるマイクロホンである、ことを特徴とする請求項9に記載のオーディオデータ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はスマートロボット分野に関し、特にスマートロボット及びそのオーディオデータ処理方法に関する。
【背景技術】
【0002】
ロボットの設計において、マイクロホンアレイの位置が正しく配置されていないと音声対話の効果に影響を及ぼす可能性がある。マイクロホンアレイのビームフォーミング(beam−forming)のための最も基本的な要件及び前提条件は、音がマイクロホンアレイ内の各マイクロホンに直接達することである。従って、環状のマイクロホンアレイがロボットの首に配置されると、ロボットの首が首の後ろのマイクロホンを遮るため、音が首によって反射されてロボットの首の後ろのマイクロホンに直接達することができず、そして収音効果に影響を及ぼす。
【0003】
上記課題に対して、現在の市場では、通常、環状マイクロホンをロボットの頭部に配置するか、又は環状マイクロホンアレイ及び直線形マイクロホンアレイを同時に使用して、ロボットの360度のウェイクアップ及び360度の音源位置決めを実現するために環状マイクロホンアレイをロボットの首部に配置し、収音のためにビームフォーミングのための直線形マイクロホンをロボットの頭部に配置する。
【0004】
環状マイクロホンアレイをロボットの頭部に配置するとロボットの高さが制限されると同時に、良好な収音効果を得るためには環状マイクロホンアレイを水平方向の静止状態にする必要がある。そのため、ロボットの頭部の動きが制限され、環状マイクロホンのロボットの頭部での環状開口もロボットの美感に影響を与える。環状マイクロホンアレイ及び直線形マイクロホンアレイを同時に使用することによって、ロボットの至るところにマイクロホンの開口があり、それはロボットの美観に影響を与える。
【発明の概要】
【発明が解決しようとする課題】
【0005】
これに鑑みて、本発明の実施例は、従来の環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決するために、ロボット及びそのオーディオデータ処理方法を提供する。
【0006】
本発明の第1態様はロボットを提供する。このロボットは、収音モジュールと主制御モジュールとを含み、
前記収音モジュールと前記主制御モジュールは電気的に接続され、前記収音モジュールはマイクロホンアレイを含み、前記マイクロホンアレイはN個のマイクロホンを含み、N≧3且つNは整数であり、
前記N個のマイクロホンは前記ロボットの本体に環状且つ均一に分布し、前記N個のマイクロホンによりオーディオデータが収集され、N個のマイクロホンにより収集されたNチャンネルのオーディオデータが前記主制御モジュールに転送され、それにより、前記主制御モジュールは前記オーディオデータに基づいて音源位置決め及び収音を行う。
【0007】
本発明の第2態様は、上記ロボットに基づくオーディオデータ処理方法を提供する。この方法は、
収音モジュールのN個のマイクロホンによりオーディオデータを収集するステップと、
前記N個のマイクロホンにより収集されたNチャンネルのオーディオデータを主制御モジュールに送信するステップと、
前記主制御モジュールは前記Nチャンネルのオーディオデータをデータバッファプール内に記憶し、オーディオデータに基づいて音源位置決め及び収音を行うステップとを含む。
【0008】
本発明によるロボット及びそのオーディオデータ処理方法は、ロボットの本体に環状且つ均一に分布するN個のマイクロホンにより構成されたマイクロホンアレイを配置してオーディオデータを収集し、収集されたNチャンネルのオーディオデータ及び参照オーディオデータを主制御モジュールに転送し、主制御モジュールによりそのオーディオデータに基づいて音源位置決め及び収音を行うことによって、ロボットの360度のウェイクアップ及び音源位置決めをサポートすることができるとともに、指向性ビームフォーミングをサポートし収音を実現することができ、ロボットの高さを制限することも、ロボットの頭部の動きを制限することもなく、環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決する。
【図面の簡単な説明】
【0009】
本発明の実施例の技術手段を更に詳細に説明するため、下記では実施例又は従来技術の説明に必要な図面を簡単に説明する。当然のことながら、下記の説明における図面は本発明の幾つかの実施例のみであり、当業者にとって、創造的労働を果たさない前提で、これらの図面に基づいて他の図面を得ることができる。
【
図1】本発明の実施例1によるロボットのモジュールの構造模式図である。
【
図2】本発明の実施例1によるロボットのマイクロホンアレイの分布模式図である。
【
図3】本発明の実施例1によるロボットの収音モジュールの構造模式図である。
【
図4】本発明の実施例2による実施例1のロボットに基づくオーディオデータ処理方法を実現するフローチャートである。
【発明を実施するための形態】
【0010】
以下の説明では、限定の目的ではなく説明の目的のために、本発明の実施例を完全に理解するように、特定のシステム構造や技術などの具体的な詳細を提供する。しかしながら、本発明がこれらの特定の詳細なしに他の実施例において実施され得ることは当業者に明らかであろう。他の状況では、不必要な詳細により本発明の説明を不明瞭にしないように、周知のシステム、システム、回路、及び方法の詳細な説明を省略する。
【0011】
なお、本発明の明細書及び特許請求の範囲における「含む」という用語及びその任意の変形は、非排他的な包含をカーバすることを意図する。例えば、一連のステップ又はユニットを含むプロセス、方法、あるいはシステム、製品又は装置は、挙げられたステップ又はユニットに限定されず、任意選択で、挙げられていないステップ又はユニットを更に含み、又はこれらのプロセス、方法、製品又は装置に固有の他のステップ又はユニットを更に含む。さらに、「第1」、「第2」、及び「第3」などの用語は、異なる対象を区別するために使用され、特定の順序を説明することを意図していない。
【0012】
本発明の実施例は、環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決するために、ロボット及びそのオーディオデータ処理方法を提供し、ロボットの本体に環状且つ均一に分布するN個のマイクロホンにより構成されたマイクロホンアレイを配置してオーディオデータを収集し、収集されたNチャンネルのオーディオデータ及び参照オーディオデータを主制御モジュールに転送し、主制御モジュールによりそのオーディオデータに基づいて音源位置決め及び収音を行うことによって、ロボットの360度のウェイクアップ及び音源位置決めをサポートすることができ、ロボットの高さを制限することも、ロボットの頭部の動きを制限することもなく、環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決する。
【0013】
下記では、具体的な実施例を用いて、本発明の技術方案を説明する。
【0014】
<実施例1>
図1に示すように、本実施例はロボット1を提供する。ロボット1は、収音モジュール10と主制御モジュール20とを含む。
【0015】
収音モジュール10と主制御モジュール20は互いに電気的に接続され、収音モジュール10はマイクロホンアレイ11を含み、マイクロホンアレイ11はN個のマイクロホンを含む。N≧3であり、且つNは整数である。
【0016】
N個のマイクロホンは、ロボット1の任意の身体部分の周りに均一に分布し、主制御モジュール20は、マイクロホンアレイ11により収集されたNチャンネルのオーディオデータを取得し、オーディオデータに基づいて音源位置決め及び収音を行う。該ロボット1は人型ロボットであってもよく、その身体部分は頭部31、首部32、胴体33の少なくとも一部を含む。他の実施例において、該ロボット1の身体部分は腰部、肢体等を含んでもよい。前記Nは3以上の整数である。
【0017】
一実施例では、上記収音モジュール10はMIC小型基板12をさらに含む。
【0018】
MIC小型基板12は、マイクロホンアレイ11と主制御モジュール20にそれぞれ電気的に接続される。
【0019】
MIC小型基板12は、マイクロホンアレイ11により収集されたNチャンネルのオーディオデータをアナログデジタル変換した後に主制御モジュール20に転送する。具体的には、MIC小型基板は、マイクロホンアレイ11により収集されたNチャンネルアナログオーディオデータをデジタルオーディオデータに変換し、そのデジタルオーディオデータを主制御モジュール20に転送する。
【0020】
一実施例では、上記MIC小型基板12は、マイクロホンアレイ11及び主制御モジュール20にそれぞれ電気的に接続されたアナログデジタル変換器121を含む。アナログデジタル変換器121により、Nチャンネルのオーディオデータはアナログデジタル変換される。
【0021】
具体的な応用では、MIC小型基板12は、各マイクロホンにより収集されたアナログオーディオデータを対応するデジタルオーディオデータに変換し、デジタルオーディオデータに番号付けし、番号付けされたデジタルオーディオデータを主制御モジュールに送信することができる。
【0022】
具体的な応用では、
図3に示すように、上記収音モジュール10は、マイクロホン線を介してマイクロホンアレイ11に電気的に接続されたMIC小型基板12を含み、MIC小型基板はアナログデジタル変換器121を含む。MIC小型基板は、I2Sバス、I2Cバス、及び電源線を介して主制御モジュール20に電気的に接続される。MIC小型基板12は、マイクロホンアレイ11により収集されたNチャンネルのオーディオデータを、アナログデジタル変換器121によりアナログデジタル変換し、変換されたNチャンネルのオーディオデータを融合し、I2Sインターフェイスを介して融合されたオーディオデータを主制御モジュール20に転送する。上記MIC小型基板はさらに、Nチャンネルのオーディオデータを番号付けし、番号付けによってオーディオデータを、そのオーディオデータを収集したマイクロホンに関連付ける。
【0023】
一実施例では、上記第1マイクロホンアレイは6個のマイクロホンを含む。6個のマイクロホンはロボットの首部32周囲に配置されて首部32の縦軸線L上の任意の点を円心とした円周に分布する。円周は、縦軸線に対して垂直である。他の実施例において、前記マイクロホンは均一に分布してもよく、非均一に分布してもよく、前記円周は楕円、または他の形状であってもよい。
【0024】
具体的な応用では、
図2に示すように、音源Sに対して、マイクロホンアレイ11は、第1マイクロホンMIC1、第2マイクロホンMIC2、第3マイクロホンMIC3、第4マイクロホンMIC4、第5マイクロホンMIC5、及び第6マイクロホンMIC6を含む。第1マイクロホンMIC1及び第2マイクロホンMIC2は、ロボット1の首部32の縦軸線Lに対して垂直な水平線H上に位置する。第1マイクロホンMIC1、第2マイクロホンMIC2、第3マイクロホンMIC3、第4マイクロホンMIC4、第5マイクロホンMIC5、及び第6マイクロホンMIC6は、等間隔で、各2つのマイクロホンと、縦軸線L上の任意の点を円心とした円周Cの円心Pとの間の角度Aを60度とし、即ち、360度で首部32の周りに均一に分布する。第1マイクロホンMIC1、第2マイクロホンMIC2、第3マイクロホンMIC3、第4マイクロホンMIC4、第5マイクロホンMIC5、及び第6マイクロホンMIC6は、ロボットの首部を囲む環状マイクロホンアレイを構成する。
【0025】
一実施例では、前記主制御モジュール20は、ロボット1のパワーアンプ30から参照オーディオデータを取得してMIC小型基板21に入力し、前記MIC小型基板21はさらに、Xチャンネルの上記参照オーディオデータをアナログデジタル変換及びコード化した後に前記主制御モジュールに転送するために使用される。前記参照オーディオデータは、前記ロボットが通常に話すまたは歌う際に再生された音声を含むことができる。具体的な応用では、主制御モジュールによりMIC小型基板12に参照オーディオデータを入力することは、入力されたXチャンネルの参照オーディオデータをMIC小型基板12によって番号付けし、上記Nチャンネルのオーディオデータと融合し、I2Sインターフェイスを介して主制御モジュール20に送信する。主制御モジュール20は、このような参照オーディオデータに基づいてエコーを除去し、環境雑音の影響をフィルタリングして、音源位置決めの精度及び音声識別の精度をさらに向上させる。
【0026】
具体的な応用では、上記主制御モジュールは、対応する再生のオーディオが2トラックである場合、2チャンネルの参照オーディオデータ(即ち、X=2)を生成する。上記主制御モジュールは、対応する再生のオーディオが1トラックである場合、1チャンネルの参照オーディオデータを生成する。主制御モジュールは、対応する再生のオーディオが4トラックである場合、4チャンネルの参照オーディオデータを生成する。2トラックを例とすると、主制御モジュールは、データ線を介して直接MIC小型基板に接続され、次に、主制御モジュールのパワーアンプによって再生される2チャンネルの参照オーディオデータをMIC小型基板に転送する。
【0027】
一実施例では、上記主制御モジュール20はデータバッファプールを含み、データバッファプールは、Nチャンネルのオーディオデータを記憶するために使用される。一実施例では、上記バッファプールはNチャンネルのオーディオデータを記憶しているだけでなく、MIC小型基板から転送された参照オーディオデータも記憶している。
【0028】
具体的な応用では、主制御モジュール20は、MIC小型基板12のI2Sインターフェイスから取得したNチャンネルのオーディオデータ及びXチャンネルの参照オーディオデータを上記データバッファプールに記憶する。主制御モジュール20によってデータバッファプール内のオーディオデータに基づいてデータ多重化が行われ、プリセットアルゴリズムを実行することによって360度のウェイクアップが実現され、ビームフォーミングされて収音が実行される。なお、上記プリセットアルゴリズムは、収集されたオーディオデータに基づいて音源位置決めを行う既存の位置決めアルゴリズム、収集されたオーディオデータに基づいてロボットのウェイクアップを行う既存のウェイクアップアルゴリズム、及び収集されたオーディオデータに基づいてビームフォーミング及び収音を行う既存のビームフォーミング収音アルゴリズムを指す。
【0029】
具体的な応用では、環状マイクロホンアレイによって収集された対応する6チャンネルのオーディオデータ及び2チャンネルの参照オーディオデータ(合計8チャンネルのオーディオデータ)に従ってロボットのウェイクアップを行う。即ち、上記8チャンネルのオーディオデータに従って音源位置決めを行い、音源位置決めによって音源の位置と現在の位置との角度差を確定し、その角度差に応じて、方向を変えるようにロボットを制御し、ロボットをウェイクアップする。ロボットをウェイクアップした後、上記環状の6MIC内の第1マイクロホンMIC1、第2マイクロホンMIC2、第3マイクロホンMIC3、及び第6マイクロホンMIC6によって収集されたオーディオデータ及び2チャンネルの参照オーディオデータ(合計6チャンネルのオーディオデータ)に従ってビームフォーミングと収音及び音声識別を行う。即ち、上記6チャンネルのオーディオデータに従ってノイズ低減及びエコーキャンセルを行った後に、音声識別ためのオーディオデータを取得し、音声装置ユニットでオーディオデータを識別することによって、音声データを文字に変換する。
【0030】
一実施例では、上記主制御モジュール20はアンドロイド開発ボードであってもよい。上記アンドロイド開発ボードのソフトウェア層にはデータバッファプールが設けられ、収音モジュール10から送信されたNチャンネルのオーディオデータ及び2チャンネルの参照オーディオデータが番号付けされて上記データバッファプール内に記憶される。ウェイクアップアルゴリズムと認識アルゴリズムを並列実行することによって、必要なオーディオデータがデータバッファプールから並行して取得される。なお、上記ウェイクアップアルゴリズムは、既存の様々な音声ウェイクアップアルゴリズムを使用してもよく、上記認識アルゴリズムは、既存の様々な音声認識アルゴリズムを使用してもよい。マイクロホンにより収集されたオーディオデータを多重化することによって、一部のマイクロホンにより取得されたオーディオデータは、ウェイクアップアルゴリズムの使用のために供給されるとともに、認識アルゴリズムの使用のために供給される。それにより、ロボットの首部に位置するマイクロホンアレイは、360度の音源位置決め及び360度のウェイクアップを依然として実現することができると同時に、音声識別のためのオーディオデータの収集(ビームフォーミング収音)を確実にして、音声識別に影響を与えない。ロボットの頭部にマイクロホン孔を開設する必要もなく、ロボットの美観に影響を与えない。
【0031】
本実施例によるロボットは、ロボットの本体に環状且つ均一に分布するN個のマイクロホンにより構成されたマイクロホンアレイを配置してオーディオデータを収集し、収集されたNチャンネルのオーディオデータを主制御モジュールに転送し、主制御モジュールによりそのオーディオデータに基づいて音源位置決め及び収音を行うことによって、ロボットの360度のウェイクアップ及び音源位置決めをサポートすることができるとともに、指向性ビームフォーミングをサポートし収音を実現することができ、ロボットの高さを制限することも、ロボットの頭部の動きを制限することもなく、環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決する。
【0032】
<実施例2>
図4に示すように、本実施例は、実施例1によるロボットに基づく音声処理方法を提供する。この方法は、具体的に、ステップS101〜ステップS103を含む。
【0033】
ステップS101では、収音モジュールのN個のマイクロホンによりオーディオデータを収集する。
【0034】
具体的な応用では、ロボット本体に配置されたN個のマイクロホンにより、オーディオデータを収集する。上記N個のマイクロホンは、ロボットの本体の縦軸線上の任意の点を円心とした円周に分布する。円周は縦軸線に対して垂直である。N≧3であり、且つNは整数である。
【0035】
一実施例では、上記N個のマイクロホンは6個のマイクロホンである。6個のマイクロホンはロボットの首部に配置される。6個のマイクロホンは、ロボットの本体の縦軸線上の任意の点を円心とした円周に分布する。円周は縦軸線に対して垂直である。6個のマイクロホンは環状の6MICアレイを形成する。
【0036】
ステップS102では、前記N個のマイクロホンにより収集されたNチャンネルのオーディオデータを主制御モジュールに送信する。
【0037】
具体的な応用では、N個のマイクロホンにより収集されたNチャンネルのオーディオデータを主制御モジュールに送信し、主制御モジュールにより上記オーディオデータに基づいて音源位置決め及び収音を実現する。
【0038】
具体的な応用では、マイクロホンアレイのN個のマイクロホンに電気的に接続されたMIC小型基板によって、Nチャンネルのオーディオデータをアナログデジタル変換した後、アナログデジタル変換されたオーディオデータに対してデータ融合を行い、融合されたオーディオデータを主制御モジュールに転送する。
【0039】
具体的な応用では、MIC小型基板は、データ融合を行うとき、参照オーディオ信号を導入することによって、参照オーディオ信号と上記Nチャンネルのオーディオデータとに対してデータ融合を行い、融合されたデジタルオーディオデータを主制御モジュールに転送する。
【0040】
具体的な応用では、上記MIC小型基板はさらに、各チャンネルのオーディオデータに対応する番号を付け、上記Nチャンネルのオーディオデータ及び2チャンネルの参照オーディオデータに対してそれぞれ番号を付ける。
【0041】
ステップS103では、前記主制御モジュールは前記Nチャンネルのオーディオデータをデータバッファプール内に記憶し、オーディオデータに基づいて音源位置決め及び収音を行う。
【0042】
具体的な応用では、主制御モジュールは、データバッファプール内に記憶されているオーディオデータに応じて、対応するアルゴリズムを実行して、音源位置決め及び収音を行って、ウェイクアップ及び音声識別を実現する。具体的には、主制御モジュールは、実行するアルゴリズムに従って、上記データバッファプールから対応するコードのオーディオデータを取得し、対応するアルゴリズムを実行する。
【0043】
具体的な応用では、主制御モジュールは、データバッファプールからNチャンネルのオーディオデータ及び2チャンネルの参照オーディオデータを取得し、Nチャンネルのオーディオデータ及び2チャンネルの参照オーディオデータに従ってウェイクアップアルゴリズムを実行することによって、ロボットの360度のウェイクアップを実現する。主制御モジュールは、データバッファプールから並行して第1マイクロホンMIC1によって取得されたオーディオデータ、第2マイクロホンMIC2によって取得されたオーディオデータ、第3マイクロホンMIC3によって取得されたオーディオデータ、第6マイクロホンMIC6によって取得されたオーディオデータ及び2チャンネルの参照オーディオデータを取得しており、第1マイクロホンMIC1によって取得されたオーディオデータ、第2マイクロホンMIC2によって取得されたオーディオデータ、第3マイクロホンMIC3によって取得されたオーディオデータ、第6マイクロホンMIC6によって取得されたオーディオデータ及び2チャンネルの参照オーディオデータに基づいて、認識アルゴリズムを実行して、ユーザーの話に対して音声識別を行う。
【0044】
一実施例では、上記ステップS103は具体的に以下のステップS1031〜ステップS1033を含む。
【0045】
ステップS1031では、2チャンネルの参照オーディオデータ及び前記Nチャンネルのオーディオデータを前記データバッファプールに格納する。
【0046】
ステップS1032では、前記データバッファプールから第1グループのオーディオデータを取得し、第1プリセットアルゴリズムにより音源位置を決める。
【0047】
ステップS1033では、前記データバッファプールから第2グループのオーディオデータを取得し、第2プリセットアルゴリズムにより前記第2グループのオーディオデータに対してビームフォーミング及びオーディオノイズ低減処理を行う。
【0048】
一実施例では、上記Nチャンネルのオーディオデータは、6チャンネルのオーディオデータを含む。
【0049】
具体的な応用では、各マイクロホンにより収集されたオーディオデータに対応する番号が付けられる。即ち、第1マイクロホンによって取得されたオーディオデータは第1オーディオデータとして番号付けされ、第2マイクロホンによって取得されたオーディオデータは第2オーディオデータとして番号付けされ、第3マイクロホンによって取得されたオーディオデータは第3オーディオデータとして番号付けされ、第4マイクロホンによって取得されたオーディオデータは第4オーディオデータとして番号付けされ、第5マイクロホンによって取得されたオーディオデータは第5オーディオデータとして番号付けされ、第6マイクロホンによって取得されたオーディオデータは第6オーディオデータとして番号付けされ、第1チャンネルの参照オーディオデータは第7オーディオデータとして番号付けされ、第2チャンネルの参照オーディオデータは第8オーディオデータとして番号付けされる。上記第1グループのオーディオデータは、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第4オーディオデータ、第5オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータを含む。上記第2グループのオーディオデータは、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータを含む。
【0050】
具体的な応用では、環状の6MICによって収集された対応するオーディオデータ及び2チャンネルの参照オーディオデータ(合計8チャンネルのオーディオデータ)に従ってエコーキャンセル、360度の音源位置決め、及びロボットのウェイクアップを行う。即ち、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第4オーディオデータ、第5オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータに従って、エコーキャンセル、音源位置決めを行い、音源位置決めによって音源の位置と現在の位置との角度差を確定し、その角度差に応じて、方向を変えるようにロボットを制御し、ロボットをウェイクアップする。ロボットをウェイクアップした後、第1マイクロホンMIC1によって収集されたオーディオデータ、第2マイクロホンMIC2によって収集されたオーディオデータ、第3マイクロホンMIC3によって収集されたオーディオデータ、第6マイクロホンMIC6によって収集されたオーディオデータ、及び2チャンネルの参照オーディオデータ(合計6チャンネルのオーディオデータ)に従って、エコーキャンセル、ノイズ低減、ビームフォーミングと収音、及び音声識別を行う。即ち、第1オーディオデータ、第2オーディオデータ、第3オーディオデータ、第6オーディオデータ、第7オーディオデータ、及び第8オーディオデータに従って、ノイズ低減及びエコーキャンセルを行った後に、音声識別ためのオーディオデータを取得し、音声装置ユニットでそのオーディオデータを識別することによって、音声データを文字に変換して、音声識別を実現する。
【0051】
なお、ユーザーがロボットの正面に立つと、ユーザーの声が直接到達できるMICはMICアレイを構成し、ビームフォーミングのために使用することができる。本実施例では環状の6MICが使用されるので、ユーザーがロボットの正面に立つと、声が直接到達できる環状のMICアレイの幾つかのMICにより構成される半円形MICアレイのマイクロホンは音収集時に遮蔽されることはない。そのため、半円形MICアレイ(第1マイクロホンMIC1、第2マイクロホンMIC2、第3マイクロホンMIC3、及び第6マイクロホンMIC6からなる半円形MICアレイ)によって収集されたオーディオデータを使用してビームフォーミングを行うと、より良い収音を実現することができる。また、上記は本実施例の一つの実施形態に過ぎず、ユーザーがロボットの正面に立つとき、ユーザーの声が直接到達できる(遮断されない)マイクロホンのすべてを使用してビームフォーミングを実現することができ、これは本明細書に制限されない。
【0052】
なお、上記第1プリセットアルゴリズムは、音源位置決め及びロボットのウェイクアップを実現することができる既存のウェイクアップアルゴリズムであり、上記第2プリセットアルゴリズムは、音声識別を実現することができる既存のアルゴリズムである。
【0053】
実施例1のロボットに基づいて実現される本実施例のオーディオデータ処理方法は同様に、ロボットの本体に環状且つ均一に分布するN個のマイクロホンにより構成されたマイクロホンアレイを配置してオーディオデータを収集し、収集されたNチャンネルのオーディオデータを主制御モジュールに転送し、主制御モジュールによりそのオーディオデータに基づいて音源位置決め及び収音を行うことによって、ロボットの360度のウェイクアップ及び音源位置決めをサポートすることができるとともに、指向性ビームフォーミングをサポートし収音を実現することができ、ロボットの高さを制限することも、ロボットの頭部の動きを制限することもなく、従来の環状マイクロホンアレイの配置位置によりロボットの高さ及び頭部の動きが制限され外観が悪いという問題を解決する。
【0054】
以上の実施例は、単に本発明の技術手段を説明するためのものであり、それを制限するものではない。上記した実施例を参照して本発明について詳述したが、当業者であれば、上記した各実施例に記載の技術手段を修正し、又はその一部の技術特徴を均等物で置き換えることができる。これらの修正又は置き換えは、対応する技術手段の本質を本発明の各実施例の技術手段の精神及び範囲から逸脱させず、いずれも本発明の保護範囲内に含まれる。
【要約】 (修正有)
【課題】ロボット及びそのオーディオデータ処理方法を提供する。
【解決手段】ロボットは、少なくとも1つの身体部分と収音モジュールと主制御モジュールとを含む。収音モジュールと主制御モジュールは互いに電気的に接続され、収音モジュールはマイクロホンアレイ11を含む。N個のマイクロホンは、ロボットの身体部分の周りに均一に分布する。主制御モジュールは、マイクロホンアレイにより収集されたNチャンネルのオーディオデータを取得し、オーディオデータに基づいて音源位置決め及び収音を行う。音源位置決め及び収音を行うことによって、ロボットの360度のウェイクアップ及び音源位置決めをサポートすることができるとともに、指向性ビームフォーミングをサポートし収音を実現することができる。
【選択図】
図2