(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-11
(45)【発行日】2024-11-19
(54)【発明の名称】情報処理装置、方法、及びプログラム
(51)【国際特許分類】
G01H 17/00 20060101AFI20241112BHJP
【FI】
G01H17/00 C
(21)【出願番号】P 2022118310
(22)【出願日】2022-07-25
【審査請求日】2024-03-05
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100139491
【氏名又は名称】河合 隆慶
(74)【代理人】
【識別番号】100224694
【氏名又は名称】伊藤 孝志
(72)【発明者】
【氏名】加来 航
【審査官】中村 圭伸
(56)【参考文献】
【文献】特開2020-060686(JP,A)
【文献】特開平11-327567(JP,A)
【文献】特開平07-083751(JP,A)
【文献】特開2005-338528(JP,A)
【文献】特開2005-164313(JP,A)
【文献】特開2018-165774(JP,A)
【文献】米国特許出願公開第2015/0057083(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01H 1/00 - 17/00
G10K 15/00
(57)【特許請求の範囲】
【請求項1】
制御部を備える情報処理装置であって、
前記制御部は、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得し、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループにつき代表周波数帯を設定し、
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートする、情報処理装置。
【請求項2】
請求項1に記載の情報処理装置であって、
前記評価対象音源は、人工音及び人工音以外の音を発するロボットであり、
前記制御部は、前記ロボットについて作成された音を前記人工音としてシミュレートする、情報処理装置。
【請求項3】
請求項2に記載の情報処理装置であって、
前記制御部は、前記ロボットについて作成された音を前記人工音としてシミュレートする際、複数の人工音及び人工音以外の音をシミュレートし、前記1つの観測点における各人工音の識別性の高さを評価することを更に含む、情報処理装置。
【請求項4】
情報処理装置が実行する方法であって、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得すること、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループの代表周波数帯を設定すること、及び
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートすること
を含む、方法。
【請求項5】
情報処理装置に、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得すること、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループの代表周波数帯を設定すること、及び
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートすること
を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、方法、及びプログラムに関する。
【背景技術】
【0002】
従来、音場シミュレーションに関する技術が知られている。例えば、特許文献1には、音波の反射経路の解析において、音波の反射方向の演算を高速化するため、所定の面は考慮せずに反射方向を演算する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
音場、特に街レベルの広い屋外音場を仮想三次元空間内で再現する音場シミュレーションでは、音源として多様な物体が存在するため計算量が膨大になる。しかし、従来は計算量の低減が不十分であり、音場シミュレーションに関する技術には改善の余地があった。
【0005】
かかる事情に鑑みてなされた本開示の目的は、音場シミュレーションに関する技術を改善することにある。
【課題を解決するための手段】
【0006】
本開示の一実施形態に係る情報処理装置は、
制御部を備える情報処理装置であって、
前記制御部は、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得し、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループにつき代表周波数帯を設定し、
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートする。
【0007】
本開示の一実施形態に係る方法は、
情報処理装置が実行する方法であって、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得すること、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループの代表周波数帯を設定すること、及び
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートすること
を含む。
【0008】
本開示の一実施形態に係るプログラムは、
情報処理装置に、
音場に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に前記音場で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得すること、
取得された音源データで示される音圧レベルに応じて、前記複数の音源グループの各音源グループの代表周波数帯を設定すること、及び
前記複数の音源グループに分類された音源とは異なる評価対象音源から前記仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から前記仮想三次元空間内を伝搬して前記1つの観測点に到達する音をシミュレートすること
を実行させる。
【発明の効果】
【0009】
本開示の一実施形態によれば、音場シミュレーションに関する技術が改善される。
【図面の簡単な説明】
【0010】
【
図1】本開示の一実施形態に係るシステムの概略構成を示すブロック図である。
【
図2】記録装置の概略構成を示すブロック図である。
【
図3】情報処理装置の概略構成を示すブロック図である。
【
図4】情報処理装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本開示の実施形態について説明する。
【0012】
<実施形態の概要>
図1を参照して、本開示の実施形態に係るシステム1の概要について説明する。システム1は、記録装置10と、情報処理装置20とを備える。記録装置10及び情報処理装置20は、例えばインターネット及び移動体通信網等を含むネットワーク30と通信可能に接続される。
【0013】
記録装置10は、例えばマイクロフォンを備えた録音装置であるが、これに限られず任意の装置であってよい。記録装置10は、本実施形態では、複数の音源41a,・・・,41nが存在する音場40に設置される。以下では、複数の音源41a,・・・,41nを「複数の音源41」とまとめて表記することもある。音場40は、本実施形態では屋外音場(例えば、街中の広場)であるが、屋内音場(例えば、工場の建屋内)であってもよい。記録装置10が設置される音場40内の位置は、本実施形態に係る1つの観測点に相当する。システム1が備える記録装置10の数は、任意に定め得る。
【0014】
情報処理装置20は、例えばサーバ装置等のコンピュータである。情報処理装置20は、ネットワーク30を介して記録装置10と通信可能である。情報処理装置20は、ネットワーク30を介して記録装置10から、取得された音源データを受信する。
【0015】
まず、本実施形態の概要について説明し、詳細については後述する。情報処理装置20は、音場に対応する仮想三次元空間内の複数の音源41のうち、複数の音源グループに分類された音源について、観察期間中に音場40で取得された、周波数ごとの音圧レベルを示す音源データを取得する。情報処理装置20は、取得された音源データで示される音圧レベルに応じて、複数の音源グループの各音源グループの代表周波数帯を設定する。情報処理装置20は、複数の音源グループに分類された音源とは異なる評価対象音源42から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする。
【0016】
このように、本実施形態によれば、評価対象音源42以外の音源である、各音源グループに属する音源の発する音を代表周波数帯に限定して、音場40のシミュレーションが実行される。このため、例えば街レベルの広い屋外音場を仮想三次元空間内で再現する際、評価対象音源42以外の音源の発する音について計算量を低減できる。したがって、音場の再現性を担保しつつ計算量の増加を抑制しやすくなる点で、音場シミュレーションに関する技術が改善される。
【0017】
次に、システム1の各構成について詳細に説明する。
【0018】
<記録装置の構成>
図2に示すように、記録装置10は、音源データ取得部11と、測位部12と、通信部13と、入力部14と、出力部15と、記憶部16と、制御部17と、を備える。
【0019】
音源データ取得部11は、例えばマイクロフォンであるが、これに限られず任意の装置であってよい。マイクロフォンは、モノラル録音又はステレオ録音等、任意の録音方式のマイクロフォンである。ステレオ録音は、バイノーラル録音を含む。バイノーラル録音とは、人間の頭部の音響効果を再現するダミーヘッド等の機器を用いて鼓膜に届く状態で音を記録する録音方式のことである。バイノーラル録音方式を採用する場合、音源データ取得部11は、人間の頭部を模したダミーヘッド等の機器の両耳に組み込まれるマイクロフォンカプセル、又は人間の両耳に装着されるイヤフォン型マイクロフォンであり得る。
【0020】
測位部12は、記録装置10の位置情報を取得する1つ以上の装置を含む。具体的には、測位部12は、例えばGPS(Global Positioning System)に対応する受信機を含むが、これに限られず、任意の衛星測位システムに対応する受信機を含んでもよい。
【0021】
通信部13は、ネットワーク30に接続する1つ以上の通信インタフェースを含む。当該通信インタフェースは、例えば4G(4th Generation)又は5G(5th Generation)等の移動体通信規格に対応するが、これらに限られない。本実施形態において、記録装置10は、通信部13及びネットワーク30を介して情報処理装置20と通信する。
【0022】
入力部14は、少なくとも1つの入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、又はディスプレイと一体的に設けられたタッチスクリーンである。入力部14は、記録装置10の動作に用いられるデータを入力する操作を受け付ける。入力部14は、記録装置10に備えられる代わりに、外部の入力機器として記録装置10に接続されてもよい。接続用インタフェースとしては、例えば、USB(Universal Serial Bus)、HDMI(High-Definition Multimedia Interface)(登録商標)、又はBluetooth(登録商標)等の規格に対応したインタフェースを用いることができる。また、入力部14は、音場40の状況を示す情報を取得可能な任意のセンサモジュールも含む。音場40の状況を示す情報は、例えば複数の音源41のそれぞれに関する、音場40内の位置(以下、「音の発出位置」ともいう。)及び1つの観測点との距離(以下、「音の到達距離」ともいう。)等を示す情報を含む。例えば、センサモジュールは、カメラ、赤外線センサ、LiDAR(light detection and ranging)等の距離センサ、又はこれらの組合せを含む。
【0023】
出力部15は、情報を出力してユーザに通知する1つ以上の出力装置を含んでもよい。当該出力装置は、例えば情報を音声で出力するスピーカ、又は情報を画像若しくは映像で出力するディスプレイ等であるが、これらに限られない。出力部15は、外部の出力装置を接続するためのインタフェースを含んでもよい。
【0024】
記憶部16は、1つ以上のメモリを含む。メモリは、例えば半導体メモリ、磁気メモリ、又は光メモリ等であるが、これらに限られない。記憶部16に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部16は、記録装置10の動作に用いられる任意の情報を記憶する。例えば、記憶部16は、システムプログラム、アプリケーションプログラム、及び組み込みソフトウェア等を記憶してもよい。記憶部16に記憶された情報は、例えば通信部13を介してネットワーク30から取得される情報で更新可能であってもよい。
【0025】
制御部17は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。プロセッサは、例えばCPU(Central Processing Unit)若しくはGPU(Graphics Processing Unit)等の汎用プロセッサ、又は特定の処理に特化した専用プロセッサであるがこれらに限られない。プログラマブル回路は、例えばFPGA(Field-Programmable Gate Array)であるがこれに限られない。専用回路は、例えばASIC(Application Specific Integrated Circuit)であるがこれに限られない。制御部17は、記録装置10全体の動作を制御する。
【0026】
<情報処理装置の構成>
図3に示すように、情報処理装置20は、通信部21と、入力部22と、出力部23と、記憶部24と、制御部25と、を備える。
【0027】
通信部21は、ネットワーク30に接続する1つ以上の通信インタフェースを含む。当該通信インタフェースは、例えば移動体通信規格、有線LAN(Local Area Network)規格、又は無線LAN規格に対応するが、これらに限られず、任意の通信規格に対応してもよい。本実施形態において、情報処理装置20は、通信部21及びネットワーク30を介して記録装置10と通信する。なお、情報処理装置20は、通信部21を介して、本実施形態に係る仮想三次元空間内の複数の音源のうち1つ以上の音源と、ネットワーク30を介して又は直接通信してもよい。
【0028】
入力部22は、少なくとも1つの入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、又はディスプレイと一体的に設けられたタッチスクリーンである。入力部22は、情報処理装置20の動作に用いられるデータを入力する操作を受け付ける。入力部22は、情報処理装置20に備えられる代わりに、外部の入力機器として情報処理装置20に接続されてもよい。接続用インタフェースとしては、例えば、USB、HDMI(登録商標)、又はBluetooth(登録商標)等の規格に対応したインタフェースを用いることができる。
【0029】
出力部23は、情報を出力してユーザに通知する1つ以上の出力装置を含んでもよい。当該出力装置は、例えば情報を音声で出力するスピーカ、又は情報を画像若しくは映像で出力するディスプレイ等であるが、これらに限られない。出力部23は、外部の出力装置を接続するためのインタフェースを含んでもよい。
【0030】
記憶部24は、1つ以上のメモリを含む。記憶部24に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部24は、情報処理装置20の動作に用いられる任意の情報を記憶する。例えば、記憶部24は、システムプログラム、アプリケーションプログラム、データベース、及び地図情報等を記憶してもよい。記憶部24に記憶された情報は、例えば通信部21を介してネットワーク30から取得される情報で更新可能であってもよい。
【0031】
制御部25は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。制御部25は、情報処理装置20全体の動作を制御する。
【0032】
本実施形態において、情報処理装置20の記憶部24には、音源データベースが記憶される。音源データベースには、複数の音源グループに分類された音源について、観察期間中に音場40で取得された、周波数ごとの音圧レベルを示す音源データが記憶される。
【0033】
音源データベースにおいて、各音源は、対応する音源グループに分類される。音源の分類の粒度は、任意に設定可能であるが、本実施形態では計算量低減の観点から粗く設定される。例えば、情報処理装置20の制御部25は、「車両」、「自転車」、「人」、及び「自然音」という音源グループを設定してもよい。「自然音」は、例えば風雨等の音が属する音源グループである。一方、音源の分類の粒度は、音場40の再現性の観点からは、細かいほど好ましい。例えば、音源グループ「人」を年齢又は性別ごとに細分化してもよい(「子供」及び「大人」又は「男性」及び「女性」等)。ただし、細分化するほど計算量が増加する傾向があるので、音源の分類の粒度は、音場40の再現性と計算量とのバランスを考慮して適宜決定し得る。そして、制御部25は、設定された音源グループの何れかに各音源を分類し、各音源にそれぞれの属する音源グループを示すフラグを付けた情報を音源データベースに記憶することで、各音源を対応する音源グループに分類し得る。
【0034】
このように設定された音源グループごとに、その音源グループを代表する音源データが作成される。音源データの作成には、任意の手法が採用可能である。例えば、記録装置10の制御部17は、観察期間中に音源データ取得部11に入力された信号をアナログデジタル変換して複数の音源41のそれぞれから発せられた音を表す録音データを作成してもよい。制御部17は、ネットワーク30及び通信部13を介して情報処理装置20の通信部21に、各音源の録音データを送信してもよい。情報処理装置20の制御部25は、通信部21を介して各音源の録音データが受信される度に、各音源の録音データを、各音源の属する音源グループの音サンプルとして音源データベースに蓄積してもよい。そして、制御部25は、各音源グループの音サンプルを使用した実験に基づいて、各音源グループの音源データを作成してもよい。実験として、例えば、制御部25は、ある音源グループについて蓄積された複数の音サンプルを、出力部23を介して出力してもよい。ユーザ(実験参加者)は、各音サンプルと、実際の音場40で聴こえる音とを聴き比べて、音場40で聴こえる音に最も近い音サンプルを特定し、入力部22を介して、特定された音サンプルの識別情報を情報処理装置20に入力してもよい。制御部25は、入力された識別情報で特定される音サンプルを、対応する音源グループの音源データとして、音源データベースに記憶する。この実験を各音源グループについて繰り返すことで、各音源グループの音源データが作成され、音源データベースに記憶され得る。本実施形態のように音源の分類の粒度を粗くする場合、各音源グループの音源データは、その音源グループに含まれる音源の典型的な音を示す。例えば、製造業者の異なる様々な車種の自転車が1つの音源グループ「自転車」に属する場合、当該音源グループの音は、種々の自転車の典型的な音を示す。
【0035】
このようにして、複数の音源グループに分類された音源について、観察期間中に音場40で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データが作成され、音源データベースに記憶される。制御部25は、以下で説明する
図4の動作を実行する度に、音源グループをクエリとして音源データベースを検索することで、音場40のシミュレーションに使用される音源データを取得し得る。
【0036】
<情報処理装置の動作フロー>
図4を参照して、本実施形態に係る情報処理装置20の動作について説明する。
図4の動作は、本実施形態に係る方法に相当する。
図4の動作は、例えば所定の周期で、繰り返し実行される。所定の周期は、任意に定め得る。
【0037】
ステップS100:情報処理装置20の制御部25は、音場40に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に音場40で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得する。
【0038】
具体的には、まず、制御部25は、音場40に対応する仮想三次元空間を作成する。仮想三次元空間の作成には、任意の手法が採用可能である。例えば、制御部25は、ネットワーク30及び通信部21を介して記録装置10の通信部13から、第1情報及び第2情報を受信する。第1情報は、記録装置10の測位部12を介して取得された、記録装置10が設置された音場40内の位置、すなわち本実施形態に係る1つの観測点の位置を示す位置情報である。第2情報は、記録装置10の入力部14を介して取得された、音場40の状況を示す情報、具体的には、複数の音源41の位置情報(すなわち、音の発出位置を示す情報)である。制御部25は、第1情報及び第2情報に基づいて、複数の音源41のそれぞれにつき、1つの観測点との距離(すなわち、音の到達距離)を算出する。音の発出位置及び音の到達距離は、本実施形態では三次元座標から算出されるが、これに限られず任意の手法が採用可能である。制御部25は、1つの観測点の位置並びに算出された音の発出位置及び音の到達距離に基づいて、音場40に対応する仮想三次元空間を作成する。例えば、制御部25は、
図5に示すような仮想三次元空間VSを作成してもよい。点Pは、本実施形態の1つの観測点に相当する。音源41a、41b、41cは、本実施形態の複数の音源に相当する。
【0039】
次に、制御部25は、記憶部24に格納された音源データベースを参照して、音場40を再現するシミュレーションに使用される複数の音源を選択する。
図5に示す例では、シミュレーションに使用される音源として、音源41a(自動運転車両)、音源41b(ロードバイク)、及び音源41c(男性)を含めた複数の音源が選択される。制御部25は、各音源に対応する音源グループを特定する。
図5に示す例では、音源41aの音源グループとして「車両」、音源41bの音源グループとして「自転車」、音源41cの音源グループとして「人」が特定される。上述したとおり、音源データベースには、音場40に対応する仮想三次元空間内の複数の音源41のうち、複数の音源グループに分類された音源について、観察期間中に音場40で取得された録音データに基づいて作成された、各音源グループの周波数ごとの音圧レベルを示す音源データが蓄積されている。したがって、制御部25は、特定された音源グループをクエリとして音源データベースを検索することで、仮想三次元空間内の各音源について、音源データを取得し得る。
図5に示す例では、仮想三次元空間VS内の音源41a、41b、41cを含む各音源について、音源データが取得される。
【0040】
このようにして、制御部25は、音場40に対応する仮想三次元空間内の複数の音源のうち、複数の音源グループに分類された音源について、観察期間中に音場40で取得された録音データに基づいて、各音源グループの周波数ごとの音圧レベルを示す音源データを取得する。これにより、音場40を再現するシミュレーションに使用される、評価対象音源42以外の各音源の音源データが取得される。音源データベースには、複数の音源41に加えて、観察期間中に音場40で取得された、評価対象音源42の人工音以外の音(後述)の音源データも蓄積し、取得されてもよい。しかしながら、音源データの取得には、これらの例に限られず任意の手法が採用可能である。
【0041】
ステップS101:制御部25は、ステップS100で取得された音源データで示される音圧レベルに応じて、複数の音源グループの各音源グループの代表周波数帯を設定する。
【0042】
具体的には、制御部25は、記憶部24に格納された音源データベースを参照して、ステップS100で設定された各音源グループにつき、各音源グループの音源データの全体の周波数範囲から特徴的な周波数帯を抽出する。制御部25は、抽出された周波数帯を各音源グループの代表周波数帯として設定する。特徴的な周波数帯の抽出には、任意の手法が採用可能である。例えば、制御部25は、音源データベースを検索して、ある音源グループの音源データで示される周波数ごとの音圧レベルを参照する。そして、制御部25は、音圧レベルのピークが現れる周波数を中心とした所定の範囲の周波数を、当該音源グループの特徴的な周波数帯として設定してもよい。
図5に示す例では、制御部25は、音源41aの属する音源グループである「車両」につき、音源データで示される周波数ごとの音圧レベルを参照する。そして、制御部25は、音圧レベルのピークが現れる周波数を中心とした所定の範囲の周波数を、音源グループ「車両」の特徴的な周波数帯として設定してもよい。所定の範囲は、任意に設定し得るが、以下に具体例を示す。
【0043】
図5には、縦軸を音圧、横軸を周波数とする2つのグラフが示されている。右側のグラフは、音源41aが属する音源グループ「車両」の音源データで示される、周波数ごとの音圧レベルの値をプロットしたグラフである。グラフの右側半分に相当する周波数帯(以下、「高い方の周波数帯」ともいう。)の音圧レベルと、グラフの左側半分に相当する周波数帯(以下、「低い方の周波数帯」ともいう。)の音圧レベルとを比較すると、低い方の周波数帯(ハッチング範囲)に音圧レベルのピークが現れている。したがって、制御部25は、低い方の周波数帯を、音源グループ「車両」の特徴的な周波数帯として設定し得る。なお、周波数帯の境界は、例えば、最大の音圧レベルから所定のデシベル(dB)下がった周波数として設定することができる。左側のグラフは、音源41bの属する音源グループである「自転車」の音源データで示される、周波数ごとの音圧レベルの値をプロットしたグラフである。高い方の周波数帯の音圧レベルと、低い方の周波数帯の音圧レベルとを比較すると、高い方の周波数帯(ハッチング範囲)に音圧レベルのピークが現れている。したがって、制御部25は、高い方の周波数帯を、音源グループ「自転車」の特徴的な周波数帯として設定し得る。図示の便宜上、音源41cのグラフは省略しているが、音源41a、41bと同様に特徴的な周波数帯を設定し得る。
【0044】
このようにして、制御部25は、取得された音源データで示される音圧レベルに応じて、複数の音源グループの各音源グループの代表周波数帯を設定する。
【0045】
ステップS102:制御部25は、複数の音源41のうち、複数の音源グループに分類された音源とは異なる音源である評価対象音源42から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする。
【0046】
本実施形態において、評価対象音源42は、人工音及び人工音以外の音を発するロボットである。
図5に示す例では、評価対象音源42であるロボットは、仮想三次元空間VS内の点Qに位置する自動搬送ロボットである。しかしながら、ロボットは、これに限られず任意のロボットであってよい。制御部25は、ロボットについて作成された音を人工音としてシミュレートする。
図5に示す例では、制御部25は、点Qに位置する自動搬送ロボットから仮想三次元空間VS内を伝搬して1つの観測点に到達する音として、自動搬送ロボットについて作成された音S0を、人工音としてシミュレートする。人工音は、本実施形態ではロボットの挙動(例えば、発進、停止、曲がる方向等)を人間に理解させやすくする音であるが、これに限られず、例えば人間の声を模した合成音声を含んでもよい。人工音の作成には、任意の手法が採用可能である。例えば、人工音は、数学計算に基づいて人間が気付きやすい音色を求め、当該音色を元に作成されたメロディであってもよい。
【0047】
また、ロボットについて作成された音を人工音としてシミュレートする際は、複数の人工音をシミュレートすることが望ましい。多数の人工音をシミュレートするほど、実際の音場40でロボットからどのような音を人間に表出すれば安全が図りやすくなるか(例えば、人間がロボットの接近に気付きやすくする音)を判定する手掛かりが増える。その結果、人工音のシミュレーションの信頼性を高めやすくなる。さらに、ロボットが発する人工音以外の音(例えば、走行音又は冷蔵システムの音)の影響も考慮することが望ましい。人工音以外の音の影響も考慮した音場シミュレーションを行えば、音場40の再現性がより高まり、音場40の再現性が高まるほど、実際の音場40で人間に理解されやすい人工音の周波数が特定しやすくなる。
【0048】
したがって、制御部25は、ロボットについて作成された音を人工音としてシミュレートする際、複数の人工音及び人工音以外の音をシミュレートし、1つの観測点における各人工音の識別性の高さを評価してもよい。
【0049】
また、制御部25は、評価対象音源42から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする際、当該音の距離減衰量を算出してもよい。具体的には、制御部25は、評価対象音源42であるロボットから仮想三次元空間内を伝搬して1つの観測点に到達する人工音及び人工音以外の音を示すデータに対して、算出された距離減衰量を適用して、人工音及び人工音以外の音をシミュレートしてもよい。距離減衰量の算出には、任意の手法が採用可能である。例えば、制御部25は、周波数及び音場40の環境条件(温度分布、温湿度、風向き等)を含めた所定の条件に基づいて、空気吸収による減衰の推定値を算出してもよい。制御部25は、算出された推定値を、当該音を示すデータに適用することで、ロボットから発せられる音について距離減衰量を算出し得る。
【0050】
ステップS103:制御部25は、ステップS101で設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする。
【0051】
具体的には、制御部25は、仮想三次元空間内の複数の音源41のそれぞれが属する各音源グループの音源データのうち、代表周波数帯以外の周波数に対応する部分は計算対象から除外し、代表周波数帯に対応する部分のみを計算対象とする。換言すると、各音源グループの音源データのうち、各音源グループに属する音源から仮想三次元空間内を伝搬して1つの観測点に到達する音のシミュレーションに使用される部分が、ステップS101で設定された代表周波数帯に対応する部分に限定される。例えば、
図5に示す音源41aについて、制御部25は、音源グループ「車両」の音源データのうち、低い方の周波数帯に対応する部分のみを計算対象として作成した音S1を、音源41aの音としてシミュレートする。また、音源41bについて、制御部25は、音源グループ「自転車」の音源データのうち、高い方の周波数帯に対応する部分のみを計算対象として作成した音S2を、音源41bの音としてシミュレートする。便宜上、音源41cは図示を省略するが、音源41cの音も同様に代表周波数帯に限定してシミュレートし得る。
【0052】
なお、説明の便宜上、ステップS102の実行後にステップS103を実行するかのように記述しているが、ステップS102とステップS103は、逆順又は同時に実行されてもよい。ステップS102及びS103を経て、プロセスは終了する。
【0053】
このようにして、制御部25は、複数の音源グループに分類された音源とは異なる評価対象音源42から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする。これにより、複数の音源グループに分類された音源については周波数帯を限定して、評価対象音源42については周波数帯を限定せずに、音場シミュレーションを実行することができる。その結果、計算量低減と音場の再現性とのバランスを考慮した音場シミュレーションが実現しやすくなる。
【0054】
なお、ステップS102で述べた人工音の識別性とは、複数の音源41が存在する音場40においてある人工音を再生した際の、当該人工音の再生事実及び所期の意図の理解しやすさのことである。人工音の識別性の評価には、任意の手法が採用可能である。例えば、ロボットの発する人工音以外の音及び各音源グループに属する音源の音を再生しながら、作業中のユーザ(実験参加者)に対して抜き打ちで人工音のサンプルを再生し、サンプルの再生事実及び所期の意図がユーザにどの程度理解されるかを調査する実験を繰り返す。ユーザは、各サンプルの識別性のスコアリングを行う。例えば、ユーザが各サンプルの再生に気付くまでの時間が短いほど、又は各サンプルの所期の意図の理解度が高いほど、高いスコアを付与してもよい。スコアの集計結果は、人工音の各サンプルとスコアとを紐付けた情報として、音源データベースに記憶されてもよい。制御部25は、音源データベースに記憶された集計結果に基づいて、例えば最も合計スコアの高いサンプルを最も識別性の高いサンプルとして抽出してもよい。制御部25は、出力部23を介して、抽出されたサンプルをユーザに出力してもよい。このようにして、制御部25は、ロボットについて作成された音を人工音としてシミュレートする際、複数の人工音及び人工音以外の音をシミュレートし、1つの観測点における各人工音の識別性の高さを評価し得る。その結果、実際の音場40でロボットから人間に表出される音として、より人間の安全が図りやすい音を特定しやすくなる。
【0055】
以上述べたように、本実施形態に係る情報処理装置20は、音場に対応する仮想三次元空間内の複数の音源41のうち、複数の音源グループに分類された音源について、観察期間中に音場40で取得された、周波数ごとの音圧レベルを示す音源データを取得する。情報処理装置20は、取得された音源データで示される音圧レベルに応じて、複数の音源グループの各音源グループの代表周波数帯を設定する。情報処理装置20は、複数の音源グループに分類された音源とは異なる評価対象音源42から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートするとともに、設定された各音源グループの代表周波数帯に限定して、各音源グループに属する音源から仮想三次元空間内を伝搬して1つの観測点に到達する音をシミュレートする。
【0056】
かかる構成によれば、評価対象音源42以外の音源である、各音源グループに属する音源の発する音を代表周波数帯に限定して、音場40のシミュレーションが実行される。このため、例えば街レベルの広い屋外音場を仮想三次元空間内で再現する際、評価対象音源42以外の音源の発する音について計算量を低減できる。したがって、音場の再現性を担保しつつ計算量の増加を抑制しやすくなる点で、音場シミュレーションに関する技術が改善される。
【0057】
本開示を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び改変を行ってもよいことに注意されたい。したがって、これらの変形及び改変は本開示の範囲に含まれることに留意されたい。例えば、各構成部又は各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部又はステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
【0058】
例えば、上述した実施形態において、情報処理装置20の構成及び動作を、互いに通信可能な複数のコンピュータに分散させた実施形態も可能である。また例えば、情報処理装置20の一部又は全部の構成要素を記録装置10に設けた実施形態も可能である。
【0059】
また、例えば汎用のコンピュータを、上述した実施形態に係る情報処理装置20として機能させる実施形態も可能である。具体的には、上述した実施形態に係る情報処理装置20の各機能を実現する処理内容を記述したプログラムを、汎用のコンピュータのメモリに格納し、プロセッサによって当該プログラムを読み出して実行させる。したがって、本開示は、プロセッサが実行可能なプログラム、又は当該プログラムを記憶する非一時的なコンピュータ可読媒体としても実現可能である。
【符号の説明】
【0060】
1 システム
10 記録装置
11 音源データ取得部
12 測位部
13 通信部
14 入力部
15 出力部
16 記憶部
17 制御部
20 情報処理装置
21 通信部
22 入力部
23 出力部
24 記憶部
25 制御部
30 ネットワーク
40 音場
41 複数の音源
41a 自動運転車両
41b ロードバイク
41c 男性
42 評価対象音源
P、Q 点
S0、S1、S2 音
VS 仮想三次元空間