IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クレプシードラ株式会社の特許一覧

<>
  • 特許-音再生記録装置、及びプログラム 図1
  • 特許-音再生記録装置、及びプログラム 図2
  • 特許-音再生記録装置、及びプログラム 図3
  • 特許-音再生記録装置、及びプログラム 図4
  • 特許-音再生記録装置、及びプログラム 図5
  • 特許-音再生記録装置、及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-07
(45)【発行日】2024-02-16
(54)【発明の名称】音再生記録装置、及びプログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240208BHJP
   G10K 15/02 20060101ALI20240208BHJP
   H04R 5/027 20060101ALN20240208BHJP
   H04S 1/00 20060101ALN20240208BHJP
【FI】
H04R3/00 310
G10K15/02
H04R3/00 320
H04R5/027 A
H04S1/00 500
【請求項の数】 12
(21)【出願番号】P 2020007962
(22)【出願日】2020-01-22
(65)【公開番号】P2021118365
(43)【公開日】2021-08-10
【審査請求日】2023-01-20
(73)【特許権者】
【識別番号】520090756
【氏名又は名称】クレプシードラ株式会社
(74)【代理人】
【識別番号】100140958
【弁理士】
【氏名又は名称】伊藤 学
(74)【代理人】
【識別番号】100137888
【弁理士】
【氏名又は名称】大山 夏子
(74)【代理人】
【識別番号】100198845
【弁理士】
【氏名又は名称】井上 善喬
(72)【発明者】
【氏名】今 誉
【審査官】中嶋 樹理
(56)【参考文献】
【文献】特開2000-059876(JP,A)
【文献】米国特許出願公開第2013/0282388(US,A1)
【文献】米国特許出願公開第2017/0019743(US,A1)
【文献】国際公開第2017/195616(WO,A1)
【文献】米国特許出願公開第2018/0091917(US,A1)
【文献】特開2014-033303(JP,A)
【文献】特開2019-146049(JP,A)
【文献】米国特許出願公開第2014/0050326(US,A1)
【文献】特開2012-151745(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00
G10K 15/02
H04R 5/027
H04S 1/00
(57)【特許請求の範囲】
【請求項1】
ユーザに対し音を再生する音再生部と、
前記ユーザの両耳付近の音を取得する音取得部と、
第1の音響信号を前記音再生部に入力して前記第1の音響信号に基づく音を前記音再生部により再生すると共に、前記音取得部により取得された音を示す第2の音響信号を記録する処理を制御する制御部と、
を備え
前記制御部は、
前記第1の音響信号の特徴を示す第1のメタ情報をさらに記録し、
記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、前記第1のメタ情報に基づいて除去する、
再生記録装置。
【請求項2】
前記第1の音響信号は、第3の音響信号を少なくとも一部の区間に含み、
前記第1のメタ情報は、前記第3の音響信号、又は前記第3の音響信号を識別するための識別情報を含む、請求項1に記載の音再生記録装置。
【請求項3】
前記第1の音響信号は、第3の音響信号を少なくとも一部の区間に含み、
前記第1のメタ情報は、前記第1の音響信号において前記第3の音響信号が含まれる区間を示す情報を含む、請求項1又2に記載の音再生記録装置。
【請求項4】
前記制御部は、前記第1の音響信号をさらに記録する、請求項1に記載の音再生記録装置。
【請求項5】
前記制御部は、記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、記録した前記第1の音響信号に基づいて除去する、請求項4に記載の音再生記録装置。
【請求項6】
前記制御部は、前記音再生部に適用される設定を示す設定情報をさらに記録する、請求項1~5のいずれか一項に記載の音再生記録装置。
【請求項7】
前記制御部は、記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、前記設定情報に基づいて除去する、請求項6に記載の音再生記録装置。
【請求項8】
前記制御部は、前記第2の音響信号が記録される区間において、前記音再生部以外の音源から発生した音の特徴を示す第2のメタ情報をさらに記録する、請求項1~7のいずれか一項に記載の音再生記録装置。
【請求項9】
前記第2のメタ情報は、前記第2の音響信号が記録される区間において、前記音再生部以外の音源から音が発生した区間を示す情報を含む、請求項8に記載の音再生記録装置。
【請求項10】
前記制御部は、記録された前記第2の音響信号から、前記音再生部以外の音源から発生した音に対応する成分を、前記第2のメタ情報に基づいて除去する、請求項8又に記載の音再生記録装置。
【請求項11】
前記音再生部以外の音源から発生した音は、前記ユーザの話声である、請求項8~10のいずれか一項に記載の音再生記録装置。
【請求項12】
コンピュータを、
第1の音響信号をユーザに対し音を再生する音再生部に入力して前記第1の音響信号に基づく音を前記音再生部により再生すると共に、ユーザの両耳付近の音を取得する音取得部により取得された音を示す第2の音響信号を記録する処理を制御する制御部、
として機能させ
前記制御部は、
前記第1の音響信号の特徴を示す第1のメタ情報をさらに記録し、
記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、前記第1のメタ情報に基づいて除去する、
ログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音再生記録装置、及びプログラムに関する。
【背景技術】
【0002】
近年、バイノーラル録音が注目されている。バイノーラル録音とは、人の両耳の鼓膜に伝わる音を録音する技術である。バイノーラル録音には、例えば両耳の外耳道内に設置されたマイクが使用される。バイノーラル録音された音を、イヤホン又はヘッドホン等により再生することで、あたかもその場に居合わせたかのような立体感及び臨場感のある音を再現することができる。
【0003】
バイノーラル録音に関する技術の一例として、下記特許文献1には、録音時の環境と再生時の環境との間の、耳の形などの身体的特徴の相違を埋めるために、再生時に補正処理を行う技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2017/195616号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記特許文献1に記載の技術を含め、従来では、再現対象の音以外の音が発生している環境でバイノーラル録音することは考慮されていなかった。換言すると、バイノーラル録音には、その場で聞こえる全ての音を録音し再生する、といった制約が課されていた。
【0006】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、バイノーラル録音の自由度を向上させることが可能な仕組みを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のある観点によれば、ユーザに対し音を再生する音再生部と、前記ユーザの両耳付近の音を取得する音取得部と、第1の音響信号を前記音再生部に入力して前記第1の音響信号に基づく音を前記音再生部により再生すると共に、前記音取得部により取得された音を示す第2の音響信号を記録する処理を制御する制御部と、を備える、音再生記録装置が提供される。
【0008】
前記制御部は、前記第1の音響信号の特徴を示す第1のメタ情報をさらに記録してもよい。
【0009】
前記第1の音響信号は、第3の音響信号を少なくとも一部の区間に含み、前記第1のメタ情報は、前記第3の音響信号、又は前記第3の音響信号を識別するための識別情報を含んでもよい。
【0010】
前記第1の音響信号は、第3の音響信号を少なくとも一部の区間に含み、前記第1のメタ情報は、前記第1の音響信号において前記第3の音響信号が含まれる区間を示す情報を含んでもよい。
【0011】
前記制御部は、記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、前記第1のメタ情報に基づいて除去してもよい。
【0012】
前記制御部は、前記第1の音響信号をさらに記録してもよい。
【0013】
前記制御部は、記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、記録した前記第1の音響信号に基づいて除去してもよい。
【0014】
前記制御部は、前記音再生部に適用される設定を示す設定情報をさらに記録してもよい。
【0015】
前記制御部は、記録された前記第2の音響信号から、前記第1の音響信号に基づく音に対応する成分を、前記設定情報に基づいて除去してもよい。
【0016】
前記制御部は、前記第2の音響信号が記録される区間において、前記音再生部以外の音源から発生した音の特徴を示す第2のメタ情報をさらに記録してもよい。
【0017】
前記第2のメタ情報は、前記第2の音響信号が記録される区間において、前記音再生部以外の音源から音が発生した区間を示す情報を含んでもよい。
【0018】
前記制御部は、記録された前記第2の音響信号から、前記音再生部以外の音源から発生した音に対応する成分を、前記第2のメタ情報に基づいて除去してもよい。
【0019】
前記音再生部以外の音源から発生した音は、前記ユーザの話声であってもよい。
【0020】
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、第1の音響信号をユーザに対し音を再生する音再生部に入力して前記第1の音響信号に基づく音を前記音再生部により再生すると共に、ユーザの両耳付近の音を取得する音取得部により取得された音を示す第2の音響信号を記録する処理を制御する制御部、として機能させるためのプログラムが提供される。
【発明の効果】
【0021】
以上説明したように本発明によれば、バイノーラル録音の自由度を向上させることが可能な仕組みが提供される。
【図面の簡単な説明】
【0022】
図1】本発明の一実施形態に係る音再生記録装置の構成の一例を示すブロック図である。
図2】本実施形態に係る第1及び第3の音響信号の波形の一例を説明するための図である。
図3】本実施形態に係る音再生記録装置により実行される第1の音響信号の記録処理の流れの一例を示すフローチャートである。
図4】本実施形態に係る音再生記録装置により実行される、記録された第1の音響信号に基づく再生音の除去処理の流れの一例を示すフローチャートである。
図5】本実施形態に係る音再生記録装置により実行されるメタ情報の記録処理の流れの一例を示すフローチャートである。
図6】本実施形態に係る音再生記録装置により実行される、記録されたメタ情報に基づく再生音の除去処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0023】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0024】
<<1.技術的課題>>
従来、バイノーラル録音は、録音時に聞こえる全ての音を録音し再生することで、録音時の空間をそのまま再現することを目的としていた。そのため、再現対象外の音を鳴っている空間では、バイノーラル録音することは困難であった。再現対象外の音までも録音し、そのまま再現してしまうためである。
【0025】
再現対象外の音として、スピーカ又はヘッドホン等の音出力装置から再生される音である、再生音が挙げられる。バイノーラル録音時に、再生音を再生することが望ましいユースケースは多々考えられる。
【0026】
再生音は、トレーニング目的で再生され得る。一例として、ユーザがメトロノームの音をイヤホンでモニターしながら楽器を演奏している様子をバイノーラル録音するユースケースが考えられる。従来のバイノーラル録音では、ユーザの演奏音にメトロノームの音が重なって録音され、そのまま再生されてしまうので、ユーザの演奏音のみを再生することは困難であった。他の一例として、誰かとのアンサンブル演奏を想定し、事前にバイノーラル録音された他者の演奏音を再生しながら楽器を演奏する様子をバイノーラル録音するユースケースが考えられる。従来のバイノーラル録音では、ユーザの演奏音に他者の演奏音が重なって録音され、そのまま再生されてしまうので、ユーザの演奏音のみを再生することは困難であった。
【0027】
他にも、再生音は、ユーザに情報を通知する目的で再生され得る。バイノーラル録音時にも、バッテリー残量の低下、及び記憶部の空き容量不足等の、ユーザに通知すべき事態が発生し得る。バイノーラル録音時は極力頭を動かさない方がよいので、視覚的な通知手段は好ましくない。他方、聴覚的な通知手段が使用された場合、ユーザに情報を通知する目的で再生される再生音(以下、通知音とも称する)が録音され、そのまま再生されてしまうので、通知音以外の、本来再現すべき音を再現することが困難であった。例えば、コンサート会場で演奏をバイノーラル録音中に通知音が鳴った場合、音場を損ねる録音になってしまっていた。さらに、例えばバイノーラル録音中にバッテリー残量低下を知らせる通知音が鳴った場合、通知音を含む録音データを再生すると通知音もまた鳴ってしまう。その場合、再生時にバッテリー残量が低下したのか、録音時にバッテリー残量が低下したのかを、判別することも困難であった。
【0028】
なお、再生音は、予め録音されていてもよいし、バイノーラル録音時にリアルタイムに発生してよい。予め録音される再生音の一例は、メトロノームの音、事前にバイノーラル録音された他者の演奏音、及び通知音である。バイノーラル録音時にリアルタイムに発生する再生音の一例は、ユーザ以外の第三者からの、ユーザがどう動くべきかを指示する話声である。かかる話声は、例えば、無線通信を介してストリーミング再生される。
【0029】
再生音以外にも、再現対象外の音が存在し得る。再現対象外の音のうち、再生音以外の音の一例は、ユーザの話声である。バイノーラル録音中にユーザが発話すると、話声が頭部を伝搬して鼓膜に伝わる音が記録されてしまう。そのため、空間を再現する目的でバイノーラル録音が行われる場合、ユーザ本人の発話は推奨されておらず、ユーザはバイノーラル録音中に話すことが困難であった。
【0030】
以上説明したように、バイノーラル録音時には、再生音を再生すること、及びユーザが発話することが推奨されない点で、不自由さがあった。そこで、本実施形態では、バイノーラル録音中に再生音を再生すること、及びユーザが発話することが許容される、自由度の高いバイノーラル録音の仕組みを提供する。
【0031】
<<2.構成例>>
図1は、本発明の一実施形態に係る音再生記録装置1の構成の一例を示すブロック図である。図1に示すように、本実施形態に係る音再生記録装置1は、音取得部10(10A~10D)、音再生部20(20A及び20B)、記憶部30、及び制御部40を含む。
【0032】
(1)音取得部10
音取得部10は、音を取得する機能を有する。図1に示すように、音取得部10Aは、マイク11、マイクアンプ12、及びADC(Analog Digital Converter)13を含む。音取得部10B~音取得部10Dも同様である。
【0033】
マイク11は、周囲の空間に鳴る音をアナログ信号に変換し、変換後のアナログ信号をマイクアンプ12に出力する。マイクアンプ12は、マイク11から入力されたアナログ信号を増幅し、増幅後のアナログ信号をADC13に出力する。ADC13は、マイクアンプ12から入力されたアナログ信号をデジタル信号に変換し、変換後のデジタル信号を制御部40に出力する。
【0034】
音取得部10A及び音取得部10Bは、ユーザの両耳の鼓膜付近の音を取得する。例えば、音取得部10A及び音取得部10Bは、ユーザの両耳の外耳道入り口と鼓膜との間の外耳道内の音を取得する。音取得部10Aのマイク11、及び音取得部10Bのマイク11は、ユーザの両耳の外耳道に挿入可能な一対の小型マイクとして構成され得る。マイクアンプ12及びADC13の配置は特に限定されず、もちろん外耳道に挿入されなくてもよい。
【0035】
音取得部10C及び音取得部10Dは、ユーザの周辺の音を取得する。とりわけ、音取得部10C及び音取得部10Dは、音再生部20以外の音源から発生した音を取得する。音再生部20以外の音源を、以下では外部音源とも称する。外部音源から発生した音を、以下では外部音とも称する。外部音の一例は、ユーザの話声である。例えば、音取得部10Cのマイク11、及び音取得部10Dのマイク11は、ユーザの首元の左右対称な位置に配置される一対のマイクとして構成され得る。外部音の他の一例としては、音再生記録装置1以外の音源からの音(例えば、他のユーザの話声、及び特定の演奏者の演奏音等)が挙げられる。マイク11の位置は、対象とする外部音に応じて適宜変更されてよい。マイクアンプ12及びADC13の配置は特に限定されない。
【0036】
以下では、音取得部10A及び音取得部10Bを、第1の音取得部10とも称する。また、音取得部10C及び音取得部10Dを、第2の音取得部10とも称する。音取得部10A~音取得部10Dを特に区別する必要がない場合、これらを単に音取得部10とも称する。
【0037】
(2)音再生部20
音再生部20は、ユーザに対し音を再生する機能を有する。図1に示すように、音再生部20は、スピーカ21、アンプ22、及びDAC(Analog Digital Converter)23を含む。
【0038】
DAC23は、制御部40から入力されたデジタル信号をアナログ信号に変換し、変換後のアナログ信号をアンプ22に出力する。アンプ22は、DAC23から入力されたアナログ信号を増幅し、増幅後のアナログ信号をスピーカ21に出力する。スピーカ21は、アンプ22から入力されたアナログ信号を音に変換し、周囲の空間に放出する。
【0039】
音再生部20は、第1の音取得部10が音を取得する空間に対して音を再生する。即ち、音再生部20により再生された音は、第1の音取得部10により取得され得る。音再生部20は、少なくとも、第1の音取得部10との相対的な位置関係が固定された位置に配置されることが望ましい。後述する再生音を除去する処理において、音再生部20から第1の音取得部10までのインパルス応答の逆特性が利用されるためである。一例として、スピーカ21は、ユーザの両耳付近で音を再生するヘッドホン又はイヤホンとして構成される。
【0040】
(3)記憶部30
記憶部30は、音再生記録装置1の動作のための各種情報を記憶する機能を有する。記憶部30は、フラッシュメモリ等の所定の記録媒体に対してデータの記録再生を行う装置として構成される。
【0041】
(4)制御部40
制御部40は、演算処理装置及び制御装置として機能し、各種プログラムに従って音再生記録装置1内の動作全般を制御する。制御部40は、例えばCPU(Central Processing Unit)、マイクロプロセッサ等の電子回路によって実現される。なお、制御部40は、使用するプログラム及び演算パラメータ等を記憶するROM(Read Only Memory)、及び適宜変化するパラメータ等を一時記憶するRAM(Random Access Memory)を含んでいてもよい。
【0042】
<<3.技術的特徴>>
<3.1.バイノーラル録音時に再生した再生音への対策>
(1)概要
音再生記録装置1は、第1の音響信号を音再生部20に入力して第1の音響信号に基づく音(即ち、再生音)を音再生部20により再生すると共に、第1の音取得部10により取得された音を示す第2の音響信号を記録する処理を制御する。第1の音響信号とは、音再生部20(より正確には、DAC23)に入力されるデジタル信号である。第2の音響信号とは、第1の音取得部10(より正確には、ADC13)から出力されるデジタル信号である。即ち、第2の音響信号は、バイノーラル録音された音のデータである。
【0043】
音再生記録装置1は、第2の音響信号を記憶部30に記憶する。さらに、音再生記録装置1は、第2の音響信号を記録する処理において、第1の音響信号に関する処理を行う。第1の音響信号に関する処理としては、第1の処理又は第2の処理が実行される。これらの処理の詳細について、以下に詳しく説明する。
【0044】
(2)第1の処理
(2.1)第1の音響信号の記録
音再生記録装置1は、第1の音響信号をさらに記録する。詳しくは、音再生記録装置1は、第2の音響信号が記録される区間において、音再生部20に入力される第1の音響信号を、第2の音響信号と共に記憶部30に記憶する。
【0045】
(2.2)第1の音響信号に基づく再生音の除去
音再生記録装置1は、記録された第2の音響信号から、第1の音響信号に基づく音(即ち、再生音)に対応する成分を、記録した第1の音響信号に基づいて除去する。詳しくは、音再生記録装置1は、音再生部20から第1の音取得部10までのインパルス応答の逆特性をFIR(Finite Impulse Response)フィルタの係数として、記録した第1の音響信号に畳み込む。そして、音再生記録装置1は、FIRフィルタ係数を畳み込んだ第1の音響信号を、第2の音響信号から減算する。これにより、第2の音響信号から再生音に対応する成分を除去することができる。
【0046】
音再生記録装置1は、再生音に対応する成分を除去した第2の音響信号を音再生部20に入力して音を再生してもよい。再生される音は、再現対象外である再生音は含まれない。よって、再現対象の音のみを再現することが可能となる。
【0047】
(2.3)効果
第1の処理によれば、再現対象外である再生音が鳴っている空間においてバイノーラル録音した場合に、再現対象の音のみを再現することが可能となる。よって、バイノーラル録音中に、メトロノームをモニターしたり、他者の演奏音を再生したり、通知音が鳴った場合であっても、再生時には、これらの再生音を除去した、再現対象の音のみを再現することができる。
【0048】
また、第1の処理によれば、第1の音響信号と第2の音響信号とが別々に記録されるので、第1の音響信号を除去する度合いを再生時に調整することが可能となる。例えば、再生音に対応する成分を一部残しながら第2の音響信号から除去することで、再現対象の音と共に、再生音を薄く再生することも可能となる。
【0049】
(3)第2の処理
(3.1)メタ情報の記録
音再生記録装置1は、第1の音響信号の特徴を示すメタ情報(第1のメタ情報に相当)をさらに記録する。詳しくは、音再生記録装置1は、第2の音響信号が記録される区間において、音再生部20に入力される第1の音響信号の特徴を示すメタ情報を、第2の音響信号と共に記憶部30に記憶する。メタ情報を説明するための前提として、第3の音響信号についてまず説明する。
【0050】
第1の音響信号は、第3の音響信号を少なくとも一部の区間に含んでいてもよい。第3の音響信号は、第1の音響信号の少なくとも一部の区間の音響信号である。第1の音響信号は、複数の異なる区間の各々に、第3の音響信号を含んでいてもよい。第1の音響信号及び第3の音響信号の一例を、図2を参照しながら説明する。
【0051】
図2は、本実施形態に係る第1及び第3の音響信号の波形の一例を説明するための図である。図2に示すグラフ50の横軸は時間であり、縦軸は振幅である。区間51の波形は、第1の音響信号の波形である。他方、区間53の波形は、第3の音響信号の波形である。例えば、メトロノームのひとつひとつの音が第3の音響信号に対応し、繰り返し鳴る複数のメトロノームの音全体が第1の音響信号に対応する。
【0052】
メタ情報は、第3の音響信号、又は第3の音響信号を識別するための識別情報を含んでいてもよい。第3の音響信号を識別するための識別情報の一例は、第3の音響信号を示すIDである。第3の音響信号を識別するための識別情報の他の一例は、第3の音響信号が記憶部30に記憶されている場合、記憶部30における第3の音響信号のメモリ位置を示す情報である。
【0053】
メタ情報は、第1の音響信号において第3の音響信号が含まれる区間を示す情報を含んでいてもよい。第3の音響信号が含まれる区間を示す情報の一例は、第3の音響信号に基づく音の再生時刻、及び再生終了時刻である。なお、第3の音響信号に基づく音の再生時刻及び再生終了時刻は、第3の音響信号の音再生部20への入力開始時刻及び入力終了時刻とも換言される。第3の音響信号が含まれる区間を示す情報の他の一例は、第3の音響信号の再生速度を示す情報である。再生速度を示す情報としては、早送りなどのトリックプレイの内容を示す情報、及びメトロノームのテンポを示す情報等が挙げられる。
【0054】
(3.2)メタ情報に基づく再生音の除去
音再生記録装置1は、記録された第2の音響信号から、第1の音響信号に基づく音(即ち、再生音)に対応する成分を、メタ情報に基づいて除去する。詳しくは、音再生記録装置1は、第1の音響信号を、メタ情報に含まれる、第3の音響信号又は第3の音響信号を識別するための識別情報、及び第1の音響信号において第3の音響信号が含まれる区間を示す情報に基づいて再現する。次に、音再生記録装置1は、音再生部20から第1の音取得部10までのインパルス応答の逆特性をFIRフィルタの係数として、再現した第1の音響信号に畳み込む。そして、音再生記録装置1は、FIRフィルタ係数を畳み込んだ第1の音響信号を、第2の音響信号から減算する。これにより、第2の音響信号から再生音に対応する成分を除去することができる。
【0055】
音再生記録装置1は、再生音に対応する成分を除去した第2の音響信号を音再生部20に入力して音を再生してもよい。再生される音は、再現対象外である再生音は含まれない。よって、再現対象の音のみを再現することが可能となる。
【0056】
(3.3)効果
第2の処理によれば、第1の処理と同様の効果が奏される。
【0057】
さらに、メタ情報は、第1の音響信号よりも典型的にはデータ量が少ない。従って、第2の処理は、上述した第1の処理と比較して少ない記憶量で、第1の処理と同様の効果を奏することができる。
【0058】
(4)音再生部20の設定情報を用いる処理
音再生部20の設定情報を用いる処理は、上述した第1の処理、又は第2の処理において実行される処理である。
【0059】
(4.1)設定情報の記録
音再生記録装置1は、音再生部20に適用される設定を示す設定情報をさらに記録してもよい。詳しくは、音再生記録装置1は、第2の音響信号が記録される区間において、音再生部20に適用される設定を示す設定情報を、第2の音響信号と共に、記憶部30に記憶する。なお、第1の処理に関しては、音再生記録装置1は、設定情報を、第1の音響信号及び第2の音響信号と共に記録する。他方、第2の処理に関しては、音再生記録装置1は、設定情報を、メタ情報及び第2の音響信号と共に記録する。音再生部20に適用される設定の一例は、アンプゲイン値、及びイコライザの設定等の、エフェクトの設定である。第2の音響信号が記録される区間において、音再生部20に適用される設定が変化する場合、設定情報は、変化前後の設定、及び変化時刻を示す情報を含む。
【0060】
(4.2)設定情報に基づく再生音の除去
音再生記録装置1は、記録された前記第2の音響信号から、第1の音響信号に基づく音(即ち、再生音)に対応する成分を、設定情報に基づいて除去する。詳しくは、第1の処理において記録された、又は第2の処理において再現された第1の音響信号に、設定情報により示されるエフェクトの効果を適用した上で、FIRフィルタの係数を畳み込む。そして、音再生記録装置1は、FIRフィルタ係数を畳み込んだ第1の音響信号を、第2の音響信号から減算する。これにより、バイノーラル録音時の音再生部20の設定を加味して、第2の音響信号から再生音に対応する成分を除去することができる。
【0061】
(5)処理の流れ
(5.1)第1の処理
図3は、本実施形態に係る音再生記録装置1により実行される第1の音響信号の記録処理の流れの一例を示すフローチャートである。図3に示すように、まず、音再生記録装置1は、第1の音響信号及び第2の音響信号の記録を開始する(ステップS102)。次いで、音再生記録装置1は、録音を終了するか否かを判定する(ステップS104)。
【0062】
録音を終了しないと判定した場合(ステップS104:NO)、音再生記録装置1は、音再生部20の設定が変化したか否かを判定する(ステップS106)。音再生部20の設定が変化したと判定した場合(ステップS106:YES)、音再生記録装置1は、変化後の設定、及び変化した時刻を、設定情報として記録する(ステップS108)。その後、処理はステップS104に戻る。音再生部20の設定が変化していないと判定された場合(ステップS106:NO)もまた、処理はステップS104に戻る。
【0063】
一方で、録音を終了すると判定した場合(ステップS104:YES)、音再生記録装置1は、終了処理を行う(ステップS110)。終了処理は、第1の音響信号及び第2の音響信号の記録を終了すること、及び記録した各信号を所定のフォーマットに従ったファイルに書き出すことを含む。
【0064】
図4は、本実施形態に係る音再生記録装置1により実行される、記録された第1の音響信号に基づく再生音の除去処理の流れの一例を示すフローチャートである。図4に示すように、まず、音再生記録装置1は、記録された第1の音響信号及び第2の音響信号の各々を、再生バッファ分読み込む(ステップS202)。
【0065】
次いで、音再生記録装置1は、音再生部20から第1の音取得部10までのインパルス応答の逆特性をFIRフィルタの係数として、読み込まれた第1の音響信号に畳み込む(ステップS204)。次に、音再生記録装置1は、FIRフィルタ係数を畳み込んだ第1の音響信号を、読み込まれた第2の音響信号から減算する(ステップS206)。次いで、音再生記録装置1は、第1の音響信号を減算済みの第2の音響信号を再生バッファに書き込む(ステップS208)。そして、音再生記録装置1は、再生バッファに書き込まれた信号を音再生部20に入力して、再現対象の音を再生する(ステップS210)。
【0066】
次に、音再生記録装置1は、再生を終了するか否かを判定する(ステップS212)。再生を終了しないと判定された場合(ステップS212:NO)、処理はステップS202に戻る。再生を終了すると判定された場合(ステップS212:YES)、処理は終了する。
【0067】
(5.2)第2の処理
図5は、本実施形態に係る音再生記録装置1により実行されるメタ情報の記録処理の流れの一例を示すフローチャートである。図5に示すように、まず、音再生記録装置1は、第2の音響信号の記録を開始する(ステップS302)。次いで、音再生記録装置1は、録音を終了するか否かを判定する(ステップS304)。
【0068】
録音を終了しないと判定した場合(ステップS304:NO)、音再生記録装置1は、再生音が再生されたか否かを判定する(ステップS306)。再生音が再生されたと判定した場合(ステップS306:YES)、音再生記録装置1は、再生音又は再生音の識別情報、及び再生音の再生時刻等のメタ情報、並びに再生音再生時の音再生部20の設定を示す設定情報を記録する(ステップS308)。その後、処理はステップS304に戻る。再生音が再生されていないと判定された場合(ステップS306:NO)もまた、処理はステップS304に戻る。
【0069】
一方で、録音を終了すると判定した場合(ステップS304:YES)、音再生記録装置1は、終了処理を行う(ステップS310)。終了処理は、第2の音響信号の記録を終了すること、及び記録した信号を所定のフォーマットに従ったファイルに書き出すことを含む。
【0070】
図6は、本実施形態に係る音再生記録装置1により実行される、記録されたメタ情報に基づく再生音の除去処理の流れの一例を示すフローチャートである。図6に示すように、まず、音再生記録装置1は、記録された第2の音響信号を、再生バッファ分読み込む(ステップS402)。
【0071】
次に、音再生記録装置1は、メタ情報を参照して、再生音の再生時刻に達したか否かを判定する(ステップS404)。再生音の再生時刻に達したと判定された場合(ステップS404:YES)、音再生記録装置1は、メタ情報により示される第3の音響信号を読み込む(ステップS406)。そして、音再生記録装置1は、読み込んだ第3の音響信号にFIRフィルタ処理を適用し、第2の音響信号から減算する(ステップS408)。ここでの処理は、上述したステップS204及びS206と同様である。次いで、音再生記録装置1は、第3の音響信号を減算済みの第2の音響信号を再生バッファに書き込む(ステップS410)。その後、処理はステップS414に進む。再生音の再生時刻に達していないと判定された場合(ステップS404:NO)、音再生記録装置1は、読み込んだ第2の音響信号を再生バッファに書き込む(ステップS412)。その後、処理はステップS414に進む。
【0072】
ステップS414において、音再生記録装置1は、再生バッファに書き込まれた信号を音再生部20に入力して、再現対象の音を再生する(ステップS412)。次に、音再生記録装置1は、再生を終了するか否かを判定する(ステップS416)。再生を終了しないと判定された場合(ステップS416:NO)、処理はステップS402に戻る。再生を終了すると判定された場合(ステップS416:YES)、処理は終了する。
【0073】
<3.2.バイノーラル録音時に発生した外部音への対策>
音再生記録装置1は、バイノーラル録音時に再生した再生音への対策と同様の処理を、バイノーラル録音時に発生した外部音への対策として実行することができる。
【0074】
(1)概要
音再生記録装置1は、第1の音取得部10により取得された音を示す第2の音響信号を記録する処理において、外部音源から発生した外部音を示す第4の音響信号に関する処理を行う。第4の音響信号とは、第2の音取得部10(より正確には、ADC13)から出力されるデジタル信号である。即ち、第4の音響信号は、外部音のデータである。かかる処理により、第2の音響信号から外部音に対応する成分を除去して再生することが可能となる。具体的な処理内容について、以下に詳しく説明する。
【0075】
(2)第3の処理
音再生記録装置1は、上述した第1の処理と同様にして、第4の音響信号を記録し、第4の音響信号に基づいて外部音を除去してもよい。かかる構成により、外部音に関し、第1の処理と同様の効果が奏される。
【0076】
(3)第4の処理
音再生記録装置1は、上述した第2の処理と同様にして、第4の音響信号のメタ情報(第2のメタ情報に相当)を記録し、メタ情報に基づいて外部音を除去してもよい。メタ情報は、外部音の特徴を示す情報であるとも捉えられる。かかる構成により、外部音に関し、第2の処理と同様の効果が奏される。以下、第4の処理に関し詳しく説明する。
【0077】
(3.1)メタ情報の記録
音再生記録装置1は、第2の音響信号が記録される区間において、外部音の特徴を示すメタ情報をさらに記録する。詳しくは、音再生記録装置1は、第2の音響信号が記録される区間において発生した外部音の特徴を示すメタ情報を、第2の音響信号と共に記憶部30に記憶する。
【0078】
メタ情報は、第2の音響信号が記録される区間において、外部音が発生した区間を示す情報を含んでいてもよい。外部音が発生した区間を示す情報の一例は、外部音の発生時刻、及び終了時刻である。
【0079】
音再生記録装置1は、第4の音響信号に基づいて、外部音が発生した区間を推定する。例えば、音再生記録装置1は、第4の音響信号に、予め設定した外部音源の存在範囲内の位置から発生した音の成分が含まれる期間を、外部音が発生した区間として推定する。外部音源の存在範囲は、第2の音取得部10の位置を基準とする、相対的な方向及び距離のいずれか一方の範囲として設定される。音再生記録装置1は、バイノーラルキューを用いて、第4の音響信号に含まれる音の音源位置を推定する。バイノーラルキューは、チャネル間のレベル差、時間差及び相関等に基づいて、音源の方向及び距離を推定する技術である。例えば、音再生記録装置1は、音取得部10Cにより取得された音と音取得部10Dにより取得された音との間のレベル差、時間差及び相関に基づいて、第4の音響信号に含まれる音の音源位置を推定する。そして、音再生記録装置1は、推定した音源位置が予め設定された外部音源の存在範囲に含まれる区間を、外部音が発生した区間として推定する。
【0080】
メタ情報は、外部音を識別するための識別情報を含んでいてもよい。外部音を識別するための識別情報は、外部音源の識別情報であってもよい。メタ情報は、外部音の音圧を示す情報等の、その他の特徴を示す情報を含んでいてもよい。
【0081】
(3.2)メタ情報に基づく外部音の除去
音再生記録装置1は、記録された前記第2の音響信号から、外部音に対応する成分を、メタ情報に基づいて除去する。詳しくは、音再生記録装置1は、第4の音響信号を、メタ情報に含まれる、外部音の識別情報、外部音の音圧、及び外部音が発生した区間を示す情報に基づいて再現する。そして、音再生記録装置1は、外部音源から第1の音取得部10までのインパルス応答の逆特性をFIRフィルタの係数として、再現した第4の音響信号に畳み込む。そして、音再生記録装置1は、FIRフィルタ係数を畳み込んだ第4の音響信号を、第2の音響信号から減算する。これにより、第2の音響信号から外部音に対応する成分を除去することができる。
【0082】
音再生記録装置1は、外部音に対応する成分を除去した第2の音響信号を音再生部20に入力して音を再生してもよい。再生される音は、再現対象外である外部音は含まれない。よって、再現対象の音のみを再現することが可能となる。
【0083】
<<4.補足>>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0084】
例えば、上記実施形態では、再生音及び外部音の除去処理が、第2の音響信号の記録時ではなく再生時に実行される例を説明したが、本発明はかかる例に限定されない。再生音及び外部音の除去処理は、第2の音響信号の記録時に実行されてもよい。即ち、音再生記録装置1は、第の音取得部10により取得された第2の音響信号から、再生音及び外部音の成分を除去した音響信号を、記録してもよい。
【0085】
例えば、上記実施形態では、音取得部10A及び音取得部10Bが、ユーザの両耳の鼓膜付近の音を取得するものと説明したが、本発明はかかる例に限定されない。音取得部10A及び音取得部10Bは、ユーザの両耳付近の音を取得する任意の構成を取り得る。例えば、音取得部10A及び音取得部10Bは、ユーザの両耳の外耳道入り口より外側に配置され、ユーザの両耳の外耳付近の音を取得してもよい。
【0086】
例えば、上記実施形態では、第1の音取得部10と第2の音取得部10とが別々に設けられるものと説明したが、本発明はかかる例に限定されない。第1の音取得部10及び第2の音取得部10は、同一であってもよい。
【0087】
例えば、上記実施形態では、音再生部20が音出力装置である例を説明したが、本発明はかかる例に限定されない。例えば、振動に起因する音が再生音であってもよく、その場合、音再生部20は振動出力装置である。その場合、メタ情報は、振動のパターン(波形)を示す情報、及び振動が出力される区間を示す情報等を含み得る。また、設定情報は、振動の強度を示す情報を含み得る。
【0088】
また、バイノーラル録音時に再生した再生音への対策、及びバイノーラル録音時に発生した外部音への対策は、組み合わせて実行されてもよい。
【0089】
なお、本明細書において説明した各装置による一連の処理は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。ソフトウェアを構成するプログラムは、例えば、各装置の内部又は外部に設けられる記録媒体(非一時的な媒体:non-transitory media)に予め格納される。そして、各プログラムは、例えば、コンピュータによる実行時にRAMに読み込まれ、CPUなどのプロセッサにより実行される。上記記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
【0090】
また、本明細書においてフローチャート及びシーケンス図を用いて説明した処理は、必ずしも図示された順序で実行されなくてもよい。いくつかの処理ステップは、並列的に実行されてもよい。また、追加的な処理ステップが採用されてもよく、一部の処理ステップが省略されてもよい。
【符号の説明】
【0091】
1 音再生記録装置
10 音取得部
11 マイク
12 マイクアンプ
13 ADC
20 音再生部
21 スピーカ
22 アンプ
23 DAC
30 記憶部
40 制御部
図1
図2
図3
図4
図5
図6