IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ジェーシービーの特許一覧

<>
  • 特開-プログラム及び情報処理装置 図1
  • 特開-プログラム及び情報処理装置 図2
  • 特開-プログラム及び情報処理装置 図3
  • 特開-プログラム及び情報処理装置 図4
  • 特開-プログラム及び情報処理装置 図5
  • 特開-プログラム及び情報処理装置 図6
  • 特開-プログラム及び情報処理装置 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024172483
(43)【公開日】2024-12-12
(54)【発明の名称】プログラム及び情報処理装置
(51)【国際特許分類】
   H04S 7/00 20060101AFI20241205BHJP
   A63F 13/54 20140101ALI20241205BHJP
【FI】
H04S7/00 370
A63F13/54
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023090234
(22)【出願日】2023-05-31
(71)【出願人】
【識別番号】593022629
【氏名又は名称】株式会社ジェーシービー
(74)【代理人】
【識別番号】100126480
【弁理士】
【氏名又は名称】佐藤 睦
(74)【代理人】
【識別番号】100140431
【弁理士】
【氏名又は名称】大石 幸雄
(72)【発明者】
【氏名】間下 公照
(72)【発明者】
【氏名】南井 享
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162CD01
5D162EG02
(57)【要約】      (修正有)
【課題】ユーザが体感する音響を改善するプログラム及び情報処理装置を提供する。
【解決手段】システム1における情報処理装置2のプログラムは、制御部10を、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定手段102と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報144とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報148を生成する生成手段104と、到達音声情報148に基づいて、ユーザに対して出力音声を出力する音声出力手段110aと、として機能させる。
【選択図】図1
【特許請求の範囲】
【請求項1】
コンピュータを、
ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定手段と、
前記音源座標と、前記音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて、前記仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を生成する生成手段と、
前記到達音声情報に基づいて、前記ユーザに対して出力音声を出力する音声出力手段と、
として機能させる、プログラム。
【請求項2】
前記観測座標は、前記ユーザの第2操作に基づいて決定される、請求項1に記載のプログラム。
【請求項3】
前記コンピュータを、さらに、
前記ユーザの第3操作に基づいて、前記発信音声情報を変更する変更手段、として機能させる、請求項1に記載のプログラム。
【請求項4】
前記第3操作は、現実空間において収録した収録音声に関する収録音声情報を読み込ませることを含み、
前記変更手段は、前記収録音声情報に基づいて前記発信音声情報を変更する、請求項3に記載のプログラム。
【請求項5】
前記第1操作は、現実空間における音源の配置に関する配置情報を読み込ませることを含み、
前記決定手段は、前記配置情報に基づいて前記音源座標を決定する、請求項1に記載のプログラム。
【請求項6】
前記仮想空間は、過去に存在した地物の内部又は周辺の空間を再現したものである、請求項1に記載のプログラム。
【請求項7】
前記音源オブジェクトは、第1音源オブジェクト及び第2音源オブジェクトを含み、
前記決定手段は、前記第1操作に基づいて、前記第1音源オブジェクトの座標である第1音源座標と、前記第2音源オブジェクトの座標である第2音源座標とを決定する、請求項1に記載のプログラム。
【請求項8】
前記コンピュータを、さらに、
前記観測座標から前記音源オブジェクトを見た場合の視野に対応する画像を前記ユーザに対して出力する画像出力手段、として機能させる、請求項1に記載のプログラム。
【請求項9】
前記生成手段は、前記仮想空間内の任意の2座標間の音響伝搬特性に関する伝搬情報を参照して前記到達音声情報を生成する、請求項1から請求項8のいずれか一項に記載のプログラム。
【請求項10】
コンピュータを、
ユーザから、仮想空間における音源オブジェクトの座標である音源座標の決定に関する第1操作を受け付ける受付手段と、
前記仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を取得する取得手段であって、前記到達音声情報は、前記音源座標と、前記音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて生成される、取得手段と、
前記到達音声情報に基づいて、前記ユーザに対して出力音声を出力する音声出力手段と、
として機能させる、プログラム。
【請求項11】
ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定部と、
前記音源座標と、前記音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて、前記仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を生成する生成部と、
前記到達音声情報に基づいて、前記ユーザに対して出力音声を出力する音声出力部と、
を備える、情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログラム及び情報処理装置に関する。
【背景技術】
【0002】
従来、臨場感の高い鑑賞体験を実現するコンテンツを提供する技術が知られている。例えば、特許文献1には、演者の身体運動に基づいて挙動制御がなされる演者キャラクタを提示するコンテンツの鑑賞体験を鑑賞ユーザに提供する鑑賞システムが開示されている。この鑑賞システムは、演者の身体運動を示す運動情報を取得し、演者キャラクタの挙動を制御し、鑑賞ユーザによりなされた操作入力の情報を取得し、決定した視点の情報に基づいて、演者に係る演者キャラクタを配置した3次元空間における演出を提示する両眼立体視コンテンツに係る描画された画像を提示する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-173870号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された鑑賞システムによっては、ユーザが体感する音響を十分に改善することができない。
【0005】
そこで、本発明は、上記課題に鑑み、ユーザが体感する音響を改善することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係るプログラムは、コンピュータを、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定手段と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を生成する生成手段と、到達音声情報に基づいて、ユーザに対して出力音声を出力する音声出力手段と、として機能させる。
【0007】
本発明の他の一態様に係るプログラムは、コンピュータを、ユーザから、仮想空間における音源オブジェクトの座標である音源座標の決定に関する第1操作を受け付ける受付手段と、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を取得する取得手段であって、到達音声情報は、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて生成される、取得手段と、到達音声情報に基づいて、ユーザに対して出力音声を出力する音声出力手段と、として機能させる。
【0008】
本発明の他の一態様に係る情報処理装置は、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定部と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報を生成する生成部と、到達音声情報に基づいて、ユーザに対して出力音声を出力する音声出力部と、を備える。
【発明の効果】
【0009】
本開示によれば、ユーザが体感する音響を改善することができる。
【図面の簡単な説明】
【0010】
図1】本実施形態に係るシステムの機能ブロック図である。
図2】本実施形態に係る情報処理装置の動作の一例を説明するための図である。
図3】本実施形態に係る情報処理装置の動作の一例を説明するための図である。
図4】本実施形態に係る情報処理装置の動作の一例を説明するための図である。
図5】本実施形態に係る情報処理装置のハードウェア構成の一例を説明するための図である。
図6】本実施形態に係る情報処理装置の動作の変形例を説明するための図である。
図7】本実施形態に係る情報処理装置の動作の変形例を説明するための図である。
【発明を実施するための形態】
【0011】
添付図面を参照して、本発明の好適な実施形態(以下では、本実施形態という)について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0012】
本発明において、「部」、「手段」、「装置」及び「システム」とは、単に物理的手段を意味するものではなく、その「部」、「手段」、「装置」及び「システム」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」、「手段」、「装置」及び「システム」が有する機能が2つ以上の物理的手段及び装置、ソフトウェアにより実現されても、2つ以上の「部」、「手段」、「装置」及び「システム」の機能が1つの物理的手段、装置、ソフトウェアにより実現されてもよい。
【0013】
<1.システム1の概要>
本実施形態に係るシステム1は、ユーザに対して仮想空間を介した音声の鑑賞体験を提供するシステムである。仮想空間とは、仮想現実(VR:Virtual Reality)における空間である。仮想現実とは、コンピュータを用いて生成されたデジタル環境である。仮想空間は、メタバースということもできる。
【0014】
ユーザは、仮想空間内における自身の分身となるオブジェクト(以下では、「アバター」と称する)として仮想空間内で活動することができる。ユーザは、アバターを介して仮想空間内の他のオブジェクトを認識することができる。
【0015】
他のオブジェクトは、例えば、仮想空間内の楽器等の音源に対応する音源オブジェクトである。ユーザは、アバターを介して音源オブジェクトの映像及び当該音源オブジェクトから仮想的に発せられる音声を体感することができる。ユーザのアバターは、他のオブジェクトを観測する観測オブジェクトであるということもできる。
【0016】
ユーザは、典型的には、端末装置3としてVRデバイスを利用して映像及び音声を体感する。VRデバイスは、ユーザに対して三次元画像(三次元映像を含む)及び立体音声を出力する。ユーザは、VRデバイスを利用することにより、あたかも自身がアバターに入り込んだかのように映像及び音声を体感することができる。VRデバイスは、例えば、ヘッドマウントディスプレイ(HDM:Head Mount Display)等である。以下では、ユーザがVRデバイスにより体感することができる三次元画像及び立体音声をそれぞれ「出力画像」及び「出力音声」と称する。
【0017】
ユーザがアバターを仮想空間内で移動させると、ユーザが体感する映像及び音声は移動先の座標に係るものに変化する。例えば、ユーザがアバターを音源オブジェクトに近づく方向に移動させると、ユーザが体感する音声の音量が大きくなるとともに、ユーザが体感する音源オブジェクトの大きさは大きくなる。他にも、例えば、ユーザが音源オブジェクトにアバターの視線を向けると、当該音源オブジェクトの音声が自身の正面側から響いているかのように体感することができる。他にも、ユーザが音源オブジェクトから離れた座標にアバターを移動させると、当該音源オブジェクトから発せられる音声が遠くから響いているかのように体感することができる。
【0018】
出力画像及び出力音声は、典型的には、アバターの座標及び視線の方向等と、音源オブジェクトの種類及び座標等とに基づいて決定される。仮想空間における臨場感を高めるためには、このうち、音源オブジェクトの種類及び座標等が特に重要となる場合がある。例えば、複数の座席を有するコンサートホールを再現した仮想空間において音源オブジェクトを配置する場合、すべての座席において音源オブジェクトから流れる音声が一定以上の品質で観測可能となるように音源オブジェクトを配置する必要がある。
【0019】
<2.システム1の構成>
図1を参照して、システム1の構成の一例について説明する。システム1は、情報処理装置2、端末装置3、音声入力装置4及び通信ネットワーク5を含む。
【0020】
[情報処理装置2]
情報処理装置2は、制御部10、記憶部14及びネットワークインタフェース部18を含む。制御部10、記憶部14及びネットワークインタフェース部18は、それぞれがバス16を介して電気的に接続されている。
【0021】
記憶部14は、情報処理装置2の動作のために必要な各種情報を記憶する。記憶される情報は、空間情報140、オブジェクト情報142、発信音声情報144、伝搬情報146、到達音声情報148、収録音声情報150及び配置情報152を含む。
【0022】
空間情報140は、仮想空間の形状等に関する情報である。仮想空間の形状等は、当該仮想空間のサイズ(すなわち、高さ、幅及び奥行き等)に関する情報を含む。仮想空間が建築物の内部である場合には、空間情報140は、当該建築物の天井、階段、床、廊下及び壁の形状、位置、色彩及び模様等に関する情報を含む。空間情報140は、例えば、CAD(Computer Aided Design)データ等の三次元構造情報であってもよい。
【0023】
情報処理装置2は、空間情報140を読み込むことで、仮想空間を生成することができる。情報処理装置2が、例えば、コンサートホールの形状等に関する情報を含む空間情報140に基づいて仮想空間を生成した場合、ユーザはアバターを介して仮想的に当該コンサートホールに入ったかのように映像及び音声を体感することができる。
【0024】
空間情報140によって生成される仮想空間は、現実に存在する空間(例えば、NHK(登録商標)ホール等)又は過去に存在した空間(例えば、日本音楽学校の校舎(現在の旧東京音楽学校奏楽堂)等)を再現したものであってもよく、現実には存在しない空間(例えば、ファンタジーの世界の空間等)をイメージして作成されたものであってもよい。
【0025】
過去に存在した空間の一例は、過去に存在した地物の内部又は周辺の空間である。このような仮想空間を生成するための空間情報140は、例えば、過去に存在した地物を撮影した画像、当該地物の設計図、当該地物の内部又は周辺の地図、当該地物が建設等された当時に使用された建材等に関する情報に基づいて生成することができる。
【0026】
オブジェクト情報142は、オブジェクトの形状等に関する情報である。オブジェクトの形状等は、当該オブジェクトのサイズ、色彩及び模様に関する情報を含む。オブジェクトは、現実空間において物理的な実体はないものの、ユーザはアバターを介してあたかも当該オブジェクトが物理的に存在するかのように認識することができる。オブジェクト情報142は、CADデータ等の三次元構造情報に基づいて生成されてもよい。
【0027】
オブジェクトの例は、音源オブジェクト、観測オブジェクト及び什器オブジェクト等である。音源オブジェクトは、例えば、楽器のオブジェクト(以下では「楽器オブジェクト」と称する)及び歌手のオブジェクト(以下では「歌手オブジェクト」と称する)である。観測オブジェクトの一例は、ユーザのアバターである。什器オブジェクトは、音源オブジェクト及び観測オブジェクト以外のオブジェクトであり、例えば、コンサートホールにおける座席等の設置物のオブジェクトである。
【0028】
なお、観測オブジェクトと音源オブジェクトとは、同一のオブジェクトであってもよい。例えば、ユーザが自身のアバターに楽器オブジェクトを演奏させた場合、当該アバターは観測オブジェクトであり、同時に音源オブジェクトでもある。
【0029】
オブジェクト情報142は、さらに、オブジェクトの仮想空間内における座標に関する情報を含む。座標は、例えば、音源オブジェクトの座標である音源座標、観測オブジェクトの座標である観測座標及び什器オブジェクトの座標である什器座標等である。
【0030】
情報処理装置2は、空間情報140及びオブジェクト情報142に基づいて、オブジェクトが配置された仮想空間を生成する。
【0031】
発信音声情報144は、音源オブジェクトから仮想的に発せられる発信音声に対応する情報である。発信音声情報144は、典型的には、音源オブジェクトの種類に応じて異なる。
【0032】
音源オブジェクトが、例えば、楽器オブジェクトである場合、発信音声情報144は、当該楽器の演奏に対応する情報となる。以下では、楽器オブジェクトに対応する発信音声情報144を、発信演奏情報144aと称する。
【0033】
音源オブジェクトが、他にも、例えば、歌手オブジェクトである場合、発信音声情報144は、当該歌手の歌唱に対応する情報となる。以下では、歌手オブジェクトに対応する発信音声情報144を、発信歌唱情報144bと称する。
【0034】
発信音声情報144は、例えば、音声ファイル(MP3(MPEG-1 Audio Layer-3)ファイル及びWAV(waveform Audio Format)ファイル等)の形式で記憶される。
【0035】
伝搬情報146は、仮想空間内の任意の2座標間の音響伝搬特性に関する情報である。音響伝搬特性は、発信音声が観測座標においてどのように聞こえるかを示すパラメータである。音響伝搬特性は、例えば、音の遅延、反射及び回析等により生じる残響感及び拡がり感に関するパラメータを含む。
【0036】
伝搬情報146は、空間情報140及びオブジェクト情報142に基づいて計算機シミュレーションにより得られたものであってもよい。他にも、伝搬情報146は、仮想空間のモデルとなった現実空間(例えば、仮想空間が実在するコンサートホールをモデルとして作成された場合における、当該コンサートホール)において収録した音声を解析することによって得られたものであってもよい。
【0037】
到達音声情報148は、仮想空間における観測座標に仮想的に到達する到達音声に対応する情報である。到達音声情報148は、典型的には、発信音声情報144と同様に、音源オブジェクトの種類に応じて異なる。
【0038】
音源オブジェクトが、例えば、楽器オブジェクトである場合、到達音声情報148も当該楽器の演奏に対応する情報となる。以下では、楽器オブジェクトに対応する到達音声情報148を、到達演奏情報148aと称する。
【0039】
音源オブジェクトが、他にも、例えば、歌手オブジェクトである場合、到達音声情報148は当該歌手の歌唱に対応する情報となる。以下では、歌手オブジェクトに対応する到達音声情報148を、到達歌唱情報148bと称する。
【0040】
到達音声情報148は、例えば、音声ファイル(MP3ファイル及びWAVファイル等)の形式で記憶される。
【0041】
収録音声情報150は、ユーザが現実空間において収録した収録音声に関する情報である。収録音声情報150は、収録が完了した状態の音声情報であってもよく、ライブ的に収録が進行している状態の音声情報であってもよい。
【0042】
収録音声情報150は、例えば、音声ファイル(MP3ファイル及びWAVファイル等)の形式で記憶される。
【0043】
配置情報152は、現実空間における音源の配置に関する情報である。配置情報152は、例えば、ステージ上に並べられた一以上の楽器等が映っている画像に関する情報であってもよい。配置情報152は、他にも、例えば、一以上の楽器等の配置図に関する情報等であってもよい。
【0044】
配置情報152は、例えば、画像ファイル(JPEG(Joint Photographic Experts Group)ファイル等)及び一以上の音源のそれぞれに対して当該音源の座標が関連付けられたテキストファイル(CSV(Comma Separated Values)ファイル等)等の形式で記憶される。
【0045】
制御部10は、記憶部14に記憶された各種プログラムを実行することにより、決定手段102、生成手段104、読込手段106、変更手段108及び出力手段110として機能する。以下では、各機能について説明する。
【0046】
―決定手段102―
決定手段102は、ユーザの音源座標の決定に関する第1操作に基づいて、音源座標を決定する。第1操作は、典型的には、端末装置3がユーザから受け付けた操作であり、情報処理装置2は当該第1操作に関する情報を受信する。第1操作は、三次元空間の座標を値として入力する操作であってもよく、GUI(Graphical User Interface)により座標を選択する操作であってもよい。音源座標は、音源位置ということもできる。
【0047】
また、第1操作は、配置情報152を読み込ませることを含んでもよく、決定手段102は、配置情報152に基づいて音源座標を決定してもよい。配置情報152が画像ファイルである場合、決定手段102は、当該画像ファイルに対して画像認識処理を施すことにより画像中の音源の配置を読み取り、これに基づいて一以上の音源オブジェクトのそれぞれに対する音源座標を決定してもよい。
【0048】
また、音源オブジェクトが、第1音源オブジェクト及び第2音源オブジェクトを含む場合、決定手段102は、第1操作に基づいて、第1音源オブジェクトの座標である第1音源座標と、第2音源オブジェクトの座標である第2音源座標とを決定してもよい。すなわち、ユーザは、第1操作により、複数の音源オブジェクトのそれぞれの音源座標を決定することができる。
【0049】
また、決定手段102は、ユーザの第2操作に基づいて、観測座標をさらに決定してもよい。第2操作は、例えば、ユーザが自身のアバターを移動させる操作である。観測座標は、観測位置ということもできる。
【0050】
―生成手段104―
生成手段104は、決定手段102により決定された音源座標と、発信音声情報144とに基づいて、到達音声情報148を生成する。このとき、生成手段104は、伝搬情報146を参照して到達音声情報148を生成してもよい。生成手段104は、例えば、発信音声情報144に対して、音響伝搬特性に対応する周波数フィルタを適用することにより到達音声情報148を得ることができる。
【0051】
―読込手段106―
読込手段106は、収録音声情報150を読み込む。読込手段106は、典型的には、端末装置3又は音声入力装置4から収録音声情報150を受信することによって当該収録音声情報150を読み込む。なお、本実施形態において、情報を読み込むことは、当該情報を制御部10において処理可能な状態にすることをいう。読込手段106は、収録音声情報150を取得する取得手段ということもできる。
【0052】
―変更手段108―
変更手段108は、ユーザの第3操作に基づいて、発信音声情報144を変更する。第3操作は、典型的には、音源オブジェクトの設定の変更に関する操作である。音源オブジェクトの設定は、例えば、音源オブジェクトが対応する楽器等の種類、発信音声の音量、発信音声の音階及び発信音声のリズム等である。
【0053】
第3操作は、ユーザが収録音声情報150を情報処理装置2に対して読み込ませることであってもよい。この場合、読込手段106は、収録音声情報150を読み込み、変更手段108は、読み込まれた収録音声情報150に基づいて発信音声情報144を変更する。具体的には、変更手段108は、発信音声として収録音声が用いられるように音源オブジェクトの設定を変更してもよい。これにより、ユーザは、あたかも収録音声が音源オブジェクトから発せられているかのように体感することができる。
【0054】
―出力手段110―
出力手段110は、生成手段104により生成された到達音声情報148に基づいて、ユーザに対して出力音声を出力する。出力音声は、典型的には、VRデバイスである端末装置3から立体音声としてユーザに対して出力される。出力手段110は、音声出力手段110aを含むということもできる。
【0055】
出力手段110は、他にも、観測座標から音源オブジェクトを見た場合の視野に対応する画像をユーザに対して出力する。画像は、典型的には、VRデバイスである端末装置3から立体画像又は立体映像としてユーザに対して出力される。出力手段110は、画像出力手段110bを含むということもできる。
【0056】
上記で例示したように、出力手段110が音声又は画像を出力することは、当該音声又は画像を他の装置(例えば、端末装置3)に出力させることを含む。
【0057】
ネットワークインタフェース部18は、通信ネットワーク5を介した端末装置3及び音声入力装置4との通信を実現する。
【0058】
[端末装置3]
端末装置3は、ユーザが操作する端末である。端末装置3は、制御部20、記憶部(図示しない)及びネットワークインタフェース部(図示しない)を含む。
【0059】
制御部20は、端末装置3の記憶部に記憶された各種プログラムを実行することにより、受付手段200、取得手段202及び出力手段204として機能する。以下では、各機能について説明する。
【0060】
―受付手段200―
受付手段200は、ユーザから、音源座標の決定に関する第1操作を受け付ける。受付手段200は、他にも観測座標の決定に関する第2操作を受け付ける。受付手段200は、他にも、発信音声情報144を変更に関する第3操作を受け付ける。第1操作―第3操作に関する情報は、端末装置3のネットワークインタフェース部を介して情報処理装置2に送信される。
【0061】
―取得手段202―
取得手段202は、到達音声情報148を取得する。取得手段202は、典型的には、端末装置3のネットワークインタフェース部を介して情報処理装置2から到達音声情報148を受信する。
【0062】
―出力手段204―
出力手段204は、到達音声情報148に基づいて、ユーザに対して出力音声を出力する。出力手段204は、音声出力手段204aを含むということもできる。出力手段204は、他にも、観測座標から音源オブジェクトを見た場合の視野に対応する画像をユーザに対して出力する。出力手段204は、画像出力手段204bを含むということもできる。
【0063】
[音声入力装置4]
音声入力装置4は、現実空間において収録音声を収録し、収録音声情報150を生成する装置である。音声入力装置4は、オーディオインタフェースということもできる。音声入力装置4は、収録音声情報150をネットワークインタフェース部(図示しない)を介して情報処理装置2に送信することができる。
【0064】
<3.情報処理装置2の動作>
図2図4を参照して、情報処理装置2の動作の一例について説明する。図2は、音源オブジェクトとして楽器オブジェクト142a及び歌手オブジェクト142bが配置される場合において、音源オブジェクトの音源座標を決定してから、出力音声を出力するまでの情報処理装置2の動作を示すフローチャートである。図3は、図2の説明を補助するための、仮想空間を俯瞰した概念図を示す。図4は、伝搬情報146の一例を示す図である。
【0065】
まず、情報処理装置2は、楽器オブジェクト142a及び歌手オブジェクト142bのそれぞれの音源座標と、観測オブジェクト142cの観測座標とを決定する(S10)。この例では、情報処理装置2は、ユーザの第1操作に基づいて、音源座標pxに楽器オブジェクト142aを、音源座標pxに歌手オブジェクト142bを、観測座標qzに観測オブジェクト142c(すなわち、自身のアバター)を配置するものとする。
【0066】
図3では、観測オブジェクト142cは、楽器オブジェクト142a及び歌手オブジェクト142bとは反対側に配置されている。楽器オブジェクト142a及び歌手オブジェクト142bが配置されている側と、観測オブジェクト142cが配置されている側との間には、什器オブジェクト142d及び什器オブジェクト142eが配置されている。
【0067】
次に、情報処理装置2は、発信演奏情報144aを生成する(S12)。この例では、情報処理装置2は、予め記憶部14に記憶されていた楽器の演奏に関する音声ファイルを読み出すことにより発信演奏情報144aを生成するものとする。
【0068】
次に、情報処理装置2は、伝搬情報146を参照しつつ、楽器オブジェクト142aの音源座標pxと、発信演奏情報144aとに基づいて、到達演奏情報148aを生成する(S14)。図4のとおり、この例における伝搬情報146は、音源座標pm(ただし、mは1以上M以下の整数)と観測座標qn(ただし、nは1以上N以下の整数)との組み合わせに対して周波数フィルタfnmが関連付けられた情報であるとする。すなわち、情報処理装置2は、発信演奏情報144aに対して、音源座標px及び観測座標qzの組み合わせにより特定される周波数フィルタfxzを適用することにより、到達演奏情報148aを生成する。
【0069】
図3では、発信演奏情報144aに対して周波数フィルタfxzを適用することにより得られた到達演奏情報148aが観測座標qzにおいて観測される様子を示す。なお、音源座標pxと観測座標qzとの間には、什器オブジェクト142dが配置されているため、周波数フィルタfxzには、その影響(例えば、正面から到達する音の減衰及び回折の影響の増加等)が反映される。
【0070】
S12と並行して、情報処理装置2は、発信歌唱情報144bを生成する(S16)。この例では、情報処理装置2は、予め記憶部14に記憶した歌唱に関する音声ファイルを読み出すことにより発信歌唱情報144bを生成するものとする。
【0071】
次に、情報処理装置2は、伝搬情報146を参照しつつ、歌手オブジェクト142bの音源座標pyと発信歌唱情報144bとに基づいて到達歌唱情報148bを生成する(S18)。情報処理装置2は、発信歌唱情報144bに対して、音源座標py及び観測座標qzの組み合わせにより特定される周波数フィルタfyzを適用することにより、到達歌唱情報148bを生成することができる。
【0072】
図3では、発信歌唱情報144bに対して周波数フィルタfyzを適用することにより得られた到達歌唱情報148bが観測座標qzにおいて観測される様子を示す。なお、音源座標pyと観測座標qzとの間には、什器オブジェクト142d及び什器オブジェクト142eは配置されていないが、その周りには配置されているため、周波数フィルタfyzには、その影響(例えば、左右から到達する音の減衰にともなう音の広がり感の減少等)が反映される。
【0073】
次に、情報処理装置2は、到達演奏情報148a及び到達歌唱情報148bに基づいて、出力音声を出力する(S20)。
【0074】
以上をまとめると、本発明の一態様に係るプログラムは、コンピュータ70を、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定手段102と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報144とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報148を生成する生成手段104と、到達音声情報148に基づいて、ユーザに対して出力音声を出力する音声出力手段110aと、として機能させる。
【0075】
<4.情報処理装置2の効果>
情報処理装置2によれば、ユーザが体感する音響を改善することができる。図2図4を参照して説明したように、ユーザは、音源座標pxに楽器オブジェクト142aを配置し、音源座標pyに歌手オブジェクト142bを配置した場合における音の聞こえ方を観測オブジェクトであるアバターを介して体感することができる。これにより、ユーザは、例えば、体感した音が意図していた聞こえ方ではなかった場合、楽器オブジェクト142aの音源座標px及び歌手オブジェクト142bの音源座標pyを変更し、別の状況における音の聞こえ方を体感することができる。すなわち、ユーザは、理想の音響を仮想空間内で再現することができる。
【0076】
また、観測座標は、ユーザの第2操作に基づいて決定されてもよい。音の聞こえ方は、音源座標と観測座標との組み合わせによって異なる。この構成によれば、ユーザは音源座標だけではなく観測座標も決定することができるようになるため、ユーザが仮想空間において体感する音響を改善することができる。
【0077】
また、変更手段108は、ユーザの第3操作に基づいて、発信音声情報144を変更してもよい。音の聞こえ方は音源座標と観測座標の組み合わせに加えて、どのような音が発せられるかによっても異なる。この構成によれば、ユーザは音源座標及び観測座標だけでなく、どのような音が音源オブジェクトから仮想的に発せられるかを変更できるようになる。そのため、ユーザが仮想空間において体感する音響を改善することができる。
【0078】
また、第1操作は、現実空間における音源の配置に関する配置情報152を読み込ませることを含んでもよく、決定手段102は、配置情報152に基づいて音源座標を決定してもよい。例えば、現実空間を再現した仮想空間を設計することにより、ユーザは当該現実空間を仮想的に体感することができる。このような場合において、現実空間における音源の配置を仮想空間にも反映させることで、ユーザは当該現実空間の音響まで仮想的に体感することができるようになる。上記構成によれば、現実空間の音源の配置を仮想空間内で容易に再現することができるようになるため、より効率的にユーザが体感する音響を改善することができる。
【0079】
また、音源オブジェクトは、第1音源オブジェクト及び第2音源オブジェクトを含んでもよく、決定手段102は、第1操作に基づいて、第1音源オブジェクトの座標である第1音源座標と、第2音源オブジェクトの座標である第2音源座標とを決定してもよい。現実空間では、複数の音源はそれぞれ異なる座標に配置され、それぞれの音源から発せられる音声は異なる伝搬路を経由して観測者に到達する。上記構成により、現実空間におけるこのような環境を仮想空間において再現することが可能になる。さらに、第1音源座標及び第2音源座標はユーザの第1操作に基づいて決定されるため、ユーザは、さまざまな音源の配置及びそれに伴う音声の聞こえ方を、仮想空間内で体感することができる。
【0080】
また、仮想空間は、過去に存在した地物の内部又は周辺の空間を再現したものであってもよい。仮想空間が単に過去をイメージして作成された現実に存在したことがない空間である場合と比較して、仮想空間が実際に過去に存在した地物を再現したものである場合、ユーザとしては、より強い説得力を体感することができる。例えば、単に過去をイメージして作成された現実に存在したことがない仮想空間で瀧廉太郎のピアノを聞く場合と、瀧廉太郎が実際にピアノを弾いていたとされる東京音楽学校の校舎を再現した仮想空間で瀧廉太郎のピアノを聞く場合とでは、ユーザの体感は大きく異なると考えられる。特に、音源オブジェクト、発信音声情報144及び伝搬情報146の少なくとも一部が再現された過去の空間に対応するものである場合、ユーザはより強い興趣性を体感することができる。
【0081】
<5.ハードウェア構成>
図5を参照して、上述してきた情報処理装置2をコンピュータ70により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の機能は、複数台の装置に分けて実現することもできる。
【0082】
図5に示すように、コンピュータ70は、プロセッサ700と、記憶装置702と、入力I/F704と、データI/F706と、通信I/F708、及び表示装置710を含む。
【0083】
プロセッサ700は、記憶装置702に記憶されているプログラムを実行することによりコンピュータ70における様々な処理を制御する。例えば、情報処理装置2の制御部10が備える各機能部等は、記憶装置702に記憶されたプログラムを、プロセッサ700が実行することにより実現可能である。
【0084】
記憶装置702は、例えばRAM(Random Access Memory)などの記憶媒体である。RAMは、プロセッサ700によって実行されるプログラムのプログラムコード及びプログラムの実行時に必要となるデータを一時的に記憶する。
【0085】
記憶装置702は、他にも、例えばハードディスクドライブ(HDD)及びフラッシュメモリなどの不揮発性の記憶媒体である。記憶装置702は、オペレーティングシステム及び上記各構成を実現するための各種プログラムを記憶する。当該各種プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体(Non-transitory computer readable medium)であってもよい。この他、記憶装置702は、各種情報を登録するテーブルと、当該テーブルを管理するDBを記憶することも可能である。このようなプログラム及びデータは、必要に応じて記憶装置702にロードされることにより、プロセッサ700から参照される。
【0086】
入力I/F704は、ユーザからの入力を受け付けるためのデバイスである。入力I/F704の具体例としては、カメラ、ボタン、マイク、キーボード、マウス、タッチパネル、各種センサ、ウェアラブル・デバイスなどが挙げられる。入力I/F704は、例えばUSB(Universal Serial Bus)などのインタフェースを介してコンピュータ70に接続されてもよい。
【0087】
データI/F706は、コンピュータ70の外部からデータを入力するためのデバイスである。データI/F706の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置などがある。データI/F706は、コンピュータ70の外部に設けられることも考えられる。その場合、データI/F706は、例えばUSBなどのインタフェースを介してコンピュータ70へと接続される。
【0088】
通信I/F708は、コンピュータ70の外部の装置と有線または無線により、通信ネットワーク4を介したデータ通信を行うためのデバイスである。通信I/F708は、コンピュータ70の外部に設けられることも考えられる。その場合、通信I/F708は、例えばUSBなどのインタフェースを介してコンピュータ70に接続される。
【0089】
表示装置710は、各種情報を表示するためのデバイスである。表示装置710の具体例としては、例えば液晶ディスプレイ及び有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイなどが挙げられる。表示装置710は、コンピュータ70の外部に設けられてもよい。その場合、表示装置710は、例えばディスプレイケーブルなどを介してコンピュータ70に接続される。また、入力I/F704としてタッチパネルが採用される場合には、表示装置710は、入力I/F704と一体化して構成することが可能である。
【0090】
また、上記実施の形態で記載された情報処理装置2が備える構成要素は、記憶装置702に格納されたプログラムがプロセッサ700によって実行されることで、定められた処理が他のハードウェアと協働して実現されるものとする。また、言い換えれば、これらの構成要素は、ソフトウェアまたはファームウェアとしても、それと対応するハードウェアとしても想定され、その双方の概念において、「機能」、「手段」、「部」、「処理回路」、「ユニット」、または「モジュール」などとも記載され、またそれぞれに読み替えることができる。
【0091】
<6.変形例>
―変形例1―
上記実施形態では、情報処理装置2は、予め記憶部14に記憶した音声ファイルを読み出すことにより発信演奏情報144a及び発信歌唱情報144bを生成するものとして説明したが(S12及びS16参照)、これに限られない。例えば、発信音声情報144は、収録音声情報150に基づいて生成及び変更されてもよい。
【0092】
図6のフローチャートを参照して、具体例について説明する。この例では、第1ユーザと第2ユーザとがそれぞれの端末装置3を用いて同時に仮想空間にアクセスする。第1ユーザは自身のアバターを音源座標pxに配置される歌手オブジェクト142bとして、第2ユーザは自身のアバターを観測座標qzに配置される観測オブジェクト142cとして振る舞わせる。すなわち、第2ユーザは仮想空間において、第1ユーザのアバターが歌唱しているかのように体感することができる。
【0093】
情報処理装置2は、第1ユーザの操作に基づいて音源座標pxを決定するとともに、第2ユーザの操作に基づいて及び観測座標をqz決定する(S100)。
【0094】
次に、情報処理装置2は、第1ユーザの歌唱により生成された収録音声情報150を読み込む(S102)。収録音声情報150は、例えば、第1ユーザがマイクである音声入力装置4を用いて自身の歌唱を収録することにより生成される。
【0095】
次に、情報処理装置2は、収録音声情報150に基づいて、発信歌唱情報144bを生成又は変更する(S104)。
【0096】
次に、情報処理装置2は、伝搬情報146を参照しつつ、音源座標pxと、収録音声情報150に基づいて生成又は変更された発信歌唱情報144bとに基づいて、観測座標qyにおける到達歌唱情報148bを生成する(S106)。
【0097】
次に、情報処理装置2は、到達歌唱情報148bに基づいて、出力音声を出力する(S108)。具体的には、情報処理装置2は、第2ユーザの端末装置3に対して出力音声を出力させる。これにより、第2ユーザは、第1ユーザがS102において収録した音声が歌手オブジェクト142b(すなわち、第1ユーザのアバター)から発せられているかのように体感することができる。
【0098】
次に、情報処理装置2は、第1ユーザによる収録が終了したか否かを判定する(S110)。収録が終了している場合(S110 YES)、情報処理装置2は動作を終了する。一方で、収録が継続している場合(S110 NO)には、情報処理装置2は引き続き第1ユーザの歌唱により生成された収録音声情報150を読み込み(S102)、後続の処理を行う。
【0099】
この例では音源オブジェクトは第1ユーザのアバターだけである場合について説明したが、これに限られない。例えば、上記実施形態において説明したように、音源オブジェクトとして楽器オブジェクト142aがさらに配置され、第2ユーザは、第1ユーザのアバターによる歌唱と、楽器オブジェクト142aによる演奏との両方を体感することができてもよい。
【0100】
また、この例では、第1ユーザの歌唱は第2ユーザが体感するものとして説明したが、これに限られない。例えば、第1ユーザは、自身のアバターを歌手オブジェクト142bとして振る舞わせるとともに、自身の歌唱を聞く観測オブジェクト142cとして振る舞わせてもよい。
【0101】
この例の構成によれば、現実空間と仮想空間とをハイブリッド的に利用した音響体験を実現することができる。例えば、この例の第1ユーザは、現実空間での演奏を仮想空間に反映させ、現実空間では感じられない音の反響及び拡がり感を感じることができる。これに対して、第2ユーザは、第1ユーザによるリアルなライブパフォーマンスを、仮想空間で体感することができる。
【0102】
―変形例2―
上記実施形態では、ユーザが体感する音声について主に説明したが、ユーザは仮想空間における画像(映像を含む)も同時に体感することができてもよい。具体的には、情報処理装置2は、観測座標から音源オブジェクトを見た場合の視野に対応する画像をユーザに対して出力してもよい。
【0103】
図7を参照して、ユーザに対して出力される画像の一例について説明する。図7に示す各種オブジェクトの配置は、図3に示した各種オブジェクトの配置に対応する。観測座標qzに配置されたユーザのアバターの視野には、音源座標pxに配置された歌手オブジェクト142b及び音源座標pyに配置された楽器オブジェクト142aが含まれる。ユーザのアバターの視野には、音源オブジェクト以外にも、什器オブジェクト142d及び什器オブジェクト142eが含まれる。この例の構成によれば、ユーザはより高い臨場感で音響を体感することができる。
【0104】
―変形例3―
上記実施形態では、伝搬情報146の音響伝搬特性は音源座標pm(m=1・・・M)と観測座標qn(m=1・・・N)との組み合わせに対して特定されるとして説明した。しかしながら、実際には、音響伝搬特性をすべての座標の組み合わせに対して(予め)設定しておくことは困難な場合がある。例えば、伝搬情報146において、音響伝搬特性f(x-1)z及び音響伝搬特性f(x+1)zは設定されているが、音響伝搬特性fxzは設定されていない場合も考えられる。そのような場合、観測座標qzで観測される音声は、例えば、音源座標pxに係る発信音声情報144に対して周波数フィルタである音響伝搬特性f(x-1)zを適用した結果と、同じく音源座標pxに係る発信音声情報144に対して周波数フィルタである音響伝搬特性f(x+1)zを適用した結果とを平均化することによって生成してもよい。
【0105】
<7.その他の実施形態>
以下のような態様も、本発明の範囲に含まれる。
【0106】
[付記1]
本発明の一態様に係るプログラムは、コンピュータ70を、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定手段102と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報144とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報148を生成する生成手段104と、到達音声情報148に基づいて、ユーザに対して出力音声を出力する音声出力手段110aと、として機能させる。
【0107】
[付記2]
付記1に記載のプログラムにおいて、観測座標は、ユーザの第2操作に基づいて決定されてもよい。
【0108】
[付記3]
付記1又は付記2に記載のプログラムは、コンピュータ70を、さらに、ユーザの第3操作に基づいて、発信音声情報144を変更する変更手段108、として機能させてもよい。
【0109】
[付記4]
付記3に記載のプログラムにおいて、第3操作は、現実空間において収録した収録音声に関する収録音声情報150を読み込ませることを含んでもよく、変更手段108は、収録音声情報150に基づいて発信音声情報144を変更してもよい。
【0110】
[付記5]
付記1から付記4のいずれか一つに記載のプログラムにおいて、第1操作は、現実空間における音源の配置に関する配置情報152を読み込ませることを含んでもよく、決定手段102は、配置情報152に基づいて音源座標を決定してもよい。
【0111】
[付記6]
付記1から付記5のいずれか一つに記載のプログラムにおいて、仮想空間は、過去に存在した地物の内部又は周辺の空間を再現したものであってもよい。
【0112】
[付記7]
付記1から付記6のいずれか一つに記載のプログラムにおいて、音源オブジェクトは、第1音源オブジェクト及び第2音源オブジェクトを含んでもよく、決定手段102は、第1操作に基づいて、第1音源オブジェクトの座標である第1音源座標と、第2音源オブジェクトの座標である第2音源座標とを決定してもよい。
【0113】
[付記8]
付記1から付記7のいずれか一つに記載のプログラムは、コンピュータ70を、さらに、観測座標から音源オブジェクトを見た場合の視野に対応する画像をユーザに対して出力する画像出力手段110b、として機能させてもよい。
【0114】
[付記9]
付記1から付記8のいずれか一つに記載のプログラムにおいて、生成手段104は、仮想空間内の任意の2座標間の音響伝搬特性に関する伝搬情報146を参照して到達音声情報148を生成してもよい。
【0115】
[付記10]
本発明の他の一態様に係るプログラムは、コンピュータ70を、ユーザから、仮想空間における音源オブジェクトの座標である音源座標の決定に関する第1操作を受け付ける受付手段200と、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報148を取得する取得手段202であって、到達音声情報148は、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報144とに基づいて生成される、取得手段202と、到達音声情報148に基づいて、ユーザに対して出力音声を出力する音声出力手段204aと、として機能させる。
【0116】
[付記11]
本発明の他の一態様に係る情報処理装置は、ユーザの第1操作に基づいて、仮想空間における音源オブジェクトの座標である音源座標を決定する決定部と、音源座標と、音源オブジェクトから仮想的に発せられる発信音声に対応する発信音声情報144とに基づいて、仮想空間における観測座標に仮想的に到達する到達音声に対応する到達音声情報148を生成する生成部と、到達音声情報148に基づいて、ユーザに対して出力音声を出力する音声出力部と、を備える。
【符号の説明】
【0117】
2…情報処理装置、70…コンピュータ、102…決定手段、104…生成手段、108…変更手段、110…出力手段、110a…音声出力手段、110b…画像出力手段、144…発信音声情報、146…伝搬情報、148…到達音声情報、150…収録音声情報、152…配置情報、200…受付手段、202…取得手段、204…出力手段、204a…音声出力手段、204b…画像出力手段
図1
図2
図3
図4
図5
図6
図7